Themen-Überblick
(Aktualisieren)
| Autor |
Nachricht |
nachtfeuer
|
Mir fällt noch ein, es gab Anfang letzten Jahres einen ganz ähnlichen Thread,
( http://www.c-plusplus.de/forum/280689 )
und ein Problem des TOs war glaub ich, neben der fehlenden Erfahrung mit ein bißchen Herumprobieren, dass die Bitmultiplikation/Addition nicht gleich verstanden wurde, dabei ist das Prinzip eigentlich sehr einfach, wenn man es mal auf Papier gemacht hat. Wenn man die Binärmultiplikation/Addition verstanden hat, und das entgegenkommen der Prozessorbefehle, versteht sich auch der Asm-Code gleich viel besser.
Wenn man von großen Zahlen wie (2^256)^64 lediglich eins abziehen will, und das ist nicht ganz trivial, kann man die Zahl von hinten nach vorn nach der nächstbesten binären 1 absuchen. Bei Zahlen wie 2^x steht die 1 natürlich ganz vorne bzw. ganz links. Bei der Zahl (2^256)^64 - 1 steht dagegen die erste 1 ganz hinten bzw. ganz rechts.
Man sucht also von rechts die nächstbeste 1, macht aus dieser (theoretisch) eine Null und aus dem Rest ( den folgenden Nullen) per
eine 1.
Direkt auf der Registerebene (der Abschnitt mit der 1) macht man (praktisch) einfach ein
(dec reg ginge natürlich auch bei den restlichen, hinteren (nuller) Abschnitten, da ja 00 - 1 FF sein muß)
(und ginge so ganz ohne Carryflag (aber mit CX also Cindy, der kleinen Zähltochter vom Graf Zahl...) ) |
|
|
 |
Christoph
|
| nachtfeuer schrieb: | | Man fragt sich gelegentlich, was eigentlich so ein funktionaler Sprachinterpreter wie z. B. der ghci Haskellinterpreter intern so treibt, wenn man mit so Begriffen wie 2*(2^256)^3 + 4 * (2^256)^2 + 2* (2^256) usw. herumrechnet oder z.B. (2^256)^64 -1. | Im Zweifelsfall steckt oft libgmp dahinter, weil man es selber nur schwer schneller hinbekommt. Bei ghc ist das so. |
|
|
 |
nachtfeuer
|
| volkard schrieb: |
Binär? Wollten wir nicht übungshalber das 256-er-System nehmen und dann das 4294967296-er benutzen? |
4294967296-er? Ist das nicht etwas veraltet? - Bei 32Bit Compi mit SSE ginge zumindest ein 2^128-er Zahlensystem.
Aber Avx...256er Zahlensystem als Einstiegsdroge und dann weiter machen mit 2^256er.
Man fragt sich gelegentlich, was eigentlich so ein funktionaler Sprachinterpreter wie z. B. der ghci Haskellinterpreter intern so treibt, wenn man mit so Begriffen wie 2*(2^256)^3 + 4 * (2^256)^2 + 2* (2^256) usw. herumrechnet oder z.B. (2^256)^64 -1.
(aber 256er? da hat wohl einer mit 8 Bit Compies angefangen was?)  |
|
|
 |
volkard
|
| nachtfeuer schrieb: | | Darüber hinaus ist es sehr hilfreich, Binärmultiplikation aufzuschreiben und zu verstehen. |
Binär? Wollten wir nicht übungshalber das 256-er-System nehmen und dann das 4294967296-er benutzen? |
|
|
 |
nachtfeuer
|
Ich würde empfehlen, erstmal zu gucken, und zu verstehen, wie die Karatsuba-Multiplikation arbeitet, denn sie läßt sich überraschend angenehm und leicht in Assembler umsetzen.
Darüber hinaus ist es sehr hilfreich, Binärmultiplikation aufzuschreiben und zu verstehen. Also 1*1 ist ja noch einfach. Aber wieviel ist 11 * 11 (binär)? oder
wieviel wäre dann 1111111111111111 * 1111111111111111? |
|
|
 |
SpR
|
Okay vielen Dank schöne Pfingsten noch.
MfG SpR |
|
|
 |
volkard
|
| SpR schrieb: | | könnte jemand mal den Namen oder nen Link zu den Algorithmen geben, welcher schneller als Karatsuba sind, heißt nicht das ich sie verstehe würde mir aber gerne einmal das Prinzip ansehen. |
Wikipedia "Karastuba" verlinkt auf die schnelleren.
Und sagt, daß bei Deinen 4096 Bits die schnelleren noch gar nicht so greifen. |
|
|
 |
SpR
|
| volkard schrieb: | | SpR schrieb: | | Bin mittlerweile dabei E = M * c² auszurechnen mit meinem großen Datentyp dabei ist mir aufgefallen ,dass ich noch gar nicht weiß wie man mit großen Zahlen multipliziert. Wäre sehr freundlich, wenn mir jemand die Theorie erklärt oder ein paar Seiten dazu verlinkt. |
Lahm: Siehe Grundschule.
Ich würde aber gleich weitergehen und Karatsuba machen. Ist nichtmal schwieriger, aber schon ganz ordentlich schnell. Die noch schnelleren werden ab hier schlagartig sehr schwierig. |
Ich danke dir, du hast recht das eigentlich Malrechnen lahm ist, allerings frage ich lieber nach ob e´s einen guten Algorithmus dafür gibt, anstatt irgend nen mist zu proggen^^. Vielen Dank Ralph dein Post hat mir auch sehr geholfen, könnte jemand mal den Namen oder nen Link zu den Algorithmen geben, welcher schneller als Karatsuba sind, heißt nicht das ich sie verstehe würde mir aber gerne einmal das Prinzip ansehen. |
|
|
 |
rkhb
|
| SpR schrieb: | | Bin mittlerweile dabei E = M * c² auszurechnen mit meinem großen Datentyp dabei ist mir aufgefallen ,dass ich noch gar nicht weiß wie man mit großen Zahlen multipliziert. Wäre sehr freundlich, wenn mir jemand die Theorie erklärt oder ein paar Seiten dazu verlinkt. |
Das hast Du schon in der Grundschule gelernt, nur mit Dezimalzahlen. Rechne mal "auf dem Papier" aus:
| Code: | 1 2 3 4 5 6 7 8 | 1234 * 5678 ----------- 9872 8638 7404 6170 =========== 7006652 | |
Eigentlich hast Du die Zahlen auseinandergerissen und mit einzelnen Ziffern gerechnet. Die Zahl 5678 ist also eigentlich nur eine zusammengeklebte Folge der Dezimalzahlen '5', '6', '7', '8', '9'. Nun stelle Dir vor, da wären keine Dezimalzahlen (Basis 10), sondern Dwords (Basis 2^32). Dann ständen da oben nicht zwei Dezimalzahlen mit 4 Dezimalziffern, sondern zwei BigInts mit 4 Dwords. Nennen wir die erste Dezimalzahl x und die zweite Dezimalzahl y und nummerieren jede Ziffer von rechts ab 0. Abstrakt würde dann aus '1234 * 5678' ein 'x3x2x1x0 * y3y2y1y0'. Die vier Zeilen unter dem Strich hast Du wie folgt ermittelt:
1. Zeile: x * y0
2. Zeile: x * y1 und um eins nach links verschoben
3. Zeile: x * y3 und um zwei nach links verschoben
4. Zeile: x * y4 und um drei nach links verschoben
und alles addiert.
Die einzelnen Multiplikationen kannst Du auf dieselbe Weise aufdröseln. Wenn man sich die Ziffern als Elemente in einem Array vorstellt (z.B. y0 als Element 0, y1 als Element 1, y3 als Element 3 usw.), dann wird die Verschieberei einfach. Die jeweiligen Ergebnisse landen im Ziel am entsprechenden Index. In Zeile 4 z. B. landet die Null im Index 4. Es ist kein Zufall, dass die Operation mit y4 im Index 4 landet. Du verstehst das besser, wenn Du die Rechnung tatsächlich auf einem Stück Karopapier machst, und Dir bei jedem kleinsten Schritt klarmachst, was Du hier eigentlich machst.
Ein Problem ist, dass das Ergebnis sehr viel größer sein kann, als die einzelnen Zahlen. Die Multiplikation zweier 4-stelliger Zahlen kann 8-stellig sein (Addition der Stellen). Die Multiplikation zweier BigInts (mit fester Stellenanzaahl) kann die Grenzen eines einzelnen BigInts sprengen. Diese "Sprengung" kannst Du bei nachfolgendem Programm gut erkennen:
| C++: | 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 | #include <stdio.h> typedef union { struct { unsigned int dwords[4]; } bigint; struct { unsigned long long ll; unsigned long long big; } ll; } big_union; void bigint_mul (void* big1, void* big2, void* erg) { _asm { ; erg auf Null setzen mov edi, erg xor eax, eax mov ecx, 4 rep stosd mov esi, big1 mov ebx, big2 mov edi, erg ; x0 * y0 mov eax, [esi+0] mul dword ptr [ebx+0] mov [edi+0], eax mov [edi+4], edx ; x1 * y0 mov eax, [esi+0] mul dword ptr [ebx+4] add [edi+4], eax adc [edi+8], edx // Übertrag adc [edi+12], 0 // Weiterer Übertrag ; x2 * y0 mov eax, [esi+0] mul dword ptr [ebx+8] add [edi+8], eax adc [edi+12], edx ; x3 * y0 mov eax, [esi+0] mul dword ptr [ebx+12] add [edi+12], eax ; Übertrag wäre außerhalb des BigInt-Wertebereichs ; x0 * y1 mov eax, [esi+4] mul dword ptr [ebx+0] add [edi+4], eax adc [edi+8], edx adc [edi+12], 0 ; x1 * y1 mov eax, [esi+4] mul dword ptr [ebx+4] add [edi+8], eax adc [edi+12], edx ; Weiterer Übertrag wäre außerhalb des BigInt-Wertebereichs ; x2 * y1 mov eax, [esi+4] mul dword ptr [ebx+8] add [edi+12], eax // Edit: Bug beseitigt ; Übertrag wäre außerhalb des BigInt-Wertebereichs ; x3 * y1 ; mov eax, [esi+4] ; mul dword ptr [ebx+12] ; Ergebnis ist außerhalb des BigInt-Wertebereichs ; x0 * y2 mov eax, [esi+8] mul dword ptr [ebx+0] add [edi+8], eax adc [edi+12], edx ; Weiterer Übertrag wäre außerhalb des BigInt-Wertebereichs ; x1 * y2 mov eax, [esi+8] mul dword ptr [ebx+4] add [edi+12], eax ; Übertrag wäre außerhalb des BigInt-Wertebereichs ; x2 * y2 mov eax, [esi+8] mul dword ptr [ebx+8] ; Ergebnis ist außerhalb des BigInt-Wertebereichs ; x3 * y2 ; mov eax, [esi+8] ; mul dword ptr [ebx+12] ; Ergebnis ist außerhalb des BigInt-Wertebereichs ; x0 * y3 mov eax, [esi+12] mul dword ptr [ebx+0] add [edi+12], eax ; Übertrag wäre außerhalb des BigInt-Wertebereichs ; x1 * y3 ; mov eax, [esi+12] ; mul dword ptr [ebx+4] ; Ergebnis ist außerhalb des BigInt-Wertebereichs ; x2 * y3 ; mov eax, [esi+12] ; mul dword ptr [ebx+8] ; Ergebnis ist außerhalb des BigInt-Wertebereichs ; x3 * y3 ; mov eax, [esi+12] ; mul dword ptr [ebx+12] ; Ergebnis ist außerhalb des BigInt-Wertebereichs } } unsigned int bigint_div10 (void* big) { _asm { mov esi, big mov ebx, 10 mov eax, [esi+12] xor edx, edx div ebx mov [esi+12], eax mov eax, [esi+8] div ebx mov [esi+8], eax mov eax, [esi+4] div ebx mov [esi+4], eax mov eax, [esi+0] div ebx mov [esi+0], eax mov eax, edx // Rückgabe: Rest } } void bigint2dez (void* big, char* buf) { big_union big1; _asm // http://dcla.rkhb.de/umwandlung/int2dez.html { mov esi, big // big1 = big lea edi, big1 mov ecx, 4 rep movsd xor cl, cl lea esi, big1 Schleife_1: push esi call bigint_div10 add esp, 4 push eax add cl, 1 mov eax, [esi] or eax, [esi+4] or eax, [esi+8] or eax, [esi+12] jnz Schleife_1 mov edi, buf Schleife_2: pop eax or al, 00110000b stosb loop Schleife_2 mov byte ptr [edi], 0 } } int main(void) { big_union big1, big2, big3; char dez[40] = "buf"; int i; big1.ll.ll = 1000; big1.ll.big=0; big2.ll.ll = 1000; big2.ll.big=0; bigint2dez (&big1, dez); printf ("big1\t0x%016I64X%016I64X\t%s\n",big1.ll.big,big1.ll.ll,dez); for (i=0; i<15; ++i) { bigint_mul (&big1, &big2, &big3); bigint2dez (&big3, dez); printf ("*1000\t0x%016I64X%016I64X\t%s\n",big3.ll.big,big3.ll.ll,dez); big1 = big3; } return 0; } | |
viele grüße
ralph |
|
|
 |
volkard
|
| SpR schrieb: | | Bin mittlerweile dabei E = M * c² auszurechnen mit meinem großen Datentyp dabei ist mir aufgefallen ,dass ich noch gar nicht weiß wie man mit großen Zahlen multipliziert. Wäre sehr freundlich, wenn mir jemand die Theorie erklärt oder ein paar Seiten dazu verlinkt. |
Lahm: Siehe Grundschule.
Ich würde aber gleich weitergehen und Karatsuba machen. Ist nichtmal schwieriger, aber schon ganz ordentlich schnell. Die noch schnelleren werden ab hier schlagartig sehr schwierig. |
|
|
 |
|
|
|
|
|