symm/rijndael-x86ish-aesni.S: Have `endswap_block' copy NKW to ECX.
[catacomb] / symm / chacha-x86ish-sse2.S
index f36bf90..641ad65 100644 (file)
@@ -42,7 +42,7 @@
 /// Main code.
 
        .arch pentium4
-       .section .text
+       .text
 
 FUNC(chacha_core_x86ish_sse2)
 
@@ -131,7 +131,7 @@ FUNC(chacha_core_x86ish_sse2)
        movdqa  SAVE2, xmm2
        movdqa  SAVE3, xmm3
 
-loop:
+0:
        // Apply a column quarterround to each of the columns simultaneously.
        // Alas, there doesn't seem to be a packed doubleword rotate, so we
        // have to synthesize it.
@@ -228,7 +228,7 @@ loop:
 
        // Decrement the loop counter and see if we should go round again.
        sub     NR, 2
-       ja      loop
+       ja      0b
 
        // Almost there.  Firstly, the feedforward addition.
        paddd   xmm0, SAVE0