symm/{salsa20,chacha}-x86ish-sse2.S: Use numeric labels for internal loops.
authorMark Wooding <mdw@distorted.org.uk>
Wed, 18 May 2016 09:29:03 +0000 (10:29 +0100)
committerMark Wooding <mdw@distorted.org.uk>
Sun, 22 May 2016 14:58:22 +0000 (15:58 +0100)
symm/chacha-x86ish-sse2.S
symm/salsa20-x86ish-sse2.S

index f36bf90..8688996 100644 (file)
@@ -131,7 +131,7 @@ FUNC(chacha_core_x86ish_sse2)
        movdqa  SAVE2, xmm2
        movdqa  SAVE3, xmm3
 
-loop:
+0:
        // Apply a column quarterround to each of the columns simultaneously.
        // Alas, there doesn't seem to be a packed doubleword rotate, so we
        // have to synthesize it.
@@ -228,7 +228,7 @@ loop:
 
        // Decrement the loop counter and see if we should go round again.
        sub     NR, 2
-       ja      loop
+       ja      0b
 
        // Almost there.  Firstly, the feedforward addition.
        paddd   xmm0, SAVE0
index b3ebf90..d74836b 100644 (file)
@@ -152,7 +152,7 @@ FUNC(salsa20_core_x86ish_sse2)
        movdqa  SAVE2, xmm2
        movdqa  SAVE3, xmm3
 
-loop:
+0:
        // Apply a column quarterround to each of the columns simultaneously.
        // Alas, there doesn't seem to be a packed doubleword rotate, so we
        // have to synthesize it.
@@ -256,7 +256,7 @@ loop:
        // Decrement the loop counter and see if we should go round again.
        // Later processors fuse this pair into a single uop.
        sub     NR, 2
-       ja      loop
+       ja      0b
 
        // Almost there.  Firstly, the feedforward addition, and then we have
        // to write out the result.  Here we have to undo the permutation