.text
///--------------------------------------------------------------------------
-/// Main.code.
+/// Main code.
FUNC(salsa20_core_arm_neon)
// d ^= (c + b) <<< 13
vadd.u32 q0, q10, q9
- vext.32 q9, q9, q9, #3
+ vext.32 q9, q9, q9, #3
vshl.u32 q1, q0, #13
vshr.u32 q0, q0, #19
vorr q0, q0, q1
// a ^= (d + c) <<< 18
vadd.u32 q0, q11, q10
- vext.32 q10, q10, q10, #2
- vext.32 q11, q11, q11, #1
+ vext.32 q10, q10, q10, #2
+ vext.32 q11, q11, q11, #1
vshl.u32 q1, q0, #18
vshr.u32 q0, q0, #14
vorr q0, q0, q1
// Almost there. Firstly the feedfoward addition. Also, establish a
// constant which will be useful later.
9: vadd.u32 q0, q8, q12 // 0, 5, 10, 15
- vmov.i64 q12, #0xffffffff // = (-1, 0, -1, 0)
+ vmov.i64 q12, #0xffffffff // = (0, -1; 0, -1)
vadd.u32 q1, q9, q13 // 4, 9, 14, 3
vadd.u32 q2, q10, q14 // 8, 13, 2, 7
vadd.u32 q3, q11, q15 // 12, 1, 6, 11