To emphasize that they're not part of the nearby logic but moved to
improve pipelining.
// d ^= (c + b) <<< 13
vadd.u32 q0, q10, q9
// d ^= (c + b) <<< 13
vadd.u32 q0, q10, q9
vshl.u32 q1, q0, #13
vshr.u32 q0, q0, #19
vorr q0, q0, q1
vshl.u32 q1, q0, #13
vshr.u32 q0, q0, #19
vorr q0, q0, q1
// a ^= (d + c) <<< 18
vadd.u32 q0, q11, q10
// a ^= (d + c) <<< 18
vadd.u32 q0, q11, q10
- vext.32 q10, q10, q10, #2
- vext.32 q11, q11, q11, #1
+ vext.32 q10, q10, q10, #2
+ vext.32 q11, q11, q11, #1
vshl.u32 q1, q0, #18
vshr.u32 q0, q0, #14
vorr q0, q0, q1
vshl.u32 q1, q0, #18
vshr.u32 q0, q0, #14
vorr q0, q0, q1