VirtualBox

source: vbox/trunk/src/libs/openssl-3.0.9/crypto/genasm-elf/sha1-mb-x86_64.S@ 100942

Last change on this file since 100942 was 94096, checked in by vboxsync, 3 years ago

libs/openssl-3.0.1: Fix for gnu assemblers and recreate asm files, ​bugref:10128

File size: 51.9 KB
Line 
1.text
2
3
4
5.globl sha1_multi_block
6.type sha1_multi_block,@function
7.align 32
8sha1_multi_block:
9.cfi_startproc
10 movq OPENSSL_ia32cap_P+4(%rip),%rcx
11 btq $61,%rcx
12 jc _shaext_shortcut
13 movq %rsp,%rax
14.cfi_def_cfa_register %rax
15 pushq %rbx
16.cfi_offset %rbx,-16
17 pushq %rbp
18.cfi_offset %rbx,-24
19 subq $288,%rsp
20 andq $-256,%rsp
21 movq %rax,272(%rsp)
22.cfi_escape 0x0f,0x06,0x77,0x90,0x02,0x06,0x23,0x08
23.Lbody:
24 leaq K_XX_XX(%rip),%rbp
25 leaq 256(%rsp),%rbx
26
27.Loop_grande:
28 movl %edx,280(%rsp)
29 xorl %edx,%edx
30
31 movq 0(%rsi),%r8
32
33 movl 8(%rsi),%ecx
34 cmpl %edx,%ecx
35 cmovgl %ecx,%edx
36 testl %ecx,%ecx
37 movl %ecx,0(%rbx)
38 cmovleq %rbp,%r8
39
40 movq 16(%rsi),%r9
41
42 movl 24(%rsi),%ecx
43 cmpl %edx,%ecx
44 cmovgl %ecx,%edx
45 testl %ecx,%ecx
46 movl %ecx,4(%rbx)
47 cmovleq %rbp,%r9
48
49 movq 32(%rsi),%r10
50
51 movl 40(%rsi),%ecx
52 cmpl %edx,%ecx
53 cmovgl %ecx,%edx
54 testl %ecx,%ecx
55 movl %ecx,8(%rbx)
56 cmovleq %rbp,%r10
57
58 movq 48(%rsi),%r11
59
60 movl 56(%rsi),%ecx
61 cmpl %edx,%ecx
62 cmovgl %ecx,%edx
63 testl %ecx,%ecx
64 movl %ecx,12(%rbx)
65 cmovleq %rbp,%r11
66 testl %edx,%edx
67 jz .Ldone
68
69 movdqu 0(%rdi),%xmm10
70 leaq 128(%rsp),%rax
71 movdqu 32(%rdi),%xmm11
72 movdqu 64(%rdi),%xmm12
73 movdqu 96(%rdi),%xmm13
74 movdqu 128(%rdi),%xmm14
75 movdqa 96(%rbp),%xmm5
76 movdqa -32(%rbp),%xmm15
77 jmp .Loop
78
79.align 32
80.Loop:
81 movd (%r8),%xmm0
82 leaq 64(%r8),%r8
83 movd (%r9),%xmm2
84 leaq 64(%r9),%r9
85 movd (%r10),%xmm3
86 leaq 64(%r10),%r10
87 movd (%r11),%xmm4
88 leaq 64(%r11),%r11
89 punpckldq %xmm3,%xmm0
90 movd -60(%r8),%xmm1
91 punpckldq %xmm4,%xmm2
92 movd -60(%r9),%xmm9
93 punpckldq %xmm2,%xmm0
94 movd -60(%r10),%xmm8
95.byte 102,15,56,0,197
96 movd -60(%r11),%xmm7
97 punpckldq %xmm8,%xmm1
98 movdqa %xmm10,%xmm8
99 paddd %xmm15,%xmm14
100 punpckldq %xmm7,%xmm9
101 movdqa %xmm11,%xmm7
102 movdqa %xmm11,%xmm6
103 pslld $5,%xmm8
104 pandn %xmm13,%xmm7
105 pand %xmm12,%xmm6
106 punpckldq %xmm9,%xmm1
107 movdqa %xmm10,%xmm9
108
109 movdqa %xmm0,0-128(%rax)
110 paddd %xmm0,%xmm14
111 movd -56(%r8),%xmm2
112 psrld $27,%xmm9
113 pxor %xmm7,%xmm6
114 movdqa %xmm11,%xmm7
115
116 por %xmm9,%xmm8
117 movd -56(%r9),%xmm9
118 pslld $30,%xmm7
119 paddd %xmm6,%xmm14
120
121 psrld $2,%xmm11
122 paddd %xmm8,%xmm14
123.byte 102,15,56,0,205
124 movd -56(%r10),%xmm8
125 por %xmm7,%xmm11
126 movd -56(%r11),%xmm7
127 punpckldq %xmm8,%xmm2
128 movdqa %xmm14,%xmm8
129 paddd %xmm15,%xmm13
130 punpckldq %xmm7,%xmm9
131 movdqa %xmm10,%xmm7
132 movdqa %xmm10,%xmm6
133 pslld $5,%xmm8
134 pandn %xmm12,%xmm7
135 pand %xmm11,%xmm6
136 punpckldq %xmm9,%xmm2
137 movdqa %xmm14,%xmm9
138
139 movdqa %xmm1,16-128(%rax)
140 paddd %xmm1,%xmm13
141 movd -52(%r8),%xmm3
142 psrld $27,%xmm9
143 pxor %xmm7,%xmm6
144 movdqa %xmm10,%xmm7
145
146 por %xmm9,%xmm8
147 movd -52(%r9),%xmm9
148 pslld $30,%xmm7
149 paddd %xmm6,%xmm13
150
151 psrld $2,%xmm10
152 paddd %xmm8,%xmm13
153.byte 102,15,56,0,213
154 movd -52(%r10),%xmm8
155 por %xmm7,%xmm10
156 movd -52(%r11),%xmm7
157 punpckldq %xmm8,%xmm3
158 movdqa %xmm13,%xmm8
159 paddd %xmm15,%xmm12
160 punpckldq %xmm7,%xmm9
161 movdqa %xmm14,%xmm7
162 movdqa %xmm14,%xmm6
163 pslld $5,%xmm8
164 pandn %xmm11,%xmm7
165 pand %xmm10,%xmm6
166 punpckldq %xmm9,%xmm3
167 movdqa %xmm13,%xmm9
168
169 movdqa %xmm2,32-128(%rax)
170 paddd %xmm2,%xmm12
171 movd -48(%r8),%xmm4
172 psrld $27,%xmm9
173 pxor %xmm7,%xmm6
174 movdqa %xmm14,%xmm7
175
176 por %xmm9,%xmm8
177 movd -48(%r9),%xmm9
178 pslld $30,%xmm7
179 paddd %xmm6,%xmm12
180
181 psrld $2,%xmm14
182 paddd %xmm8,%xmm12
183.byte 102,15,56,0,221
184 movd -48(%r10),%xmm8
185 por %xmm7,%xmm14
186 movd -48(%r11),%xmm7
187 punpckldq %xmm8,%xmm4
188 movdqa %xmm12,%xmm8
189 paddd %xmm15,%xmm11
190 punpckldq %xmm7,%xmm9
191 movdqa %xmm13,%xmm7
192 movdqa %xmm13,%xmm6
193 pslld $5,%xmm8
194 pandn %xmm10,%xmm7
195 pand %xmm14,%xmm6
196 punpckldq %xmm9,%xmm4
197 movdqa %xmm12,%xmm9
198
199 movdqa %xmm3,48-128(%rax)
200 paddd %xmm3,%xmm11
201 movd -44(%r8),%xmm0
202 psrld $27,%xmm9
203 pxor %xmm7,%xmm6
204 movdqa %xmm13,%xmm7
205
206 por %xmm9,%xmm8
207 movd -44(%r9),%xmm9
208 pslld $30,%xmm7
209 paddd %xmm6,%xmm11
210
211 psrld $2,%xmm13
212 paddd %xmm8,%xmm11
213.byte 102,15,56,0,229
214 movd -44(%r10),%xmm8
215 por %xmm7,%xmm13
216 movd -44(%r11),%xmm7
217 punpckldq %xmm8,%xmm0
218 movdqa %xmm11,%xmm8
219 paddd %xmm15,%xmm10
220 punpckldq %xmm7,%xmm9
221 movdqa %xmm12,%xmm7
222 movdqa %xmm12,%xmm6
223 pslld $5,%xmm8
224 pandn %xmm14,%xmm7
225 pand %xmm13,%xmm6
226 punpckldq %xmm9,%xmm0
227 movdqa %xmm11,%xmm9
228
229 movdqa %xmm4,64-128(%rax)
230 paddd %xmm4,%xmm10
231 movd -40(%r8),%xmm1
232 psrld $27,%xmm9
233 pxor %xmm7,%xmm6
234 movdqa %xmm12,%xmm7
235
236 por %xmm9,%xmm8
237 movd -40(%r9),%xmm9
238 pslld $30,%xmm7
239 paddd %xmm6,%xmm10
240
241 psrld $2,%xmm12
242 paddd %xmm8,%xmm10
243.byte 102,15,56,0,197
244 movd -40(%r10),%xmm8
245 por %xmm7,%xmm12
246 movd -40(%r11),%xmm7
247 punpckldq %xmm8,%xmm1
248 movdqa %xmm10,%xmm8
249 paddd %xmm15,%xmm14
250 punpckldq %xmm7,%xmm9
251 movdqa %xmm11,%xmm7
252 movdqa %xmm11,%xmm6
253 pslld $5,%xmm8
254 pandn %xmm13,%xmm7
255 pand %xmm12,%xmm6
256 punpckldq %xmm9,%xmm1
257 movdqa %xmm10,%xmm9
258
259 movdqa %xmm0,80-128(%rax)
260 paddd %xmm0,%xmm14
261 movd -36(%r8),%xmm2
262 psrld $27,%xmm9
263 pxor %xmm7,%xmm6
264 movdqa %xmm11,%xmm7
265
266 por %xmm9,%xmm8
267 movd -36(%r9),%xmm9
268 pslld $30,%xmm7
269 paddd %xmm6,%xmm14
270
271 psrld $2,%xmm11
272 paddd %xmm8,%xmm14
273.byte 102,15,56,0,205
274 movd -36(%r10),%xmm8
275 por %xmm7,%xmm11
276 movd -36(%r11),%xmm7
277 punpckldq %xmm8,%xmm2
278 movdqa %xmm14,%xmm8
279 paddd %xmm15,%xmm13
280 punpckldq %xmm7,%xmm9
281 movdqa %xmm10,%xmm7
282 movdqa %xmm10,%xmm6
283 pslld $5,%xmm8
284 pandn %xmm12,%xmm7
285 pand %xmm11,%xmm6
286 punpckldq %xmm9,%xmm2
287 movdqa %xmm14,%xmm9
288
289 movdqa %xmm1,96-128(%rax)
290 paddd %xmm1,%xmm13
291 movd -32(%r8),%xmm3
292 psrld $27,%xmm9
293 pxor %xmm7,%xmm6
294 movdqa %xmm10,%xmm7
295
296 por %xmm9,%xmm8
297 movd -32(%r9),%xmm9
298 pslld $30,%xmm7
299 paddd %xmm6,%xmm13
300
301 psrld $2,%xmm10
302 paddd %xmm8,%xmm13
303.byte 102,15,56,0,213
304 movd -32(%r10),%xmm8
305 por %xmm7,%xmm10
306 movd -32(%r11),%xmm7
307 punpckldq %xmm8,%xmm3
308 movdqa %xmm13,%xmm8
309 paddd %xmm15,%xmm12
310 punpckldq %xmm7,%xmm9
311 movdqa %xmm14,%xmm7
312 movdqa %xmm14,%xmm6
313 pslld $5,%xmm8
314 pandn %xmm11,%xmm7
315 pand %xmm10,%xmm6
316 punpckldq %xmm9,%xmm3
317 movdqa %xmm13,%xmm9
318
319 movdqa %xmm2,112-128(%rax)
320 paddd %xmm2,%xmm12
321 movd -28(%r8),%xmm4
322 psrld $27,%xmm9
323 pxor %xmm7,%xmm6
324 movdqa %xmm14,%xmm7
325
326 por %xmm9,%xmm8
327 movd -28(%r9),%xmm9
328 pslld $30,%xmm7
329 paddd %xmm6,%xmm12
330
331 psrld $2,%xmm14
332 paddd %xmm8,%xmm12
333.byte 102,15,56,0,221
334 movd -28(%r10),%xmm8
335 por %xmm7,%xmm14
336 movd -28(%r11),%xmm7
337 punpckldq %xmm8,%xmm4
338 movdqa %xmm12,%xmm8
339 paddd %xmm15,%xmm11
340 punpckldq %xmm7,%xmm9
341 movdqa %xmm13,%xmm7
342 movdqa %xmm13,%xmm6
343 pslld $5,%xmm8
344 pandn %xmm10,%xmm7
345 pand %xmm14,%xmm6
346 punpckldq %xmm9,%xmm4
347 movdqa %xmm12,%xmm9
348
349 movdqa %xmm3,128-128(%rax)
350 paddd %xmm3,%xmm11
351 movd -24(%r8),%xmm0
352 psrld $27,%xmm9
353 pxor %xmm7,%xmm6
354 movdqa %xmm13,%xmm7
355
356 por %xmm9,%xmm8
357 movd -24(%r9),%xmm9
358 pslld $30,%xmm7
359 paddd %xmm6,%xmm11
360
361 psrld $2,%xmm13
362 paddd %xmm8,%xmm11
363.byte 102,15,56,0,229
364 movd -24(%r10),%xmm8
365 por %xmm7,%xmm13
366 movd -24(%r11),%xmm7
367 punpckldq %xmm8,%xmm0
368 movdqa %xmm11,%xmm8
369 paddd %xmm15,%xmm10
370 punpckldq %xmm7,%xmm9
371 movdqa %xmm12,%xmm7
372 movdqa %xmm12,%xmm6
373 pslld $5,%xmm8
374 pandn %xmm14,%xmm7
375 pand %xmm13,%xmm6
376 punpckldq %xmm9,%xmm0
377 movdqa %xmm11,%xmm9
378
379 movdqa %xmm4,144-128(%rax)
380 paddd %xmm4,%xmm10
381 movd -20(%r8),%xmm1
382 psrld $27,%xmm9
383 pxor %xmm7,%xmm6
384 movdqa %xmm12,%xmm7
385
386 por %xmm9,%xmm8
387 movd -20(%r9),%xmm9
388 pslld $30,%xmm7
389 paddd %xmm6,%xmm10
390
391 psrld $2,%xmm12
392 paddd %xmm8,%xmm10
393.byte 102,15,56,0,197
394 movd -20(%r10),%xmm8
395 por %xmm7,%xmm12
396 movd -20(%r11),%xmm7
397 punpckldq %xmm8,%xmm1
398 movdqa %xmm10,%xmm8
399 paddd %xmm15,%xmm14
400 punpckldq %xmm7,%xmm9
401 movdqa %xmm11,%xmm7
402 movdqa %xmm11,%xmm6
403 pslld $5,%xmm8
404 pandn %xmm13,%xmm7
405 pand %xmm12,%xmm6
406 punpckldq %xmm9,%xmm1
407 movdqa %xmm10,%xmm9
408
409 movdqa %xmm0,160-128(%rax)
410 paddd %xmm0,%xmm14
411 movd -16(%r8),%xmm2
412 psrld $27,%xmm9
413 pxor %xmm7,%xmm6
414 movdqa %xmm11,%xmm7
415
416 por %xmm9,%xmm8
417 movd -16(%r9),%xmm9
418 pslld $30,%xmm7
419 paddd %xmm6,%xmm14
420
421 psrld $2,%xmm11
422 paddd %xmm8,%xmm14
423.byte 102,15,56,0,205
424 movd -16(%r10),%xmm8
425 por %xmm7,%xmm11
426 movd -16(%r11),%xmm7
427 punpckldq %xmm8,%xmm2
428 movdqa %xmm14,%xmm8
429 paddd %xmm15,%xmm13
430 punpckldq %xmm7,%xmm9
431 movdqa %xmm10,%xmm7
432 movdqa %xmm10,%xmm6
433 pslld $5,%xmm8
434 pandn %xmm12,%xmm7
435 pand %xmm11,%xmm6
436 punpckldq %xmm9,%xmm2
437 movdqa %xmm14,%xmm9
438
439 movdqa %xmm1,176-128(%rax)
440 paddd %xmm1,%xmm13
441 movd -12(%r8),%xmm3
442 psrld $27,%xmm9
443 pxor %xmm7,%xmm6
444 movdqa %xmm10,%xmm7
445
446 por %xmm9,%xmm8
447 movd -12(%r9),%xmm9
448 pslld $30,%xmm7
449 paddd %xmm6,%xmm13
450
451 psrld $2,%xmm10
452 paddd %xmm8,%xmm13
453.byte 102,15,56,0,213
454 movd -12(%r10),%xmm8
455 por %xmm7,%xmm10
456 movd -12(%r11),%xmm7
457 punpckldq %xmm8,%xmm3
458 movdqa %xmm13,%xmm8
459 paddd %xmm15,%xmm12
460 punpckldq %xmm7,%xmm9
461 movdqa %xmm14,%xmm7
462 movdqa %xmm14,%xmm6
463 pslld $5,%xmm8
464 pandn %xmm11,%xmm7
465 pand %xmm10,%xmm6
466 punpckldq %xmm9,%xmm3
467 movdqa %xmm13,%xmm9
468
469 movdqa %xmm2,192-128(%rax)
470 paddd %xmm2,%xmm12
471 movd -8(%r8),%xmm4
472 psrld $27,%xmm9
473 pxor %xmm7,%xmm6
474 movdqa %xmm14,%xmm7
475
476 por %xmm9,%xmm8
477 movd -8(%r9),%xmm9
478 pslld $30,%xmm7
479 paddd %xmm6,%xmm12
480
481 psrld $2,%xmm14
482 paddd %xmm8,%xmm12
483.byte 102,15,56,0,221
484 movd -8(%r10),%xmm8
485 por %xmm7,%xmm14
486 movd -8(%r11),%xmm7
487 punpckldq %xmm8,%xmm4
488 movdqa %xmm12,%xmm8
489 paddd %xmm15,%xmm11
490 punpckldq %xmm7,%xmm9
491 movdqa %xmm13,%xmm7
492 movdqa %xmm13,%xmm6
493 pslld $5,%xmm8
494 pandn %xmm10,%xmm7
495 pand %xmm14,%xmm6
496 punpckldq %xmm9,%xmm4
497 movdqa %xmm12,%xmm9
498
499 movdqa %xmm3,208-128(%rax)
500 paddd %xmm3,%xmm11
501 movd -4(%r8),%xmm0
502 psrld $27,%xmm9
503 pxor %xmm7,%xmm6
504 movdqa %xmm13,%xmm7
505
506 por %xmm9,%xmm8
507 movd -4(%r9),%xmm9
508 pslld $30,%xmm7
509 paddd %xmm6,%xmm11
510
511 psrld $2,%xmm13
512 paddd %xmm8,%xmm11
513.byte 102,15,56,0,229
514 movd -4(%r10),%xmm8
515 por %xmm7,%xmm13
516 movdqa 0-128(%rax),%xmm1
517 movd -4(%r11),%xmm7
518 punpckldq %xmm8,%xmm0
519 movdqa %xmm11,%xmm8
520 paddd %xmm15,%xmm10
521 punpckldq %xmm7,%xmm9
522 movdqa %xmm12,%xmm7
523 movdqa %xmm12,%xmm6
524 pslld $5,%xmm8
525 prefetcht0 63(%r8)
526 pandn %xmm14,%xmm7
527 pand %xmm13,%xmm6
528 punpckldq %xmm9,%xmm0
529 movdqa %xmm11,%xmm9
530
531 movdqa %xmm4,224-128(%rax)
532 paddd %xmm4,%xmm10
533 psrld $27,%xmm9
534 pxor %xmm7,%xmm6
535 movdqa %xmm12,%xmm7
536 prefetcht0 63(%r9)
537
538 por %xmm9,%xmm8
539 pslld $30,%xmm7
540 paddd %xmm6,%xmm10
541 prefetcht0 63(%r10)
542
543 psrld $2,%xmm12
544 paddd %xmm8,%xmm10
545.byte 102,15,56,0,197
546 prefetcht0 63(%r11)
547 por %xmm7,%xmm12
548 movdqa 16-128(%rax),%xmm2
549 pxor %xmm3,%xmm1
550 movdqa 32-128(%rax),%xmm3
551
552 movdqa %xmm10,%xmm8
553 pxor 128-128(%rax),%xmm1
554 paddd %xmm15,%xmm14
555 movdqa %xmm11,%xmm7
556 pslld $5,%xmm8
557 pxor %xmm3,%xmm1
558 movdqa %xmm11,%xmm6
559 pandn %xmm13,%xmm7
560 movdqa %xmm1,%xmm5
561 pand %xmm12,%xmm6
562 movdqa %xmm10,%xmm9
563 psrld $31,%xmm5
564 paddd %xmm1,%xmm1
565
566 movdqa %xmm0,240-128(%rax)
567 paddd %xmm0,%xmm14
568 psrld $27,%xmm9
569 pxor %xmm7,%xmm6
570
571 movdqa %xmm11,%xmm7
572 por %xmm9,%xmm8
573 pslld $30,%xmm7
574 paddd %xmm6,%xmm14
575
576 psrld $2,%xmm11
577 paddd %xmm8,%xmm14
578 por %xmm5,%xmm1
579 por %xmm7,%xmm11
580 pxor %xmm4,%xmm2
581 movdqa 48-128(%rax),%xmm4
582
583 movdqa %xmm14,%xmm8
584 pxor 144-128(%rax),%xmm2
585 paddd %xmm15,%xmm13
586 movdqa %xmm10,%xmm7
587 pslld $5,%xmm8
588 pxor %xmm4,%xmm2
589 movdqa %xmm10,%xmm6
590 pandn %xmm12,%xmm7
591 movdqa %xmm2,%xmm5
592 pand %xmm11,%xmm6
593 movdqa %xmm14,%xmm9
594 psrld $31,%xmm5
595 paddd %xmm2,%xmm2
596
597 movdqa %xmm1,0-128(%rax)
598 paddd %xmm1,%xmm13
599 psrld $27,%xmm9
600 pxor %xmm7,%xmm6
601
602 movdqa %xmm10,%xmm7
603 por %xmm9,%xmm8
604 pslld $30,%xmm7
605 paddd %xmm6,%xmm13
606
607 psrld $2,%xmm10
608 paddd %xmm8,%xmm13
609 por %xmm5,%xmm2
610 por %xmm7,%xmm10
611 pxor %xmm0,%xmm3
612 movdqa 64-128(%rax),%xmm0
613
614 movdqa %xmm13,%xmm8
615 pxor 160-128(%rax),%xmm3
616 paddd %xmm15,%xmm12
617 movdqa %xmm14,%xmm7
618 pslld $5,%xmm8
619 pxor %xmm0,%xmm3
620 movdqa %xmm14,%xmm6
621 pandn %xmm11,%xmm7
622 movdqa %xmm3,%xmm5
623 pand %xmm10,%xmm6
624 movdqa %xmm13,%xmm9
625 psrld $31,%xmm5
626 paddd %xmm3,%xmm3
627
628 movdqa %xmm2,16-128(%rax)
629 paddd %xmm2,%xmm12
630 psrld $27,%xmm9
631 pxor %xmm7,%xmm6
632
633 movdqa %xmm14,%xmm7
634 por %xmm9,%xmm8
635 pslld $30,%xmm7
636 paddd %xmm6,%xmm12
637
638 psrld $2,%xmm14
639 paddd %xmm8,%xmm12
640 por %xmm5,%xmm3
641 por %xmm7,%xmm14
642 pxor %xmm1,%xmm4
643 movdqa 80-128(%rax),%xmm1
644
645 movdqa %xmm12,%xmm8
646 pxor 176-128(%rax),%xmm4
647 paddd %xmm15,%xmm11
648 movdqa %xmm13,%xmm7
649 pslld $5,%xmm8
650 pxor %xmm1,%xmm4
651 movdqa %xmm13,%xmm6
652 pandn %xmm10,%xmm7
653 movdqa %xmm4,%xmm5
654 pand %xmm14,%xmm6
655 movdqa %xmm12,%xmm9
656 psrld $31,%xmm5
657 paddd %xmm4,%xmm4
658
659 movdqa %xmm3,32-128(%rax)
660 paddd %xmm3,%xmm11
661 psrld $27,%xmm9
662 pxor %xmm7,%xmm6
663
664 movdqa %xmm13,%xmm7
665 por %xmm9,%xmm8
666 pslld $30,%xmm7
667 paddd %xmm6,%xmm11
668
669 psrld $2,%xmm13
670 paddd %xmm8,%xmm11
671 por %xmm5,%xmm4
672 por %xmm7,%xmm13
673 pxor %xmm2,%xmm0
674 movdqa 96-128(%rax),%xmm2
675
676 movdqa %xmm11,%xmm8
677 pxor 192-128(%rax),%xmm0
678 paddd %xmm15,%xmm10
679 movdqa %xmm12,%xmm7
680 pslld $5,%xmm8
681 pxor %xmm2,%xmm0
682 movdqa %xmm12,%xmm6
683 pandn %xmm14,%xmm7
684 movdqa %xmm0,%xmm5
685 pand %xmm13,%xmm6
686 movdqa %xmm11,%xmm9
687 psrld $31,%xmm5
688 paddd %xmm0,%xmm0
689
690 movdqa %xmm4,48-128(%rax)
691 paddd %xmm4,%xmm10
692 psrld $27,%xmm9
693 pxor %xmm7,%xmm6
694
695 movdqa %xmm12,%xmm7
696 por %xmm9,%xmm8
697 pslld $30,%xmm7
698 paddd %xmm6,%xmm10
699
700 psrld $2,%xmm12
701 paddd %xmm8,%xmm10
702 por %xmm5,%xmm0
703 por %xmm7,%xmm12
704 movdqa 0(%rbp),%xmm15
705 pxor %xmm3,%xmm1
706 movdqa 112-128(%rax),%xmm3
707
708 movdqa %xmm10,%xmm8
709 movdqa %xmm13,%xmm6
710 pxor 208-128(%rax),%xmm1
711 paddd %xmm15,%xmm14
712 pslld $5,%xmm8
713 pxor %xmm11,%xmm6
714
715 movdqa %xmm10,%xmm9
716 movdqa %xmm0,64-128(%rax)
717 paddd %xmm0,%xmm14
718 pxor %xmm3,%xmm1
719 psrld $27,%xmm9
720 pxor %xmm12,%xmm6
721 movdqa %xmm11,%xmm7
722
723 pslld $30,%xmm7
724 movdqa %xmm1,%xmm5
725 por %xmm9,%xmm8
726 psrld $31,%xmm5
727 paddd %xmm6,%xmm14
728 paddd %xmm1,%xmm1
729
730 psrld $2,%xmm11
731 paddd %xmm8,%xmm14
732 por %xmm5,%xmm1
733 por %xmm7,%xmm11
734 pxor %xmm4,%xmm2
735 movdqa 128-128(%rax),%xmm4
736
737 movdqa %xmm14,%xmm8
738 movdqa %xmm12,%xmm6
739 pxor 224-128(%rax),%xmm2
740 paddd %xmm15,%xmm13
741 pslld $5,%xmm8
742 pxor %xmm10,%xmm6
743
744 movdqa %xmm14,%xmm9
745 movdqa %xmm1,80-128(%rax)
746 paddd %xmm1,%xmm13
747 pxor %xmm4,%xmm2
748 psrld $27,%xmm9
749 pxor %xmm11,%xmm6
750 movdqa %xmm10,%xmm7
751
752 pslld $30,%xmm7
753 movdqa %xmm2,%xmm5
754 por %xmm9,%xmm8
755 psrld $31,%xmm5
756 paddd %xmm6,%xmm13
757 paddd %xmm2,%xmm2
758
759 psrld $2,%xmm10
760 paddd %xmm8,%xmm13
761 por %xmm5,%xmm2
762 por %xmm7,%xmm10
763 pxor %xmm0,%xmm3
764 movdqa 144-128(%rax),%xmm0
765
766 movdqa %xmm13,%xmm8
767 movdqa %xmm11,%xmm6
768 pxor 240-128(%rax),%xmm3
769 paddd %xmm15,%xmm12
770 pslld $5,%xmm8
771 pxor %xmm14,%xmm6
772
773 movdqa %xmm13,%xmm9
774 movdqa %xmm2,96-128(%rax)
775 paddd %xmm2,%xmm12
776 pxor %xmm0,%xmm3
777 psrld $27,%xmm9
778 pxor %xmm10,%xmm6
779 movdqa %xmm14,%xmm7
780
781 pslld $30,%xmm7
782 movdqa %xmm3,%xmm5
783 por %xmm9,%xmm8
784 psrld $31,%xmm5
785 paddd %xmm6,%xmm12
786 paddd %xmm3,%xmm3
787
788 psrld $2,%xmm14
789 paddd %xmm8,%xmm12
790 por %xmm5,%xmm3
791 por %xmm7,%xmm14
792 pxor %xmm1,%xmm4
793 movdqa 160-128(%rax),%xmm1
794
795 movdqa %xmm12,%xmm8
796 movdqa %xmm10,%xmm6
797 pxor 0-128(%rax),%xmm4
798 paddd %xmm15,%xmm11
799 pslld $5,%xmm8
800 pxor %xmm13,%xmm6
801
802 movdqa %xmm12,%xmm9
803 movdqa %xmm3,112-128(%rax)
804 paddd %xmm3,%xmm11
805 pxor %xmm1,%xmm4
806 psrld $27,%xmm9
807 pxor %xmm14,%xmm6
808 movdqa %xmm13,%xmm7
809
810 pslld $30,%xmm7
811 movdqa %xmm4,%xmm5
812 por %xmm9,%xmm8
813 psrld $31,%xmm5
814 paddd %xmm6,%xmm11
815 paddd %xmm4,%xmm4
816
817 psrld $2,%xmm13
818 paddd %xmm8,%xmm11
819 por %xmm5,%xmm4
820 por %xmm7,%xmm13
821 pxor %xmm2,%xmm0
822 movdqa 176-128(%rax),%xmm2
823
824 movdqa %xmm11,%xmm8
825 movdqa %xmm14,%xmm6
826 pxor 16-128(%rax),%xmm0
827 paddd %xmm15,%xmm10
828 pslld $5,%xmm8
829 pxor %xmm12,%xmm6
830
831 movdqa %xmm11,%xmm9
832 movdqa %xmm4,128-128(%rax)
833 paddd %xmm4,%xmm10
834 pxor %xmm2,%xmm0
835 psrld $27,%xmm9
836 pxor %xmm13,%xmm6
837 movdqa %xmm12,%xmm7
838
839 pslld $30,%xmm7
840 movdqa %xmm0,%xmm5
841 por %xmm9,%xmm8
842 psrld $31,%xmm5
843 paddd %xmm6,%xmm10
844 paddd %xmm0,%xmm0
845
846 psrld $2,%xmm12
847 paddd %xmm8,%xmm10
848 por %xmm5,%xmm0
849 por %xmm7,%xmm12
850 pxor %xmm3,%xmm1
851 movdqa 192-128(%rax),%xmm3
852
853 movdqa %xmm10,%xmm8
854 movdqa %xmm13,%xmm6
855 pxor 32-128(%rax),%xmm1
856 paddd %xmm15,%xmm14
857 pslld $5,%xmm8
858 pxor %xmm11,%xmm6
859
860 movdqa %xmm10,%xmm9
861 movdqa %xmm0,144-128(%rax)
862 paddd %xmm0,%xmm14
863 pxor %xmm3,%xmm1
864 psrld $27,%xmm9
865 pxor %xmm12,%xmm6
866 movdqa %xmm11,%xmm7
867
868 pslld $30,%xmm7
869 movdqa %xmm1,%xmm5
870 por %xmm9,%xmm8
871 psrld $31,%xmm5
872 paddd %xmm6,%xmm14
873 paddd %xmm1,%xmm1
874
875 psrld $2,%xmm11
876 paddd %xmm8,%xmm14
877 por %xmm5,%xmm1
878 por %xmm7,%xmm11
879 pxor %xmm4,%xmm2
880 movdqa 208-128(%rax),%xmm4
881
882 movdqa %xmm14,%xmm8
883 movdqa %xmm12,%xmm6
884 pxor 48-128(%rax),%xmm2
885 paddd %xmm15,%xmm13
886 pslld $5,%xmm8
887 pxor %xmm10,%xmm6
888
889 movdqa %xmm14,%xmm9
890 movdqa %xmm1,160-128(%rax)
891 paddd %xmm1,%xmm13
892 pxor %xmm4,%xmm2
893 psrld $27,%xmm9
894 pxor %xmm11,%xmm6
895 movdqa %xmm10,%xmm7
896
897 pslld $30,%xmm7
898 movdqa %xmm2,%xmm5
899 por %xmm9,%xmm8
900 psrld $31,%xmm5
901 paddd %xmm6,%xmm13
902 paddd %xmm2,%xmm2
903
904 psrld $2,%xmm10
905 paddd %xmm8,%xmm13
906 por %xmm5,%xmm2
907 por %xmm7,%xmm10
908 pxor %xmm0,%xmm3
909 movdqa 224-128(%rax),%xmm0
910
911 movdqa %xmm13,%xmm8
912 movdqa %xmm11,%xmm6
913 pxor 64-128(%rax),%xmm3
914 paddd %xmm15,%xmm12
915 pslld $5,%xmm8
916 pxor %xmm14,%xmm6
917
918 movdqa %xmm13,%xmm9
919 movdqa %xmm2,176-128(%rax)
920 paddd %xmm2,%xmm12
921 pxor %xmm0,%xmm3
922 psrld $27,%xmm9
923 pxor %xmm10,%xmm6
924 movdqa %xmm14,%xmm7
925
926 pslld $30,%xmm7
927 movdqa %xmm3,%xmm5
928 por %xmm9,%xmm8
929 psrld $31,%xmm5
930 paddd %xmm6,%xmm12
931 paddd %xmm3,%xmm3
932
933 psrld $2,%xmm14
934 paddd %xmm8,%xmm12
935 por %xmm5,%xmm3
936 por %xmm7,%xmm14
937 pxor %xmm1,%xmm4
938 movdqa 240-128(%rax),%xmm1
939
940 movdqa %xmm12,%xmm8
941 movdqa %xmm10,%xmm6
942 pxor 80-128(%rax),%xmm4
943 paddd %xmm15,%xmm11
944 pslld $5,%xmm8
945 pxor %xmm13,%xmm6
946
947 movdqa %xmm12,%xmm9
948 movdqa %xmm3,192-128(%rax)
949 paddd %xmm3,%xmm11
950 pxor %xmm1,%xmm4
951 psrld $27,%xmm9
952 pxor %xmm14,%xmm6
953 movdqa %xmm13,%xmm7
954
955 pslld $30,%xmm7
956 movdqa %xmm4,%xmm5
957 por %xmm9,%xmm8
958 psrld $31,%xmm5
959 paddd %xmm6,%xmm11
960 paddd %xmm4,%xmm4
961
962 psrld $2,%xmm13
963 paddd %xmm8,%xmm11
964 por %xmm5,%xmm4
965 por %xmm7,%xmm13
966 pxor %xmm2,%xmm0
967 movdqa 0-128(%rax),%xmm2
968
969 movdqa %xmm11,%xmm8
970 movdqa %xmm14,%xmm6
971 pxor 96-128(%rax),%xmm0
972 paddd %xmm15,%xmm10
973 pslld $5,%xmm8
974 pxor %xmm12,%xmm6
975
976 movdqa %xmm11,%xmm9
977 movdqa %xmm4,208-128(%rax)
978 paddd %xmm4,%xmm10
979 pxor %xmm2,%xmm0
980 psrld $27,%xmm9
981 pxor %xmm13,%xmm6
982 movdqa %xmm12,%xmm7
983
984 pslld $30,%xmm7
985 movdqa %xmm0,%xmm5
986 por %xmm9,%xmm8
987 psrld $31,%xmm5
988 paddd %xmm6,%xmm10
989 paddd %xmm0,%xmm0
990
991 psrld $2,%xmm12
992 paddd %xmm8,%xmm10
993 por %xmm5,%xmm0
994 por %xmm7,%xmm12
995 pxor %xmm3,%xmm1
996 movdqa 16-128(%rax),%xmm3
997
998 movdqa %xmm10,%xmm8
999 movdqa %xmm13,%xmm6
1000 pxor 112-128(%rax),%xmm1
1001 paddd %xmm15,%xmm14
1002 pslld $5,%xmm8
1003 pxor %xmm11,%xmm6
1004
1005 movdqa %xmm10,%xmm9
1006 movdqa %xmm0,224-128(%rax)
1007 paddd %xmm0,%xmm14
1008 pxor %xmm3,%xmm1
1009 psrld $27,%xmm9
1010 pxor %xmm12,%xmm6
1011 movdqa %xmm11,%xmm7
1012
1013 pslld $30,%xmm7
1014 movdqa %xmm1,%xmm5
1015 por %xmm9,%xmm8
1016 psrld $31,%xmm5
1017 paddd %xmm6,%xmm14
1018 paddd %xmm1,%xmm1
1019
1020 psrld $2,%xmm11
1021 paddd %xmm8,%xmm14
1022 por %xmm5,%xmm1
1023 por %xmm7,%xmm11
1024 pxor %xmm4,%xmm2
1025 movdqa 32-128(%rax),%xmm4
1026
1027 movdqa %xmm14,%xmm8
1028 movdqa %xmm12,%xmm6
1029 pxor 128-128(%rax),%xmm2
1030 paddd %xmm15,%xmm13
1031 pslld $5,%xmm8
1032 pxor %xmm10,%xmm6
1033
1034 movdqa %xmm14,%xmm9
1035 movdqa %xmm1,240-128(%rax)
1036 paddd %xmm1,%xmm13
1037 pxor %xmm4,%xmm2
1038 psrld $27,%xmm9
1039 pxor %xmm11,%xmm6
1040 movdqa %xmm10,%xmm7
1041
1042 pslld $30,%xmm7
1043 movdqa %xmm2,%xmm5
1044 por %xmm9,%xmm8
1045 psrld $31,%xmm5
1046 paddd %xmm6,%xmm13
1047 paddd %xmm2,%xmm2
1048
1049 psrld $2,%xmm10
1050 paddd %xmm8,%xmm13
1051 por %xmm5,%xmm2
1052 por %xmm7,%xmm10
1053 pxor %xmm0,%xmm3
1054 movdqa 48-128(%rax),%xmm0
1055
1056 movdqa %xmm13,%xmm8
1057 movdqa %xmm11,%xmm6
1058 pxor 144-128(%rax),%xmm3
1059 paddd %xmm15,%xmm12
1060 pslld $5,%xmm8
1061 pxor %xmm14,%xmm6
1062
1063 movdqa %xmm13,%xmm9
1064 movdqa %xmm2,0-128(%rax)
1065 paddd %xmm2,%xmm12
1066 pxor %xmm0,%xmm3
1067 psrld $27,%xmm9
1068 pxor %xmm10,%xmm6
1069 movdqa %xmm14,%xmm7
1070
1071 pslld $30,%xmm7
1072 movdqa %xmm3,%xmm5
1073 por %xmm9,%xmm8
1074 psrld $31,%xmm5
1075 paddd %xmm6,%xmm12
1076 paddd %xmm3,%xmm3
1077
1078 psrld $2,%xmm14
1079 paddd %xmm8,%xmm12
1080 por %xmm5,%xmm3
1081 por %xmm7,%xmm14
1082 pxor %xmm1,%xmm4
1083 movdqa 64-128(%rax),%xmm1
1084
1085 movdqa %xmm12,%xmm8
1086 movdqa %xmm10,%xmm6
1087 pxor 160-128(%rax),%xmm4
1088 paddd %xmm15,%xmm11
1089 pslld $5,%xmm8
1090 pxor %xmm13,%xmm6
1091
1092 movdqa %xmm12,%xmm9
1093 movdqa %xmm3,16-128(%rax)
1094 paddd %xmm3,%xmm11
1095 pxor %xmm1,%xmm4
1096 psrld $27,%xmm9
1097 pxor %xmm14,%xmm6
1098 movdqa %xmm13,%xmm7
1099
1100 pslld $30,%xmm7
1101 movdqa %xmm4,%xmm5
1102 por %xmm9,%xmm8
1103 psrld $31,%xmm5
1104 paddd %xmm6,%xmm11
1105 paddd %xmm4,%xmm4
1106
1107 psrld $2,%xmm13
1108 paddd %xmm8,%xmm11
1109 por %xmm5,%xmm4
1110 por %xmm7,%xmm13
1111 pxor %xmm2,%xmm0
1112 movdqa 80-128(%rax),%xmm2
1113
1114 movdqa %xmm11,%xmm8
1115 movdqa %xmm14,%xmm6
1116 pxor 176-128(%rax),%xmm0
1117 paddd %xmm15,%xmm10
1118 pslld $5,%xmm8
1119 pxor %xmm12,%xmm6
1120
1121 movdqa %xmm11,%xmm9
1122 movdqa %xmm4,32-128(%rax)
1123 paddd %xmm4,%xmm10
1124 pxor %xmm2,%xmm0
1125 psrld $27,%xmm9
1126 pxor %xmm13,%xmm6
1127 movdqa %xmm12,%xmm7
1128
1129 pslld $30,%xmm7
1130 movdqa %xmm0,%xmm5
1131 por %xmm9,%xmm8
1132 psrld $31,%xmm5
1133 paddd %xmm6,%xmm10
1134 paddd %xmm0,%xmm0
1135
1136 psrld $2,%xmm12
1137 paddd %xmm8,%xmm10
1138 por %xmm5,%xmm0
1139 por %xmm7,%xmm12
1140 pxor %xmm3,%xmm1
1141 movdqa 96-128(%rax),%xmm3
1142
1143 movdqa %xmm10,%xmm8
1144 movdqa %xmm13,%xmm6
1145 pxor 192-128(%rax),%xmm1
1146 paddd %xmm15,%xmm14
1147 pslld $5,%xmm8
1148 pxor %xmm11,%xmm6
1149
1150 movdqa %xmm10,%xmm9
1151 movdqa %xmm0,48-128(%rax)
1152 paddd %xmm0,%xmm14
1153 pxor %xmm3,%xmm1
1154 psrld $27,%xmm9
1155 pxor %xmm12,%xmm6
1156 movdqa %xmm11,%xmm7
1157
1158 pslld $30,%xmm7
1159 movdqa %xmm1,%xmm5
1160 por %xmm9,%xmm8
1161 psrld $31,%xmm5
1162 paddd %xmm6,%xmm14
1163 paddd %xmm1,%xmm1
1164
1165 psrld $2,%xmm11
1166 paddd %xmm8,%xmm14
1167 por %xmm5,%xmm1
1168 por %xmm7,%xmm11
1169 pxor %xmm4,%xmm2
1170 movdqa 112-128(%rax),%xmm4
1171
1172 movdqa %xmm14,%xmm8
1173 movdqa %xmm12,%xmm6
1174 pxor 208-128(%rax),%xmm2
1175 paddd %xmm15,%xmm13
1176 pslld $5,%xmm8
1177 pxor %xmm10,%xmm6
1178
1179 movdqa %xmm14,%xmm9
1180 movdqa %xmm1,64-128(%rax)
1181 paddd %xmm1,%xmm13
1182 pxor %xmm4,%xmm2
1183 psrld $27,%xmm9
1184 pxor %xmm11,%xmm6
1185 movdqa %xmm10,%xmm7
1186
1187 pslld $30,%xmm7
1188 movdqa %xmm2,%xmm5
1189 por %xmm9,%xmm8
1190 psrld $31,%xmm5
1191 paddd %xmm6,%xmm13
1192 paddd %xmm2,%xmm2
1193
1194 psrld $2,%xmm10
1195 paddd %xmm8,%xmm13
1196 por %xmm5,%xmm2
1197 por %xmm7,%xmm10
1198 pxor %xmm0,%xmm3
1199 movdqa 128-128(%rax),%xmm0
1200
1201 movdqa %xmm13,%xmm8
1202 movdqa %xmm11,%xmm6
1203 pxor 224-128(%rax),%xmm3
1204 paddd %xmm15,%xmm12
1205 pslld $5,%xmm8
1206 pxor %xmm14,%xmm6
1207
1208 movdqa %xmm13,%xmm9
1209 movdqa %xmm2,80-128(%rax)
1210 paddd %xmm2,%xmm12
1211 pxor %xmm0,%xmm3
1212 psrld $27,%xmm9
1213 pxor %xmm10,%xmm6
1214 movdqa %xmm14,%xmm7
1215
1216 pslld $30,%xmm7
1217 movdqa %xmm3,%xmm5
1218 por %xmm9,%xmm8
1219 psrld $31,%xmm5
1220 paddd %xmm6,%xmm12
1221 paddd %xmm3,%xmm3
1222
1223 psrld $2,%xmm14
1224 paddd %xmm8,%xmm12
1225 por %xmm5,%xmm3
1226 por %xmm7,%xmm14
1227 pxor %xmm1,%xmm4
1228 movdqa 144-128(%rax),%xmm1
1229
1230 movdqa %xmm12,%xmm8
1231 movdqa %xmm10,%xmm6
1232 pxor 240-128(%rax),%xmm4
1233 paddd %xmm15,%xmm11
1234 pslld $5,%xmm8
1235 pxor %xmm13,%xmm6
1236
1237 movdqa %xmm12,%xmm9
1238 movdqa %xmm3,96-128(%rax)
1239 paddd %xmm3,%xmm11
1240 pxor %xmm1,%xmm4
1241 psrld $27,%xmm9
1242 pxor %xmm14,%xmm6
1243 movdqa %xmm13,%xmm7
1244
1245 pslld $30,%xmm7
1246 movdqa %xmm4,%xmm5
1247 por %xmm9,%xmm8
1248 psrld $31,%xmm5
1249 paddd %xmm6,%xmm11
1250 paddd %xmm4,%xmm4
1251
1252 psrld $2,%xmm13
1253 paddd %xmm8,%xmm11
1254 por %xmm5,%xmm4
1255 por %xmm7,%xmm13
1256 pxor %xmm2,%xmm0
1257 movdqa 160-128(%rax),%xmm2
1258
1259 movdqa %xmm11,%xmm8
1260 movdqa %xmm14,%xmm6
1261 pxor 0-128(%rax),%xmm0
1262 paddd %xmm15,%xmm10
1263 pslld $5,%xmm8
1264 pxor %xmm12,%xmm6
1265
1266 movdqa %xmm11,%xmm9
1267 movdqa %xmm4,112-128(%rax)
1268 paddd %xmm4,%xmm10
1269 pxor %xmm2,%xmm0
1270 psrld $27,%xmm9
1271 pxor %xmm13,%xmm6
1272 movdqa %xmm12,%xmm7
1273
1274 pslld $30,%xmm7
1275 movdqa %xmm0,%xmm5
1276 por %xmm9,%xmm8
1277 psrld $31,%xmm5
1278 paddd %xmm6,%xmm10
1279 paddd %xmm0,%xmm0
1280
1281 psrld $2,%xmm12
1282 paddd %xmm8,%xmm10
1283 por %xmm5,%xmm0
1284 por %xmm7,%xmm12
1285 movdqa 32(%rbp),%xmm15
1286 pxor %xmm3,%xmm1
1287 movdqa 176-128(%rax),%xmm3
1288
1289 movdqa %xmm10,%xmm8
1290 movdqa %xmm13,%xmm7
1291 pxor 16-128(%rax),%xmm1
1292 pxor %xmm3,%xmm1
1293 paddd %xmm15,%xmm14
1294 pslld $5,%xmm8
1295 movdqa %xmm10,%xmm9
1296 pand %xmm12,%xmm7
1297
1298 movdqa %xmm13,%xmm6
1299 movdqa %xmm1,%xmm5
1300 psrld $27,%xmm9
1301 paddd %xmm7,%xmm14
1302 pxor %xmm12,%xmm6
1303
1304 movdqa %xmm0,128-128(%rax)
1305 paddd %xmm0,%xmm14
1306 por %xmm9,%xmm8
1307 psrld $31,%xmm5
1308 pand %xmm11,%xmm6
1309 movdqa %xmm11,%xmm7
1310
1311 pslld $30,%xmm7
1312 paddd %xmm1,%xmm1
1313 paddd %xmm6,%xmm14
1314
1315 psrld $2,%xmm11
1316 paddd %xmm8,%xmm14
1317 por %xmm5,%xmm1
1318 por %xmm7,%xmm11
1319 pxor %xmm4,%xmm2
1320 movdqa 192-128(%rax),%xmm4
1321
1322 movdqa %xmm14,%xmm8
1323 movdqa %xmm12,%xmm7
1324 pxor 32-128(%rax),%xmm2
1325 pxor %xmm4,%xmm2
1326 paddd %xmm15,%xmm13
1327 pslld $5,%xmm8
1328 movdqa %xmm14,%xmm9
1329 pand %xmm11,%xmm7
1330
1331 movdqa %xmm12,%xmm6
1332 movdqa %xmm2,%xmm5
1333 psrld $27,%xmm9
1334 paddd %xmm7,%xmm13
1335 pxor %xmm11,%xmm6
1336
1337 movdqa %xmm1,144-128(%rax)
1338 paddd %xmm1,%xmm13
1339 por %xmm9,%xmm8
1340 psrld $31,%xmm5
1341 pand %xmm10,%xmm6
1342 movdqa %xmm10,%xmm7
1343
1344 pslld $30,%xmm7
1345 paddd %xmm2,%xmm2
1346 paddd %xmm6,%xmm13
1347
1348 psrld $2,%xmm10
1349 paddd %xmm8,%xmm13
1350 por %xmm5,%xmm2
1351 por %xmm7,%xmm10
1352 pxor %xmm0,%xmm3
1353 movdqa 208-128(%rax),%xmm0
1354
1355 movdqa %xmm13,%xmm8
1356 movdqa %xmm11,%xmm7
1357 pxor 48-128(%rax),%xmm3
1358 pxor %xmm0,%xmm3
1359 paddd %xmm15,%xmm12
1360 pslld $5,%xmm8
1361 movdqa %xmm13,%xmm9
1362 pand %xmm10,%xmm7
1363
1364 movdqa %xmm11,%xmm6
1365 movdqa %xmm3,%xmm5
1366 psrld $27,%xmm9
1367 paddd %xmm7,%xmm12
1368 pxor %xmm10,%xmm6
1369
1370 movdqa %xmm2,160-128(%rax)
1371 paddd %xmm2,%xmm12
1372 por %xmm9,%xmm8
1373 psrld $31,%xmm5
1374 pand %xmm14,%xmm6
1375 movdqa %xmm14,%xmm7
1376
1377 pslld $30,%xmm7
1378 paddd %xmm3,%xmm3
1379 paddd %xmm6,%xmm12
1380
1381 psrld $2,%xmm14
1382 paddd %xmm8,%xmm12
1383 por %xmm5,%xmm3
1384 por %xmm7,%xmm14
1385 pxor %xmm1,%xmm4
1386 movdqa 224-128(%rax),%xmm1
1387
1388 movdqa %xmm12,%xmm8
1389 movdqa %xmm10,%xmm7
1390 pxor 64-128(%rax),%xmm4
1391 pxor %xmm1,%xmm4
1392 paddd %xmm15,%xmm11
1393 pslld $5,%xmm8
1394 movdqa %xmm12,%xmm9
1395 pand %xmm14,%xmm7
1396
1397 movdqa %xmm10,%xmm6
1398 movdqa %xmm4,%xmm5
1399 psrld $27,%xmm9
1400 paddd %xmm7,%xmm11
1401 pxor %xmm14,%xmm6
1402
1403 movdqa %xmm3,176-128(%rax)
1404 paddd %xmm3,%xmm11
1405 por %xmm9,%xmm8
1406 psrld $31,%xmm5
1407 pand %xmm13,%xmm6
1408 movdqa %xmm13,%xmm7
1409
1410 pslld $30,%xmm7
1411 paddd %xmm4,%xmm4
1412 paddd %xmm6,%xmm11
1413
1414 psrld $2,%xmm13
1415 paddd %xmm8,%xmm11
1416 por %xmm5,%xmm4
1417 por %xmm7,%xmm13
1418 pxor %xmm2,%xmm0
1419 movdqa 240-128(%rax),%xmm2
1420
1421 movdqa %xmm11,%xmm8
1422 movdqa %xmm14,%xmm7
1423 pxor 80-128(%rax),%xmm0
1424 pxor %xmm2,%xmm0
1425 paddd %xmm15,%xmm10
1426 pslld $5,%xmm8
1427 movdqa %xmm11,%xmm9
1428 pand %xmm13,%xmm7
1429
1430 movdqa %xmm14,%xmm6
1431 movdqa %xmm0,%xmm5
1432 psrld $27,%xmm9
1433 paddd %xmm7,%xmm10
1434 pxor %xmm13,%xmm6
1435
1436 movdqa %xmm4,192-128(%rax)
1437 paddd %xmm4,%xmm10
1438 por %xmm9,%xmm8
1439 psrld $31,%xmm5
1440 pand %xmm12,%xmm6
1441 movdqa %xmm12,%xmm7
1442
1443 pslld $30,%xmm7
1444 paddd %xmm0,%xmm0
1445 paddd %xmm6,%xmm10
1446
1447 psrld $2,%xmm12
1448 paddd %xmm8,%xmm10
1449 por %xmm5,%xmm0
1450 por %xmm7,%xmm12
1451 pxor %xmm3,%xmm1
1452 movdqa 0-128(%rax),%xmm3
1453
1454 movdqa %xmm10,%xmm8
1455 movdqa %xmm13,%xmm7
1456 pxor 96-128(%rax),%xmm1
1457 pxor %xmm3,%xmm1
1458 paddd %xmm15,%xmm14
1459 pslld $5,%xmm8
1460 movdqa %xmm10,%xmm9
1461 pand %xmm12,%xmm7
1462
1463 movdqa %xmm13,%xmm6
1464 movdqa %xmm1,%xmm5
1465 psrld $27,%xmm9
1466 paddd %xmm7,%xmm14
1467 pxor %xmm12,%xmm6
1468
1469 movdqa %xmm0,208-128(%rax)
1470 paddd %xmm0,%xmm14
1471 por %xmm9,%xmm8
1472 psrld $31,%xmm5
1473 pand %xmm11,%xmm6
1474 movdqa %xmm11,%xmm7
1475
1476 pslld $30,%xmm7
1477 paddd %xmm1,%xmm1
1478 paddd %xmm6,%xmm14
1479
1480 psrld $2,%xmm11
1481 paddd %xmm8,%xmm14
1482 por %xmm5,%xmm1
1483 por %xmm7,%xmm11
1484 pxor %xmm4,%xmm2
1485 movdqa 16-128(%rax),%xmm4
1486
1487 movdqa %xmm14,%xmm8
1488 movdqa %xmm12,%xmm7
1489 pxor 112-128(%rax),%xmm2
1490 pxor %xmm4,%xmm2
1491 paddd %xmm15,%xmm13
1492 pslld $5,%xmm8
1493 movdqa %xmm14,%xmm9
1494 pand %xmm11,%xmm7
1495
1496 movdqa %xmm12,%xmm6
1497 movdqa %xmm2,%xmm5
1498 psrld $27,%xmm9
1499 paddd %xmm7,%xmm13
1500 pxor %xmm11,%xmm6
1501
1502 movdqa %xmm1,224-128(%rax)
1503 paddd %xmm1,%xmm13
1504 por %xmm9,%xmm8
1505 psrld $31,%xmm5
1506 pand %xmm10,%xmm6
1507 movdqa %xmm10,%xmm7
1508
1509 pslld $30,%xmm7
1510 paddd %xmm2,%xmm2
1511 paddd %xmm6,%xmm13
1512
1513 psrld $2,%xmm10
1514 paddd %xmm8,%xmm13
1515 por %xmm5,%xmm2
1516 por %xmm7,%xmm10
1517 pxor %xmm0,%xmm3
1518 movdqa 32-128(%rax),%xmm0
1519
1520 movdqa %xmm13,%xmm8
1521 movdqa %xmm11,%xmm7
1522 pxor 128-128(%rax),%xmm3
1523 pxor %xmm0,%xmm3
1524 paddd %xmm15,%xmm12
1525 pslld $5,%xmm8
1526 movdqa %xmm13,%xmm9
1527 pand %xmm10,%xmm7
1528
1529 movdqa %xmm11,%xmm6
1530 movdqa %xmm3,%xmm5
1531 psrld $27,%xmm9
1532 paddd %xmm7,%xmm12
1533 pxor %xmm10,%xmm6
1534
1535 movdqa %xmm2,240-128(%rax)
1536 paddd %xmm2,%xmm12
1537 por %xmm9,%xmm8
1538 psrld $31,%xmm5
1539 pand %xmm14,%xmm6
1540 movdqa %xmm14,%xmm7
1541
1542 pslld $30,%xmm7
1543 paddd %xmm3,%xmm3
1544 paddd %xmm6,%xmm12
1545
1546 psrld $2,%xmm14
1547 paddd %xmm8,%xmm12
1548 por %xmm5,%xmm3
1549 por %xmm7,%xmm14
1550 pxor %xmm1,%xmm4
1551 movdqa 48-128(%rax),%xmm1
1552
1553 movdqa %xmm12,%xmm8
1554 movdqa %xmm10,%xmm7
1555 pxor 144-128(%rax),%xmm4
1556 pxor %xmm1,%xmm4
1557 paddd %xmm15,%xmm11
1558 pslld $5,%xmm8
1559 movdqa %xmm12,%xmm9
1560 pand %xmm14,%xmm7
1561
1562 movdqa %xmm10,%xmm6
1563 movdqa %xmm4,%xmm5
1564 psrld $27,%xmm9
1565 paddd %xmm7,%xmm11
1566 pxor %xmm14,%xmm6
1567
1568 movdqa %xmm3,0-128(%rax)
1569 paddd %xmm3,%xmm11
1570 por %xmm9,%xmm8
1571 psrld $31,%xmm5
1572 pand %xmm13,%xmm6
1573 movdqa %xmm13,%xmm7
1574
1575 pslld $30,%xmm7
1576 paddd %xmm4,%xmm4
1577 paddd %xmm6,%xmm11
1578
1579 psrld $2,%xmm13
1580 paddd %xmm8,%xmm11
1581 por %xmm5,%xmm4
1582 por %xmm7,%xmm13
1583 pxor %xmm2,%xmm0
1584 movdqa 64-128(%rax),%xmm2
1585
1586 movdqa %xmm11,%xmm8
1587 movdqa %xmm14,%xmm7
1588 pxor 160-128(%rax),%xmm0
1589 pxor %xmm2,%xmm0
1590 paddd %xmm15,%xmm10
1591 pslld $5,%xmm8
1592 movdqa %xmm11,%xmm9
1593 pand %xmm13,%xmm7
1594
1595 movdqa %xmm14,%xmm6
1596 movdqa %xmm0,%xmm5
1597 psrld $27,%xmm9
1598 paddd %xmm7,%xmm10
1599 pxor %xmm13,%xmm6
1600
1601 movdqa %xmm4,16-128(%rax)
1602 paddd %xmm4,%xmm10
1603 por %xmm9,%xmm8
1604 psrld $31,%xmm5
1605 pand %xmm12,%xmm6
1606 movdqa %xmm12,%xmm7
1607
1608 pslld $30,%xmm7
1609 paddd %xmm0,%xmm0
1610 paddd %xmm6,%xmm10
1611
1612 psrld $2,%xmm12
1613 paddd %xmm8,%xmm10
1614 por %xmm5,%xmm0
1615 por %xmm7,%xmm12
1616 pxor %xmm3,%xmm1
1617 movdqa 80-128(%rax),%xmm3
1618
1619 movdqa %xmm10,%xmm8
1620 movdqa %xmm13,%xmm7
1621 pxor 176-128(%rax),%xmm1
1622 pxor %xmm3,%xmm1
1623 paddd %xmm15,%xmm14
1624 pslld $5,%xmm8
1625 movdqa %xmm10,%xmm9
1626 pand %xmm12,%xmm7
1627
1628 movdqa %xmm13,%xmm6
1629 movdqa %xmm1,%xmm5
1630 psrld $27,%xmm9
1631 paddd %xmm7,%xmm14
1632 pxor %xmm12,%xmm6
1633
1634 movdqa %xmm0,32-128(%rax)
1635 paddd %xmm0,%xmm14
1636 por %xmm9,%xmm8
1637 psrld $31,%xmm5
1638 pand %xmm11,%xmm6
1639 movdqa %xmm11,%xmm7
1640
1641 pslld $30,%xmm7
1642 paddd %xmm1,%xmm1
1643 paddd %xmm6,%xmm14
1644
1645 psrld $2,%xmm11
1646 paddd %xmm8,%xmm14
1647 por %xmm5,%xmm1
1648 por %xmm7,%xmm11
1649 pxor %xmm4,%xmm2
1650 movdqa 96-128(%rax),%xmm4
1651
1652 movdqa %xmm14,%xmm8
1653 movdqa %xmm12,%xmm7
1654 pxor 192-128(%rax),%xmm2
1655 pxor %xmm4,%xmm2
1656 paddd %xmm15,%xmm13
1657 pslld $5,%xmm8
1658 movdqa %xmm14,%xmm9
1659 pand %xmm11,%xmm7
1660
1661 movdqa %xmm12,%xmm6
1662 movdqa %xmm2,%xmm5
1663 psrld $27,%xmm9
1664 paddd %xmm7,%xmm13
1665 pxor %xmm11,%xmm6
1666
1667 movdqa %xmm1,48-128(%rax)
1668 paddd %xmm1,%xmm13
1669 por %xmm9,%xmm8
1670 psrld $31,%xmm5
1671 pand %xmm10,%xmm6
1672 movdqa %xmm10,%xmm7
1673
1674 pslld $30,%xmm7
1675 paddd %xmm2,%xmm2
1676 paddd %xmm6,%xmm13
1677
1678 psrld $2,%xmm10
1679 paddd %xmm8,%xmm13
1680 por %xmm5,%xmm2
1681 por %xmm7,%xmm10
1682 pxor %xmm0,%xmm3
1683 movdqa 112-128(%rax),%xmm0
1684
1685 movdqa %xmm13,%xmm8
1686 movdqa %xmm11,%xmm7
1687 pxor 208-128(%rax),%xmm3
1688 pxor %xmm0,%xmm3
1689 paddd %xmm15,%xmm12
1690 pslld $5,%xmm8
1691 movdqa %xmm13,%xmm9
1692 pand %xmm10,%xmm7
1693
1694 movdqa %xmm11,%xmm6
1695 movdqa %xmm3,%xmm5
1696 psrld $27,%xmm9
1697 paddd %xmm7,%xmm12
1698 pxor %xmm10,%xmm6
1699
1700 movdqa %xmm2,64-128(%rax)
1701 paddd %xmm2,%xmm12
1702 por %xmm9,%xmm8
1703 psrld $31,%xmm5
1704 pand %xmm14,%xmm6
1705 movdqa %xmm14,%xmm7
1706
1707 pslld $30,%xmm7
1708 paddd %xmm3,%xmm3
1709 paddd %xmm6,%xmm12
1710
1711 psrld $2,%xmm14
1712 paddd %xmm8,%xmm12
1713 por %xmm5,%xmm3
1714 por %xmm7,%xmm14
1715 pxor %xmm1,%xmm4
1716 movdqa 128-128(%rax),%xmm1
1717
1718 movdqa %xmm12,%xmm8
1719 movdqa %xmm10,%xmm7
1720 pxor 224-128(%rax),%xmm4
1721 pxor %xmm1,%xmm4
1722 paddd %xmm15,%xmm11
1723 pslld $5,%xmm8
1724 movdqa %xmm12,%xmm9
1725 pand %xmm14,%xmm7
1726
1727 movdqa %xmm10,%xmm6
1728 movdqa %xmm4,%xmm5
1729 psrld $27,%xmm9
1730 paddd %xmm7,%xmm11
1731 pxor %xmm14,%xmm6
1732
1733 movdqa %xmm3,80-128(%rax)
1734 paddd %xmm3,%xmm11
1735 por %xmm9,%xmm8
1736 psrld $31,%xmm5
1737 pand %xmm13,%xmm6
1738 movdqa %xmm13,%xmm7
1739
1740 pslld $30,%xmm7
1741 paddd %xmm4,%xmm4
1742 paddd %xmm6,%xmm11
1743
1744 psrld $2,%xmm13
1745 paddd %xmm8,%xmm11
1746 por %xmm5,%xmm4
1747 por %xmm7,%xmm13
1748 pxor %xmm2,%xmm0
1749 movdqa 144-128(%rax),%xmm2
1750
1751 movdqa %xmm11,%xmm8
1752 movdqa %xmm14,%xmm7
1753 pxor 240-128(%rax),%xmm0
1754 pxor %xmm2,%xmm0
1755 paddd %xmm15,%xmm10
1756 pslld $5,%xmm8
1757 movdqa %xmm11,%xmm9
1758 pand %xmm13,%xmm7
1759
1760 movdqa %xmm14,%xmm6
1761 movdqa %xmm0,%xmm5
1762 psrld $27,%xmm9
1763 paddd %xmm7,%xmm10
1764 pxor %xmm13,%xmm6
1765
1766 movdqa %xmm4,96-128(%rax)
1767 paddd %xmm4,%xmm10
1768 por %xmm9,%xmm8
1769 psrld $31,%xmm5
1770 pand %xmm12,%xmm6
1771 movdqa %xmm12,%xmm7
1772
1773 pslld $30,%xmm7
1774 paddd %xmm0,%xmm0
1775 paddd %xmm6,%xmm10
1776
1777 psrld $2,%xmm12
1778 paddd %xmm8,%xmm10
1779 por %xmm5,%xmm0
1780 por %xmm7,%xmm12
1781 pxor %xmm3,%xmm1
1782 movdqa 160-128(%rax),%xmm3
1783
1784 movdqa %xmm10,%xmm8
1785 movdqa %xmm13,%xmm7
1786 pxor 0-128(%rax),%xmm1
1787 pxor %xmm3,%xmm1
1788 paddd %xmm15,%xmm14
1789 pslld $5,%xmm8
1790 movdqa %xmm10,%xmm9
1791 pand %xmm12,%xmm7
1792
1793 movdqa %xmm13,%xmm6
1794 movdqa %xmm1,%xmm5
1795 psrld $27,%xmm9
1796 paddd %xmm7,%xmm14
1797 pxor %xmm12,%xmm6
1798
1799 movdqa %xmm0,112-128(%rax)
1800 paddd %xmm0,%xmm14
1801 por %xmm9,%xmm8
1802 psrld $31,%xmm5
1803 pand %xmm11,%xmm6
1804 movdqa %xmm11,%xmm7
1805
1806 pslld $30,%xmm7
1807 paddd %xmm1,%xmm1
1808 paddd %xmm6,%xmm14
1809
1810 psrld $2,%xmm11
1811 paddd %xmm8,%xmm14
1812 por %xmm5,%xmm1
1813 por %xmm7,%xmm11
1814 pxor %xmm4,%xmm2
1815 movdqa 176-128(%rax),%xmm4
1816
1817 movdqa %xmm14,%xmm8
1818 movdqa %xmm12,%xmm7
1819 pxor 16-128(%rax),%xmm2
1820 pxor %xmm4,%xmm2
1821 paddd %xmm15,%xmm13
1822 pslld $5,%xmm8
1823 movdqa %xmm14,%xmm9
1824 pand %xmm11,%xmm7
1825
1826 movdqa %xmm12,%xmm6
1827 movdqa %xmm2,%xmm5
1828 psrld $27,%xmm9
1829 paddd %xmm7,%xmm13
1830 pxor %xmm11,%xmm6
1831
1832 movdqa %xmm1,128-128(%rax)
1833 paddd %xmm1,%xmm13
1834 por %xmm9,%xmm8
1835 psrld $31,%xmm5
1836 pand %xmm10,%xmm6
1837 movdqa %xmm10,%xmm7
1838
1839 pslld $30,%xmm7
1840 paddd %xmm2,%xmm2
1841 paddd %xmm6,%xmm13
1842
1843 psrld $2,%xmm10
1844 paddd %xmm8,%xmm13
1845 por %xmm5,%xmm2
1846 por %xmm7,%xmm10
1847 pxor %xmm0,%xmm3
1848 movdqa 192-128(%rax),%xmm0
1849
1850 movdqa %xmm13,%xmm8
1851 movdqa %xmm11,%xmm7
1852 pxor 32-128(%rax),%xmm3
1853 pxor %xmm0,%xmm3
1854 paddd %xmm15,%xmm12
1855 pslld $5,%xmm8
1856 movdqa %xmm13,%xmm9
1857 pand %xmm10,%xmm7
1858
1859 movdqa %xmm11,%xmm6
1860 movdqa %xmm3,%xmm5
1861 psrld $27,%xmm9
1862 paddd %xmm7,%xmm12
1863 pxor %xmm10,%xmm6
1864
1865 movdqa %xmm2,144-128(%rax)
1866 paddd %xmm2,%xmm12
1867 por %xmm9,%xmm8
1868 psrld $31,%xmm5
1869 pand %xmm14,%xmm6
1870 movdqa %xmm14,%xmm7
1871
1872 pslld $30,%xmm7
1873 paddd %xmm3,%xmm3
1874 paddd %xmm6,%xmm12
1875
1876 psrld $2,%xmm14
1877 paddd %xmm8,%xmm12
1878 por %xmm5,%xmm3
1879 por %xmm7,%xmm14
1880 pxor %xmm1,%xmm4
1881 movdqa 208-128(%rax),%xmm1
1882
1883 movdqa %xmm12,%xmm8
1884 movdqa %xmm10,%xmm7
1885 pxor 48-128(%rax),%xmm4
1886 pxor %xmm1,%xmm4
1887 paddd %xmm15,%xmm11
1888 pslld $5,%xmm8
1889 movdqa %xmm12,%xmm9
1890 pand %xmm14,%xmm7
1891
1892 movdqa %xmm10,%xmm6
1893 movdqa %xmm4,%xmm5
1894 psrld $27,%xmm9
1895 paddd %xmm7,%xmm11
1896 pxor %xmm14,%xmm6
1897
1898 movdqa %xmm3,160-128(%rax)
1899 paddd %xmm3,%xmm11
1900 por %xmm9,%xmm8
1901 psrld $31,%xmm5
1902 pand %xmm13,%xmm6
1903 movdqa %xmm13,%xmm7
1904
1905 pslld $30,%xmm7
1906 paddd %xmm4,%xmm4
1907 paddd %xmm6,%xmm11
1908
1909 psrld $2,%xmm13
1910 paddd %xmm8,%xmm11
1911 por %xmm5,%xmm4
1912 por %xmm7,%xmm13
1913 pxor %xmm2,%xmm0
1914 movdqa 224-128(%rax),%xmm2
1915
1916 movdqa %xmm11,%xmm8
1917 movdqa %xmm14,%xmm7
1918 pxor 64-128(%rax),%xmm0
1919 pxor %xmm2,%xmm0
1920 paddd %xmm15,%xmm10
1921 pslld $5,%xmm8
1922 movdqa %xmm11,%xmm9
1923 pand %xmm13,%xmm7
1924
1925 movdqa %xmm14,%xmm6
1926 movdqa %xmm0,%xmm5
1927 psrld $27,%xmm9
1928 paddd %xmm7,%xmm10
1929 pxor %xmm13,%xmm6
1930
1931 movdqa %xmm4,176-128(%rax)
1932 paddd %xmm4,%xmm10
1933 por %xmm9,%xmm8
1934 psrld $31,%xmm5
1935 pand %xmm12,%xmm6
1936 movdqa %xmm12,%xmm7
1937
1938 pslld $30,%xmm7
1939 paddd %xmm0,%xmm0
1940 paddd %xmm6,%xmm10
1941
1942 psrld $2,%xmm12
1943 paddd %xmm8,%xmm10
1944 por %xmm5,%xmm0
1945 por %xmm7,%xmm12
1946 movdqa 64(%rbp),%xmm15
1947 pxor %xmm3,%xmm1
1948 movdqa 240-128(%rax),%xmm3
1949
1950 movdqa %xmm10,%xmm8
1951 movdqa %xmm13,%xmm6
1952 pxor 80-128(%rax),%xmm1
1953 paddd %xmm15,%xmm14
1954 pslld $5,%xmm8
1955 pxor %xmm11,%xmm6
1956
1957 movdqa %xmm10,%xmm9
1958 movdqa %xmm0,192-128(%rax)
1959 paddd %xmm0,%xmm14
1960 pxor %xmm3,%xmm1
1961 psrld $27,%xmm9
1962 pxor %xmm12,%xmm6
1963 movdqa %xmm11,%xmm7
1964
1965 pslld $30,%xmm7
1966 movdqa %xmm1,%xmm5
1967 por %xmm9,%xmm8
1968 psrld $31,%xmm5
1969 paddd %xmm6,%xmm14
1970 paddd %xmm1,%xmm1
1971
1972 psrld $2,%xmm11
1973 paddd %xmm8,%xmm14
1974 por %xmm5,%xmm1
1975 por %xmm7,%xmm11
1976 pxor %xmm4,%xmm2
1977 movdqa 0-128(%rax),%xmm4
1978
1979 movdqa %xmm14,%xmm8
1980 movdqa %xmm12,%xmm6
1981 pxor 96-128(%rax),%xmm2
1982 paddd %xmm15,%xmm13
1983 pslld $5,%xmm8
1984 pxor %xmm10,%xmm6
1985
1986 movdqa %xmm14,%xmm9
1987 movdqa %xmm1,208-128(%rax)
1988 paddd %xmm1,%xmm13
1989 pxor %xmm4,%xmm2
1990 psrld $27,%xmm9
1991 pxor %xmm11,%xmm6
1992 movdqa %xmm10,%xmm7
1993
1994 pslld $30,%xmm7
1995 movdqa %xmm2,%xmm5
1996 por %xmm9,%xmm8
1997 psrld $31,%xmm5
1998 paddd %xmm6,%xmm13
1999 paddd %xmm2,%xmm2
2000
2001 psrld $2,%xmm10
2002 paddd %xmm8,%xmm13
2003 por %xmm5,%xmm2
2004 por %xmm7,%xmm10
2005 pxor %xmm0,%xmm3
2006 movdqa 16-128(%rax),%xmm0
2007
2008 movdqa %xmm13,%xmm8
2009 movdqa %xmm11,%xmm6
2010 pxor 112-128(%rax),%xmm3
2011 paddd %xmm15,%xmm12
2012 pslld $5,%xmm8
2013 pxor %xmm14,%xmm6
2014
2015 movdqa %xmm13,%xmm9
2016 movdqa %xmm2,224-128(%rax)
2017 paddd %xmm2,%xmm12
2018 pxor %xmm0,%xmm3
2019 psrld $27,%xmm9
2020 pxor %xmm10,%xmm6
2021 movdqa %xmm14,%xmm7
2022
2023 pslld $30,%xmm7
2024 movdqa %xmm3,%xmm5
2025 por %xmm9,%xmm8
2026 psrld $31,%xmm5
2027 paddd %xmm6,%xmm12
2028 paddd %xmm3,%xmm3
2029
2030 psrld $2,%xmm14
2031 paddd %xmm8,%xmm12
2032 por %xmm5,%xmm3
2033 por %xmm7,%xmm14
2034 pxor %xmm1,%xmm4
2035 movdqa 32-128(%rax),%xmm1
2036
2037 movdqa %xmm12,%xmm8
2038 movdqa %xmm10,%xmm6
2039 pxor 128-128(%rax),%xmm4
2040 paddd %xmm15,%xmm11
2041 pslld $5,%xmm8
2042 pxor %xmm13,%xmm6
2043
2044 movdqa %xmm12,%xmm9
2045 movdqa %xmm3,240-128(%rax)
2046 paddd %xmm3,%xmm11
2047 pxor %xmm1,%xmm4
2048 psrld $27,%xmm9
2049 pxor %xmm14,%xmm6
2050 movdqa %xmm13,%xmm7
2051
2052 pslld $30,%xmm7
2053 movdqa %xmm4,%xmm5
2054 por %xmm9,%xmm8
2055 psrld $31,%xmm5
2056 paddd %xmm6,%xmm11
2057 paddd %xmm4,%xmm4
2058
2059 psrld $2,%xmm13
2060 paddd %xmm8,%xmm11
2061 por %xmm5,%xmm4
2062 por %xmm7,%xmm13
2063 pxor %xmm2,%xmm0
2064 movdqa 48-128(%rax),%xmm2
2065
2066 movdqa %xmm11,%xmm8
2067 movdqa %xmm14,%xmm6
2068 pxor 144-128(%rax),%xmm0
2069 paddd %xmm15,%xmm10
2070 pslld $5,%xmm8
2071 pxor %xmm12,%xmm6
2072
2073 movdqa %xmm11,%xmm9
2074 movdqa %xmm4,0-128(%rax)
2075 paddd %xmm4,%xmm10
2076 pxor %xmm2,%xmm0
2077 psrld $27,%xmm9
2078 pxor %xmm13,%xmm6
2079 movdqa %xmm12,%xmm7
2080
2081 pslld $30,%xmm7
2082 movdqa %xmm0,%xmm5
2083 por %xmm9,%xmm8
2084 psrld $31,%xmm5
2085 paddd %xmm6,%xmm10
2086 paddd %xmm0,%xmm0
2087
2088 psrld $2,%xmm12
2089 paddd %xmm8,%xmm10
2090 por %xmm5,%xmm0
2091 por %xmm7,%xmm12
2092 pxor %xmm3,%xmm1
2093 movdqa 64-128(%rax),%xmm3
2094
2095 movdqa %xmm10,%xmm8
2096 movdqa %xmm13,%xmm6
2097 pxor 160-128(%rax),%xmm1
2098 paddd %xmm15,%xmm14
2099 pslld $5,%xmm8
2100 pxor %xmm11,%xmm6
2101
2102 movdqa %xmm10,%xmm9
2103 movdqa %xmm0,16-128(%rax)
2104 paddd %xmm0,%xmm14
2105 pxor %xmm3,%xmm1
2106 psrld $27,%xmm9
2107 pxor %xmm12,%xmm6
2108 movdqa %xmm11,%xmm7
2109
2110 pslld $30,%xmm7
2111 movdqa %xmm1,%xmm5
2112 por %xmm9,%xmm8
2113 psrld $31,%xmm5
2114 paddd %xmm6,%xmm14
2115 paddd %xmm1,%xmm1
2116
2117 psrld $2,%xmm11
2118 paddd %xmm8,%xmm14
2119 por %xmm5,%xmm1
2120 por %xmm7,%xmm11
2121 pxor %xmm4,%xmm2
2122 movdqa 80-128(%rax),%xmm4
2123
2124 movdqa %xmm14,%xmm8
2125 movdqa %xmm12,%xmm6
2126 pxor 176-128(%rax),%xmm2
2127 paddd %xmm15,%xmm13
2128 pslld $5,%xmm8
2129 pxor %xmm10,%xmm6
2130
2131 movdqa %xmm14,%xmm9
2132 movdqa %xmm1,32-128(%rax)
2133 paddd %xmm1,%xmm13
2134 pxor %xmm4,%xmm2
2135 psrld $27,%xmm9
2136 pxor %xmm11,%xmm6
2137 movdqa %xmm10,%xmm7
2138
2139 pslld $30,%xmm7
2140 movdqa %xmm2,%xmm5
2141 por %xmm9,%xmm8
2142 psrld $31,%xmm5
2143 paddd %xmm6,%xmm13
2144 paddd %xmm2,%xmm2
2145
2146 psrld $2,%xmm10
2147 paddd %xmm8,%xmm13
2148 por %xmm5,%xmm2
2149 por %xmm7,%xmm10
2150 pxor %xmm0,%xmm3
2151 movdqa 96-128(%rax),%xmm0
2152
2153 movdqa %xmm13,%xmm8
2154 movdqa %xmm11,%xmm6
2155 pxor 192-128(%rax),%xmm3
2156 paddd %xmm15,%xmm12
2157 pslld $5,%xmm8
2158 pxor %xmm14,%xmm6
2159
2160 movdqa %xmm13,%xmm9
2161 movdqa %xmm2,48-128(%rax)
2162 paddd %xmm2,%xmm12
2163 pxor %xmm0,%xmm3
2164 psrld $27,%xmm9
2165 pxor %xmm10,%xmm6
2166 movdqa %xmm14,%xmm7
2167
2168 pslld $30,%xmm7
2169 movdqa %xmm3,%xmm5
2170 por %xmm9,%xmm8
2171 psrld $31,%xmm5
2172 paddd %xmm6,%xmm12
2173 paddd %xmm3,%xmm3
2174
2175 psrld $2,%xmm14
2176 paddd %xmm8,%xmm12
2177 por %xmm5,%xmm3
2178 por %xmm7,%xmm14
2179 pxor %xmm1,%xmm4
2180 movdqa 112-128(%rax),%xmm1
2181
2182 movdqa %xmm12,%xmm8
2183 movdqa %xmm10,%xmm6
2184 pxor 208-128(%rax),%xmm4
2185 paddd %xmm15,%xmm11
2186 pslld $5,%xmm8
2187 pxor %xmm13,%xmm6
2188
2189 movdqa %xmm12,%xmm9
2190 movdqa %xmm3,64-128(%rax)
2191 paddd %xmm3,%xmm11
2192 pxor %xmm1,%xmm4
2193 psrld $27,%xmm9
2194 pxor %xmm14,%xmm6
2195 movdqa %xmm13,%xmm7
2196
2197 pslld $30,%xmm7
2198 movdqa %xmm4,%xmm5
2199 por %xmm9,%xmm8
2200 psrld $31,%xmm5
2201 paddd %xmm6,%xmm11
2202 paddd %xmm4,%xmm4
2203
2204 psrld $2,%xmm13
2205 paddd %xmm8,%xmm11
2206 por %xmm5,%xmm4
2207 por %xmm7,%xmm13
2208 pxor %xmm2,%xmm0
2209 movdqa 128-128(%rax),%xmm2
2210
2211 movdqa %xmm11,%xmm8
2212 movdqa %xmm14,%xmm6
2213 pxor 224-128(%rax),%xmm0
2214 paddd %xmm15,%xmm10
2215 pslld $5,%xmm8
2216 pxor %xmm12,%xmm6
2217
2218 movdqa %xmm11,%xmm9
2219 movdqa %xmm4,80-128(%rax)
2220 paddd %xmm4,%xmm10
2221 pxor %xmm2,%xmm0
2222 psrld $27,%xmm9
2223 pxor %xmm13,%xmm6
2224 movdqa %xmm12,%xmm7
2225
2226 pslld $30,%xmm7
2227 movdqa %xmm0,%xmm5
2228 por %xmm9,%xmm8
2229 psrld $31,%xmm5
2230 paddd %xmm6,%xmm10
2231 paddd %xmm0,%xmm0
2232
2233 psrld $2,%xmm12
2234 paddd %xmm8,%xmm10
2235 por %xmm5,%xmm0
2236 por %xmm7,%xmm12
2237 pxor %xmm3,%xmm1
2238 movdqa 144-128(%rax),%xmm3
2239
2240 movdqa %xmm10,%xmm8
2241 movdqa %xmm13,%xmm6
2242 pxor 240-128(%rax),%xmm1
2243 paddd %xmm15,%xmm14
2244 pslld $5,%xmm8
2245 pxor %xmm11,%xmm6
2246
2247 movdqa %xmm10,%xmm9
2248 movdqa %xmm0,96-128(%rax)
2249 paddd %xmm0,%xmm14
2250 pxor %xmm3,%xmm1
2251 psrld $27,%xmm9
2252 pxor %xmm12,%xmm6
2253 movdqa %xmm11,%xmm7
2254
2255 pslld $30,%xmm7
2256 movdqa %xmm1,%xmm5
2257 por %xmm9,%xmm8
2258 psrld $31,%xmm5
2259 paddd %xmm6,%xmm14
2260 paddd %xmm1,%xmm1
2261
2262 psrld $2,%xmm11
2263 paddd %xmm8,%xmm14
2264 por %xmm5,%xmm1
2265 por %xmm7,%xmm11
2266 pxor %xmm4,%xmm2
2267 movdqa 160-128(%rax),%xmm4
2268
2269 movdqa %xmm14,%xmm8
2270 movdqa %xmm12,%xmm6
2271 pxor 0-128(%rax),%xmm2
2272 paddd %xmm15,%xmm13
2273 pslld $5,%xmm8
2274 pxor %xmm10,%xmm6
2275
2276 movdqa %xmm14,%xmm9
2277 movdqa %xmm1,112-128(%rax)
2278 paddd %xmm1,%xmm13
2279 pxor %xmm4,%xmm2
2280 psrld $27,%xmm9
2281 pxor %xmm11,%xmm6
2282 movdqa %xmm10,%xmm7
2283
2284 pslld $30,%xmm7
2285 movdqa %xmm2,%xmm5
2286 por %xmm9,%xmm8
2287 psrld $31,%xmm5
2288 paddd %xmm6,%xmm13
2289 paddd %xmm2,%xmm2
2290
2291 psrld $2,%xmm10
2292 paddd %xmm8,%xmm13
2293 por %xmm5,%xmm2
2294 por %xmm7,%xmm10
2295 pxor %xmm0,%xmm3
2296 movdqa 176-128(%rax),%xmm0
2297
2298 movdqa %xmm13,%xmm8
2299 movdqa %xmm11,%xmm6
2300 pxor 16-128(%rax),%xmm3
2301 paddd %xmm15,%xmm12
2302 pslld $5,%xmm8
2303 pxor %xmm14,%xmm6
2304
2305 movdqa %xmm13,%xmm9
2306 paddd %xmm2,%xmm12
2307 pxor %xmm0,%xmm3
2308 psrld $27,%xmm9
2309 pxor %xmm10,%xmm6
2310 movdqa %xmm14,%xmm7
2311
2312 pslld $30,%xmm7
2313 movdqa %xmm3,%xmm5
2314 por %xmm9,%xmm8
2315 psrld $31,%xmm5
2316 paddd %xmm6,%xmm12
2317 paddd %xmm3,%xmm3
2318
2319 psrld $2,%xmm14
2320 paddd %xmm8,%xmm12
2321 por %xmm5,%xmm3
2322 por %xmm7,%xmm14
2323 pxor %xmm1,%xmm4
2324 movdqa 192-128(%rax),%xmm1
2325
2326 movdqa %xmm12,%xmm8
2327 movdqa %xmm10,%xmm6
2328 pxor 32-128(%rax),%xmm4
2329 paddd %xmm15,%xmm11
2330 pslld $5,%xmm8
2331 pxor %xmm13,%xmm6
2332
2333 movdqa %xmm12,%xmm9
2334 paddd %xmm3,%xmm11
2335 pxor %xmm1,%xmm4
2336 psrld $27,%xmm9
2337 pxor %xmm14,%xmm6
2338 movdqa %xmm13,%xmm7
2339
2340 pslld $30,%xmm7
2341 movdqa %xmm4,%xmm5
2342 por %xmm9,%xmm8
2343 psrld $31,%xmm5
2344 paddd %xmm6,%xmm11
2345 paddd %xmm4,%xmm4
2346
2347 psrld $2,%xmm13
2348 paddd %xmm8,%xmm11
2349 por %xmm5,%xmm4
2350 por %xmm7,%xmm13
2351 pxor %xmm2,%xmm0
2352 movdqa 208-128(%rax),%xmm2
2353
2354 movdqa %xmm11,%xmm8
2355 movdqa %xmm14,%xmm6
2356 pxor 48-128(%rax),%xmm0
2357 paddd %xmm15,%xmm10
2358 pslld $5,%xmm8
2359 pxor %xmm12,%xmm6
2360
2361 movdqa %xmm11,%xmm9
2362 paddd %xmm4,%xmm10
2363 pxor %xmm2,%xmm0
2364 psrld $27,%xmm9
2365 pxor %xmm13,%xmm6
2366 movdqa %xmm12,%xmm7
2367
2368 pslld $30,%xmm7
2369 movdqa %xmm0,%xmm5
2370 por %xmm9,%xmm8
2371 psrld $31,%xmm5
2372 paddd %xmm6,%xmm10
2373 paddd %xmm0,%xmm0
2374
2375 psrld $2,%xmm12
2376 paddd %xmm8,%xmm10
2377 por %xmm5,%xmm0
2378 por %xmm7,%xmm12
2379 pxor %xmm3,%xmm1
2380 movdqa 224-128(%rax),%xmm3
2381
2382 movdqa %xmm10,%xmm8
2383 movdqa %xmm13,%xmm6
2384 pxor 64-128(%rax),%xmm1
2385 paddd %xmm15,%xmm14
2386 pslld $5,%xmm8
2387 pxor %xmm11,%xmm6
2388
2389 movdqa %xmm10,%xmm9
2390 paddd %xmm0,%xmm14
2391 pxor %xmm3,%xmm1
2392 psrld $27,%xmm9
2393 pxor %xmm12,%xmm6
2394 movdqa %xmm11,%xmm7
2395
2396 pslld $30,%xmm7
2397 movdqa %xmm1,%xmm5
2398 por %xmm9,%xmm8
2399 psrld $31,%xmm5
2400 paddd %xmm6,%xmm14
2401 paddd %xmm1,%xmm1
2402
2403 psrld $2,%xmm11
2404 paddd %xmm8,%xmm14
2405 por %xmm5,%xmm1
2406 por %xmm7,%xmm11
2407 pxor %xmm4,%xmm2
2408 movdqa 240-128(%rax),%xmm4
2409
2410 movdqa %xmm14,%xmm8
2411 movdqa %xmm12,%xmm6
2412 pxor 80-128(%rax),%xmm2
2413 paddd %xmm15,%xmm13
2414 pslld $5,%xmm8
2415 pxor %xmm10,%xmm6
2416
2417 movdqa %xmm14,%xmm9
2418 paddd %xmm1,%xmm13
2419 pxor %xmm4,%xmm2
2420 psrld $27,%xmm9
2421 pxor %xmm11,%xmm6
2422 movdqa %xmm10,%xmm7
2423
2424 pslld $30,%xmm7
2425 movdqa %xmm2,%xmm5
2426 por %xmm9,%xmm8
2427 psrld $31,%xmm5
2428 paddd %xmm6,%xmm13
2429 paddd %xmm2,%xmm2
2430
2431 psrld $2,%xmm10
2432 paddd %xmm8,%xmm13
2433 por %xmm5,%xmm2
2434 por %xmm7,%xmm10
2435 pxor %xmm0,%xmm3
2436 movdqa 0-128(%rax),%xmm0
2437
2438 movdqa %xmm13,%xmm8
2439 movdqa %xmm11,%xmm6
2440 pxor 96-128(%rax),%xmm3
2441 paddd %xmm15,%xmm12
2442 pslld $5,%xmm8
2443 pxor %xmm14,%xmm6
2444
2445 movdqa %xmm13,%xmm9
2446 paddd %xmm2,%xmm12
2447 pxor %xmm0,%xmm3
2448 psrld $27,%xmm9
2449 pxor %xmm10,%xmm6
2450 movdqa %xmm14,%xmm7
2451
2452 pslld $30,%xmm7
2453 movdqa %xmm3,%xmm5
2454 por %xmm9,%xmm8
2455 psrld $31,%xmm5
2456 paddd %xmm6,%xmm12
2457 paddd %xmm3,%xmm3
2458
2459 psrld $2,%xmm14
2460 paddd %xmm8,%xmm12
2461 por %xmm5,%xmm3
2462 por %xmm7,%xmm14
2463 pxor %xmm1,%xmm4
2464 movdqa 16-128(%rax),%xmm1
2465
2466 movdqa %xmm12,%xmm8
2467 movdqa %xmm10,%xmm6
2468 pxor 112-128(%rax),%xmm4
2469 paddd %xmm15,%xmm11
2470 pslld $5,%xmm8
2471 pxor %xmm13,%xmm6
2472
2473 movdqa %xmm12,%xmm9
2474 paddd %xmm3,%xmm11
2475 pxor %xmm1,%xmm4
2476 psrld $27,%xmm9
2477 pxor %xmm14,%xmm6
2478 movdqa %xmm13,%xmm7
2479
2480 pslld $30,%xmm7
2481 movdqa %xmm4,%xmm5
2482 por %xmm9,%xmm8
2483 psrld $31,%xmm5
2484 paddd %xmm6,%xmm11
2485 paddd %xmm4,%xmm4
2486
2487 psrld $2,%xmm13
2488 paddd %xmm8,%xmm11
2489 por %xmm5,%xmm4
2490 por %xmm7,%xmm13
2491 movdqa %xmm11,%xmm8
2492 paddd %xmm15,%xmm10
2493 movdqa %xmm14,%xmm6
2494 pslld $5,%xmm8
2495 pxor %xmm12,%xmm6
2496
2497 movdqa %xmm11,%xmm9
2498 paddd %xmm4,%xmm10
2499 psrld $27,%xmm9
2500 movdqa %xmm12,%xmm7
2501 pxor %xmm13,%xmm6
2502
2503 pslld $30,%xmm7
2504 por %xmm9,%xmm8
2505 paddd %xmm6,%xmm10
2506
2507 psrld $2,%xmm12
2508 paddd %xmm8,%xmm10
2509 por %xmm7,%xmm12
2510 movdqa (%rbx),%xmm0
2511 movl $1,%ecx
2512 cmpl 0(%rbx),%ecx
2513 pxor %xmm8,%xmm8
2514 cmovgeq %rbp,%r8
2515 cmpl 4(%rbx),%ecx
2516 movdqa %xmm0,%xmm1
2517 cmovgeq %rbp,%r9
2518 cmpl 8(%rbx),%ecx
2519 pcmpgtd %xmm8,%xmm1
2520 cmovgeq %rbp,%r10
2521 cmpl 12(%rbx),%ecx
2522 paddd %xmm1,%xmm0
2523 cmovgeq %rbp,%r11
2524
2525 movdqu 0(%rdi),%xmm6
2526 pand %xmm1,%xmm10
2527 movdqu 32(%rdi),%xmm7
2528 pand %xmm1,%xmm11
2529 paddd %xmm6,%xmm10
2530 movdqu 64(%rdi),%xmm8
2531 pand %xmm1,%xmm12
2532 paddd %xmm7,%xmm11
2533 movdqu 96(%rdi),%xmm9
2534 pand %xmm1,%xmm13
2535 paddd %xmm8,%xmm12
2536 movdqu 128(%rdi),%xmm5
2537 pand %xmm1,%xmm14
2538 movdqu %xmm10,0(%rdi)
2539 paddd %xmm9,%xmm13
2540 movdqu %xmm11,32(%rdi)
2541 paddd %xmm5,%xmm14
2542 movdqu %xmm12,64(%rdi)
2543 movdqu %xmm13,96(%rdi)
2544 movdqu %xmm14,128(%rdi)
2545
2546 movdqa %xmm0,(%rbx)
2547 movdqa 96(%rbp),%xmm5
2548 movdqa -32(%rbp),%xmm15
2549 decl %edx
2550 jnz .Loop
2551
2552 movl 280(%rsp),%edx
2553 leaq 16(%rdi),%rdi
2554 leaq 64(%rsi),%rsi
2555 decl %edx
2556 jnz .Loop_grande
2557
2558.Ldone:
2559 movq 272(%rsp),%rax
2560.cfi_def_cfa %rax,8
2561 movq -16(%rax),%rbp
2562.cfi_restore %rbp
2563 movq -8(%rax),%rbx
2564.cfi_restore %rbx
2565 leaq (%rax),%rsp
2566.cfi_def_cfa_register %rsp
2567.Lepilogue:
2568 .byte 0xf3,0xc3
2569.cfi_endproc
2570.size sha1_multi_block,.-sha1_multi_block
2571.type sha1_multi_block_shaext,@function
2572.align 32
2573sha1_multi_block_shaext:
2574.cfi_startproc
2575_shaext_shortcut:
2576 movq %rsp,%rax
2577.cfi_def_cfa_register %rax
2578 pushq %rbx
2579.cfi_offset %rbx,-16
2580 pushq %rbp
2581.cfi_offset %rbp,-24
2582 subq $288,%rsp
2583 shll $1,%edx
2584 andq $-256,%rsp
2585 leaq 64(%rdi),%rdi
2586 movq %rax,272(%rsp)
2587.Lbody_shaext:
2588 leaq 256(%rsp),%rbx
2589 movdqa K_XX_XX+128(%rip),%xmm3
2590
2591.Loop_grande_shaext:
2592 movl %edx,280(%rsp)
2593 xorl %edx,%edx
2594
2595 movq 0(%rsi),%r8
2596
2597 movl 8(%rsi),%ecx
2598 cmpl %edx,%ecx
2599 cmovgl %ecx,%edx
2600 testl %ecx,%ecx
2601 movl %ecx,0(%rbx)
2602 cmovleq %rsp,%r8
2603
2604 movq 16(%rsi),%r9
2605
2606 movl 24(%rsi),%ecx
2607 cmpl %edx,%ecx
2608 cmovgl %ecx,%edx
2609 testl %ecx,%ecx
2610 movl %ecx,4(%rbx)
2611 cmovleq %rsp,%r9
2612 testl %edx,%edx
2613 jz .Ldone_shaext
2614
2615 movq 0-64(%rdi),%xmm0
2616 movq 32-64(%rdi),%xmm4
2617 movq 64-64(%rdi),%xmm5
2618 movq 96-64(%rdi),%xmm6
2619 movq 128-64(%rdi),%xmm7
2620
2621 punpckldq %xmm4,%xmm0
2622 punpckldq %xmm6,%xmm5
2623
2624 movdqa %xmm0,%xmm8
2625 punpcklqdq %xmm5,%xmm0
2626 punpckhqdq %xmm5,%xmm8
2627
2628 pshufd $63,%xmm7,%xmm1
2629 pshufd $127,%xmm7,%xmm9
2630 pshufd $27,%xmm0,%xmm0
2631 pshufd $27,%xmm8,%xmm8
2632 jmp .Loop_shaext
2633
2634.align 32
2635.Loop_shaext:
2636 movdqu 0(%r8),%xmm4
2637 movdqu 0(%r9),%xmm11
2638 movdqu 16(%r8),%xmm5
2639 movdqu 16(%r9),%xmm12
2640 movdqu 32(%r8),%xmm6
2641.byte 102,15,56,0,227
2642 movdqu 32(%r9),%xmm13
2643.byte 102,68,15,56,0,219
2644 movdqu 48(%r8),%xmm7
2645 leaq 64(%r8),%r8
2646.byte 102,15,56,0,235
2647 movdqu 48(%r9),%xmm14
2648 leaq 64(%r9),%r9
2649.byte 102,68,15,56,0,227
2650
2651 movdqa %xmm1,80(%rsp)
2652 paddd %xmm4,%xmm1
2653 movdqa %xmm9,112(%rsp)
2654 paddd %xmm11,%xmm9
2655 movdqa %xmm0,64(%rsp)
2656 movdqa %xmm0,%xmm2
2657 movdqa %xmm8,96(%rsp)
2658 movdqa %xmm8,%xmm10
2659.byte 15,58,204,193,0
2660.byte 15,56,200,213
2661.byte 69,15,58,204,193,0
2662.byte 69,15,56,200,212
2663.byte 102,15,56,0,243
2664 prefetcht0 127(%r8)
2665.byte 15,56,201,229
2666.byte 102,68,15,56,0,235
2667 prefetcht0 127(%r9)
2668.byte 69,15,56,201,220
2669
2670.byte 102,15,56,0,251
2671 movdqa %xmm0,%xmm1
2672.byte 102,68,15,56,0,243
2673 movdqa %xmm8,%xmm9
2674.byte 15,58,204,194,0
2675.byte 15,56,200,206
2676.byte 69,15,58,204,194,0
2677.byte 69,15,56,200,205
2678 pxor %xmm6,%xmm4
2679.byte 15,56,201,238
2680 pxor %xmm13,%xmm11
2681.byte 69,15,56,201,229
2682 movdqa %xmm0,%xmm2
2683 movdqa %xmm8,%xmm10
2684.byte 15,58,204,193,0
2685.byte 15,56,200,215
2686.byte 69,15,58,204,193,0
2687.byte 69,15,56,200,214
2688.byte 15,56,202,231
2689.byte 69,15,56,202,222
2690 pxor %xmm7,%xmm5
2691.byte 15,56,201,247
2692 pxor %xmm14,%xmm12
2693.byte 69,15,56,201,238
2694 movdqa %xmm0,%xmm1
2695 movdqa %xmm8,%xmm9
2696.byte 15,58,204,194,0
2697.byte 15,56,200,204
2698.byte 69,15,58,204,194,0
2699.byte 69,15,56,200,203
2700.byte 15,56,202,236
2701.byte 69,15,56,202,227
2702 pxor %xmm4,%xmm6
2703.byte 15,56,201,252
2704 pxor %xmm11,%xmm13
2705.byte 69,15,56,201,243
2706 movdqa %xmm0,%xmm2
2707 movdqa %xmm8,%xmm10
2708.byte 15,58,204,193,0
2709.byte 15,56,200,213
2710.byte 69,15,58,204,193,0
2711.byte 69,15,56,200,212
2712.byte 15,56,202,245
2713.byte 69,15,56,202,236
2714 pxor %xmm5,%xmm7
2715.byte 15,56,201,229
2716 pxor %xmm12,%xmm14
2717.byte 69,15,56,201,220
2718 movdqa %xmm0,%xmm1
2719 movdqa %xmm8,%xmm9
2720.byte 15,58,204,194,1
2721.byte 15,56,200,206
2722.byte 69,15,58,204,194,1
2723.byte 69,15,56,200,205
2724.byte 15,56,202,254
2725.byte 69,15,56,202,245
2726 pxor %xmm6,%xmm4
2727.byte 15,56,201,238
2728 pxor %xmm13,%xmm11
2729.byte 69,15,56,201,229
2730 movdqa %xmm0,%xmm2
2731 movdqa %xmm8,%xmm10
2732.byte 15,58,204,193,1
2733.byte 15,56,200,215
2734.byte 69,15,58,204,193,1
2735.byte 69,15,56,200,214
2736.byte 15,56,202,231
2737.byte 69,15,56,202,222
2738 pxor %xmm7,%xmm5
2739.byte 15,56,201,247
2740 pxor %xmm14,%xmm12
2741.byte 69,15,56,201,238
2742 movdqa %xmm0,%xmm1
2743 movdqa %xmm8,%xmm9
2744.byte 15,58,204,194,1
2745.byte 15,56,200,204
2746.byte 69,15,58,204,194,1
2747.byte 69,15,56,200,203
2748.byte 15,56,202,236
2749.byte 69,15,56,202,227
2750 pxor %xmm4,%xmm6
2751.byte 15,56,201,252
2752 pxor %xmm11,%xmm13
2753.byte 69,15,56,201,243
2754 movdqa %xmm0,%xmm2
2755 movdqa %xmm8,%xmm10
2756.byte 15,58,204,193,1
2757.byte 15,56,200,213
2758.byte 69,15,58,204,193,1
2759.byte 69,15,56,200,212
2760.byte 15,56,202,245
2761.byte 69,15,56,202,236
2762 pxor %xmm5,%xmm7
2763.byte 15,56,201,229
2764 pxor %xmm12,%xmm14
2765.byte 69,15,56,201,220
2766 movdqa %xmm0,%xmm1
2767 movdqa %xmm8,%xmm9
2768.byte 15,58,204,194,1
2769.byte 15,56,200,206
2770.byte 69,15,58,204,194,1
2771.byte 69,15,56,200,205
2772.byte 15,56,202,254
2773.byte 69,15,56,202,245
2774 pxor %xmm6,%xmm4
2775.byte 15,56,201,238
2776 pxor %xmm13,%xmm11
2777.byte 69,15,56,201,229
2778 movdqa %xmm0,%xmm2
2779 movdqa %xmm8,%xmm10
2780.byte 15,58,204,193,2
2781.byte 15,56,200,215
2782.byte 69,15,58,204,193,2
2783.byte 69,15,56,200,214
2784.byte 15,56,202,231
2785.byte 69,15,56,202,222
2786 pxor %xmm7,%xmm5
2787.byte 15,56,201,247
2788 pxor %xmm14,%xmm12
2789.byte 69,15,56,201,238
2790 movdqa %xmm0,%xmm1
2791 movdqa %xmm8,%xmm9
2792.byte 15,58,204,194,2
2793.byte 15,56,200,204
2794.byte 69,15,58,204,194,2
2795.byte 69,15,56,200,203
2796.byte 15,56,202,236
2797.byte 69,15,56,202,227
2798 pxor %xmm4,%xmm6
2799.byte 15,56,201,252
2800 pxor %xmm11,%xmm13
2801.byte 69,15,56,201,243
2802 movdqa %xmm0,%xmm2
2803 movdqa %xmm8,%xmm10
2804.byte 15,58,204,193,2
2805.byte 15,56,200,213
2806.byte 69,15,58,204,193,2
2807.byte 69,15,56,200,212
2808.byte 15,56,202,245
2809.byte 69,15,56,202,236
2810 pxor %xmm5,%xmm7
2811.byte 15,56,201,229
2812 pxor %xmm12,%xmm14
2813.byte 69,15,56,201,220
2814 movdqa %xmm0,%xmm1
2815 movdqa %xmm8,%xmm9
2816.byte 15,58,204,194,2
2817.byte 15,56,200,206
2818.byte 69,15,58,204,194,2
2819.byte 69,15,56,200,205
2820.byte 15,56,202,254
2821.byte 69,15,56,202,245
2822 pxor %xmm6,%xmm4
2823.byte 15,56,201,238
2824 pxor %xmm13,%xmm11
2825.byte 69,15,56,201,229
2826 movdqa %xmm0,%xmm2
2827 movdqa %xmm8,%xmm10
2828.byte 15,58,204,193,2
2829.byte 15,56,200,215
2830.byte 69,15,58,204,193,2
2831.byte 69,15,56,200,214
2832.byte 15,56,202,231
2833.byte 69,15,56,202,222
2834 pxor %xmm7,%xmm5
2835.byte 15,56,201,247
2836 pxor %xmm14,%xmm12
2837.byte 69,15,56,201,238
2838 movdqa %xmm0,%xmm1
2839 movdqa %xmm8,%xmm9
2840.byte 15,58,204,194,3
2841.byte 15,56,200,204
2842.byte 69,15,58,204,194,3
2843.byte 69,15,56,200,203
2844.byte 15,56,202,236
2845.byte 69,15,56,202,227
2846 pxor %xmm4,%xmm6
2847.byte 15,56,201,252
2848 pxor %xmm11,%xmm13
2849.byte 69,15,56,201,243
2850 movdqa %xmm0,%xmm2
2851 movdqa %xmm8,%xmm10
2852.byte 15,58,204,193,3
2853.byte 15,56,200,213
2854.byte 69,15,58,204,193,3
2855.byte 69,15,56,200,212
2856.byte 15,56,202,245
2857.byte 69,15,56,202,236
2858 pxor %xmm5,%xmm7
2859 pxor %xmm12,%xmm14
2860
2861 movl $1,%ecx
2862 pxor %xmm4,%xmm4
2863 cmpl 0(%rbx),%ecx
2864 cmovgeq %rsp,%r8
2865
2866 movdqa %xmm0,%xmm1
2867 movdqa %xmm8,%xmm9
2868.byte 15,58,204,194,3
2869.byte 15,56,200,206
2870.byte 69,15,58,204,194,3
2871.byte 69,15,56,200,205
2872.byte 15,56,202,254
2873.byte 69,15,56,202,245
2874
2875 cmpl 4(%rbx),%ecx
2876 cmovgeq %rsp,%r9
2877 movq (%rbx),%xmm6
2878
2879 movdqa %xmm0,%xmm2
2880 movdqa %xmm8,%xmm10
2881.byte 15,58,204,193,3
2882.byte 15,56,200,215
2883.byte 69,15,58,204,193,3
2884.byte 69,15,56,200,214
2885
2886 pshufd $0x00,%xmm6,%xmm11
2887 pshufd $0x55,%xmm6,%xmm12
2888 movdqa %xmm6,%xmm7
2889 pcmpgtd %xmm4,%xmm11
2890 pcmpgtd %xmm4,%xmm12
2891
2892 movdqa %xmm0,%xmm1
2893 movdqa %xmm8,%xmm9
2894.byte 15,58,204,194,3
2895.byte 15,56,200,204
2896.byte 69,15,58,204,194,3
2897.byte 68,15,56,200,204
2898
2899 pcmpgtd %xmm4,%xmm7
2900 pand %xmm11,%xmm0
2901 pand %xmm11,%xmm1
2902 pand %xmm12,%xmm8
2903 pand %xmm12,%xmm9
2904 paddd %xmm7,%xmm6
2905
2906 paddd 64(%rsp),%xmm0
2907 paddd 80(%rsp),%xmm1
2908 paddd 96(%rsp),%xmm8
2909 paddd 112(%rsp),%xmm9
2910
2911 movq %xmm6,(%rbx)
2912 decl %edx
2913 jnz .Loop_shaext
2914
2915 movl 280(%rsp),%edx
2916
2917 pshufd $27,%xmm0,%xmm0
2918 pshufd $27,%xmm8,%xmm8
2919
2920 movdqa %xmm0,%xmm6
2921 punpckldq %xmm8,%xmm0
2922 punpckhdq %xmm8,%xmm6
2923 punpckhdq %xmm9,%xmm1
2924 movq %xmm0,0-64(%rdi)
2925 psrldq $8,%xmm0
2926 movq %xmm6,64-64(%rdi)
2927 psrldq $8,%xmm6
2928 movq %xmm0,32-64(%rdi)
2929 psrldq $8,%xmm1
2930 movq %xmm6,96-64(%rdi)
2931 movq %xmm1,128-64(%rdi)
2932
2933 leaq 8(%rdi),%rdi
2934 leaq 32(%rsi),%rsi
2935 decl %edx
2936 jnz .Loop_grande_shaext
2937
2938.Ldone_shaext:
2939
2940 movq -16(%rax),%rbp
2941.cfi_restore %rbp
2942 movq -8(%rax),%rbx
2943.cfi_restore %rbx
2944 leaq (%rax),%rsp
2945.cfi_def_cfa_register %rsp
2946.Lepilogue_shaext:
2947 .byte 0xf3,0xc3
2948.cfi_endproc
2949.size sha1_multi_block_shaext,.-sha1_multi_block_shaext
2950
2951.align 256
2952.long 0x5a827999,0x5a827999,0x5a827999,0x5a827999
2953.long 0x5a827999,0x5a827999,0x5a827999,0x5a827999
2954K_XX_XX:
2955.long 0x6ed9eba1,0x6ed9eba1,0x6ed9eba1,0x6ed9eba1
2956.long 0x6ed9eba1,0x6ed9eba1,0x6ed9eba1,0x6ed9eba1
2957.long 0x8f1bbcdc,0x8f1bbcdc,0x8f1bbcdc,0x8f1bbcdc
2958.long 0x8f1bbcdc,0x8f1bbcdc,0x8f1bbcdc,0x8f1bbcdc
2959.long 0xca62c1d6,0xca62c1d6,0xca62c1d6,0xca62c1d6
2960.long 0xca62c1d6,0xca62c1d6,0xca62c1d6,0xca62c1d6
2961.long 0x00010203,0x04050607,0x08090a0b,0x0c0d0e0f
2962.long 0x00010203,0x04050607,0x08090a0b,0x0c0d0e0f
2963.byte 0xf,0xe,0xd,0xc,0xb,0xa,0x9,0x8,0x7,0x6,0x5,0x4,0x3,0x2,0x1,0x0
2964.byte 83,72,65,49,32,109,117,108,116,105,45,98,108,111,99,107,32,116,114,97,110,115,102,111,114,109,32,102,111,114,32,120,56,54,95,54,52,44,32,67,82,89,80,84,79,71,65,77,83,32,98,121,32,60,97,112,112,114,111,64,111,112,101,110,115,115,108,46,111,114,103,62,0
2965 .section ".note.gnu.property", "a"
2966 .p2align 3
2967 .long 1f - 0f
2968 .long 4f - 1f
2969 .long 5
29700:
2971 # "GNU" encoded with .byte, since .asciz isn't supported
2972 # on Solaris.
2973 .byte 0x47
2974 .byte 0x4e
2975 .byte 0x55
2976 .byte 0
29771:
2978 .p2align 3
2979 .long 0xc0000002
2980 .long 3f - 2f
29812:
2982 .long 3
29833:
2984 .p2align 3
29854:
Note: See TracBrowser for help on using the repository browser.

© 2024 Oracle Support Privacy / Do Not Sell My Info Terms of Use Trademark Policy Automated Access Etiquette