Changeset 95221 in vbox for trunk/src/libs/openssl-3.0.3/crypto/genasm-nasm/sha256-mb-x86_64.S
- Timestamp:
- Jun 8, 2022 8:35:57 AM (3 years ago)
- File:
-
- 1 edited
Legend:
- Unmodified
- Added
- Removed
-
trunk/src/libs/openssl-3.0.3/crypto/genasm-nasm/sha256-mb-x86_64.S
r94083 r95221 25 25 bt rcx,61 26 26 jc NEAR _shaext_shortcut 27 test ecx,26843545628 jnz NEAR _avx_shortcut29 27 mov rax,rsp 30 28 … … 3207 3205 3208 3206 $L$SEH_end_sha256_multi_block_shaext: 3209 3210 ALIGN 323211 sha256_multi_block_avx:3212 mov QWORD[8+rsp],rdi ;WIN64 prologue3213 mov QWORD[16+rsp],rsi3214 mov rax,rsp3215 $L$SEH_begin_sha256_multi_block_avx:3216 mov rdi,rcx3217 mov rsi,rdx3218 mov rdx,r83219 3220 3221 3222 _avx_shortcut:3223 shr rcx,323224 cmp edx,23225 jb NEAR $L$avx3226 test ecx,323227 jnz NEAR _avx2_shortcut3228 jmp NEAR $L$avx3229 ALIGN 323230 $L$avx:3231 mov rax,rsp3232 3233 push rbx3234 3235 push rbp3236 3237 lea rsp,[((-168))+rsp]3238 movaps XMMWORD[rsp],xmm63239 movaps XMMWORD[16+rsp],xmm73240 movaps XMMWORD[32+rsp],xmm83241 movaps XMMWORD[48+rsp],xmm93242 movaps XMMWORD[(-120)+rax],xmm103243 movaps XMMWORD[(-104)+rax],xmm113244 movaps XMMWORD[(-88)+rax],xmm123245 movaps XMMWORD[(-72)+rax],xmm133246 movaps XMMWORD[(-56)+rax],xmm143247 movaps XMMWORD[(-40)+rax],xmm153248 sub rsp,2883249 and rsp,-2563250 mov QWORD[272+rsp],rax3251 3252 $L$body_avx:3253 lea rbp,[((K256+128))]3254 lea rbx,[256+rsp]3255 lea rdi,[128+rdi]3256 3257 $L$oop_grande_avx:3258 mov DWORD[280+rsp],edx3259 xor edx,edx3260 3261 mov r8,QWORD[rsi]3262 3263 mov ecx,DWORD[8+rsi]3264 cmp ecx,edx3265 cmovg edx,ecx3266 test ecx,ecx3267 mov DWORD[rbx],ecx3268 cmovle r8,rbp3269 3270 mov r9,QWORD[16+rsi]3271 3272 mov ecx,DWORD[24+rsi]3273 cmp ecx,edx3274 cmovg edx,ecx3275 test ecx,ecx3276 mov DWORD[4+rbx],ecx3277 cmovle r9,rbp3278 3279 mov r10,QWORD[32+rsi]3280 3281 mov ecx,DWORD[40+rsi]3282 cmp ecx,edx3283 cmovg edx,ecx3284 test ecx,ecx3285 mov DWORD[8+rbx],ecx3286 cmovle r10,rbp3287 3288 mov r11,QWORD[48+rsi]3289 3290 mov ecx,DWORD[56+rsi]3291 cmp ecx,edx3292 cmovg edx,ecx3293 test ecx,ecx3294 mov DWORD[12+rbx],ecx3295 cmovle r11,rbp3296 test edx,edx3297 jz NEAR $L$done_avx3298 3299 vmovdqu xmm8,XMMWORD[((0-128))+rdi]3300 lea rax,[128+rsp]3301 vmovdqu xmm9,XMMWORD[((32-128))+rdi]3302 vmovdqu xmm10,XMMWORD[((64-128))+rdi]3303 vmovdqu xmm11,XMMWORD[((96-128))+rdi]3304 vmovdqu xmm12,XMMWORD[((128-128))+rdi]3305 vmovdqu xmm13,XMMWORD[((160-128))+rdi]3306 vmovdqu xmm14,XMMWORD[((192-128))+rdi]3307 vmovdqu xmm15,XMMWORD[((224-128))+rdi]3308 vmovdqu xmm6,XMMWORD[$L$pbswap]3309 jmp NEAR $L$oop_avx3310 3311 ALIGN 323312 $L$oop_avx:3313 vpxor xmm4,xmm10,xmm93314 vmovd xmm5,DWORD[r8]3315 vmovd xmm0,DWORD[r9]3316 vpinsrd xmm5,xmm5,DWORD[r10],13317 vpinsrd xmm0,xmm0,DWORD[r11],13318 vpunpckldq xmm5,xmm5,xmm03319 vpshufb xmm5,xmm5,xmm63320 vpsrld xmm7,xmm12,63321 vpslld xmm2,xmm12,263322 vmovdqu XMMWORD[(0-128)+rax],xmm53323 vpaddd xmm5,xmm5,xmm153324 3325 vpsrld xmm1,xmm12,113326 vpxor xmm7,xmm7,xmm23327 vpslld xmm2,xmm12,213328 vpaddd xmm5,xmm5,XMMWORD[((-128))+rbp]3329 vpxor xmm7,xmm7,xmm13330 3331 vpsrld xmm1,xmm12,253332 vpxor xmm7,xmm7,xmm23333 3334 vpslld xmm2,xmm12,73335 vpandn xmm0,xmm12,xmm143336 vpand xmm3,xmm12,xmm133337 3338 vpxor xmm7,xmm7,xmm13339 3340 vpsrld xmm15,xmm8,23341 vpxor xmm7,xmm7,xmm23342 3343 vpslld xmm1,xmm8,303344 vpxor xmm0,xmm0,xmm33345 vpxor xmm3,xmm9,xmm83346 3347 vpxor xmm15,xmm15,xmm13348 vpaddd xmm5,xmm5,xmm73349 3350 vpsrld xmm1,xmm8,133351 3352 vpslld xmm2,xmm8,193353 vpaddd xmm5,xmm5,xmm03354 vpand xmm4,xmm4,xmm33355 3356 vpxor xmm7,xmm15,xmm13357 3358 vpsrld xmm1,xmm8,223359 vpxor xmm7,xmm7,xmm23360 3361 vpslld xmm2,xmm8,103362 vpxor xmm15,xmm9,xmm43363 vpaddd xmm11,xmm11,xmm53364 3365 vpxor xmm7,xmm7,xmm13366 vpxor xmm7,xmm7,xmm23367 3368 vpaddd xmm15,xmm15,xmm53369 vpaddd xmm15,xmm15,xmm73370 vmovd xmm5,DWORD[4+r8]3371 vmovd xmm0,DWORD[4+r9]3372 vpinsrd xmm5,xmm5,DWORD[4+r10],13373 vpinsrd xmm0,xmm0,DWORD[4+r11],13374 vpunpckldq xmm5,xmm5,xmm03375 vpshufb xmm5,xmm5,xmm63376 vpsrld xmm7,xmm11,63377 vpslld xmm2,xmm11,263378 vmovdqu XMMWORD[(16-128)+rax],xmm53379 vpaddd xmm5,xmm5,xmm143380 3381 vpsrld xmm1,xmm11,113382 vpxor xmm7,xmm7,xmm23383 vpslld xmm2,xmm11,213384 vpaddd xmm5,xmm5,XMMWORD[((-96))+rbp]3385 vpxor xmm7,xmm7,xmm13386 3387 vpsrld xmm1,xmm11,253388 vpxor xmm7,xmm7,xmm23389 3390 vpslld xmm2,xmm11,73391 vpandn xmm0,xmm11,xmm133392 vpand xmm4,xmm11,xmm123393 3394 vpxor xmm7,xmm7,xmm13395 3396 vpsrld xmm14,xmm15,23397 vpxor xmm7,xmm7,xmm23398 3399 vpslld xmm1,xmm15,303400 vpxor xmm0,xmm0,xmm43401 vpxor xmm4,xmm8,xmm153402 3403 vpxor xmm14,xmm14,xmm13404 vpaddd xmm5,xmm5,xmm73405 3406 vpsrld xmm1,xmm15,133407 3408 vpslld xmm2,xmm15,193409 vpaddd xmm5,xmm5,xmm03410 vpand xmm3,xmm3,xmm43411 3412 vpxor xmm7,xmm14,xmm13413 3414 vpsrld xmm1,xmm15,223415 vpxor xmm7,xmm7,xmm23416 3417 vpslld xmm2,xmm15,103418 vpxor xmm14,xmm8,xmm33419 vpaddd xmm10,xmm10,xmm53420 3421 vpxor xmm7,xmm7,xmm13422 vpxor xmm7,xmm7,xmm23423 3424 vpaddd xmm14,xmm14,xmm53425 vpaddd xmm14,xmm14,xmm73426 vmovd xmm5,DWORD[8+r8]3427 vmovd xmm0,DWORD[8+r9]3428 vpinsrd xmm5,xmm5,DWORD[8+r10],13429 vpinsrd xmm0,xmm0,DWORD[8+r11],13430 vpunpckldq xmm5,xmm5,xmm03431 vpshufb xmm5,xmm5,xmm63432 vpsrld xmm7,xmm10,63433 vpslld xmm2,xmm10,263434 vmovdqu XMMWORD[(32-128)+rax],xmm53435 vpaddd xmm5,xmm5,xmm133436 3437 vpsrld xmm1,xmm10,113438 vpxor xmm7,xmm7,xmm23439 vpslld xmm2,xmm10,213440 vpaddd xmm5,xmm5,XMMWORD[((-64))+rbp]3441 vpxor xmm7,xmm7,xmm13442 3443 vpsrld xmm1,xmm10,253444 vpxor xmm7,xmm7,xmm23445 3446 vpslld xmm2,xmm10,73447 vpandn xmm0,xmm10,xmm123448 vpand xmm3,xmm10,xmm113449 3450 vpxor xmm7,xmm7,xmm13451 3452 vpsrld xmm13,xmm14,23453 vpxor xmm7,xmm7,xmm23454 3455 vpslld xmm1,xmm14,303456 vpxor xmm0,xmm0,xmm33457 vpxor xmm3,xmm15,xmm143458 3459 vpxor xmm13,xmm13,xmm13460 vpaddd xmm5,xmm5,xmm73461 3462 vpsrld xmm1,xmm14,133463 3464 vpslld xmm2,xmm14,193465 vpaddd xmm5,xmm5,xmm03466 vpand xmm4,xmm4,xmm33467 3468 vpxor xmm7,xmm13,xmm13469 3470 vpsrld xmm1,xmm14,223471 vpxor xmm7,xmm7,xmm23472 3473 vpslld xmm2,xmm14,103474 vpxor xmm13,xmm15,xmm43475 vpaddd xmm9,xmm9,xmm53476 3477 vpxor xmm7,xmm7,xmm13478 vpxor xmm7,xmm7,xmm23479 3480 vpaddd xmm13,xmm13,xmm53481 vpaddd xmm13,xmm13,xmm73482 vmovd xmm5,DWORD[12+r8]3483 vmovd xmm0,DWORD[12+r9]3484 vpinsrd xmm5,xmm5,DWORD[12+r10],13485 vpinsrd xmm0,xmm0,DWORD[12+r11],13486 vpunpckldq xmm5,xmm5,xmm03487 vpshufb xmm5,xmm5,xmm63488 vpsrld xmm7,xmm9,63489 vpslld xmm2,xmm9,263490 vmovdqu XMMWORD[(48-128)+rax],xmm53491 vpaddd xmm5,xmm5,xmm123492 3493 vpsrld xmm1,xmm9,113494 vpxor xmm7,xmm7,xmm23495 vpslld xmm2,xmm9,213496 vpaddd xmm5,xmm5,XMMWORD[((-32))+rbp]3497 vpxor xmm7,xmm7,xmm13498 3499 vpsrld xmm1,xmm9,253500 vpxor xmm7,xmm7,xmm23501 3502 vpslld xmm2,xmm9,73503 vpandn xmm0,xmm9,xmm113504 vpand xmm4,xmm9,xmm103505 3506 vpxor xmm7,xmm7,xmm13507 3508 vpsrld xmm12,xmm13,23509 vpxor xmm7,xmm7,xmm23510 3511 vpslld xmm1,xmm13,303512 vpxor xmm0,xmm0,xmm43513 vpxor xmm4,xmm14,xmm133514 3515 vpxor xmm12,xmm12,xmm13516 vpaddd xmm5,xmm5,xmm73517 3518 vpsrld xmm1,xmm13,133519 3520 vpslld xmm2,xmm13,193521 vpaddd xmm5,xmm5,xmm03522 vpand xmm3,xmm3,xmm43523 3524 vpxor xmm7,xmm12,xmm13525 3526 vpsrld xmm1,xmm13,223527 vpxor xmm7,xmm7,xmm23528 3529 vpslld xmm2,xmm13,103530 vpxor xmm12,xmm14,xmm33531 vpaddd xmm8,xmm8,xmm53532 3533 vpxor xmm7,xmm7,xmm13534 vpxor xmm7,xmm7,xmm23535 3536 vpaddd xmm12,xmm12,xmm53537 vpaddd xmm12,xmm12,xmm73538 vmovd xmm5,DWORD[16+r8]3539 vmovd xmm0,DWORD[16+r9]3540 vpinsrd xmm5,xmm5,DWORD[16+r10],13541 vpinsrd xmm0,xmm0,DWORD[16+r11],13542 vpunpckldq xmm5,xmm5,xmm03543 vpshufb xmm5,xmm5,xmm63544 vpsrld xmm7,xmm8,63545 vpslld xmm2,xmm8,263546 vmovdqu XMMWORD[(64-128)+rax],xmm53547 vpaddd xmm5,xmm5,xmm113548 3549 vpsrld xmm1,xmm8,113550 vpxor xmm7,xmm7,xmm23551 vpslld xmm2,xmm8,213552 vpaddd xmm5,xmm5,XMMWORD[rbp]3553 vpxor xmm7,xmm7,xmm13554 3555 vpsrld xmm1,xmm8,253556 vpxor xmm7,xmm7,xmm23557 3558 vpslld xmm2,xmm8,73559 vpandn xmm0,xmm8,xmm103560 vpand xmm3,xmm8,xmm93561 3562 vpxor xmm7,xmm7,xmm13563 3564 vpsrld xmm11,xmm12,23565 vpxor xmm7,xmm7,xmm23566 3567 vpslld xmm1,xmm12,303568 vpxor xmm0,xmm0,xmm33569 vpxor xmm3,xmm13,xmm123570 3571 vpxor xmm11,xmm11,xmm13572 vpaddd xmm5,xmm5,xmm73573 3574 vpsrld xmm1,xmm12,133575 3576 vpslld xmm2,xmm12,193577 vpaddd xmm5,xmm5,xmm03578 vpand xmm4,xmm4,xmm33579 3580 vpxor xmm7,xmm11,xmm13581 3582 vpsrld xmm1,xmm12,223583 vpxor xmm7,xmm7,xmm23584 3585 vpslld xmm2,xmm12,103586 vpxor xmm11,xmm13,xmm43587 vpaddd xmm15,xmm15,xmm53588 3589 vpxor xmm7,xmm7,xmm13590 vpxor xmm7,xmm7,xmm23591 3592 vpaddd xmm11,xmm11,xmm53593 vpaddd xmm11,xmm11,xmm73594 vmovd xmm5,DWORD[20+r8]3595 vmovd xmm0,DWORD[20+r9]3596 vpinsrd xmm5,xmm5,DWORD[20+r10],13597 vpinsrd xmm0,xmm0,DWORD[20+r11],13598 vpunpckldq xmm5,xmm5,xmm03599 vpshufb xmm5,xmm5,xmm63600 vpsrld xmm7,xmm15,63601 vpslld xmm2,xmm15,263602 vmovdqu XMMWORD[(80-128)+rax],xmm53603 vpaddd xmm5,xmm5,xmm103604 3605 vpsrld xmm1,xmm15,113606 vpxor xmm7,xmm7,xmm23607 vpslld xmm2,xmm15,213608 vpaddd xmm5,xmm5,XMMWORD[32+rbp]3609 vpxor xmm7,xmm7,xmm13610 3611 vpsrld xmm1,xmm15,253612 vpxor xmm7,xmm7,xmm23613 3614 vpslld xmm2,xmm15,73615 vpandn xmm0,xmm15,xmm93616 vpand xmm4,xmm15,xmm83617 3618 vpxor xmm7,xmm7,xmm13619 3620 vpsrld xmm10,xmm11,23621 vpxor xmm7,xmm7,xmm23622 3623 vpslld xmm1,xmm11,303624 vpxor xmm0,xmm0,xmm43625 vpxor xmm4,xmm12,xmm113626 3627 vpxor xmm10,xmm10,xmm13628 vpaddd xmm5,xmm5,xmm73629 3630 vpsrld xmm1,xmm11,133631 3632 vpslld xmm2,xmm11,193633 vpaddd xmm5,xmm5,xmm03634 vpand xmm3,xmm3,xmm43635 3636 vpxor xmm7,xmm10,xmm13637 3638 vpsrld xmm1,xmm11,223639 vpxor xmm7,xmm7,xmm23640 3641 vpslld xmm2,xmm11,103642 vpxor xmm10,xmm12,xmm33643 vpaddd xmm14,xmm14,xmm53644 3645 vpxor xmm7,xmm7,xmm13646 vpxor xmm7,xmm7,xmm23647 3648 vpaddd xmm10,xmm10,xmm53649 vpaddd xmm10,xmm10,xmm73650 vmovd xmm5,DWORD[24+r8]3651 vmovd xmm0,DWORD[24+r9]3652 vpinsrd xmm5,xmm5,DWORD[24+r10],13653 vpinsrd xmm0,xmm0,DWORD[24+r11],13654 vpunpckldq xmm5,xmm5,xmm03655 vpshufb xmm5,xmm5,xmm63656 vpsrld xmm7,xmm14,63657 vpslld xmm2,xmm14,263658 vmovdqu XMMWORD[(96-128)+rax],xmm53659 vpaddd xmm5,xmm5,xmm93660 3661 vpsrld xmm1,xmm14,113662 vpxor xmm7,xmm7,xmm23663 vpslld xmm2,xmm14,213664 vpaddd xmm5,xmm5,XMMWORD[64+rbp]3665 vpxor xmm7,xmm7,xmm13666 3667 vpsrld xmm1,xmm14,253668 vpxor xmm7,xmm7,xmm23669 3670 vpslld xmm2,xmm14,73671 vpandn xmm0,xmm14,xmm83672 vpand xmm3,xmm14,xmm153673 3674 vpxor xmm7,xmm7,xmm13675 3676 vpsrld xmm9,xmm10,23677 vpxor xmm7,xmm7,xmm23678 3679 vpslld xmm1,xmm10,303680 vpxor xmm0,xmm0,xmm33681 vpxor xmm3,xmm11,xmm103682 3683 vpxor xmm9,xmm9,xmm13684 vpaddd xmm5,xmm5,xmm73685 3686 vpsrld xmm1,xmm10,133687 3688 vpslld xmm2,xmm10,193689 vpaddd xmm5,xmm5,xmm03690 vpand xmm4,xmm4,xmm33691 3692 vpxor xmm7,xmm9,xmm13693 3694 vpsrld xmm1,xmm10,223695 vpxor xmm7,xmm7,xmm23696 3697 vpslld xmm2,xmm10,103698 vpxor xmm9,xmm11,xmm43699 vpaddd xmm13,xmm13,xmm53700 3701 vpxor xmm7,xmm7,xmm13702 vpxor xmm7,xmm7,xmm23703 3704 vpaddd xmm9,xmm9,xmm53705 vpaddd xmm9,xmm9,xmm73706 vmovd xmm5,DWORD[28+r8]3707 vmovd xmm0,DWORD[28+r9]3708 vpinsrd xmm5,xmm5,DWORD[28+r10],13709 vpinsrd xmm0,xmm0,DWORD[28+r11],13710 vpunpckldq xmm5,xmm5,xmm03711 vpshufb xmm5,xmm5,xmm63712 vpsrld xmm7,xmm13,63713 vpslld xmm2,xmm13,263714 vmovdqu XMMWORD[(112-128)+rax],xmm53715 vpaddd xmm5,xmm5,xmm83716 3717 vpsrld xmm1,xmm13,113718 vpxor xmm7,xmm7,xmm23719 vpslld xmm2,xmm13,213720 vpaddd xmm5,xmm5,XMMWORD[96+rbp]3721 vpxor xmm7,xmm7,xmm13722 3723 vpsrld xmm1,xmm13,253724 vpxor xmm7,xmm7,xmm23725 3726 vpslld xmm2,xmm13,73727 vpandn xmm0,xmm13,xmm153728 vpand xmm4,xmm13,xmm143729 3730 vpxor xmm7,xmm7,xmm13731 3732 vpsrld xmm8,xmm9,23733 vpxor xmm7,xmm7,xmm23734 3735 vpslld xmm1,xmm9,303736 vpxor xmm0,xmm0,xmm43737 vpxor xmm4,xmm10,xmm93738 3739 vpxor xmm8,xmm8,xmm13740 vpaddd xmm5,xmm5,xmm73741 3742 vpsrld xmm1,xmm9,133743 3744 vpslld xmm2,xmm9,193745 vpaddd xmm5,xmm5,xmm03746 vpand xmm3,xmm3,xmm43747 3748 vpxor xmm7,xmm8,xmm13749 3750 vpsrld xmm1,xmm9,223751 vpxor xmm7,xmm7,xmm23752 3753 vpslld xmm2,xmm9,103754 vpxor xmm8,xmm10,xmm33755 vpaddd xmm12,xmm12,xmm53756 3757 vpxor xmm7,xmm7,xmm13758 vpxor xmm7,xmm7,xmm23759 3760 vpaddd xmm8,xmm8,xmm53761 vpaddd xmm8,xmm8,xmm73762 add rbp,2563763 vmovd xmm5,DWORD[32+r8]3764 vmovd xmm0,DWORD[32+r9]3765 vpinsrd xmm5,xmm5,DWORD[32+r10],13766 vpinsrd xmm0,xmm0,DWORD[32+r11],13767 vpunpckldq xmm5,xmm5,xmm03768 vpshufb xmm5,xmm5,xmm63769 vpsrld xmm7,xmm12,63770 vpslld xmm2,xmm12,263771 vmovdqu XMMWORD[(128-128)+rax],xmm53772 vpaddd xmm5,xmm5,xmm153773 3774 vpsrld xmm1,xmm12,113775 vpxor xmm7,xmm7,xmm23776 vpslld xmm2,xmm12,213777 vpaddd xmm5,xmm5,XMMWORD[((-128))+rbp]3778 vpxor xmm7,xmm7,xmm13779 3780 vpsrld xmm1,xmm12,253781 vpxor xmm7,xmm7,xmm23782 3783 vpslld xmm2,xmm12,73784 vpandn xmm0,xmm12,xmm143785 vpand xmm3,xmm12,xmm133786 3787 vpxor xmm7,xmm7,xmm13788 3789 vpsrld xmm15,xmm8,23790 vpxor xmm7,xmm7,xmm23791 3792 vpslld xmm1,xmm8,303793 vpxor xmm0,xmm0,xmm33794 vpxor xmm3,xmm9,xmm83795 3796 vpxor xmm15,xmm15,xmm13797 vpaddd xmm5,xmm5,xmm73798 3799 vpsrld xmm1,xmm8,133800 3801 vpslld xmm2,xmm8,193802 vpaddd xmm5,xmm5,xmm03803 vpand xmm4,xmm4,xmm33804 3805 vpxor xmm7,xmm15,xmm13806 3807 vpsrld xmm1,xmm8,223808 vpxor xmm7,xmm7,xmm23809 3810 vpslld xmm2,xmm8,103811 vpxor xmm15,xmm9,xmm43812 vpaddd xmm11,xmm11,xmm53813 3814 vpxor xmm7,xmm7,xmm13815 vpxor xmm7,xmm7,xmm23816 3817 vpaddd xmm15,xmm15,xmm53818 vpaddd xmm15,xmm15,xmm73819 vmovd xmm5,DWORD[36+r8]3820 vmovd xmm0,DWORD[36+r9]3821 vpinsrd xmm5,xmm5,DWORD[36+r10],13822 vpinsrd xmm0,xmm0,DWORD[36+r11],13823 vpunpckldq xmm5,xmm5,xmm03824 vpshufb xmm5,xmm5,xmm63825 vpsrld xmm7,xmm11,63826 vpslld xmm2,xmm11,263827 vmovdqu XMMWORD[(144-128)+rax],xmm53828 vpaddd xmm5,xmm5,xmm143829 3830 vpsrld xmm1,xmm11,113831 vpxor xmm7,xmm7,xmm23832 vpslld xmm2,xmm11,213833 vpaddd xmm5,xmm5,XMMWORD[((-96))+rbp]3834 vpxor xmm7,xmm7,xmm13835 3836 vpsrld xmm1,xmm11,253837 vpxor xmm7,xmm7,xmm23838 3839 vpslld xmm2,xmm11,73840 vpandn xmm0,xmm11,xmm133841 vpand xmm4,xmm11,xmm123842 3843 vpxor xmm7,xmm7,xmm13844 3845 vpsrld xmm14,xmm15,23846 vpxor xmm7,xmm7,xmm23847 3848 vpslld xmm1,xmm15,303849 vpxor xmm0,xmm0,xmm43850 vpxor xmm4,xmm8,xmm153851 3852 vpxor xmm14,xmm14,xmm13853 vpaddd xmm5,xmm5,xmm73854 3855 vpsrld xmm1,xmm15,133856 3857 vpslld xmm2,xmm15,193858 vpaddd xmm5,xmm5,xmm03859 vpand xmm3,xmm3,xmm43860 3861 vpxor xmm7,xmm14,xmm13862 3863 vpsrld xmm1,xmm15,223864 vpxor xmm7,xmm7,xmm23865 3866 vpslld xmm2,xmm15,103867 vpxor xmm14,xmm8,xmm33868 vpaddd xmm10,xmm10,xmm53869 3870 vpxor xmm7,xmm7,xmm13871 vpxor xmm7,xmm7,xmm23872 3873 vpaddd xmm14,xmm14,xmm53874 vpaddd xmm14,xmm14,xmm73875 vmovd xmm5,DWORD[40+r8]3876 vmovd xmm0,DWORD[40+r9]3877 vpinsrd xmm5,xmm5,DWORD[40+r10],13878 vpinsrd xmm0,xmm0,DWORD[40+r11],13879 vpunpckldq xmm5,xmm5,xmm03880 vpshufb xmm5,xmm5,xmm63881 vpsrld xmm7,xmm10,63882 vpslld xmm2,xmm10,263883 vmovdqu XMMWORD[(160-128)+rax],xmm53884 vpaddd xmm5,xmm5,xmm133885 3886 vpsrld xmm1,xmm10,113887 vpxor xmm7,xmm7,xmm23888 vpslld xmm2,xmm10,213889 vpaddd xmm5,xmm5,XMMWORD[((-64))+rbp]3890 vpxor xmm7,xmm7,xmm13891 3892 vpsrld xmm1,xmm10,253893 vpxor xmm7,xmm7,xmm23894 3895 vpslld xmm2,xmm10,73896 vpandn xmm0,xmm10,xmm123897 vpand xmm3,xmm10,xmm113898 3899 vpxor xmm7,xmm7,xmm13900 3901 vpsrld xmm13,xmm14,23902 vpxor xmm7,xmm7,xmm23903 3904 vpslld xmm1,xmm14,303905 vpxor xmm0,xmm0,xmm33906 vpxor xmm3,xmm15,xmm143907 3908 vpxor xmm13,xmm13,xmm13909 vpaddd xmm5,xmm5,xmm73910 3911 vpsrld xmm1,xmm14,133912 3913 vpslld xmm2,xmm14,193914 vpaddd xmm5,xmm5,xmm03915 vpand xmm4,xmm4,xmm33916 3917 vpxor xmm7,xmm13,xmm13918 3919 vpsrld xmm1,xmm14,223920 vpxor xmm7,xmm7,xmm23921 3922 vpslld xmm2,xmm14,103923 vpxor xmm13,xmm15,xmm43924 vpaddd xmm9,xmm9,xmm53925 3926 vpxor xmm7,xmm7,xmm13927 vpxor xmm7,xmm7,xmm23928 3929 vpaddd xmm13,xmm13,xmm53930 vpaddd xmm13,xmm13,xmm73931 vmovd xmm5,DWORD[44+r8]3932 vmovd xmm0,DWORD[44+r9]3933 vpinsrd xmm5,xmm5,DWORD[44+r10],13934 vpinsrd xmm0,xmm0,DWORD[44+r11],13935 vpunpckldq xmm5,xmm5,xmm03936 vpshufb xmm5,xmm5,xmm63937 vpsrld xmm7,xmm9,63938 vpslld xmm2,xmm9,263939 vmovdqu XMMWORD[(176-128)+rax],xmm53940 vpaddd xmm5,xmm5,xmm123941 3942 vpsrld xmm1,xmm9,113943 vpxor xmm7,xmm7,xmm23944 vpslld xmm2,xmm9,213945 vpaddd xmm5,xmm5,XMMWORD[((-32))+rbp]3946 vpxor xmm7,xmm7,xmm13947 3948 vpsrld xmm1,xmm9,253949 vpxor xmm7,xmm7,xmm23950 3951 vpslld xmm2,xmm9,73952 vpandn xmm0,xmm9,xmm113953 vpand xmm4,xmm9,xmm103954 3955 vpxor xmm7,xmm7,xmm13956 3957 vpsrld xmm12,xmm13,23958 vpxor xmm7,xmm7,xmm23959 3960 vpslld xmm1,xmm13,303961 vpxor xmm0,xmm0,xmm43962 vpxor xmm4,xmm14,xmm133963 3964 vpxor xmm12,xmm12,xmm13965 vpaddd xmm5,xmm5,xmm73966 3967 vpsrld xmm1,xmm13,133968 3969 vpslld xmm2,xmm13,193970 vpaddd xmm5,xmm5,xmm03971 vpand xmm3,xmm3,xmm43972 3973 vpxor xmm7,xmm12,xmm13974 3975 vpsrld xmm1,xmm13,223976 vpxor xmm7,xmm7,xmm23977 3978 vpslld xmm2,xmm13,103979 vpxor xmm12,xmm14,xmm33980 vpaddd xmm8,xmm8,xmm53981 3982 vpxor xmm7,xmm7,xmm13983 vpxor xmm7,xmm7,xmm23984 3985 vpaddd xmm12,xmm12,xmm53986 vpaddd xmm12,xmm12,xmm73987 vmovd xmm5,DWORD[48+r8]3988 vmovd xmm0,DWORD[48+r9]3989 vpinsrd xmm5,xmm5,DWORD[48+r10],13990 vpinsrd xmm0,xmm0,DWORD[48+r11],13991 vpunpckldq xmm5,xmm5,xmm03992 vpshufb xmm5,xmm5,xmm63993 vpsrld xmm7,xmm8,63994 vpslld xmm2,xmm8,263995 vmovdqu XMMWORD[(192-128)+rax],xmm53996 vpaddd xmm5,xmm5,xmm113997 3998 vpsrld xmm1,xmm8,113999 vpxor xmm7,xmm7,xmm24000 vpslld xmm2,xmm8,214001 vpaddd xmm5,xmm5,XMMWORD[rbp]4002 vpxor xmm7,xmm7,xmm14003 4004 vpsrld xmm1,xmm8,254005 vpxor xmm7,xmm7,xmm24006 4007 vpslld xmm2,xmm8,74008 vpandn xmm0,xmm8,xmm104009 vpand xmm3,xmm8,xmm94010 4011 vpxor xmm7,xmm7,xmm14012 4013 vpsrld xmm11,xmm12,24014 vpxor xmm7,xmm7,xmm24015 4016 vpslld xmm1,xmm12,304017 vpxor xmm0,xmm0,xmm34018 vpxor xmm3,xmm13,xmm124019 4020 vpxor xmm11,xmm11,xmm14021 vpaddd xmm5,xmm5,xmm74022 4023 vpsrld xmm1,xmm12,134024 4025 vpslld xmm2,xmm12,194026 vpaddd xmm5,xmm5,xmm04027 vpand xmm4,xmm4,xmm34028 4029 vpxor xmm7,xmm11,xmm14030 4031 vpsrld xmm1,xmm12,224032 vpxor xmm7,xmm7,xmm24033 4034 vpslld xmm2,xmm12,104035 vpxor xmm11,xmm13,xmm44036 vpaddd xmm15,xmm15,xmm54037 4038 vpxor xmm7,xmm7,xmm14039 vpxor xmm7,xmm7,xmm24040 4041 vpaddd xmm11,xmm11,xmm54042 vpaddd xmm11,xmm11,xmm74043 vmovd xmm5,DWORD[52+r8]4044 vmovd xmm0,DWORD[52+r9]4045 vpinsrd xmm5,xmm5,DWORD[52+r10],14046 vpinsrd xmm0,xmm0,DWORD[52+r11],14047 vpunpckldq xmm5,xmm5,xmm04048 vpshufb xmm5,xmm5,xmm64049 vpsrld xmm7,xmm15,64050 vpslld xmm2,xmm15,264051 vmovdqu XMMWORD[(208-128)+rax],xmm54052 vpaddd xmm5,xmm5,xmm104053 4054 vpsrld xmm1,xmm15,114055 vpxor xmm7,xmm7,xmm24056 vpslld xmm2,xmm15,214057 vpaddd xmm5,xmm5,XMMWORD[32+rbp]4058 vpxor xmm7,xmm7,xmm14059 4060 vpsrld xmm1,xmm15,254061 vpxor xmm7,xmm7,xmm24062 4063 vpslld xmm2,xmm15,74064 vpandn xmm0,xmm15,xmm94065 vpand xmm4,xmm15,xmm84066 4067 vpxor xmm7,xmm7,xmm14068 4069 vpsrld xmm10,xmm11,24070 vpxor xmm7,xmm7,xmm24071 4072 vpslld xmm1,xmm11,304073 vpxor xmm0,xmm0,xmm44074 vpxor xmm4,xmm12,xmm114075 4076 vpxor xmm10,xmm10,xmm14077 vpaddd xmm5,xmm5,xmm74078 4079 vpsrld xmm1,xmm11,134080 4081 vpslld xmm2,xmm11,194082 vpaddd xmm5,xmm5,xmm04083 vpand xmm3,xmm3,xmm44084 4085 vpxor xmm7,xmm10,xmm14086 4087 vpsrld xmm1,xmm11,224088 vpxor xmm7,xmm7,xmm24089 4090 vpslld xmm2,xmm11,104091 vpxor xmm10,xmm12,xmm34092 vpaddd xmm14,xmm14,xmm54093 4094 vpxor xmm7,xmm7,xmm14095 vpxor xmm7,xmm7,xmm24096 4097 vpaddd xmm10,xmm10,xmm54098 vpaddd xmm10,xmm10,xmm74099 vmovd xmm5,DWORD[56+r8]4100 vmovd xmm0,DWORD[56+r9]4101 vpinsrd xmm5,xmm5,DWORD[56+r10],14102 vpinsrd xmm0,xmm0,DWORD[56+r11],14103 vpunpckldq xmm5,xmm5,xmm04104 vpshufb xmm5,xmm5,xmm64105 vpsrld xmm7,xmm14,64106 vpslld xmm2,xmm14,264107 vmovdqu XMMWORD[(224-128)+rax],xmm54108 vpaddd xmm5,xmm5,xmm94109 4110 vpsrld xmm1,xmm14,114111 vpxor xmm7,xmm7,xmm24112 vpslld xmm2,xmm14,214113 vpaddd xmm5,xmm5,XMMWORD[64+rbp]4114 vpxor xmm7,xmm7,xmm14115 4116 vpsrld xmm1,xmm14,254117 vpxor xmm7,xmm7,xmm24118 4119 vpslld xmm2,xmm14,74120 vpandn xmm0,xmm14,xmm84121 vpand xmm3,xmm14,xmm154122 4123 vpxor xmm7,xmm7,xmm14124 4125 vpsrld xmm9,xmm10,24126 vpxor xmm7,xmm7,xmm24127 4128 vpslld xmm1,xmm10,304129 vpxor xmm0,xmm0,xmm34130 vpxor xmm3,xmm11,xmm104131 4132 vpxor xmm9,xmm9,xmm14133 vpaddd xmm5,xmm5,xmm74134 4135 vpsrld xmm1,xmm10,134136 4137 vpslld xmm2,xmm10,194138 vpaddd xmm5,xmm5,xmm04139 vpand xmm4,xmm4,xmm34140 4141 vpxor xmm7,xmm9,xmm14142 4143 vpsrld xmm1,xmm10,224144 vpxor xmm7,xmm7,xmm24145 4146 vpslld xmm2,xmm10,104147 vpxor xmm9,xmm11,xmm44148 vpaddd xmm13,xmm13,xmm54149 4150 vpxor xmm7,xmm7,xmm14151 vpxor xmm7,xmm7,xmm24152 4153 vpaddd xmm9,xmm9,xmm54154 vpaddd xmm9,xmm9,xmm74155 vmovd xmm5,DWORD[60+r8]4156 lea r8,[64+r8]4157 vmovd xmm0,DWORD[60+r9]4158 lea r9,[64+r9]4159 vpinsrd xmm5,xmm5,DWORD[60+r10],14160 lea r10,[64+r10]4161 vpinsrd xmm0,xmm0,DWORD[60+r11],14162 lea r11,[64+r11]4163 vpunpckldq xmm5,xmm5,xmm04164 vpshufb xmm5,xmm5,xmm64165 vpsrld xmm7,xmm13,64166 vpslld xmm2,xmm13,264167 vmovdqu XMMWORD[(240-128)+rax],xmm54168 vpaddd xmm5,xmm5,xmm84169 4170 vpsrld xmm1,xmm13,114171 vpxor xmm7,xmm7,xmm24172 vpslld xmm2,xmm13,214173 vpaddd xmm5,xmm5,XMMWORD[96+rbp]4174 vpxor xmm7,xmm7,xmm14175 4176 vpsrld xmm1,xmm13,254177 vpxor xmm7,xmm7,xmm24178 prefetcht0 [63+r8]4179 vpslld xmm2,xmm13,74180 vpandn xmm0,xmm13,xmm154181 vpand xmm4,xmm13,xmm144182 prefetcht0 [63+r9]4183 vpxor xmm7,xmm7,xmm14184 4185 vpsrld xmm8,xmm9,24186 vpxor xmm7,xmm7,xmm24187 prefetcht0 [63+r10]4188 vpslld xmm1,xmm9,304189 vpxor xmm0,xmm0,xmm44190 vpxor xmm4,xmm10,xmm94191 prefetcht0 [63+r11]4192 vpxor xmm8,xmm8,xmm14193 vpaddd xmm5,xmm5,xmm74194 4195 vpsrld xmm1,xmm9,134196 4197 vpslld xmm2,xmm9,194198 vpaddd xmm5,xmm5,xmm04199 vpand xmm3,xmm3,xmm44200 4201 vpxor xmm7,xmm8,xmm14202 4203 vpsrld xmm1,xmm9,224204 vpxor xmm7,xmm7,xmm24205 4206 vpslld xmm2,xmm9,104207 vpxor xmm8,xmm10,xmm34208 vpaddd xmm12,xmm12,xmm54209 4210 vpxor xmm7,xmm7,xmm14211 vpxor xmm7,xmm7,xmm24212 4213 vpaddd xmm8,xmm8,xmm54214 vpaddd xmm8,xmm8,xmm74215 add rbp,2564216 vmovdqu xmm5,XMMWORD[((0-128))+rax]4217 mov ecx,34218 jmp NEAR $L$oop_16_xx_avx4219 ALIGN 324220 $L$oop_16_xx_avx:4221 vmovdqu xmm6,XMMWORD[((16-128))+rax]4222 vpaddd xmm5,xmm5,XMMWORD[((144-128))+rax]4223 4224 vpsrld xmm7,xmm6,34225 vpsrld xmm1,xmm6,74226 vpslld xmm2,xmm6,254227 vpxor xmm7,xmm7,xmm14228 vpsrld xmm1,xmm6,184229 vpxor xmm7,xmm7,xmm24230 vpslld xmm2,xmm6,144231 vmovdqu xmm0,XMMWORD[((224-128))+rax]4232 vpsrld xmm3,xmm0,104233 4234 vpxor xmm7,xmm7,xmm14235 vpsrld xmm1,xmm0,174236 vpxor xmm7,xmm7,xmm24237 vpslld xmm2,xmm0,154238 vpaddd xmm5,xmm5,xmm74239 vpxor xmm7,xmm3,xmm14240 vpsrld xmm1,xmm0,194241 vpxor xmm7,xmm7,xmm24242 vpslld xmm2,xmm0,134243 vpxor xmm7,xmm7,xmm14244 vpxor xmm7,xmm7,xmm24245 vpaddd xmm5,xmm5,xmm74246 vpsrld xmm7,xmm12,64247 vpslld xmm2,xmm12,264248 vmovdqu XMMWORD[(0-128)+rax],xmm54249 vpaddd xmm5,xmm5,xmm154250 4251 vpsrld xmm1,xmm12,114252 vpxor xmm7,xmm7,xmm24253 vpslld xmm2,xmm12,214254 vpaddd xmm5,xmm5,XMMWORD[((-128))+rbp]4255 vpxor xmm7,xmm7,xmm14256 4257 vpsrld xmm1,xmm12,254258 vpxor xmm7,xmm7,xmm24259 4260 vpslld xmm2,xmm12,74261 vpandn xmm0,xmm12,xmm144262 vpand xmm3,xmm12,xmm134263 4264 vpxor xmm7,xmm7,xmm14265 4266 vpsrld xmm15,xmm8,24267 vpxor xmm7,xmm7,xmm24268 4269 vpslld xmm1,xmm8,304270 vpxor xmm0,xmm0,xmm34271 vpxor xmm3,xmm9,xmm84272 4273 vpxor xmm15,xmm15,xmm14274 vpaddd xmm5,xmm5,xmm74275 4276 vpsrld xmm1,xmm8,134277 4278 vpslld xmm2,xmm8,194279 vpaddd xmm5,xmm5,xmm04280 vpand xmm4,xmm4,xmm34281 4282 vpxor xmm7,xmm15,xmm14283 4284 vpsrld xmm1,xmm8,224285 vpxor xmm7,xmm7,xmm24286 4287 vpslld xmm2,xmm8,104288 vpxor xmm15,xmm9,xmm44289 vpaddd xmm11,xmm11,xmm54290 4291 vpxor xmm7,xmm7,xmm14292 vpxor xmm7,xmm7,xmm24293 4294 vpaddd xmm15,xmm15,xmm54295 vpaddd xmm15,xmm15,xmm74296 vmovdqu xmm5,XMMWORD[((32-128))+rax]4297 vpaddd xmm6,xmm6,XMMWORD[((160-128))+rax]4298 4299 vpsrld xmm7,xmm5,34300 vpsrld xmm1,xmm5,74301 vpslld xmm2,xmm5,254302 vpxor xmm7,xmm7,xmm14303 vpsrld xmm1,xmm5,184304 vpxor xmm7,xmm7,xmm24305 vpslld xmm2,xmm5,144306 vmovdqu xmm0,XMMWORD[((240-128))+rax]4307 vpsrld xmm4,xmm0,104308 4309 vpxor xmm7,xmm7,xmm14310 vpsrld xmm1,xmm0,174311 vpxor xmm7,xmm7,xmm24312 vpslld xmm2,xmm0,154313 vpaddd xmm6,xmm6,xmm74314 vpxor xmm7,xmm4,xmm14315 vpsrld xmm1,xmm0,194316 vpxor xmm7,xmm7,xmm24317 vpslld xmm2,xmm0,134318 vpxor xmm7,xmm7,xmm14319 vpxor xmm7,xmm7,xmm24320 vpaddd xmm6,xmm6,xmm74321 vpsrld xmm7,xmm11,64322 vpslld xmm2,xmm11,264323 vmovdqu XMMWORD[(16-128)+rax],xmm64324 vpaddd xmm6,xmm6,xmm144325 4326 vpsrld xmm1,xmm11,114327 vpxor xmm7,xmm7,xmm24328 vpslld xmm2,xmm11,214329 vpaddd xmm6,xmm6,XMMWORD[((-96))+rbp]4330 vpxor xmm7,xmm7,xmm14331 4332 vpsrld xmm1,xmm11,254333 vpxor xmm7,xmm7,xmm24334 4335 vpslld xmm2,xmm11,74336 vpandn xmm0,xmm11,xmm134337 vpand xmm4,xmm11,xmm124338 4339 vpxor xmm7,xmm7,xmm14340 4341 vpsrld xmm14,xmm15,24342 vpxor xmm7,xmm7,xmm24343 4344 vpslld xmm1,xmm15,304345 vpxor xmm0,xmm0,xmm44346 vpxor xmm4,xmm8,xmm154347 4348 vpxor xmm14,xmm14,xmm14349 vpaddd xmm6,xmm6,xmm74350 4351 vpsrld xmm1,xmm15,134352 4353 vpslld xmm2,xmm15,194354 vpaddd xmm6,xmm6,xmm04355 vpand xmm3,xmm3,xmm44356 4357 vpxor xmm7,xmm14,xmm14358 4359 vpsrld xmm1,xmm15,224360 vpxor xmm7,xmm7,xmm24361 4362 vpslld xmm2,xmm15,104363 vpxor xmm14,xmm8,xmm34364 vpaddd xmm10,xmm10,xmm64365 4366 vpxor xmm7,xmm7,xmm14367 vpxor xmm7,xmm7,xmm24368 4369 vpaddd xmm14,xmm14,xmm64370 vpaddd xmm14,xmm14,xmm74371 vmovdqu xmm6,XMMWORD[((48-128))+rax]4372 vpaddd xmm5,xmm5,XMMWORD[((176-128))+rax]4373 4374 vpsrld xmm7,xmm6,34375 vpsrld xmm1,xmm6,74376 vpslld xmm2,xmm6,254377 vpxor xmm7,xmm7,xmm14378 vpsrld xmm1,xmm6,184379 vpxor xmm7,xmm7,xmm24380 vpslld xmm2,xmm6,144381 vmovdqu xmm0,XMMWORD[((0-128))+rax]4382 vpsrld xmm3,xmm0,104383 4384 vpxor xmm7,xmm7,xmm14385 vpsrld xmm1,xmm0,174386 vpxor xmm7,xmm7,xmm24387 vpslld xmm2,xmm0,154388 vpaddd xmm5,xmm5,xmm74389 vpxor xmm7,xmm3,xmm14390 vpsrld xmm1,xmm0,194391 vpxor xmm7,xmm7,xmm24392 vpslld xmm2,xmm0,134393 vpxor xmm7,xmm7,xmm14394 vpxor xmm7,xmm7,xmm24395 vpaddd xmm5,xmm5,xmm74396 vpsrld xmm7,xmm10,64397 vpslld xmm2,xmm10,264398 vmovdqu XMMWORD[(32-128)+rax],xmm54399 vpaddd xmm5,xmm5,xmm134400 4401 vpsrld xmm1,xmm10,114402 vpxor xmm7,xmm7,xmm24403 vpslld xmm2,xmm10,214404 vpaddd xmm5,xmm5,XMMWORD[((-64))+rbp]4405 vpxor xmm7,xmm7,xmm14406 4407 vpsrld xmm1,xmm10,254408 vpxor xmm7,xmm7,xmm24409 4410 vpslld xmm2,xmm10,74411 vpandn xmm0,xmm10,xmm124412 vpand xmm3,xmm10,xmm114413 4414 vpxor xmm7,xmm7,xmm14415 4416 vpsrld xmm13,xmm14,24417 vpxor xmm7,xmm7,xmm24418 4419 vpslld xmm1,xmm14,304420 vpxor xmm0,xmm0,xmm34421 vpxor xmm3,xmm15,xmm144422 4423 vpxor xmm13,xmm13,xmm14424 vpaddd xmm5,xmm5,xmm74425 4426 vpsrld xmm1,xmm14,134427 4428 vpslld xmm2,xmm14,194429 vpaddd xmm5,xmm5,xmm04430 vpand xmm4,xmm4,xmm34431 4432 vpxor xmm7,xmm13,xmm14433 4434 vpsrld xmm1,xmm14,224435 vpxor xmm7,xmm7,xmm24436 4437 vpslld xmm2,xmm14,104438 vpxor xmm13,xmm15,xmm44439 vpaddd xmm9,xmm9,xmm54440 4441 vpxor xmm7,xmm7,xmm14442 vpxor xmm7,xmm7,xmm24443 4444 vpaddd xmm13,xmm13,xmm54445 vpaddd xmm13,xmm13,xmm74446 vmovdqu xmm5,XMMWORD[((64-128))+rax]4447 vpaddd xmm6,xmm6,XMMWORD[((192-128))+rax]4448 4449 vpsrld xmm7,xmm5,34450 vpsrld xmm1,xmm5,74451 vpslld xmm2,xmm5,254452 vpxor xmm7,xmm7,xmm14453 vpsrld xmm1,xmm5,184454 vpxor xmm7,xmm7,xmm24455 vpslld xmm2,xmm5,144456 vmovdqu xmm0,XMMWORD[((16-128))+rax]4457 vpsrld xmm4,xmm0,104458 4459 vpxor xmm7,xmm7,xmm14460 vpsrld xmm1,xmm0,174461 vpxor xmm7,xmm7,xmm24462 vpslld xmm2,xmm0,154463 vpaddd xmm6,xmm6,xmm74464 vpxor xmm7,xmm4,xmm14465 vpsrld xmm1,xmm0,194466 vpxor xmm7,xmm7,xmm24467 vpslld xmm2,xmm0,134468 vpxor xmm7,xmm7,xmm14469 vpxor xmm7,xmm7,xmm24470 vpaddd xmm6,xmm6,xmm74471 vpsrld xmm7,xmm9,64472 vpslld xmm2,xmm9,264473 vmovdqu XMMWORD[(48-128)+rax],xmm64474 vpaddd xmm6,xmm6,xmm124475 4476 vpsrld xmm1,xmm9,114477 vpxor xmm7,xmm7,xmm24478 vpslld xmm2,xmm9,214479 vpaddd xmm6,xmm6,XMMWORD[((-32))+rbp]4480 vpxor xmm7,xmm7,xmm14481 4482 vpsrld xmm1,xmm9,254483 vpxor xmm7,xmm7,xmm24484 4485 vpslld xmm2,xmm9,74486 vpandn xmm0,xmm9,xmm114487 vpand xmm4,xmm9,xmm104488 4489 vpxor xmm7,xmm7,xmm14490 4491 vpsrld xmm12,xmm13,24492 vpxor xmm7,xmm7,xmm24493 4494 vpslld xmm1,xmm13,304495 vpxor xmm0,xmm0,xmm44496 vpxor xmm4,xmm14,xmm134497 4498 vpxor xmm12,xmm12,xmm14499 vpaddd xmm6,xmm6,xmm74500 4501 vpsrld xmm1,xmm13,134502 4503 vpslld xmm2,xmm13,194504 vpaddd xmm6,xmm6,xmm04505 vpand xmm3,xmm3,xmm44506 4507 vpxor xmm7,xmm12,xmm14508 4509 vpsrld xmm1,xmm13,224510 vpxor xmm7,xmm7,xmm24511 4512 vpslld xmm2,xmm13,104513 vpxor xmm12,xmm14,xmm34514 vpaddd xmm8,xmm8,xmm64515 4516 vpxor xmm7,xmm7,xmm14517 vpxor xmm7,xmm7,xmm24518 4519 vpaddd xmm12,xmm12,xmm64520 vpaddd xmm12,xmm12,xmm74521 vmovdqu xmm6,XMMWORD[((80-128))+rax]4522 vpaddd xmm5,xmm5,XMMWORD[((208-128))+rax]4523 4524 vpsrld xmm7,xmm6,34525 vpsrld xmm1,xmm6,74526 vpslld xmm2,xmm6,254527 vpxor xmm7,xmm7,xmm14528 vpsrld xmm1,xmm6,184529 vpxor xmm7,xmm7,xmm24530 vpslld xmm2,xmm6,144531 vmovdqu xmm0,XMMWORD[((32-128))+rax]4532 vpsrld xmm3,xmm0,104533 4534 vpxor xmm7,xmm7,xmm14535 vpsrld xmm1,xmm0,174536 vpxor xmm7,xmm7,xmm24537 vpslld xmm2,xmm0,154538 vpaddd xmm5,xmm5,xmm74539 vpxor xmm7,xmm3,xmm14540 vpsrld xmm1,xmm0,194541 vpxor xmm7,xmm7,xmm24542 vpslld xmm2,xmm0,134543 vpxor xmm7,xmm7,xmm14544 vpxor xmm7,xmm7,xmm24545 vpaddd xmm5,xmm5,xmm74546 vpsrld xmm7,xmm8,64547 vpslld xmm2,xmm8,264548 vmovdqu XMMWORD[(64-128)+rax],xmm54549 vpaddd xmm5,xmm5,xmm114550 4551 vpsrld xmm1,xmm8,114552 vpxor xmm7,xmm7,xmm24553 vpslld xmm2,xmm8,214554 vpaddd xmm5,xmm5,XMMWORD[rbp]4555 vpxor xmm7,xmm7,xmm14556 4557 vpsrld xmm1,xmm8,254558 vpxor xmm7,xmm7,xmm24559 4560 vpslld xmm2,xmm8,74561 vpandn xmm0,xmm8,xmm104562 vpand xmm3,xmm8,xmm94563 4564 vpxor xmm7,xmm7,xmm14565 4566 vpsrld xmm11,xmm12,24567 vpxor xmm7,xmm7,xmm24568 4569 vpslld xmm1,xmm12,304570 vpxor xmm0,xmm0,xmm34571 vpxor xmm3,xmm13,xmm124572 4573 vpxor xmm11,xmm11,xmm14574 vpaddd xmm5,xmm5,xmm74575 4576 vpsrld xmm1,xmm12,134577 4578 vpslld xmm2,xmm12,194579 vpaddd xmm5,xmm5,xmm04580 vpand xmm4,xmm4,xmm34581 4582 vpxor xmm7,xmm11,xmm14583 4584 vpsrld xmm1,xmm12,224585 vpxor xmm7,xmm7,xmm24586 4587 vpslld xmm2,xmm12,104588 vpxor xmm11,xmm13,xmm44589 vpaddd xmm15,xmm15,xmm54590 4591 vpxor xmm7,xmm7,xmm14592 vpxor xmm7,xmm7,xmm24593 4594 vpaddd xmm11,xmm11,xmm54595 vpaddd xmm11,xmm11,xmm74596 vmovdqu xmm5,XMMWORD[((96-128))+rax]4597 vpaddd xmm6,xmm6,XMMWORD[((224-128))+rax]4598 4599 vpsrld xmm7,xmm5,34600 vpsrld xmm1,xmm5,74601 vpslld xmm2,xmm5,254602 vpxor xmm7,xmm7,xmm14603 vpsrld xmm1,xmm5,184604 vpxor xmm7,xmm7,xmm24605 vpslld xmm2,xmm5,144606 vmovdqu xmm0,XMMWORD[((48-128))+rax]4607 vpsrld xmm4,xmm0,104608 4609 vpxor xmm7,xmm7,xmm14610 vpsrld xmm1,xmm0,174611 vpxor xmm7,xmm7,xmm24612 vpslld xmm2,xmm0,154613 vpaddd xmm6,xmm6,xmm74614 vpxor xmm7,xmm4,xmm14615 vpsrld xmm1,xmm0,194616 vpxor xmm7,xmm7,xmm24617 vpslld xmm2,xmm0,134618 vpxor xmm7,xmm7,xmm14619 vpxor xmm7,xmm7,xmm24620 vpaddd xmm6,xmm6,xmm74621 vpsrld xmm7,xmm15,64622 vpslld xmm2,xmm15,264623 vmovdqu XMMWORD[(80-128)+rax],xmm64624 vpaddd xmm6,xmm6,xmm104625 4626 vpsrld xmm1,xmm15,114627 vpxor xmm7,xmm7,xmm24628 vpslld xmm2,xmm15,214629 vpaddd xmm6,xmm6,XMMWORD[32+rbp]4630 vpxor xmm7,xmm7,xmm14631 4632 vpsrld xmm1,xmm15,254633 vpxor xmm7,xmm7,xmm24634 4635 vpslld xmm2,xmm15,74636 vpandn xmm0,xmm15,xmm94637 vpand xmm4,xmm15,xmm84638 4639 vpxor xmm7,xmm7,xmm14640 4641 vpsrld xmm10,xmm11,24642 vpxor xmm7,xmm7,xmm24643 4644 vpslld xmm1,xmm11,304645 vpxor xmm0,xmm0,xmm44646 vpxor xmm4,xmm12,xmm114647 4648 vpxor xmm10,xmm10,xmm14649 vpaddd xmm6,xmm6,xmm74650 4651 vpsrld xmm1,xmm11,134652 4653 vpslld xmm2,xmm11,194654 vpaddd xmm6,xmm6,xmm04655 vpand xmm3,xmm3,xmm44656 4657 vpxor xmm7,xmm10,xmm14658 4659 vpsrld xmm1,xmm11,224660 vpxor xmm7,xmm7,xmm24661 4662 vpslld xmm2,xmm11,104663 vpxor xmm10,xmm12,xmm34664 vpaddd xmm14,xmm14,xmm64665 4666 vpxor xmm7,xmm7,xmm14667 vpxor xmm7,xmm7,xmm24668 4669 vpaddd xmm10,xmm10,xmm64670 vpaddd xmm10,xmm10,xmm74671 vmovdqu xmm6,XMMWORD[((112-128))+rax]4672 vpaddd xmm5,xmm5,XMMWORD[((240-128))+rax]4673 4674 vpsrld xmm7,xmm6,34675 vpsrld xmm1,xmm6,74676 vpslld xmm2,xmm6,254677 vpxor xmm7,xmm7,xmm14678 vpsrld xmm1,xmm6,184679 vpxor xmm7,xmm7,xmm24680 vpslld xmm2,xmm6,144681 vmovdqu xmm0,XMMWORD[((64-128))+rax]4682 vpsrld xmm3,xmm0,104683 4684 vpxor xmm7,xmm7,xmm14685 vpsrld xmm1,xmm0,174686 vpxor xmm7,xmm7,xmm24687 vpslld xmm2,xmm0,154688 vpaddd xmm5,xmm5,xmm74689 vpxor xmm7,xmm3,xmm14690 vpsrld xmm1,xmm0,194691 vpxor xmm7,xmm7,xmm24692 vpslld xmm2,xmm0,134693 vpxor xmm7,xmm7,xmm14694 vpxor xmm7,xmm7,xmm24695 vpaddd xmm5,xmm5,xmm74696 vpsrld xmm7,xmm14,64697 vpslld xmm2,xmm14,264698 vmovdqu XMMWORD[(96-128)+rax],xmm54699 vpaddd xmm5,xmm5,xmm94700 4701 vpsrld xmm1,xmm14,114702 vpxor xmm7,xmm7,xmm24703 vpslld xmm2,xmm14,214704 vpaddd xmm5,xmm5,XMMWORD[64+rbp]4705 vpxor xmm7,xmm7,xmm14706 4707 vpsrld xmm1,xmm14,254708 vpxor xmm7,xmm7,xmm24709 4710 vpslld xmm2,xmm14,74711 vpandn xmm0,xmm14,xmm84712 vpand xmm3,xmm14,xmm154713 4714 vpxor xmm7,xmm7,xmm14715 4716 vpsrld xmm9,xmm10,24717 vpxor xmm7,xmm7,xmm24718 4719 vpslld xmm1,xmm10,304720 vpxor xmm0,xmm0,xmm34721 vpxor xmm3,xmm11,xmm104722 4723 vpxor xmm9,xmm9,xmm14724 vpaddd xmm5,xmm5,xmm74725 4726 vpsrld xmm1,xmm10,134727 4728 vpslld xmm2,xmm10,194729 vpaddd xmm5,xmm5,xmm04730 vpand xmm4,xmm4,xmm34731 4732 vpxor xmm7,xmm9,xmm14733 4734 vpsrld xmm1,xmm10,224735 vpxor xmm7,xmm7,xmm24736 4737 vpslld xmm2,xmm10,104738 vpxor xmm9,xmm11,xmm44739 vpaddd xmm13,xmm13,xmm54740 4741 vpxor xmm7,xmm7,xmm14742 vpxor xmm7,xmm7,xmm24743 4744 vpaddd xmm9,xmm9,xmm54745 vpaddd xmm9,xmm9,xmm74746 vmovdqu xmm5,XMMWORD[((128-128))+rax]4747 vpaddd xmm6,xmm6,XMMWORD[((0-128))+rax]4748 4749 vpsrld xmm7,xmm5,34750 vpsrld xmm1,xmm5,74751 vpslld xmm2,xmm5,254752 vpxor xmm7,xmm7,xmm14753 vpsrld xmm1,xmm5,184754 vpxor xmm7,xmm7,xmm24755 vpslld xmm2,xmm5,144756 vmovdqu xmm0,XMMWORD[((80-128))+rax]4757 vpsrld xmm4,xmm0,104758 4759 vpxor xmm7,xmm7,xmm14760 vpsrld xmm1,xmm0,174761 vpxor xmm7,xmm7,xmm24762 vpslld xmm2,xmm0,154763 vpaddd xmm6,xmm6,xmm74764 vpxor xmm7,xmm4,xmm14765 vpsrld xmm1,xmm0,194766 vpxor xmm7,xmm7,xmm24767 vpslld xmm2,xmm0,134768 vpxor xmm7,xmm7,xmm14769 vpxor xmm7,xmm7,xmm24770 vpaddd xmm6,xmm6,xmm74771 vpsrld xmm7,xmm13,64772 vpslld xmm2,xmm13,264773 vmovdqu XMMWORD[(112-128)+rax],xmm64774 vpaddd xmm6,xmm6,xmm84775 4776 vpsrld xmm1,xmm13,114777 vpxor xmm7,xmm7,xmm24778 vpslld xmm2,xmm13,214779 vpaddd xmm6,xmm6,XMMWORD[96+rbp]4780 vpxor xmm7,xmm7,xmm14781 4782 vpsrld xmm1,xmm13,254783 vpxor xmm7,xmm7,xmm24784 4785 vpslld xmm2,xmm13,74786 vpandn xmm0,xmm13,xmm154787 vpand xmm4,xmm13,xmm144788 4789 vpxor xmm7,xmm7,xmm14790 4791 vpsrld xmm8,xmm9,24792 vpxor xmm7,xmm7,xmm24793 4794 vpslld xmm1,xmm9,304795 vpxor xmm0,xmm0,xmm44796 vpxor xmm4,xmm10,xmm94797 4798 vpxor xmm8,xmm8,xmm14799 vpaddd xmm6,xmm6,xmm74800 4801 vpsrld xmm1,xmm9,134802 4803 vpslld xmm2,xmm9,194804 vpaddd xmm6,xmm6,xmm04805 vpand xmm3,xmm3,xmm44806 4807 vpxor xmm7,xmm8,xmm14808 4809 vpsrld xmm1,xmm9,224810 vpxor xmm7,xmm7,xmm24811 4812 vpslld xmm2,xmm9,104813 vpxor xmm8,xmm10,xmm34814 vpaddd xmm12,xmm12,xmm64815 4816 vpxor xmm7,xmm7,xmm14817 vpxor xmm7,xmm7,xmm24818 4819 vpaddd xmm8,xmm8,xmm64820 vpaddd xmm8,xmm8,xmm74821 add rbp,2564822 vmovdqu xmm6,XMMWORD[((144-128))+rax]4823 vpaddd xmm5,xmm5,XMMWORD[((16-128))+rax]4824 4825 vpsrld xmm7,xmm6,34826 vpsrld xmm1,xmm6,74827 vpslld xmm2,xmm6,254828 vpxor xmm7,xmm7,xmm14829 vpsrld xmm1,xmm6,184830 vpxor xmm7,xmm7,xmm24831 vpslld xmm2,xmm6,144832 vmovdqu xmm0,XMMWORD[((96-128))+rax]4833 vpsrld xmm3,xmm0,104834 4835 vpxor xmm7,xmm7,xmm14836 vpsrld xmm1,xmm0,174837 vpxor xmm7,xmm7,xmm24838 vpslld xmm2,xmm0,154839 vpaddd xmm5,xmm5,xmm74840 vpxor xmm7,xmm3,xmm14841 vpsrld xmm1,xmm0,194842 vpxor xmm7,xmm7,xmm24843 vpslld xmm2,xmm0,134844 vpxor xmm7,xmm7,xmm14845 vpxor xmm7,xmm7,xmm24846 vpaddd xmm5,xmm5,xmm74847 vpsrld xmm7,xmm12,64848 vpslld xmm2,xmm12,264849 vmovdqu XMMWORD[(128-128)+rax],xmm54850 vpaddd xmm5,xmm5,xmm154851 4852 vpsrld xmm1,xmm12,114853 vpxor xmm7,xmm7,xmm24854 vpslld xmm2,xmm12,214855 vpaddd xmm5,xmm5,XMMWORD[((-128))+rbp]4856 vpxor xmm7,xmm7,xmm14857 4858 vpsrld xmm1,xmm12,254859 vpxor xmm7,xmm7,xmm24860 4861 vpslld xmm2,xmm12,74862 vpandn xmm0,xmm12,xmm144863 vpand xmm3,xmm12,xmm134864 4865 vpxor xmm7,xmm7,xmm14866 4867 vpsrld xmm15,xmm8,24868 vpxor xmm7,xmm7,xmm24869 4870 vpslld xmm1,xmm8,304871 vpxor xmm0,xmm0,xmm34872 vpxor xmm3,xmm9,xmm84873 4874 vpxor xmm15,xmm15,xmm14875 vpaddd xmm5,xmm5,xmm74876 4877 vpsrld xmm1,xmm8,134878 4879 vpslld xmm2,xmm8,194880 vpaddd xmm5,xmm5,xmm04881 vpand xmm4,xmm4,xmm34882 4883 vpxor xmm7,xmm15,xmm14884 4885 vpsrld xmm1,xmm8,224886 vpxor xmm7,xmm7,xmm24887 4888 vpslld xmm2,xmm8,104889 vpxor xmm15,xmm9,xmm44890 vpaddd xmm11,xmm11,xmm54891 4892 vpxor xmm7,xmm7,xmm14893 vpxor xmm7,xmm7,xmm24894 4895 vpaddd xmm15,xmm15,xmm54896 vpaddd xmm15,xmm15,xmm74897 vmovdqu xmm5,XMMWORD[((160-128))+rax]4898 vpaddd xmm6,xmm6,XMMWORD[((32-128))+rax]4899 4900 vpsrld xmm7,xmm5,34901 vpsrld xmm1,xmm5,74902 vpslld xmm2,xmm5,254903 vpxor xmm7,xmm7,xmm14904 vpsrld xmm1,xmm5,184905 vpxor xmm7,xmm7,xmm24906 vpslld xmm2,xmm5,144907 vmovdqu xmm0,XMMWORD[((112-128))+rax]4908 vpsrld xmm4,xmm0,104909 4910 vpxor xmm7,xmm7,xmm14911 vpsrld xmm1,xmm0,174912 vpxor xmm7,xmm7,xmm24913 vpslld xmm2,xmm0,154914 vpaddd xmm6,xmm6,xmm74915 vpxor xmm7,xmm4,xmm14916 vpsrld xmm1,xmm0,194917 vpxor xmm7,xmm7,xmm24918 vpslld xmm2,xmm0,134919 vpxor xmm7,xmm7,xmm14920 vpxor xmm7,xmm7,xmm24921 vpaddd xmm6,xmm6,xmm74922 vpsrld xmm7,xmm11,64923 vpslld xmm2,xmm11,264924 vmovdqu XMMWORD[(144-128)+rax],xmm64925 vpaddd xmm6,xmm6,xmm144926 4927 vpsrld xmm1,xmm11,114928 vpxor xmm7,xmm7,xmm24929 vpslld xmm2,xmm11,214930 vpaddd xmm6,xmm6,XMMWORD[((-96))+rbp]4931 vpxor xmm7,xmm7,xmm14932 4933 vpsrld xmm1,xmm11,254934 vpxor xmm7,xmm7,xmm24935 4936 vpslld xmm2,xmm11,74937 vpandn xmm0,xmm11,xmm134938 vpand xmm4,xmm11,xmm124939 4940 vpxor xmm7,xmm7,xmm14941 4942 vpsrld xmm14,xmm15,24943 vpxor xmm7,xmm7,xmm24944 4945 vpslld xmm1,xmm15,304946 vpxor xmm0,xmm0,xmm44947 vpxor xmm4,xmm8,xmm154948 4949 vpxor xmm14,xmm14,xmm14950 vpaddd xmm6,xmm6,xmm74951 4952 vpsrld xmm1,xmm15,134953 4954 vpslld xmm2,xmm15,194955 vpaddd xmm6,xmm6,xmm04956 vpand xmm3,xmm3,xmm44957 4958 vpxor xmm7,xmm14,xmm14959 4960 vpsrld xmm1,xmm15,224961 vpxor xmm7,xmm7,xmm24962 4963 vpslld xmm2,xmm15,104964 vpxor xmm14,xmm8,xmm34965 vpaddd xmm10,xmm10,xmm64966 4967 vpxor xmm7,xmm7,xmm14968 vpxor xmm7,xmm7,xmm24969 4970 vpaddd xmm14,xmm14,xmm64971 vpaddd xmm14,xmm14,xmm74972 vmovdqu xmm6,XMMWORD[((176-128))+rax]4973 vpaddd xmm5,xmm5,XMMWORD[((48-128))+rax]4974 4975 vpsrld xmm7,xmm6,34976 vpsrld xmm1,xmm6,74977 vpslld xmm2,xmm6,254978 vpxor xmm7,xmm7,xmm14979 vpsrld xmm1,xmm6,184980 vpxor xmm7,xmm7,xmm24981 vpslld xmm2,xmm6,144982 vmovdqu xmm0,XMMWORD[((128-128))+rax]4983 vpsrld xmm3,xmm0,104984 4985 vpxor xmm7,xmm7,xmm14986 vpsrld xmm1,xmm0,174987 vpxor xmm7,xmm7,xmm24988 vpslld xmm2,xmm0,154989 vpaddd xmm5,xmm5,xmm74990 vpxor xmm7,xmm3,xmm14991 vpsrld xmm1,xmm0,194992 vpxor xmm7,xmm7,xmm24993 vpslld xmm2,xmm0,134994 vpxor xmm7,xmm7,xmm14995 vpxor xmm7,xmm7,xmm24996 vpaddd xmm5,xmm5,xmm74997 vpsrld xmm7,xmm10,64998 vpslld xmm2,xmm10,264999 vmovdqu XMMWORD[(160-128)+rax],xmm55000 vpaddd xmm5,xmm5,xmm135001 5002 vpsrld xmm1,xmm10,115003 vpxor xmm7,xmm7,xmm25004 vpslld xmm2,xmm10,215005 vpaddd xmm5,xmm5,XMMWORD[((-64))+rbp]5006 vpxor xmm7,xmm7,xmm15007 5008 vpsrld xmm1,xmm10,255009 vpxor xmm7,xmm7,xmm25010 5011 vpslld xmm2,xmm10,75012 vpandn xmm0,xmm10,xmm125013 vpand xmm3,xmm10,xmm115014 5015 vpxor xmm7,xmm7,xmm15016 5017 vpsrld xmm13,xmm14,25018 vpxor xmm7,xmm7,xmm25019 5020 vpslld xmm1,xmm14,305021 vpxor xmm0,xmm0,xmm35022 vpxor xmm3,xmm15,xmm145023 5024 vpxor xmm13,xmm13,xmm15025 vpaddd xmm5,xmm5,xmm75026 5027 vpsrld xmm1,xmm14,135028 5029 vpslld xmm2,xmm14,195030 vpaddd xmm5,xmm5,xmm05031 vpand xmm4,xmm4,xmm35032 5033 vpxor xmm7,xmm13,xmm15034 5035 vpsrld xmm1,xmm14,225036 vpxor xmm7,xmm7,xmm25037 5038 vpslld xmm2,xmm14,105039 vpxor xmm13,xmm15,xmm45040 vpaddd xmm9,xmm9,xmm55041 5042 vpxor xmm7,xmm7,xmm15043 vpxor xmm7,xmm7,xmm25044 5045 vpaddd xmm13,xmm13,xmm55046 vpaddd xmm13,xmm13,xmm75047 vmovdqu xmm5,XMMWORD[((192-128))+rax]5048 vpaddd xmm6,xmm6,XMMWORD[((64-128))+rax]5049 5050 vpsrld xmm7,xmm5,35051 vpsrld xmm1,xmm5,75052 vpslld xmm2,xmm5,255053 vpxor xmm7,xmm7,xmm15054 vpsrld xmm1,xmm5,185055 vpxor xmm7,xmm7,xmm25056 vpslld xmm2,xmm5,145057 vmovdqu xmm0,XMMWORD[((144-128))+rax]5058 vpsrld xmm4,xmm0,105059 5060 vpxor xmm7,xmm7,xmm15061 vpsrld xmm1,xmm0,175062 vpxor xmm7,xmm7,xmm25063 vpslld xmm2,xmm0,155064 vpaddd xmm6,xmm6,xmm75065 vpxor xmm7,xmm4,xmm15066 vpsrld xmm1,xmm0,195067 vpxor xmm7,xmm7,xmm25068 vpslld xmm2,xmm0,135069 vpxor xmm7,xmm7,xmm15070 vpxor xmm7,xmm7,xmm25071 vpaddd xmm6,xmm6,xmm75072 vpsrld xmm7,xmm9,65073 vpslld xmm2,xmm9,265074 vmovdqu XMMWORD[(176-128)+rax],xmm65075 vpaddd xmm6,xmm6,xmm125076 5077 vpsrld xmm1,xmm9,115078 vpxor xmm7,xmm7,xmm25079 vpslld xmm2,xmm9,215080 vpaddd xmm6,xmm6,XMMWORD[((-32))+rbp]5081 vpxor xmm7,xmm7,xmm15082 5083 vpsrld xmm1,xmm9,255084 vpxor xmm7,xmm7,xmm25085 5086 vpslld xmm2,xmm9,75087 vpandn xmm0,xmm9,xmm115088 vpand xmm4,xmm9,xmm105089 5090 vpxor xmm7,xmm7,xmm15091 5092 vpsrld xmm12,xmm13,25093 vpxor xmm7,xmm7,xmm25094 5095 vpslld xmm1,xmm13,305096 vpxor xmm0,xmm0,xmm45097 vpxor xmm4,xmm14,xmm135098 5099 vpxor xmm12,xmm12,xmm15100 vpaddd xmm6,xmm6,xmm75101 5102 vpsrld xmm1,xmm13,135103 5104 vpslld xmm2,xmm13,195105 vpaddd xmm6,xmm6,xmm05106 vpand xmm3,xmm3,xmm45107 5108 vpxor xmm7,xmm12,xmm15109 5110 vpsrld xmm1,xmm13,225111 vpxor xmm7,xmm7,xmm25112 5113 vpslld xmm2,xmm13,105114 vpxor xmm12,xmm14,xmm35115 vpaddd xmm8,xmm8,xmm65116 5117 vpxor xmm7,xmm7,xmm15118 vpxor xmm7,xmm7,xmm25119 5120 vpaddd xmm12,xmm12,xmm65121 vpaddd xmm12,xmm12,xmm75122 vmovdqu xmm6,XMMWORD[((208-128))+rax]5123 vpaddd xmm5,xmm5,XMMWORD[((80-128))+rax]5124 5125 vpsrld xmm7,xmm6,35126 vpsrld xmm1,xmm6,75127 vpslld xmm2,xmm6,255128 vpxor xmm7,xmm7,xmm15129 vpsrld xmm1,xmm6,185130 vpxor xmm7,xmm7,xmm25131 vpslld xmm2,xmm6,145132 vmovdqu xmm0,XMMWORD[((160-128))+rax]5133 vpsrld xmm3,xmm0,105134 5135 vpxor xmm7,xmm7,xmm15136 vpsrld xmm1,xmm0,175137 vpxor xmm7,xmm7,xmm25138 vpslld xmm2,xmm0,155139 vpaddd xmm5,xmm5,xmm75140 vpxor xmm7,xmm3,xmm15141 vpsrld xmm1,xmm0,195142 vpxor xmm7,xmm7,xmm25143 vpslld xmm2,xmm0,135144 vpxor xmm7,xmm7,xmm15145 vpxor xmm7,xmm7,xmm25146 vpaddd xmm5,xmm5,xmm75147 vpsrld xmm7,xmm8,65148 vpslld xmm2,xmm8,265149 vmovdqu XMMWORD[(192-128)+rax],xmm55150 vpaddd xmm5,xmm5,xmm115151 5152 vpsrld xmm1,xmm8,115153 vpxor xmm7,xmm7,xmm25154 vpslld xmm2,xmm8,215155 vpaddd xmm5,xmm5,XMMWORD[rbp]5156 vpxor xmm7,xmm7,xmm15157 5158 vpsrld xmm1,xmm8,255159 vpxor xmm7,xmm7,xmm25160 5161 vpslld xmm2,xmm8,75162 vpandn xmm0,xmm8,xmm105163 vpand xmm3,xmm8,xmm95164 5165 vpxor xmm7,xmm7,xmm15166 5167 vpsrld xmm11,xmm12,25168 vpxor xmm7,xmm7,xmm25169 5170 vpslld xmm1,xmm12,305171 vpxor xmm0,xmm0,xmm35172 vpxor xmm3,xmm13,xmm125173 5174 vpxor xmm11,xmm11,xmm15175 vpaddd xmm5,xmm5,xmm75176 5177 vpsrld xmm1,xmm12,135178 5179 vpslld xmm2,xmm12,195180 vpaddd xmm5,xmm5,xmm05181 vpand xmm4,xmm4,xmm35182 5183 vpxor xmm7,xmm11,xmm15184 5185 vpsrld xmm1,xmm12,225186 vpxor xmm7,xmm7,xmm25187 5188 vpslld xmm2,xmm12,105189 vpxor xmm11,xmm13,xmm45190 vpaddd xmm15,xmm15,xmm55191 5192 vpxor xmm7,xmm7,xmm15193 vpxor xmm7,xmm7,xmm25194 5195 vpaddd xmm11,xmm11,xmm55196 vpaddd xmm11,xmm11,xmm75197 vmovdqu xmm5,XMMWORD[((224-128))+rax]5198 vpaddd xmm6,xmm6,XMMWORD[((96-128))+rax]5199 5200 vpsrld xmm7,xmm5,35201 vpsrld xmm1,xmm5,75202 vpslld xmm2,xmm5,255203 vpxor xmm7,xmm7,xmm15204 vpsrld xmm1,xmm5,185205 vpxor xmm7,xmm7,xmm25206 vpslld xmm2,xmm5,145207 vmovdqu xmm0,XMMWORD[((176-128))+rax]5208 vpsrld xmm4,xmm0,105209 5210 vpxor xmm7,xmm7,xmm15211 vpsrld xmm1,xmm0,175212 vpxor xmm7,xmm7,xmm25213 vpslld xmm2,xmm0,155214 vpaddd xmm6,xmm6,xmm75215 vpxor xmm7,xmm4,xmm15216 vpsrld xmm1,xmm0,195217 vpxor xmm7,xmm7,xmm25218 vpslld xmm2,xmm0,135219 vpxor xmm7,xmm7,xmm15220 vpxor xmm7,xmm7,xmm25221 vpaddd xmm6,xmm6,xmm75222 vpsrld xmm7,xmm15,65223 vpslld xmm2,xmm15,265224 vmovdqu XMMWORD[(208-128)+rax],xmm65225 vpaddd xmm6,xmm6,xmm105226 5227 vpsrld xmm1,xmm15,115228 vpxor xmm7,xmm7,xmm25229 vpslld xmm2,xmm15,215230 vpaddd xmm6,xmm6,XMMWORD[32+rbp]5231 vpxor xmm7,xmm7,xmm15232 5233 vpsrld xmm1,xmm15,255234 vpxor xmm7,xmm7,xmm25235 5236 vpslld xmm2,xmm15,75237 vpandn xmm0,xmm15,xmm95238 vpand xmm4,xmm15,xmm85239 5240 vpxor xmm7,xmm7,xmm15241 5242 vpsrld xmm10,xmm11,25243 vpxor xmm7,xmm7,xmm25244 5245 vpslld xmm1,xmm11,305246 vpxor xmm0,xmm0,xmm45247 vpxor xmm4,xmm12,xmm115248 5249 vpxor xmm10,xmm10,xmm15250 vpaddd xmm6,xmm6,xmm75251 5252 vpsrld xmm1,xmm11,135253 5254 vpslld xmm2,xmm11,195255 vpaddd xmm6,xmm6,xmm05256 vpand xmm3,xmm3,xmm45257 5258 vpxor xmm7,xmm10,xmm15259 5260 vpsrld xmm1,xmm11,225261 vpxor xmm7,xmm7,xmm25262 5263 vpslld xmm2,xmm11,105264 vpxor xmm10,xmm12,xmm35265 vpaddd xmm14,xmm14,xmm65266 5267 vpxor xmm7,xmm7,xmm15268 vpxor xmm7,xmm7,xmm25269 5270 vpaddd xmm10,xmm10,xmm65271 vpaddd xmm10,xmm10,xmm75272 vmovdqu xmm6,XMMWORD[((240-128))+rax]5273 vpaddd xmm5,xmm5,XMMWORD[((112-128))+rax]5274 5275 vpsrld xmm7,xmm6,35276 vpsrld xmm1,xmm6,75277 vpslld xmm2,xmm6,255278 vpxor xmm7,xmm7,xmm15279 vpsrld xmm1,xmm6,185280 vpxor xmm7,xmm7,xmm25281 vpslld xmm2,xmm6,145282 vmovdqu xmm0,XMMWORD[((192-128))+rax]5283 vpsrld xmm3,xmm0,105284 5285 vpxor xmm7,xmm7,xmm15286 vpsrld xmm1,xmm0,175287 vpxor xmm7,xmm7,xmm25288 vpslld xmm2,xmm0,155289 vpaddd xmm5,xmm5,xmm75290 vpxor xmm7,xmm3,xmm15291 vpsrld xmm1,xmm0,195292 vpxor xmm7,xmm7,xmm25293 vpslld xmm2,xmm0,135294 vpxor xmm7,xmm7,xmm15295 vpxor xmm7,xmm7,xmm25296 vpaddd xmm5,xmm5,xmm75297 vpsrld xmm7,xmm14,65298 vpslld xmm2,xmm14,265299 vmovdqu XMMWORD[(224-128)+rax],xmm55300 vpaddd xmm5,xmm5,xmm95301 5302 vpsrld xmm1,xmm14,115303 vpxor xmm7,xmm7,xmm25304 vpslld xmm2,xmm14,215305 vpaddd xmm5,xmm5,XMMWORD[64+rbp]5306 vpxor xmm7,xmm7,xmm15307 5308 vpsrld xmm1,xmm14,255309 vpxor xmm7,xmm7,xmm25310 5311 vpslld xmm2,xmm14,75312 vpandn xmm0,xmm14,xmm85313 vpand xmm3,xmm14,xmm155314 5315 vpxor xmm7,xmm7,xmm15316 5317 vpsrld xmm9,xmm10,25318 vpxor xmm7,xmm7,xmm25319 5320 vpslld xmm1,xmm10,305321 vpxor xmm0,xmm0,xmm35322 vpxor xmm3,xmm11,xmm105323 5324 vpxor xmm9,xmm9,xmm15325 vpaddd xmm5,xmm5,xmm75326 5327 vpsrld xmm1,xmm10,135328 5329 vpslld xmm2,xmm10,195330 vpaddd xmm5,xmm5,xmm05331 vpand xmm4,xmm4,xmm35332 5333 vpxor xmm7,xmm9,xmm15334 5335 vpsrld xmm1,xmm10,225336 vpxor xmm7,xmm7,xmm25337 5338 vpslld xmm2,xmm10,105339 vpxor xmm9,xmm11,xmm45340 vpaddd xmm13,xmm13,xmm55341 5342 vpxor xmm7,xmm7,xmm15343 vpxor xmm7,xmm7,xmm25344 5345 vpaddd xmm9,xmm9,xmm55346 vpaddd xmm9,xmm9,xmm75347 vmovdqu xmm5,XMMWORD[((0-128))+rax]5348 vpaddd xmm6,xmm6,XMMWORD[((128-128))+rax]5349 5350 vpsrld xmm7,xmm5,35351 vpsrld xmm1,xmm5,75352 vpslld xmm2,xmm5,255353 vpxor xmm7,xmm7,xmm15354 vpsrld xmm1,xmm5,185355 vpxor xmm7,xmm7,xmm25356 vpslld xmm2,xmm5,145357 vmovdqu xmm0,XMMWORD[((208-128))+rax]5358 vpsrld xmm4,xmm0,105359 5360 vpxor xmm7,xmm7,xmm15361 vpsrld xmm1,xmm0,175362 vpxor xmm7,xmm7,xmm25363 vpslld xmm2,xmm0,155364 vpaddd xmm6,xmm6,xmm75365 vpxor xmm7,xmm4,xmm15366 vpsrld xmm1,xmm0,195367 vpxor xmm7,xmm7,xmm25368 vpslld xmm2,xmm0,135369 vpxor xmm7,xmm7,xmm15370 vpxor xmm7,xmm7,xmm25371 vpaddd xmm6,xmm6,xmm75372 vpsrld xmm7,xmm13,65373 vpslld xmm2,xmm13,265374 vmovdqu XMMWORD[(240-128)+rax],xmm65375 vpaddd xmm6,xmm6,xmm85376 5377 vpsrld xmm1,xmm13,115378 vpxor xmm7,xmm7,xmm25379 vpslld xmm2,xmm13,215380 vpaddd xmm6,xmm6,XMMWORD[96+rbp]5381 vpxor xmm7,xmm7,xmm15382 5383 vpsrld xmm1,xmm13,255384 vpxor xmm7,xmm7,xmm25385 5386 vpslld xmm2,xmm13,75387 vpandn xmm0,xmm13,xmm155388 vpand xmm4,xmm13,xmm145389 5390 vpxor xmm7,xmm7,xmm15391 5392 vpsrld xmm8,xmm9,25393 vpxor xmm7,xmm7,xmm25394 5395 vpslld xmm1,xmm9,305396 vpxor xmm0,xmm0,xmm45397 vpxor xmm4,xmm10,xmm95398 5399 vpxor xmm8,xmm8,xmm15400 vpaddd xmm6,xmm6,xmm75401 5402 vpsrld xmm1,xmm9,135403 5404 vpslld xmm2,xmm9,195405 vpaddd xmm6,xmm6,xmm05406 vpand xmm3,xmm3,xmm45407 5408 vpxor xmm7,xmm8,xmm15409 5410 vpsrld xmm1,xmm9,225411 vpxor xmm7,xmm7,xmm25412 5413 vpslld xmm2,xmm9,105414 vpxor xmm8,xmm10,xmm35415 vpaddd xmm12,xmm12,xmm65416 5417 vpxor xmm7,xmm7,xmm15418 vpxor xmm7,xmm7,xmm25419 5420 vpaddd xmm8,xmm8,xmm65421 vpaddd xmm8,xmm8,xmm75422 add rbp,2565423 dec ecx5424 jnz NEAR $L$oop_16_xx_avx5425 5426 mov ecx,15427 lea rbp,[((K256+128))]5428 cmp ecx,DWORD[rbx]5429 cmovge r8,rbp5430 cmp ecx,DWORD[4+rbx]5431 cmovge r9,rbp5432 cmp ecx,DWORD[8+rbx]5433 cmovge r10,rbp5434 cmp ecx,DWORD[12+rbx]5435 cmovge r11,rbp5436 vmovdqa xmm7,XMMWORD[rbx]5437 vpxor xmm0,xmm0,xmm05438 vmovdqa xmm6,xmm75439 vpcmpgtd xmm6,xmm6,xmm05440 vpaddd xmm7,xmm7,xmm65441 5442 vmovdqu xmm0,XMMWORD[((0-128))+rdi]5443 vpand xmm8,xmm8,xmm65444 vmovdqu xmm1,XMMWORD[((32-128))+rdi]5445 vpand xmm9,xmm9,xmm65446 vmovdqu xmm2,XMMWORD[((64-128))+rdi]5447 vpand xmm10,xmm10,xmm65448 vmovdqu xmm5,XMMWORD[((96-128))+rdi]5449 vpand xmm11,xmm11,xmm65450 vpaddd xmm8,xmm8,xmm05451 vmovdqu xmm0,XMMWORD[((128-128))+rdi]5452 vpand xmm12,xmm12,xmm65453 vpaddd xmm9,xmm9,xmm15454 vmovdqu xmm1,XMMWORD[((160-128))+rdi]5455 vpand xmm13,xmm13,xmm65456 vpaddd xmm10,xmm10,xmm25457 vmovdqu xmm2,XMMWORD[((192-128))+rdi]5458 vpand xmm14,xmm14,xmm65459 vpaddd xmm11,xmm11,xmm55460 vmovdqu xmm5,XMMWORD[((224-128))+rdi]5461 vpand xmm15,xmm15,xmm65462 vpaddd xmm12,xmm12,xmm05463 vpaddd xmm13,xmm13,xmm15464 vmovdqu XMMWORD[(0-128)+rdi],xmm85465 vpaddd xmm14,xmm14,xmm25466 vmovdqu XMMWORD[(32-128)+rdi],xmm95467 vpaddd xmm15,xmm15,xmm55468 vmovdqu XMMWORD[(64-128)+rdi],xmm105469 vmovdqu XMMWORD[(96-128)+rdi],xmm115470 vmovdqu XMMWORD[(128-128)+rdi],xmm125471 vmovdqu XMMWORD[(160-128)+rdi],xmm135472 vmovdqu XMMWORD[(192-128)+rdi],xmm145473 vmovdqu XMMWORD[(224-128)+rdi],xmm155474 5475 vmovdqu XMMWORD[rbx],xmm75476 vmovdqu xmm6,XMMWORD[$L$pbswap]5477 dec edx5478 jnz NEAR $L$oop_avx5479 5480 mov edx,DWORD[280+rsp]5481 lea rdi,[16+rdi]5482 lea rsi,[64+rsi]5483 dec edx5484 jnz NEAR $L$oop_grande_avx5485 5486 $L$done_avx:5487 mov rax,QWORD[272+rsp]5488 5489 vzeroupper5490 movaps xmm6,XMMWORD[((-184))+rax]5491 movaps xmm7,XMMWORD[((-168))+rax]5492 movaps xmm8,XMMWORD[((-152))+rax]5493 movaps xmm9,XMMWORD[((-136))+rax]5494 movaps xmm10,XMMWORD[((-120))+rax]5495 movaps xmm11,XMMWORD[((-104))+rax]5496 movaps xmm12,XMMWORD[((-88))+rax]5497 movaps xmm13,XMMWORD[((-72))+rax]5498 movaps xmm14,XMMWORD[((-56))+rax]5499 movaps xmm15,XMMWORD[((-40))+rax]5500 mov rbp,QWORD[((-16))+rax]5501 5502 mov rbx,QWORD[((-8))+rax]5503 5504 lea rsp,[rax]5505 5506 $L$epilogue_avx:5507 mov rdi,QWORD[8+rsp] ;WIN64 epilogue5508 mov rsi,QWORD[16+rsp]5509 DB 0F3h,0C3h ;repret5510 5511 $L$SEH_end_sha256_multi_block_avx:5512 5513 ALIGN 325514 sha256_multi_block_avx2:5515 mov QWORD[8+rsp],rdi ;WIN64 prologue5516 mov QWORD[16+rsp],rsi5517 mov rax,rsp5518 $L$SEH_begin_sha256_multi_block_avx2:5519 mov rdi,rcx5520 mov rsi,rdx5521 mov rdx,r85522 5523 5524 5525 _avx2_shortcut:5526 mov rax,rsp5527 5528 push rbx5529 5530 push rbp5531 5532 push r125533 5534 push r135535 5536 push r145537 5538 push r155539 5540 lea rsp,[((-168))+rsp]5541 movaps XMMWORD[rsp],xmm65542 movaps XMMWORD[16+rsp],xmm75543 movaps XMMWORD[32+rsp],xmm85544 movaps XMMWORD[48+rsp],xmm95545 movaps XMMWORD[64+rsp],xmm105546 movaps XMMWORD[80+rsp],xmm115547 movaps XMMWORD[(-120)+rax],xmm125548 movaps XMMWORD[(-104)+rax],xmm135549 movaps XMMWORD[(-88)+rax],xmm145550 movaps XMMWORD[(-72)+rax],xmm155551 sub rsp,5765552 and rsp,-2565553 mov QWORD[544+rsp],rax5554 5555 $L$body_avx2:5556 lea rbp,[((K256+128))]5557 lea rdi,[128+rdi]5558 5559 $L$oop_grande_avx2:5560 mov DWORD[552+rsp],edx5561 xor edx,edx5562 lea rbx,[512+rsp]5563 5564 mov r12,QWORD[rsi]5565 5566 mov ecx,DWORD[8+rsi]5567 cmp ecx,edx5568 cmovg edx,ecx5569 test ecx,ecx5570 mov DWORD[rbx],ecx5571 cmovle r12,rbp5572 5573 mov r13,QWORD[16+rsi]5574 5575 mov ecx,DWORD[24+rsi]5576 cmp ecx,edx5577 cmovg edx,ecx5578 test ecx,ecx5579 mov DWORD[4+rbx],ecx5580 cmovle r13,rbp5581 5582 mov r14,QWORD[32+rsi]5583 5584 mov ecx,DWORD[40+rsi]5585 cmp ecx,edx5586 cmovg edx,ecx5587 test ecx,ecx5588 mov DWORD[8+rbx],ecx5589 cmovle r14,rbp5590 5591 mov r15,QWORD[48+rsi]5592 5593 mov ecx,DWORD[56+rsi]5594 cmp ecx,edx5595 cmovg edx,ecx5596 test ecx,ecx5597 mov DWORD[12+rbx],ecx5598 cmovle r15,rbp5599 5600 mov r8,QWORD[64+rsi]5601 5602 mov ecx,DWORD[72+rsi]5603 cmp ecx,edx5604 cmovg edx,ecx5605 test ecx,ecx5606 mov DWORD[16+rbx],ecx5607 cmovle r8,rbp5608 5609 mov r9,QWORD[80+rsi]5610 5611 mov ecx,DWORD[88+rsi]5612 cmp ecx,edx5613 cmovg edx,ecx5614 test ecx,ecx5615 mov DWORD[20+rbx],ecx5616 cmovle r9,rbp5617 5618 mov r10,QWORD[96+rsi]5619 5620 mov ecx,DWORD[104+rsi]5621 cmp ecx,edx5622 cmovg edx,ecx5623 test ecx,ecx5624 mov DWORD[24+rbx],ecx5625 cmovle r10,rbp5626 5627 mov r11,QWORD[112+rsi]5628 5629 mov ecx,DWORD[120+rsi]5630 cmp ecx,edx5631 cmovg edx,ecx5632 test ecx,ecx5633 mov DWORD[28+rbx],ecx5634 cmovle r11,rbp5635 vmovdqu ymm8,YMMWORD[((0-128))+rdi]5636 lea rax,[128+rsp]5637 vmovdqu ymm9,YMMWORD[((32-128))+rdi]5638 lea rbx,[((256+128))+rsp]5639 vmovdqu ymm10,YMMWORD[((64-128))+rdi]5640 vmovdqu ymm11,YMMWORD[((96-128))+rdi]5641 vmovdqu ymm12,YMMWORD[((128-128))+rdi]5642 vmovdqu ymm13,YMMWORD[((160-128))+rdi]5643 vmovdqu ymm14,YMMWORD[((192-128))+rdi]5644 vmovdqu ymm15,YMMWORD[((224-128))+rdi]5645 vmovdqu ymm6,YMMWORD[$L$pbswap]5646 jmp NEAR $L$oop_avx25647 5648 ALIGN 325649 $L$oop_avx2:5650 vpxor ymm4,ymm10,ymm95651 vmovd xmm5,DWORD[r12]5652 vmovd xmm0,DWORD[r8]5653 vmovd xmm1,DWORD[r13]5654 vmovd xmm2,DWORD[r9]5655 vpinsrd xmm5,xmm5,DWORD[r14],15656 vpinsrd xmm0,xmm0,DWORD[r10],15657 vpinsrd xmm1,xmm1,DWORD[r15],15658 vpunpckldq ymm5,ymm5,ymm15659 vpinsrd xmm2,xmm2,DWORD[r11],15660 vpunpckldq ymm0,ymm0,ymm25661 vinserti128 ymm5,ymm5,xmm0,15662 vpshufb ymm5,ymm5,ymm65663 vpsrld ymm7,ymm12,65664 vpslld ymm2,ymm12,265665 vmovdqu YMMWORD[(0-128)+rax],ymm55666 vpaddd ymm5,ymm5,ymm155667 5668 vpsrld ymm1,ymm12,115669 vpxor ymm7,ymm7,ymm25670 vpslld ymm2,ymm12,215671 vpaddd ymm5,ymm5,YMMWORD[((-128))+rbp]5672 vpxor ymm7,ymm7,ymm15673 5674 vpsrld ymm1,ymm12,255675 vpxor ymm7,ymm7,ymm25676 5677 vpslld ymm2,ymm12,75678 vpandn ymm0,ymm12,ymm145679 vpand ymm3,ymm12,ymm135680 5681 vpxor ymm7,ymm7,ymm15682 5683 vpsrld ymm15,ymm8,25684 vpxor ymm7,ymm7,ymm25685 5686 vpslld ymm1,ymm8,305687 vpxor ymm0,ymm0,ymm35688 vpxor ymm3,ymm9,ymm85689 5690 vpxor ymm15,ymm15,ymm15691 vpaddd ymm5,ymm5,ymm75692 5693 vpsrld ymm1,ymm8,135694 5695 vpslld ymm2,ymm8,195696 vpaddd ymm5,ymm5,ymm05697 vpand ymm4,ymm4,ymm35698 5699 vpxor ymm7,ymm15,ymm15700 5701 vpsrld ymm1,ymm8,225702 vpxor ymm7,ymm7,ymm25703 5704 vpslld ymm2,ymm8,105705 vpxor ymm15,ymm9,ymm45706 vpaddd ymm11,ymm11,ymm55707 5708 vpxor ymm7,ymm7,ymm15709 vpxor ymm7,ymm7,ymm25710 5711 vpaddd ymm15,ymm15,ymm55712 vpaddd ymm15,ymm15,ymm75713 vmovd xmm5,DWORD[4+r12]5714 vmovd xmm0,DWORD[4+r8]5715 vmovd xmm1,DWORD[4+r13]5716 vmovd xmm2,DWORD[4+r9]5717 vpinsrd xmm5,xmm5,DWORD[4+r14],15718 vpinsrd xmm0,xmm0,DWORD[4+r10],15719 vpinsrd xmm1,xmm1,DWORD[4+r15],15720 vpunpckldq ymm5,ymm5,ymm15721 vpinsrd xmm2,xmm2,DWORD[4+r11],15722 vpunpckldq ymm0,ymm0,ymm25723 vinserti128 ymm5,ymm5,xmm0,15724 vpshufb ymm5,ymm5,ymm65725 vpsrld ymm7,ymm11,65726 vpslld ymm2,ymm11,265727 vmovdqu YMMWORD[(32-128)+rax],ymm55728 vpaddd ymm5,ymm5,ymm145729 5730 vpsrld ymm1,ymm11,115731 vpxor ymm7,ymm7,ymm25732 vpslld ymm2,ymm11,215733 vpaddd ymm5,ymm5,YMMWORD[((-96))+rbp]5734 vpxor ymm7,ymm7,ymm15735 5736 vpsrld ymm1,ymm11,255737 vpxor ymm7,ymm7,ymm25738 5739 vpslld ymm2,ymm11,75740 vpandn ymm0,ymm11,ymm135741 vpand ymm4,ymm11,ymm125742 5743 vpxor ymm7,ymm7,ymm15744 5745 vpsrld ymm14,ymm15,25746 vpxor ymm7,ymm7,ymm25747 5748 vpslld ymm1,ymm15,305749 vpxor ymm0,ymm0,ymm45750 vpxor ymm4,ymm8,ymm155751 5752 vpxor ymm14,ymm14,ymm15753 vpaddd ymm5,ymm5,ymm75754 5755 vpsrld ymm1,ymm15,135756 5757 vpslld ymm2,ymm15,195758 vpaddd ymm5,ymm5,ymm05759 vpand ymm3,ymm3,ymm45760 5761 vpxor ymm7,ymm14,ymm15762 5763 vpsrld ymm1,ymm15,225764 vpxor ymm7,ymm7,ymm25765 5766 vpslld ymm2,ymm15,105767 vpxor ymm14,ymm8,ymm35768 vpaddd ymm10,ymm10,ymm55769 5770 vpxor ymm7,ymm7,ymm15771 vpxor ymm7,ymm7,ymm25772 5773 vpaddd ymm14,ymm14,ymm55774 vpaddd ymm14,ymm14,ymm75775 vmovd xmm5,DWORD[8+r12]5776 vmovd xmm0,DWORD[8+r8]5777 vmovd xmm1,DWORD[8+r13]5778 vmovd xmm2,DWORD[8+r9]5779 vpinsrd xmm5,xmm5,DWORD[8+r14],15780 vpinsrd xmm0,xmm0,DWORD[8+r10],15781 vpinsrd xmm1,xmm1,DWORD[8+r15],15782 vpunpckldq ymm5,ymm5,ymm15783 vpinsrd xmm2,xmm2,DWORD[8+r11],15784 vpunpckldq ymm0,ymm0,ymm25785 vinserti128 ymm5,ymm5,xmm0,15786 vpshufb ymm5,ymm5,ymm65787 vpsrld ymm7,ymm10,65788 vpslld ymm2,ymm10,265789 vmovdqu YMMWORD[(64-128)+rax],ymm55790 vpaddd ymm5,ymm5,ymm135791 5792 vpsrld ymm1,ymm10,115793 vpxor ymm7,ymm7,ymm25794 vpslld ymm2,ymm10,215795 vpaddd ymm5,ymm5,YMMWORD[((-64))+rbp]5796 vpxor ymm7,ymm7,ymm15797 5798 vpsrld ymm1,ymm10,255799 vpxor ymm7,ymm7,ymm25800 5801 vpslld ymm2,ymm10,75802 vpandn ymm0,ymm10,ymm125803 vpand ymm3,ymm10,ymm115804 5805 vpxor ymm7,ymm7,ymm15806 5807 vpsrld ymm13,ymm14,25808 vpxor ymm7,ymm7,ymm25809 5810 vpslld ymm1,ymm14,305811 vpxor ymm0,ymm0,ymm35812 vpxor ymm3,ymm15,ymm145813 5814 vpxor ymm13,ymm13,ymm15815 vpaddd ymm5,ymm5,ymm75816 5817 vpsrld ymm1,ymm14,135818 5819 vpslld ymm2,ymm14,195820 vpaddd ymm5,ymm5,ymm05821 vpand ymm4,ymm4,ymm35822 5823 vpxor ymm7,ymm13,ymm15824 5825 vpsrld ymm1,ymm14,225826 vpxor ymm7,ymm7,ymm25827 5828 vpslld ymm2,ymm14,105829 vpxor ymm13,ymm15,ymm45830 vpaddd ymm9,ymm9,ymm55831 5832 vpxor ymm7,ymm7,ymm15833 vpxor ymm7,ymm7,ymm25834 5835 vpaddd ymm13,ymm13,ymm55836 vpaddd ymm13,ymm13,ymm75837 vmovd xmm5,DWORD[12+r12]5838 vmovd xmm0,DWORD[12+r8]5839 vmovd xmm1,DWORD[12+r13]5840 vmovd xmm2,DWORD[12+r9]5841 vpinsrd xmm5,xmm5,DWORD[12+r14],15842 vpinsrd xmm0,xmm0,DWORD[12+r10],15843 vpinsrd xmm1,xmm1,DWORD[12+r15],15844 vpunpckldq ymm5,ymm5,ymm15845 vpinsrd xmm2,xmm2,DWORD[12+r11],15846 vpunpckldq ymm0,ymm0,ymm25847 vinserti128 ymm5,ymm5,xmm0,15848 vpshufb ymm5,ymm5,ymm65849 vpsrld ymm7,ymm9,65850 vpslld ymm2,ymm9,265851 vmovdqu YMMWORD[(96-128)+rax],ymm55852 vpaddd ymm5,ymm5,ymm125853 5854 vpsrld ymm1,ymm9,115855 vpxor ymm7,ymm7,ymm25856 vpslld ymm2,ymm9,215857 vpaddd ymm5,ymm5,YMMWORD[((-32))+rbp]5858 vpxor ymm7,ymm7,ymm15859 5860 vpsrld ymm1,ymm9,255861 vpxor ymm7,ymm7,ymm25862 5863 vpslld ymm2,ymm9,75864 vpandn ymm0,ymm9,ymm115865 vpand ymm4,ymm9,ymm105866 5867 vpxor ymm7,ymm7,ymm15868 5869 vpsrld ymm12,ymm13,25870 vpxor ymm7,ymm7,ymm25871 5872 vpslld ymm1,ymm13,305873 vpxor ymm0,ymm0,ymm45874 vpxor ymm4,ymm14,ymm135875 5876 vpxor ymm12,ymm12,ymm15877 vpaddd ymm5,ymm5,ymm75878 5879 vpsrld ymm1,ymm13,135880 5881 vpslld ymm2,ymm13,195882 vpaddd ymm5,ymm5,ymm05883 vpand ymm3,ymm3,ymm45884 5885 vpxor ymm7,ymm12,ymm15886 5887 vpsrld ymm1,ymm13,225888 vpxor ymm7,ymm7,ymm25889 5890 vpslld ymm2,ymm13,105891 vpxor ymm12,ymm14,ymm35892 vpaddd ymm8,ymm8,ymm55893 5894 vpxor ymm7,ymm7,ymm15895 vpxor ymm7,ymm7,ymm25896 5897 vpaddd ymm12,ymm12,ymm55898 vpaddd ymm12,ymm12,ymm75899 vmovd xmm5,DWORD[16+r12]5900 vmovd xmm0,DWORD[16+r8]5901 vmovd xmm1,DWORD[16+r13]5902 vmovd xmm2,DWORD[16+r9]5903 vpinsrd xmm5,xmm5,DWORD[16+r14],15904 vpinsrd xmm0,xmm0,DWORD[16+r10],15905 vpinsrd xmm1,xmm1,DWORD[16+r15],15906 vpunpckldq ymm5,ymm5,ymm15907 vpinsrd xmm2,xmm2,DWORD[16+r11],15908 vpunpckldq ymm0,ymm0,ymm25909 vinserti128 ymm5,ymm5,xmm0,15910 vpshufb ymm5,ymm5,ymm65911 vpsrld ymm7,ymm8,65912 vpslld ymm2,ymm8,265913 vmovdqu YMMWORD[(128-128)+rax],ymm55914 vpaddd ymm5,ymm5,ymm115915 5916 vpsrld ymm1,ymm8,115917 vpxor ymm7,ymm7,ymm25918 vpslld ymm2,ymm8,215919 vpaddd ymm5,ymm5,YMMWORD[rbp]5920 vpxor ymm7,ymm7,ymm15921 5922 vpsrld ymm1,ymm8,255923 vpxor ymm7,ymm7,ymm25924 5925 vpslld ymm2,ymm8,75926 vpandn ymm0,ymm8,ymm105927 vpand ymm3,ymm8,ymm95928 5929 vpxor ymm7,ymm7,ymm15930 5931 vpsrld ymm11,ymm12,25932 vpxor ymm7,ymm7,ymm25933 5934 vpslld ymm1,ymm12,305935 vpxor ymm0,ymm0,ymm35936 vpxor ymm3,ymm13,ymm125937 5938 vpxor ymm11,ymm11,ymm15939 vpaddd ymm5,ymm5,ymm75940 5941 vpsrld ymm1,ymm12,135942 5943 vpslld ymm2,ymm12,195944 vpaddd ymm5,ymm5,ymm05945 vpand ymm4,ymm4,ymm35946 5947 vpxor ymm7,ymm11,ymm15948 5949 vpsrld ymm1,ymm12,225950 vpxor ymm7,ymm7,ymm25951 5952 vpslld ymm2,ymm12,105953 vpxor ymm11,ymm13,ymm45954 vpaddd ymm15,ymm15,ymm55955 5956 vpxor ymm7,ymm7,ymm15957 vpxor ymm7,ymm7,ymm25958 5959 vpaddd ymm11,ymm11,ymm55960 vpaddd ymm11,ymm11,ymm75961 vmovd xmm5,DWORD[20+r12]5962 vmovd xmm0,DWORD[20+r8]5963 vmovd xmm1,DWORD[20+r13]5964 vmovd xmm2,DWORD[20+r9]5965 vpinsrd xmm5,xmm5,DWORD[20+r14],15966 vpinsrd xmm0,xmm0,DWORD[20+r10],15967 vpinsrd xmm1,xmm1,DWORD[20+r15],15968 vpunpckldq ymm5,ymm5,ymm15969 vpinsrd xmm2,xmm2,DWORD[20+r11],15970 vpunpckldq ymm0,ymm0,ymm25971 vinserti128 ymm5,ymm5,xmm0,15972 vpshufb ymm5,ymm5,ymm65973 vpsrld ymm7,ymm15,65974 vpslld ymm2,ymm15,265975 vmovdqu YMMWORD[(160-128)+rax],ymm55976 vpaddd ymm5,ymm5,ymm105977 5978 vpsrld ymm1,ymm15,115979 vpxor ymm7,ymm7,ymm25980 vpslld ymm2,ymm15,215981 vpaddd ymm5,ymm5,YMMWORD[32+rbp]5982 vpxor ymm7,ymm7,ymm15983 5984 vpsrld ymm1,ymm15,255985 vpxor ymm7,ymm7,ymm25986 5987 vpslld ymm2,ymm15,75988 vpandn ymm0,ymm15,ymm95989 vpand ymm4,ymm15,ymm85990 5991 vpxor ymm7,ymm7,ymm15992 5993 vpsrld ymm10,ymm11,25994 vpxor ymm7,ymm7,ymm25995 5996 vpslld ymm1,ymm11,305997 vpxor ymm0,ymm0,ymm45998 vpxor ymm4,ymm12,ymm115999 6000 vpxor ymm10,ymm10,ymm16001 vpaddd ymm5,ymm5,ymm76002 6003 vpsrld ymm1,ymm11,136004 6005 vpslld ymm2,ymm11,196006 vpaddd ymm5,ymm5,ymm06007 vpand ymm3,ymm3,ymm46008 6009 vpxor ymm7,ymm10,ymm16010 6011 vpsrld ymm1,ymm11,226012 vpxor ymm7,ymm7,ymm26013 6014 vpslld ymm2,ymm11,106015 vpxor ymm10,ymm12,ymm36016 vpaddd ymm14,ymm14,ymm56017 6018 vpxor ymm7,ymm7,ymm16019 vpxor ymm7,ymm7,ymm26020 6021 vpaddd ymm10,ymm10,ymm56022 vpaddd ymm10,ymm10,ymm76023 vmovd xmm5,DWORD[24+r12]6024 vmovd xmm0,DWORD[24+r8]6025 vmovd xmm1,DWORD[24+r13]6026 vmovd xmm2,DWORD[24+r9]6027 vpinsrd xmm5,xmm5,DWORD[24+r14],16028 vpinsrd xmm0,xmm0,DWORD[24+r10],16029 vpinsrd xmm1,xmm1,DWORD[24+r15],16030 vpunpckldq ymm5,ymm5,ymm16031 vpinsrd xmm2,xmm2,DWORD[24+r11],16032 vpunpckldq ymm0,ymm0,ymm26033 vinserti128 ymm5,ymm5,xmm0,16034 vpshufb ymm5,ymm5,ymm66035 vpsrld ymm7,ymm14,66036 vpslld ymm2,ymm14,266037 vmovdqu YMMWORD[(192-128)+rax],ymm56038 vpaddd ymm5,ymm5,ymm96039 6040 vpsrld ymm1,ymm14,116041 vpxor ymm7,ymm7,ymm26042 vpslld ymm2,ymm14,216043 vpaddd ymm5,ymm5,YMMWORD[64+rbp]6044 vpxor ymm7,ymm7,ymm16045 6046 vpsrld ymm1,ymm14,256047 vpxor ymm7,ymm7,ymm26048 6049 vpslld ymm2,ymm14,76050 vpandn ymm0,ymm14,ymm86051 vpand ymm3,ymm14,ymm156052 6053 vpxor ymm7,ymm7,ymm16054 6055 vpsrld ymm9,ymm10,26056 vpxor ymm7,ymm7,ymm26057 6058 vpslld ymm1,ymm10,306059 vpxor ymm0,ymm0,ymm36060 vpxor ymm3,ymm11,ymm106061 6062 vpxor ymm9,ymm9,ymm16063 vpaddd ymm5,ymm5,ymm76064 6065 vpsrld ymm1,ymm10,136066 6067 vpslld ymm2,ymm10,196068 vpaddd ymm5,ymm5,ymm06069 vpand ymm4,ymm4,ymm36070 6071 vpxor ymm7,ymm9,ymm16072 6073 vpsrld ymm1,ymm10,226074 vpxor ymm7,ymm7,ymm26075 6076 vpslld ymm2,ymm10,106077 vpxor ymm9,ymm11,ymm46078 vpaddd ymm13,ymm13,ymm56079 6080 vpxor ymm7,ymm7,ymm16081 vpxor ymm7,ymm7,ymm26082 6083 vpaddd ymm9,ymm9,ymm56084 vpaddd ymm9,ymm9,ymm76085 vmovd xmm5,DWORD[28+r12]6086 vmovd xmm0,DWORD[28+r8]6087 vmovd xmm1,DWORD[28+r13]6088 vmovd xmm2,DWORD[28+r9]6089 vpinsrd xmm5,xmm5,DWORD[28+r14],16090 vpinsrd xmm0,xmm0,DWORD[28+r10],16091 vpinsrd xmm1,xmm1,DWORD[28+r15],16092 vpunpckldq ymm5,ymm5,ymm16093 vpinsrd xmm2,xmm2,DWORD[28+r11],16094 vpunpckldq ymm0,ymm0,ymm26095 vinserti128 ymm5,ymm5,xmm0,16096 vpshufb ymm5,ymm5,ymm66097 vpsrld ymm7,ymm13,66098 vpslld ymm2,ymm13,266099 vmovdqu YMMWORD[(224-128)+rax],ymm56100 vpaddd ymm5,ymm5,ymm86101 6102 vpsrld ymm1,ymm13,116103 vpxor ymm7,ymm7,ymm26104 vpslld ymm2,ymm13,216105 vpaddd ymm5,ymm5,YMMWORD[96+rbp]6106 vpxor ymm7,ymm7,ymm16107 6108 vpsrld ymm1,ymm13,256109 vpxor ymm7,ymm7,ymm26110 6111 vpslld ymm2,ymm13,76112 vpandn ymm0,ymm13,ymm156113 vpand ymm4,ymm13,ymm146114 6115 vpxor ymm7,ymm7,ymm16116 6117 vpsrld ymm8,ymm9,26118 vpxor ymm7,ymm7,ymm26119 6120 vpslld ymm1,ymm9,306121 vpxor ymm0,ymm0,ymm46122 vpxor ymm4,ymm10,ymm96123 6124 vpxor ymm8,ymm8,ymm16125 vpaddd ymm5,ymm5,ymm76126 6127 vpsrld ymm1,ymm9,136128 6129 vpslld ymm2,ymm9,196130 vpaddd ymm5,ymm5,ymm06131 vpand ymm3,ymm3,ymm46132 6133 vpxor ymm7,ymm8,ymm16134 6135 vpsrld ymm1,ymm9,226136 vpxor ymm7,ymm7,ymm26137 6138 vpslld ymm2,ymm9,106139 vpxor ymm8,ymm10,ymm36140 vpaddd ymm12,ymm12,ymm56141 6142 vpxor ymm7,ymm7,ymm16143 vpxor ymm7,ymm7,ymm26144 6145 vpaddd ymm8,ymm8,ymm56146 vpaddd ymm8,ymm8,ymm76147 add rbp,2566148 vmovd xmm5,DWORD[32+r12]6149 vmovd xmm0,DWORD[32+r8]6150 vmovd xmm1,DWORD[32+r13]6151 vmovd xmm2,DWORD[32+r9]6152 vpinsrd xmm5,xmm5,DWORD[32+r14],16153 vpinsrd xmm0,xmm0,DWORD[32+r10],16154 vpinsrd xmm1,xmm1,DWORD[32+r15],16155 vpunpckldq ymm5,ymm5,ymm16156 vpinsrd xmm2,xmm2,DWORD[32+r11],16157 vpunpckldq ymm0,ymm0,ymm26158 vinserti128 ymm5,ymm5,xmm0,16159 vpshufb ymm5,ymm5,ymm66160 vpsrld ymm7,ymm12,66161 vpslld ymm2,ymm12,266162 vmovdqu YMMWORD[(256-256-128)+rbx],ymm56163 vpaddd ymm5,ymm5,ymm156164 6165 vpsrld ymm1,ymm12,116166 vpxor ymm7,ymm7,ymm26167 vpslld ymm2,ymm12,216168 vpaddd ymm5,ymm5,YMMWORD[((-128))+rbp]6169 vpxor ymm7,ymm7,ymm16170 6171 vpsrld ymm1,ymm12,256172 vpxor ymm7,ymm7,ymm26173 6174 vpslld ymm2,ymm12,76175 vpandn ymm0,ymm12,ymm146176 vpand ymm3,ymm12,ymm136177 6178 vpxor ymm7,ymm7,ymm16179 6180 vpsrld ymm15,ymm8,26181 vpxor ymm7,ymm7,ymm26182 6183 vpslld ymm1,ymm8,306184 vpxor ymm0,ymm0,ymm36185 vpxor ymm3,ymm9,ymm86186 6187 vpxor ymm15,ymm15,ymm16188 vpaddd ymm5,ymm5,ymm76189 6190 vpsrld ymm1,ymm8,136191 6192 vpslld ymm2,ymm8,196193 vpaddd ymm5,ymm5,ymm06194 vpand ymm4,ymm4,ymm36195 6196 vpxor ymm7,ymm15,ymm16197 6198 vpsrld ymm1,ymm8,226199 vpxor ymm7,ymm7,ymm26200 6201 vpslld ymm2,ymm8,106202 vpxor ymm15,ymm9,ymm46203 vpaddd ymm11,ymm11,ymm56204 6205 vpxor ymm7,ymm7,ymm16206 vpxor ymm7,ymm7,ymm26207 6208 vpaddd ymm15,ymm15,ymm56209 vpaddd ymm15,ymm15,ymm76210 vmovd xmm5,DWORD[36+r12]6211 vmovd xmm0,DWORD[36+r8]6212 vmovd xmm1,DWORD[36+r13]6213 vmovd xmm2,DWORD[36+r9]6214 vpinsrd xmm5,xmm5,DWORD[36+r14],16215 vpinsrd xmm0,xmm0,DWORD[36+r10],16216 vpinsrd xmm1,xmm1,DWORD[36+r15],16217 vpunpckldq ymm5,ymm5,ymm16218 vpinsrd xmm2,xmm2,DWORD[36+r11],16219 vpunpckldq ymm0,ymm0,ymm26220 vinserti128 ymm5,ymm5,xmm0,16221 vpshufb ymm5,ymm5,ymm66222 vpsrld ymm7,ymm11,66223 vpslld ymm2,ymm11,266224 vmovdqu YMMWORD[(288-256-128)+rbx],ymm56225 vpaddd ymm5,ymm5,ymm146226 6227 vpsrld ymm1,ymm11,116228 vpxor ymm7,ymm7,ymm26229 vpslld ymm2,ymm11,216230 vpaddd ymm5,ymm5,YMMWORD[((-96))+rbp]6231 vpxor ymm7,ymm7,ymm16232 6233 vpsrld ymm1,ymm11,256234 vpxor ymm7,ymm7,ymm26235 6236 vpslld ymm2,ymm11,76237 vpandn ymm0,ymm11,ymm136238 vpand ymm4,ymm11,ymm126239 6240 vpxor ymm7,ymm7,ymm16241 6242 vpsrld ymm14,ymm15,26243 vpxor ymm7,ymm7,ymm26244 6245 vpslld ymm1,ymm15,306246 vpxor ymm0,ymm0,ymm46247 vpxor ymm4,ymm8,ymm156248 6249 vpxor ymm14,ymm14,ymm16250 vpaddd ymm5,ymm5,ymm76251 6252 vpsrld ymm1,ymm15,136253 6254 vpslld ymm2,ymm15,196255 vpaddd ymm5,ymm5,ymm06256 vpand ymm3,ymm3,ymm46257 6258 vpxor ymm7,ymm14,ymm16259 6260 vpsrld ymm1,ymm15,226261 vpxor ymm7,ymm7,ymm26262 6263 vpslld ymm2,ymm15,106264 vpxor ymm14,ymm8,ymm36265 vpaddd ymm10,ymm10,ymm56266 6267 vpxor ymm7,ymm7,ymm16268 vpxor ymm7,ymm7,ymm26269 6270 vpaddd ymm14,ymm14,ymm56271 vpaddd ymm14,ymm14,ymm76272 vmovd xmm5,DWORD[40+r12]6273 vmovd xmm0,DWORD[40+r8]6274 vmovd xmm1,DWORD[40+r13]6275 vmovd xmm2,DWORD[40+r9]6276 vpinsrd xmm5,xmm5,DWORD[40+r14],16277 vpinsrd xmm0,xmm0,DWORD[40+r10],16278 vpinsrd xmm1,xmm1,DWORD[40+r15],16279 vpunpckldq ymm5,ymm5,ymm16280 vpinsrd xmm2,xmm2,DWORD[40+r11],16281 vpunpckldq ymm0,ymm0,ymm26282 vinserti128 ymm5,ymm5,xmm0,16283 vpshufb ymm5,ymm5,ymm66284 vpsrld ymm7,ymm10,66285 vpslld ymm2,ymm10,266286 vmovdqu YMMWORD[(320-256-128)+rbx],ymm56287 vpaddd ymm5,ymm5,ymm136288 6289 vpsrld ymm1,ymm10,116290 vpxor ymm7,ymm7,ymm26291 vpslld ymm2,ymm10,216292 vpaddd ymm5,ymm5,YMMWORD[((-64))+rbp]6293 vpxor ymm7,ymm7,ymm16294 6295 vpsrld ymm1,ymm10,256296 vpxor ymm7,ymm7,ymm26297 6298 vpslld ymm2,ymm10,76299 vpandn ymm0,ymm10,ymm126300 vpand ymm3,ymm10,ymm116301 6302 vpxor ymm7,ymm7,ymm16303 6304 vpsrld ymm13,ymm14,26305 vpxor ymm7,ymm7,ymm26306 6307 vpslld ymm1,ymm14,306308 vpxor ymm0,ymm0,ymm36309 vpxor ymm3,ymm15,ymm146310 6311 vpxor ymm13,ymm13,ymm16312 vpaddd ymm5,ymm5,ymm76313 6314 vpsrld ymm1,ymm14,136315 6316 vpslld ymm2,ymm14,196317 vpaddd ymm5,ymm5,ymm06318 vpand ymm4,ymm4,ymm36319 6320 vpxor ymm7,ymm13,ymm16321 6322 vpsrld ymm1,ymm14,226323 vpxor ymm7,ymm7,ymm26324 6325 vpslld ymm2,ymm14,106326 vpxor ymm13,ymm15,ymm46327 vpaddd ymm9,ymm9,ymm56328 6329 vpxor ymm7,ymm7,ymm16330 vpxor ymm7,ymm7,ymm26331 6332 vpaddd ymm13,ymm13,ymm56333 vpaddd ymm13,ymm13,ymm76334 vmovd xmm5,DWORD[44+r12]6335 vmovd xmm0,DWORD[44+r8]6336 vmovd xmm1,DWORD[44+r13]6337 vmovd xmm2,DWORD[44+r9]6338 vpinsrd xmm5,xmm5,DWORD[44+r14],16339 vpinsrd xmm0,xmm0,DWORD[44+r10],16340 vpinsrd xmm1,xmm1,DWORD[44+r15],16341 vpunpckldq ymm5,ymm5,ymm16342 vpinsrd xmm2,xmm2,DWORD[44+r11],16343 vpunpckldq ymm0,ymm0,ymm26344 vinserti128 ymm5,ymm5,xmm0,16345 vpshufb ymm5,ymm5,ymm66346 vpsrld ymm7,ymm9,66347 vpslld ymm2,ymm9,266348 vmovdqu YMMWORD[(352-256-128)+rbx],ymm56349 vpaddd ymm5,ymm5,ymm126350 6351 vpsrld ymm1,ymm9,116352 vpxor ymm7,ymm7,ymm26353 vpslld ymm2,ymm9,216354 vpaddd ymm5,ymm5,YMMWORD[((-32))+rbp]6355 vpxor ymm7,ymm7,ymm16356 6357 vpsrld ymm1,ymm9,256358 vpxor ymm7,ymm7,ymm26359 6360 vpslld ymm2,ymm9,76361 vpandn ymm0,ymm9,ymm116362 vpand ymm4,ymm9,ymm106363 6364 vpxor ymm7,ymm7,ymm16365 6366 vpsrld ymm12,ymm13,26367 vpxor ymm7,ymm7,ymm26368 6369 vpslld ymm1,ymm13,306370 vpxor ymm0,ymm0,ymm46371 vpxor ymm4,ymm14,ymm136372 6373 vpxor ymm12,ymm12,ymm16374 vpaddd ymm5,ymm5,ymm76375 6376 vpsrld ymm1,ymm13,136377 6378 vpslld ymm2,ymm13,196379 vpaddd ymm5,ymm5,ymm06380 vpand ymm3,ymm3,ymm46381 6382 vpxor ymm7,ymm12,ymm16383 6384 vpsrld ymm1,ymm13,226385 vpxor ymm7,ymm7,ymm26386 6387 vpslld ymm2,ymm13,106388 vpxor ymm12,ymm14,ymm36389 vpaddd ymm8,ymm8,ymm56390 6391 vpxor ymm7,ymm7,ymm16392 vpxor ymm7,ymm7,ymm26393 6394 vpaddd ymm12,ymm12,ymm56395 vpaddd ymm12,ymm12,ymm76396 vmovd xmm5,DWORD[48+r12]6397 vmovd xmm0,DWORD[48+r8]6398 vmovd xmm1,DWORD[48+r13]6399 vmovd xmm2,DWORD[48+r9]6400 vpinsrd xmm5,xmm5,DWORD[48+r14],16401 vpinsrd xmm0,xmm0,DWORD[48+r10],16402 vpinsrd xmm1,xmm1,DWORD[48+r15],16403 vpunpckldq ymm5,ymm5,ymm16404 vpinsrd xmm2,xmm2,DWORD[48+r11],16405 vpunpckldq ymm0,ymm0,ymm26406 vinserti128 ymm5,ymm5,xmm0,16407 vpshufb ymm5,ymm5,ymm66408 vpsrld ymm7,ymm8,66409 vpslld ymm2,ymm8,266410 vmovdqu YMMWORD[(384-256-128)+rbx],ymm56411 vpaddd ymm5,ymm5,ymm116412 6413 vpsrld ymm1,ymm8,116414 vpxor ymm7,ymm7,ymm26415 vpslld ymm2,ymm8,216416 vpaddd ymm5,ymm5,YMMWORD[rbp]6417 vpxor ymm7,ymm7,ymm16418 6419 vpsrld ymm1,ymm8,256420 vpxor ymm7,ymm7,ymm26421 6422 vpslld ymm2,ymm8,76423 vpandn ymm0,ymm8,ymm106424 vpand ymm3,ymm8,ymm96425 6426 vpxor ymm7,ymm7,ymm16427 6428 vpsrld ymm11,ymm12,26429 vpxor ymm7,ymm7,ymm26430 6431 vpslld ymm1,ymm12,306432 vpxor ymm0,ymm0,ymm36433 vpxor ymm3,ymm13,ymm126434 6435 vpxor ymm11,ymm11,ymm16436 vpaddd ymm5,ymm5,ymm76437 6438 vpsrld ymm1,ymm12,136439 6440 vpslld ymm2,ymm12,196441 vpaddd ymm5,ymm5,ymm06442 vpand ymm4,ymm4,ymm36443 6444 vpxor ymm7,ymm11,ymm16445 6446 vpsrld ymm1,ymm12,226447 vpxor ymm7,ymm7,ymm26448 6449 vpslld ymm2,ymm12,106450 vpxor ymm11,ymm13,ymm46451 vpaddd ymm15,ymm15,ymm56452 6453 vpxor ymm7,ymm7,ymm16454 vpxor ymm7,ymm7,ymm26455 6456 vpaddd ymm11,ymm11,ymm56457 vpaddd ymm11,ymm11,ymm76458 vmovd xmm5,DWORD[52+r12]6459 vmovd xmm0,DWORD[52+r8]6460 vmovd xmm1,DWORD[52+r13]6461 vmovd xmm2,DWORD[52+r9]6462 vpinsrd xmm5,xmm5,DWORD[52+r14],16463 vpinsrd xmm0,xmm0,DWORD[52+r10],16464 vpinsrd xmm1,xmm1,DWORD[52+r15],16465 vpunpckldq ymm5,ymm5,ymm16466 vpinsrd xmm2,xmm2,DWORD[52+r11],16467 vpunpckldq ymm0,ymm0,ymm26468 vinserti128 ymm5,ymm5,xmm0,16469 vpshufb ymm5,ymm5,ymm66470 vpsrld ymm7,ymm15,66471 vpslld ymm2,ymm15,266472 vmovdqu YMMWORD[(416-256-128)+rbx],ymm56473 vpaddd ymm5,ymm5,ymm106474 6475 vpsrld ymm1,ymm15,116476 vpxor ymm7,ymm7,ymm26477 vpslld ymm2,ymm15,216478 vpaddd ymm5,ymm5,YMMWORD[32+rbp]6479 vpxor ymm7,ymm7,ymm16480 6481 vpsrld ymm1,ymm15,256482 vpxor ymm7,ymm7,ymm26483 6484 vpslld ymm2,ymm15,76485 vpandn ymm0,ymm15,ymm96486 vpand ymm4,ymm15,ymm86487 6488 vpxor ymm7,ymm7,ymm16489 6490 vpsrld ymm10,ymm11,26491 vpxor ymm7,ymm7,ymm26492 6493 vpslld ymm1,ymm11,306494 vpxor ymm0,ymm0,ymm46495 vpxor ymm4,ymm12,ymm116496 6497 vpxor ymm10,ymm10,ymm16498 vpaddd ymm5,ymm5,ymm76499 6500 vpsrld ymm1,ymm11,136501 6502 vpslld ymm2,ymm11,196503 vpaddd ymm5,ymm5,ymm06504 vpand ymm3,ymm3,ymm46505 6506 vpxor ymm7,ymm10,ymm16507 6508 vpsrld ymm1,ymm11,226509 vpxor ymm7,ymm7,ymm26510 6511 vpslld ymm2,ymm11,106512 vpxor ymm10,ymm12,ymm36513 vpaddd ymm14,ymm14,ymm56514 6515 vpxor ymm7,ymm7,ymm16516 vpxor ymm7,ymm7,ymm26517 6518 vpaddd ymm10,ymm10,ymm56519 vpaddd ymm10,ymm10,ymm76520 vmovd xmm5,DWORD[56+r12]6521 vmovd xmm0,DWORD[56+r8]6522 vmovd xmm1,DWORD[56+r13]6523 vmovd xmm2,DWORD[56+r9]6524 vpinsrd xmm5,xmm5,DWORD[56+r14],16525 vpinsrd xmm0,xmm0,DWORD[56+r10],16526 vpinsrd xmm1,xmm1,DWORD[56+r15],16527 vpunpckldq ymm5,ymm5,ymm16528 vpinsrd xmm2,xmm2,DWORD[56+r11],16529 vpunpckldq ymm0,ymm0,ymm26530 vinserti128 ymm5,ymm5,xmm0,16531 vpshufb ymm5,ymm5,ymm66532 vpsrld ymm7,ymm14,66533 vpslld ymm2,ymm14,266534 vmovdqu YMMWORD[(448-256-128)+rbx],ymm56535 vpaddd ymm5,ymm5,ymm96536 6537 vpsrld ymm1,ymm14,116538 vpxor ymm7,ymm7,ymm26539 vpslld ymm2,ymm14,216540 vpaddd ymm5,ymm5,YMMWORD[64+rbp]6541 vpxor ymm7,ymm7,ymm16542 6543 vpsrld ymm1,ymm14,256544 vpxor ymm7,ymm7,ymm26545 6546 vpslld ymm2,ymm14,76547 vpandn ymm0,ymm14,ymm86548 vpand ymm3,ymm14,ymm156549 6550 vpxor ymm7,ymm7,ymm16551 6552 vpsrld ymm9,ymm10,26553 vpxor ymm7,ymm7,ymm26554 6555 vpslld ymm1,ymm10,306556 vpxor ymm0,ymm0,ymm36557 vpxor ymm3,ymm11,ymm106558 6559 vpxor ymm9,ymm9,ymm16560 vpaddd ymm5,ymm5,ymm76561 6562 vpsrld ymm1,ymm10,136563 6564 vpslld ymm2,ymm10,196565 vpaddd ymm5,ymm5,ymm06566 vpand ymm4,ymm4,ymm36567 6568 vpxor ymm7,ymm9,ymm16569 6570 vpsrld ymm1,ymm10,226571 vpxor ymm7,ymm7,ymm26572 6573 vpslld ymm2,ymm10,106574 vpxor ymm9,ymm11,ymm46575 vpaddd ymm13,ymm13,ymm56576 6577 vpxor ymm7,ymm7,ymm16578 vpxor ymm7,ymm7,ymm26579 6580 vpaddd ymm9,ymm9,ymm56581 vpaddd ymm9,ymm9,ymm76582 vmovd xmm5,DWORD[60+r12]6583 lea r12,[64+r12]6584 vmovd xmm0,DWORD[60+r8]6585 lea r8,[64+r8]6586 vmovd xmm1,DWORD[60+r13]6587 lea r13,[64+r13]6588 vmovd xmm2,DWORD[60+r9]6589 lea r9,[64+r9]6590 vpinsrd xmm5,xmm5,DWORD[60+r14],16591 lea r14,[64+r14]6592 vpinsrd xmm0,xmm0,DWORD[60+r10],16593 lea r10,[64+r10]6594 vpinsrd xmm1,xmm1,DWORD[60+r15],16595 lea r15,[64+r15]6596 vpunpckldq ymm5,ymm5,ymm16597 vpinsrd xmm2,xmm2,DWORD[60+r11],16598 lea r11,[64+r11]6599 vpunpckldq ymm0,ymm0,ymm26600 vinserti128 ymm5,ymm5,xmm0,16601 vpshufb ymm5,ymm5,ymm66602 vpsrld ymm7,ymm13,66603 vpslld ymm2,ymm13,266604 vmovdqu YMMWORD[(480-256-128)+rbx],ymm56605 vpaddd ymm5,ymm5,ymm86606 6607 vpsrld ymm1,ymm13,116608 vpxor ymm7,ymm7,ymm26609 vpslld ymm2,ymm13,216610 vpaddd ymm5,ymm5,YMMWORD[96+rbp]6611 vpxor ymm7,ymm7,ymm16612 6613 vpsrld ymm1,ymm13,256614 vpxor ymm7,ymm7,ymm26615 prefetcht0 [63+r12]6616 vpslld ymm2,ymm13,76617 vpandn ymm0,ymm13,ymm156618 vpand ymm4,ymm13,ymm146619 prefetcht0 [63+r13]6620 vpxor ymm7,ymm7,ymm16621 6622 vpsrld ymm8,ymm9,26623 vpxor ymm7,ymm7,ymm26624 prefetcht0 [63+r14]6625 vpslld ymm1,ymm9,306626 vpxor ymm0,ymm0,ymm46627 vpxor ymm4,ymm10,ymm96628 prefetcht0 [63+r15]6629 vpxor ymm8,ymm8,ymm16630 vpaddd ymm5,ymm5,ymm76631 6632 vpsrld ymm1,ymm9,136633 prefetcht0 [63+r8]6634 vpslld ymm2,ymm9,196635 vpaddd ymm5,ymm5,ymm06636 vpand ymm3,ymm3,ymm46637 prefetcht0 [63+r9]6638 vpxor ymm7,ymm8,ymm16639 6640 vpsrld ymm1,ymm9,226641 vpxor ymm7,ymm7,ymm26642 prefetcht0 [63+r10]6643 vpslld ymm2,ymm9,106644 vpxor ymm8,ymm10,ymm36645 vpaddd ymm12,ymm12,ymm56646 prefetcht0 [63+r11]6647 vpxor ymm7,ymm7,ymm16648 vpxor ymm7,ymm7,ymm26649 6650 vpaddd ymm8,ymm8,ymm56651 vpaddd ymm8,ymm8,ymm76652 add rbp,2566653 vmovdqu ymm5,YMMWORD[((0-128))+rax]6654 mov ecx,36655 jmp NEAR $L$oop_16_xx_avx26656 ALIGN 326657 $L$oop_16_xx_avx2:6658 vmovdqu ymm6,YMMWORD[((32-128))+rax]6659 vpaddd ymm5,ymm5,YMMWORD[((288-256-128))+rbx]6660 6661 vpsrld ymm7,ymm6,36662 vpsrld ymm1,ymm6,76663 vpslld ymm2,ymm6,256664 vpxor ymm7,ymm7,ymm16665 vpsrld ymm1,ymm6,186666 vpxor ymm7,ymm7,ymm26667 vpslld ymm2,ymm6,146668 vmovdqu ymm0,YMMWORD[((448-256-128))+rbx]6669 vpsrld ymm3,ymm0,106670 6671 vpxor ymm7,ymm7,ymm16672 vpsrld ymm1,ymm0,176673 vpxor ymm7,ymm7,ymm26674 vpslld ymm2,ymm0,156675 vpaddd ymm5,ymm5,ymm76676 vpxor ymm7,ymm3,ymm16677 vpsrld ymm1,ymm0,196678 vpxor ymm7,ymm7,ymm26679 vpslld ymm2,ymm0,136680 vpxor ymm7,ymm7,ymm16681 vpxor ymm7,ymm7,ymm26682 vpaddd ymm5,ymm5,ymm76683 vpsrld ymm7,ymm12,66684 vpslld ymm2,ymm12,266685 vmovdqu YMMWORD[(0-128)+rax],ymm56686 vpaddd ymm5,ymm5,ymm156687 6688 vpsrld ymm1,ymm12,116689 vpxor ymm7,ymm7,ymm26690 vpslld ymm2,ymm12,216691 vpaddd ymm5,ymm5,YMMWORD[((-128))+rbp]6692 vpxor ymm7,ymm7,ymm16693 6694 vpsrld ymm1,ymm12,256695 vpxor ymm7,ymm7,ymm26696 6697 vpslld ymm2,ymm12,76698 vpandn ymm0,ymm12,ymm146699 vpand ymm3,ymm12,ymm136700 6701 vpxor ymm7,ymm7,ymm16702 6703 vpsrld ymm15,ymm8,26704 vpxor ymm7,ymm7,ymm26705 6706 vpslld ymm1,ymm8,306707 vpxor ymm0,ymm0,ymm36708 vpxor ymm3,ymm9,ymm86709 6710 vpxor ymm15,ymm15,ymm16711 vpaddd ymm5,ymm5,ymm76712 6713 vpsrld ymm1,ymm8,136714 6715 vpslld ymm2,ymm8,196716 vpaddd ymm5,ymm5,ymm06717 vpand ymm4,ymm4,ymm36718 6719 vpxor ymm7,ymm15,ymm16720 6721 vpsrld ymm1,ymm8,226722 vpxor ymm7,ymm7,ymm26723 6724 vpslld ymm2,ymm8,106725 vpxor ymm15,ymm9,ymm46726 vpaddd ymm11,ymm11,ymm56727 6728 vpxor ymm7,ymm7,ymm16729 vpxor ymm7,ymm7,ymm26730 6731 vpaddd ymm15,ymm15,ymm56732 vpaddd ymm15,ymm15,ymm76733 vmovdqu ymm5,YMMWORD[((64-128))+rax]6734 vpaddd ymm6,ymm6,YMMWORD[((320-256-128))+rbx]6735 6736 vpsrld ymm7,ymm5,36737 vpsrld ymm1,ymm5,76738 vpslld ymm2,ymm5,256739 vpxor ymm7,ymm7,ymm16740 vpsrld ymm1,ymm5,186741 vpxor ymm7,ymm7,ymm26742 vpslld ymm2,ymm5,146743 vmovdqu ymm0,YMMWORD[((480-256-128))+rbx]6744 vpsrld ymm4,ymm0,106745 6746 vpxor ymm7,ymm7,ymm16747 vpsrld ymm1,ymm0,176748 vpxor ymm7,ymm7,ymm26749 vpslld ymm2,ymm0,156750 vpaddd ymm6,ymm6,ymm76751 vpxor ymm7,ymm4,ymm16752 vpsrld ymm1,ymm0,196753 vpxor ymm7,ymm7,ymm26754 vpslld ymm2,ymm0,136755 vpxor ymm7,ymm7,ymm16756 vpxor ymm7,ymm7,ymm26757 vpaddd ymm6,ymm6,ymm76758 vpsrld ymm7,ymm11,66759 vpslld ymm2,ymm11,266760 vmovdqu YMMWORD[(32-128)+rax],ymm66761 vpaddd ymm6,ymm6,ymm146762 6763 vpsrld ymm1,ymm11,116764 vpxor ymm7,ymm7,ymm26765 vpslld ymm2,ymm11,216766 vpaddd ymm6,ymm6,YMMWORD[((-96))+rbp]6767 vpxor ymm7,ymm7,ymm16768 6769 vpsrld ymm1,ymm11,256770 vpxor ymm7,ymm7,ymm26771 6772 vpslld ymm2,ymm11,76773 vpandn ymm0,ymm11,ymm136774 vpand ymm4,ymm11,ymm126775 6776 vpxor ymm7,ymm7,ymm16777 6778 vpsrld ymm14,ymm15,26779 vpxor ymm7,ymm7,ymm26780 6781 vpslld ymm1,ymm15,306782 vpxor ymm0,ymm0,ymm46783 vpxor ymm4,ymm8,ymm156784 6785 vpxor ymm14,ymm14,ymm16786 vpaddd ymm6,ymm6,ymm76787 6788 vpsrld ymm1,ymm15,136789 6790 vpslld ymm2,ymm15,196791 vpaddd ymm6,ymm6,ymm06792 vpand ymm3,ymm3,ymm46793 6794 vpxor ymm7,ymm14,ymm16795 6796 vpsrld ymm1,ymm15,226797 vpxor ymm7,ymm7,ymm26798 6799 vpslld ymm2,ymm15,106800 vpxor ymm14,ymm8,ymm36801 vpaddd ymm10,ymm10,ymm66802 6803 vpxor ymm7,ymm7,ymm16804 vpxor ymm7,ymm7,ymm26805 6806 vpaddd ymm14,ymm14,ymm66807 vpaddd ymm14,ymm14,ymm76808 vmovdqu ymm6,YMMWORD[((96-128))+rax]6809 vpaddd ymm5,ymm5,YMMWORD[((352-256-128))+rbx]6810 6811 vpsrld ymm7,ymm6,36812 vpsrld ymm1,ymm6,76813 vpslld ymm2,ymm6,256814 vpxor ymm7,ymm7,ymm16815 vpsrld ymm1,ymm6,186816 vpxor ymm7,ymm7,ymm26817 vpslld ymm2,ymm6,146818 vmovdqu ymm0,YMMWORD[((0-128))+rax]6819 vpsrld ymm3,ymm0,106820 6821 vpxor ymm7,ymm7,ymm16822 vpsrld ymm1,ymm0,176823 vpxor ymm7,ymm7,ymm26824 vpslld ymm2,ymm0,156825 vpaddd ymm5,ymm5,ymm76826 vpxor ymm7,ymm3,ymm16827 vpsrld ymm1,ymm0,196828 vpxor ymm7,ymm7,ymm26829 vpslld ymm2,ymm0,136830 vpxor ymm7,ymm7,ymm16831 vpxor ymm7,ymm7,ymm26832 vpaddd ymm5,ymm5,ymm76833 vpsrld ymm7,ymm10,66834 vpslld ymm2,ymm10,266835 vmovdqu YMMWORD[(64-128)+rax],ymm56836 vpaddd ymm5,ymm5,ymm136837 6838 vpsrld ymm1,ymm10,116839 vpxor ymm7,ymm7,ymm26840 vpslld ymm2,ymm10,216841 vpaddd ymm5,ymm5,YMMWORD[((-64))+rbp]6842 vpxor ymm7,ymm7,ymm16843 6844 vpsrld ymm1,ymm10,256845 vpxor ymm7,ymm7,ymm26846 6847 vpslld ymm2,ymm10,76848 vpandn ymm0,ymm10,ymm126849 vpand ymm3,ymm10,ymm116850 6851 vpxor ymm7,ymm7,ymm16852 6853 vpsrld ymm13,ymm14,26854 vpxor ymm7,ymm7,ymm26855 6856 vpslld ymm1,ymm14,306857 vpxor ymm0,ymm0,ymm36858 vpxor ymm3,ymm15,ymm146859 6860 vpxor ymm13,ymm13,ymm16861 vpaddd ymm5,ymm5,ymm76862 6863 vpsrld ymm1,ymm14,136864 6865 vpslld ymm2,ymm14,196866 vpaddd ymm5,ymm5,ymm06867 vpand ymm4,ymm4,ymm36868 6869 vpxor ymm7,ymm13,ymm16870 6871 vpsrld ymm1,ymm14,226872 vpxor ymm7,ymm7,ymm26873 6874 vpslld ymm2,ymm14,106875 vpxor ymm13,ymm15,ymm46876 vpaddd ymm9,ymm9,ymm56877 6878 vpxor ymm7,ymm7,ymm16879 vpxor ymm7,ymm7,ymm26880 6881 vpaddd ymm13,ymm13,ymm56882 vpaddd ymm13,ymm13,ymm76883 vmovdqu ymm5,YMMWORD[((128-128))+rax]6884 vpaddd ymm6,ymm6,YMMWORD[((384-256-128))+rbx]6885 6886 vpsrld ymm7,ymm5,36887 vpsrld ymm1,ymm5,76888 vpslld ymm2,ymm5,256889 vpxor ymm7,ymm7,ymm16890 vpsrld ymm1,ymm5,186891 vpxor ymm7,ymm7,ymm26892 vpslld ymm2,ymm5,146893 vmovdqu ymm0,YMMWORD[((32-128))+rax]6894 vpsrld ymm4,ymm0,106895 6896 vpxor ymm7,ymm7,ymm16897 vpsrld ymm1,ymm0,176898 vpxor ymm7,ymm7,ymm26899 vpslld ymm2,ymm0,156900 vpaddd ymm6,ymm6,ymm76901 vpxor ymm7,ymm4,ymm16902 vpsrld ymm1,ymm0,196903 vpxor ymm7,ymm7,ymm26904 vpslld ymm2,ymm0,136905 vpxor ymm7,ymm7,ymm16906 vpxor ymm7,ymm7,ymm26907 vpaddd ymm6,ymm6,ymm76908 vpsrld ymm7,ymm9,66909 vpslld ymm2,ymm9,266910 vmovdqu YMMWORD[(96-128)+rax],ymm66911 vpaddd ymm6,ymm6,ymm126912 6913 vpsrld ymm1,ymm9,116914 vpxor ymm7,ymm7,ymm26915 vpslld ymm2,ymm9,216916 vpaddd ymm6,ymm6,YMMWORD[((-32))+rbp]6917 vpxor ymm7,ymm7,ymm16918 6919 vpsrld ymm1,ymm9,256920 vpxor ymm7,ymm7,ymm26921 6922 vpslld ymm2,ymm9,76923 vpandn ymm0,ymm9,ymm116924 vpand ymm4,ymm9,ymm106925 6926 vpxor ymm7,ymm7,ymm16927 6928 vpsrld ymm12,ymm13,26929 vpxor ymm7,ymm7,ymm26930 6931 vpslld ymm1,ymm13,306932 vpxor ymm0,ymm0,ymm46933 vpxor ymm4,ymm14,ymm136934 6935 vpxor ymm12,ymm12,ymm16936 vpaddd ymm6,ymm6,ymm76937 6938 vpsrld ymm1,ymm13,136939 6940 vpslld ymm2,ymm13,196941 vpaddd ymm6,ymm6,ymm06942 vpand ymm3,ymm3,ymm46943 6944 vpxor ymm7,ymm12,ymm16945 6946 vpsrld ymm1,ymm13,226947 vpxor ymm7,ymm7,ymm26948 6949 vpslld ymm2,ymm13,106950 vpxor ymm12,ymm14,ymm36951 vpaddd ymm8,ymm8,ymm66952 6953 vpxor ymm7,ymm7,ymm16954 vpxor ymm7,ymm7,ymm26955 6956 vpaddd ymm12,ymm12,ymm66957 vpaddd ymm12,ymm12,ymm76958 vmovdqu ymm6,YMMWORD[((160-128))+rax]6959 vpaddd ymm5,ymm5,YMMWORD[((416-256-128))+rbx]6960 6961 vpsrld ymm7,ymm6,36962 vpsrld ymm1,ymm6,76963 vpslld ymm2,ymm6,256964 vpxor ymm7,ymm7,ymm16965 vpsrld ymm1,ymm6,186966 vpxor ymm7,ymm7,ymm26967 vpslld ymm2,ymm6,146968 vmovdqu ymm0,YMMWORD[((64-128))+rax]6969 vpsrld ymm3,ymm0,106970 6971 vpxor ymm7,ymm7,ymm16972 vpsrld ymm1,ymm0,176973 vpxor ymm7,ymm7,ymm26974 vpslld ymm2,ymm0,156975 vpaddd ymm5,ymm5,ymm76976 vpxor ymm7,ymm3,ymm16977 vpsrld ymm1,ymm0,196978 vpxor ymm7,ymm7,ymm26979 vpslld ymm2,ymm0,136980 vpxor ymm7,ymm7,ymm16981 vpxor ymm7,ymm7,ymm26982 vpaddd ymm5,ymm5,ymm76983 vpsrld ymm7,ymm8,66984 vpslld ymm2,ymm8,266985 vmovdqu YMMWORD[(128-128)+rax],ymm56986 vpaddd ymm5,ymm5,ymm116987 6988 vpsrld ymm1,ymm8,116989 vpxor ymm7,ymm7,ymm26990 vpslld ymm2,ymm8,216991 vpaddd ymm5,ymm5,YMMWORD[rbp]6992 vpxor ymm7,ymm7,ymm16993 6994 vpsrld ymm1,ymm8,256995 vpxor ymm7,ymm7,ymm26996 6997 vpslld ymm2,ymm8,76998 vpandn ymm0,ymm8,ymm106999 vpand ymm3,ymm8,ymm97000 7001 vpxor ymm7,ymm7,ymm17002 7003 vpsrld ymm11,ymm12,27004 vpxor ymm7,ymm7,ymm27005 7006 vpslld ymm1,ymm12,307007 vpxor ymm0,ymm0,ymm37008 vpxor ymm3,ymm13,ymm127009 7010 vpxor ymm11,ymm11,ymm17011 vpaddd ymm5,ymm5,ymm77012 7013 vpsrld ymm1,ymm12,137014 7015 vpslld ymm2,ymm12,197016 vpaddd ymm5,ymm5,ymm07017 vpand ymm4,ymm4,ymm37018 7019 vpxor ymm7,ymm11,ymm17020 7021 vpsrld ymm1,ymm12,227022 vpxor ymm7,ymm7,ymm27023 7024 vpslld ymm2,ymm12,107025 vpxor ymm11,ymm13,ymm47026 vpaddd ymm15,ymm15,ymm57027 7028 vpxor ymm7,ymm7,ymm17029 vpxor ymm7,ymm7,ymm27030 7031 vpaddd ymm11,ymm11,ymm57032 vpaddd ymm11,ymm11,ymm77033 vmovdqu ymm5,YMMWORD[((192-128))+rax]7034 vpaddd ymm6,ymm6,YMMWORD[((448-256-128))+rbx]7035 7036 vpsrld ymm7,ymm5,37037 vpsrld ymm1,ymm5,77038 vpslld ymm2,ymm5,257039 vpxor ymm7,ymm7,ymm17040 vpsrld ymm1,ymm5,187041 vpxor ymm7,ymm7,ymm27042 vpslld ymm2,ymm5,147043 vmovdqu ymm0,YMMWORD[((96-128))+rax]7044 vpsrld ymm4,ymm0,107045 7046 vpxor ymm7,ymm7,ymm17047 vpsrld ymm1,ymm0,177048 vpxor ymm7,ymm7,ymm27049 vpslld ymm2,ymm0,157050 vpaddd ymm6,ymm6,ymm77051 vpxor ymm7,ymm4,ymm17052 vpsrld ymm1,ymm0,197053 vpxor ymm7,ymm7,ymm27054 vpslld ymm2,ymm0,137055 vpxor ymm7,ymm7,ymm17056 vpxor ymm7,ymm7,ymm27057 vpaddd ymm6,ymm6,ymm77058 vpsrld ymm7,ymm15,67059 vpslld ymm2,ymm15,267060 vmovdqu YMMWORD[(160-128)+rax],ymm67061 vpaddd ymm6,ymm6,ymm107062 7063 vpsrld ymm1,ymm15,117064 vpxor ymm7,ymm7,ymm27065 vpslld ymm2,ymm15,217066 vpaddd ymm6,ymm6,YMMWORD[32+rbp]7067 vpxor ymm7,ymm7,ymm17068 7069 vpsrld ymm1,ymm15,257070 vpxor ymm7,ymm7,ymm27071 7072 vpslld ymm2,ymm15,77073 vpandn ymm0,ymm15,ymm97074 vpand ymm4,ymm15,ymm87075 7076 vpxor ymm7,ymm7,ymm17077 7078 vpsrld ymm10,ymm11,27079 vpxor ymm7,ymm7,ymm27080 7081 vpslld ymm1,ymm11,307082 vpxor ymm0,ymm0,ymm47083 vpxor ymm4,ymm12,ymm117084 7085 vpxor ymm10,ymm10,ymm17086 vpaddd ymm6,ymm6,ymm77087 7088 vpsrld ymm1,ymm11,137089 7090 vpslld ymm2,ymm11,197091 vpaddd ymm6,ymm6,ymm07092 vpand ymm3,ymm3,ymm47093 7094 vpxor ymm7,ymm10,ymm17095 7096 vpsrld ymm1,ymm11,227097 vpxor ymm7,ymm7,ymm27098 7099 vpslld ymm2,ymm11,107100 vpxor ymm10,ymm12,ymm37101 vpaddd ymm14,ymm14,ymm67102 7103 vpxor ymm7,ymm7,ymm17104 vpxor ymm7,ymm7,ymm27105 7106 vpaddd ymm10,ymm10,ymm67107 vpaddd ymm10,ymm10,ymm77108 vmovdqu ymm6,YMMWORD[((224-128))+rax]7109 vpaddd ymm5,ymm5,YMMWORD[((480-256-128))+rbx]7110 7111 vpsrld ymm7,ymm6,37112 vpsrld ymm1,ymm6,77113 vpslld ymm2,ymm6,257114 vpxor ymm7,ymm7,ymm17115 vpsrld ymm1,ymm6,187116 vpxor ymm7,ymm7,ymm27117 vpslld ymm2,ymm6,147118 vmovdqu ymm0,YMMWORD[((128-128))+rax]7119 vpsrld ymm3,ymm0,107120 7121 vpxor ymm7,ymm7,ymm17122 vpsrld ymm1,ymm0,177123 vpxor ymm7,ymm7,ymm27124 vpslld ymm2,ymm0,157125 vpaddd ymm5,ymm5,ymm77126 vpxor ymm7,ymm3,ymm17127 vpsrld ymm1,ymm0,197128 vpxor ymm7,ymm7,ymm27129 vpslld ymm2,ymm0,137130 vpxor ymm7,ymm7,ymm17131 vpxor ymm7,ymm7,ymm27132 vpaddd ymm5,ymm5,ymm77133 vpsrld ymm7,ymm14,67134 vpslld ymm2,ymm14,267135 vmovdqu YMMWORD[(192-128)+rax],ymm57136 vpaddd ymm5,ymm5,ymm97137 7138 vpsrld ymm1,ymm14,117139 vpxor ymm7,ymm7,ymm27140 vpslld ymm2,ymm14,217141 vpaddd ymm5,ymm5,YMMWORD[64+rbp]7142 vpxor ymm7,ymm7,ymm17143 7144 vpsrld ymm1,ymm14,257145 vpxor ymm7,ymm7,ymm27146 7147 vpslld ymm2,ymm14,77148 vpandn ymm0,ymm14,ymm87149 vpand ymm3,ymm14,ymm157150 7151 vpxor ymm7,ymm7,ymm17152 7153 vpsrld ymm9,ymm10,27154 vpxor ymm7,ymm7,ymm27155 7156 vpslld ymm1,ymm10,307157 vpxor ymm0,ymm0,ymm37158 vpxor ymm3,ymm11,ymm107159 7160 vpxor ymm9,ymm9,ymm17161 vpaddd ymm5,ymm5,ymm77162 7163 vpsrld ymm1,ymm10,137164 7165 vpslld ymm2,ymm10,197166 vpaddd ymm5,ymm5,ymm07167 vpand ymm4,ymm4,ymm37168 7169 vpxor ymm7,ymm9,ymm17170 7171 vpsrld ymm1,ymm10,227172 vpxor ymm7,ymm7,ymm27173 7174 vpslld ymm2,ymm10,107175 vpxor ymm9,ymm11,ymm47176 vpaddd ymm13,ymm13,ymm57177 7178 vpxor ymm7,ymm7,ymm17179 vpxor ymm7,ymm7,ymm27180 7181 vpaddd ymm9,ymm9,ymm57182 vpaddd ymm9,ymm9,ymm77183 vmovdqu ymm5,YMMWORD[((256-256-128))+rbx]7184 vpaddd ymm6,ymm6,YMMWORD[((0-128))+rax]7185 7186 vpsrld ymm7,ymm5,37187 vpsrld ymm1,ymm5,77188 vpslld ymm2,ymm5,257189 vpxor ymm7,ymm7,ymm17190 vpsrld ymm1,ymm5,187191 vpxor ymm7,ymm7,ymm27192 vpslld ymm2,ymm5,147193 vmovdqu ymm0,YMMWORD[((160-128))+rax]7194 vpsrld ymm4,ymm0,107195 7196 vpxor ymm7,ymm7,ymm17197 vpsrld ymm1,ymm0,177198 vpxor ymm7,ymm7,ymm27199 vpslld ymm2,ymm0,157200 vpaddd ymm6,ymm6,ymm77201 vpxor ymm7,ymm4,ymm17202 vpsrld ymm1,ymm0,197203 vpxor ymm7,ymm7,ymm27204 vpslld ymm2,ymm0,137205 vpxor ymm7,ymm7,ymm17206 vpxor ymm7,ymm7,ymm27207 vpaddd ymm6,ymm6,ymm77208 vpsrld ymm7,ymm13,67209 vpslld ymm2,ymm13,267210 vmovdqu YMMWORD[(224-128)+rax],ymm67211 vpaddd ymm6,ymm6,ymm87212 7213 vpsrld ymm1,ymm13,117214 vpxor ymm7,ymm7,ymm27215 vpslld ymm2,ymm13,217216 vpaddd ymm6,ymm6,YMMWORD[96+rbp]7217 vpxor ymm7,ymm7,ymm17218 7219 vpsrld ymm1,ymm13,257220 vpxor ymm7,ymm7,ymm27221 7222 vpslld ymm2,ymm13,77223 vpandn ymm0,ymm13,ymm157224 vpand ymm4,ymm13,ymm147225 7226 vpxor ymm7,ymm7,ymm17227 7228 vpsrld ymm8,ymm9,27229 vpxor ymm7,ymm7,ymm27230 7231 vpslld ymm1,ymm9,307232 vpxor ymm0,ymm0,ymm47233 vpxor ymm4,ymm10,ymm97234 7235 vpxor ymm8,ymm8,ymm17236 vpaddd ymm6,ymm6,ymm77237 7238 vpsrld ymm1,ymm9,137239 7240 vpslld ymm2,ymm9,197241 vpaddd ymm6,ymm6,ymm07242 vpand ymm3,ymm3,ymm47243 7244 vpxor ymm7,ymm8,ymm17245 7246 vpsrld ymm1,ymm9,227247 vpxor ymm7,ymm7,ymm27248 7249 vpslld ymm2,ymm9,107250 vpxor ymm8,ymm10,ymm37251 vpaddd ymm12,ymm12,ymm67252 7253 vpxor ymm7,ymm7,ymm17254 vpxor ymm7,ymm7,ymm27255 7256 vpaddd ymm8,ymm8,ymm67257 vpaddd ymm8,ymm8,ymm77258 add rbp,2567259 vmovdqu ymm6,YMMWORD[((288-256-128))+rbx]7260 vpaddd ymm5,ymm5,YMMWORD[((32-128))+rax]7261 7262 vpsrld ymm7,ymm6,37263 vpsrld ymm1,ymm6,77264 vpslld ymm2,ymm6,257265 vpxor ymm7,ymm7,ymm17266 vpsrld ymm1,ymm6,187267 vpxor ymm7,ymm7,ymm27268 vpslld ymm2,ymm6,147269 vmovdqu ymm0,YMMWORD[((192-128))+rax]7270 vpsrld ymm3,ymm0,107271 7272 vpxor ymm7,ymm7,ymm17273 vpsrld ymm1,ymm0,177274 vpxor ymm7,ymm7,ymm27275 vpslld ymm2,ymm0,157276 vpaddd ymm5,ymm5,ymm77277 vpxor ymm7,ymm3,ymm17278 vpsrld ymm1,ymm0,197279 vpxor ymm7,ymm7,ymm27280 vpslld ymm2,ymm0,137281 vpxor ymm7,ymm7,ymm17282 vpxor ymm7,ymm7,ymm27283 vpaddd ymm5,ymm5,ymm77284 vpsrld ymm7,ymm12,67285 vpslld ymm2,ymm12,267286 vmovdqu YMMWORD[(256-256-128)+rbx],ymm57287 vpaddd ymm5,ymm5,ymm157288 7289 vpsrld ymm1,ymm12,117290 vpxor ymm7,ymm7,ymm27291 vpslld ymm2,ymm12,217292 vpaddd ymm5,ymm5,YMMWORD[((-128))+rbp]7293 vpxor ymm7,ymm7,ymm17294 7295 vpsrld ymm1,ymm12,257296 vpxor ymm7,ymm7,ymm27297 7298 vpslld ymm2,ymm12,77299 vpandn ymm0,ymm12,ymm147300 vpand ymm3,ymm12,ymm137301 7302 vpxor ymm7,ymm7,ymm17303 7304 vpsrld ymm15,ymm8,27305 vpxor ymm7,ymm7,ymm27306 7307 vpslld ymm1,ymm8,307308 vpxor ymm0,ymm0,ymm37309 vpxor ymm3,ymm9,ymm87310 7311 vpxor ymm15,ymm15,ymm17312 vpaddd ymm5,ymm5,ymm77313 7314 vpsrld ymm1,ymm8,137315 7316 vpslld ymm2,ymm8,197317 vpaddd ymm5,ymm5,ymm07318 vpand ymm4,ymm4,ymm37319 7320 vpxor ymm7,ymm15,ymm17321 7322 vpsrld ymm1,ymm8,227323 vpxor ymm7,ymm7,ymm27324 7325 vpslld ymm2,ymm8,107326 vpxor ymm15,ymm9,ymm47327 vpaddd ymm11,ymm11,ymm57328 7329 vpxor ymm7,ymm7,ymm17330 vpxor ymm7,ymm7,ymm27331 7332 vpaddd ymm15,ymm15,ymm57333 vpaddd ymm15,ymm15,ymm77334 vmovdqu ymm5,YMMWORD[((320-256-128))+rbx]7335 vpaddd ymm6,ymm6,YMMWORD[((64-128))+rax]7336 7337 vpsrld ymm7,ymm5,37338 vpsrld ymm1,ymm5,77339 vpslld ymm2,ymm5,257340 vpxor ymm7,ymm7,ymm17341 vpsrld ymm1,ymm5,187342 vpxor ymm7,ymm7,ymm27343 vpslld ymm2,ymm5,147344 vmovdqu ymm0,YMMWORD[((224-128))+rax]7345 vpsrld ymm4,ymm0,107346 7347 vpxor ymm7,ymm7,ymm17348 vpsrld ymm1,ymm0,177349 vpxor ymm7,ymm7,ymm27350 vpslld ymm2,ymm0,157351 vpaddd ymm6,ymm6,ymm77352 vpxor ymm7,ymm4,ymm17353 vpsrld ymm1,ymm0,197354 vpxor ymm7,ymm7,ymm27355 vpslld ymm2,ymm0,137356 vpxor ymm7,ymm7,ymm17357 vpxor ymm7,ymm7,ymm27358 vpaddd ymm6,ymm6,ymm77359 vpsrld ymm7,ymm11,67360 vpslld ymm2,ymm11,267361 vmovdqu YMMWORD[(288-256-128)+rbx],ymm67362 vpaddd ymm6,ymm6,ymm147363 7364 vpsrld ymm1,ymm11,117365 vpxor ymm7,ymm7,ymm27366 vpslld ymm2,ymm11,217367 vpaddd ymm6,ymm6,YMMWORD[((-96))+rbp]7368 vpxor ymm7,ymm7,ymm17369 7370 vpsrld ymm1,ymm11,257371 vpxor ymm7,ymm7,ymm27372 7373 vpslld ymm2,ymm11,77374 vpandn ymm0,ymm11,ymm137375 vpand ymm4,ymm11,ymm127376 7377 vpxor ymm7,ymm7,ymm17378 7379 vpsrld ymm14,ymm15,27380 vpxor ymm7,ymm7,ymm27381 7382 vpslld ymm1,ymm15,307383 vpxor ymm0,ymm0,ymm47384 vpxor ymm4,ymm8,ymm157385 7386 vpxor ymm14,ymm14,ymm17387 vpaddd ymm6,ymm6,ymm77388 7389 vpsrld ymm1,ymm15,137390 7391 vpslld ymm2,ymm15,197392 vpaddd ymm6,ymm6,ymm07393 vpand ymm3,ymm3,ymm47394 7395 vpxor ymm7,ymm14,ymm17396 7397 vpsrld ymm1,ymm15,227398 vpxor ymm7,ymm7,ymm27399 7400 vpslld ymm2,ymm15,107401 vpxor ymm14,ymm8,ymm37402 vpaddd ymm10,ymm10,ymm67403 7404 vpxor ymm7,ymm7,ymm17405 vpxor ymm7,ymm7,ymm27406 7407 vpaddd ymm14,ymm14,ymm67408 vpaddd ymm14,ymm14,ymm77409 vmovdqu ymm6,YMMWORD[((352-256-128))+rbx]7410 vpaddd ymm5,ymm5,YMMWORD[((96-128))+rax]7411 7412 vpsrld ymm7,ymm6,37413 vpsrld ymm1,ymm6,77414 vpslld ymm2,ymm6,257415 vpxor ymm7,ymm7,ymm17416 vpsrld ymm1,ymm6,187417 vpxor ymm7,ymm7,ymm27418 vpslld ymm2,ymm6,147419 vmovdqu ymm0,YMMWORD[((256-256-128))+rbx]7420 vpsrld ymm3,ymm0,107421 7422 vpxor ymm7,ymm7,ymm17423 vpsrld ymm1,ymm0,177424 vpxor ymm7,ymm7,ymm27425 vpslld ymm2,ymm0,157426 vpaddd ymm5,ymm5,ymm77427 vpxor ymm7,ymm3,ymm17428 vpsrld ymm1,ymm0,197429 vpxor ymm7,ymm7,ymm27430 vpslld ymm2,ymm0,137431 vpxor ymm7,ymm7,ymm17432 vpxor ymm7,ymm7,ymm27433 vpaddd ymm5,ymm5,ymm77434 vpsrld ymm7,ymm10,67435 vpslld ymm2,ymm10,267436 vmovdqu YMMWORD[(320-256-128)+rbx],ymm57437 vpaddd ymm5,ymm5,ymm137438 7439 vpsrld ymm1,ymm10,117440 vpxor ymm7,ymm7,ymm27441 vpslld ymm2,ymm10,217442 vpaddd ymm5,ymm5,YMMWORD[((-64))+rbp]7443 vpxor ymm7,ymm7,ymm17444 7445 vpsrld ymm1,ymm10,257446 vpxor ymm7,ymm7,ymm27447 7448 vpslld ymm2,ymm10,77449 vpandn ymm0,ymm10,ymm127450 vpand ymm3,ymm10,ymm117451 7452 vpxor ymm7,ymm7,ymm17453 7454 vpsrld ymm13,ymm14,27455 vpxor ymm7,ymm7,ymm27456 7457 vpslld ymm1,ymm14,307458 vpxor ymm0,ymm0,ymm37459 vpxor ymm3,ymm15,ymm147460 7461 vpxor ymm13,ymm13,ymm17462 vpaddd ymm5,ymm5,ymm77463 7464 vpsrld ymm1,ymm14,137465 7466 vpslld ymm2,ymm14,197467 vpaddd ymm5,ymm5,ymm07468 vpand ymm4,ymm4,ymm37469 7470 vpxor ymm7,ymm13,ymm17471 7472 vpsrld ymm1,ymm14,227473 vpxor ymm7,ymm7,ymm27474 7475 vpslld ymm2,ymm14,107476 vpxor ymm13,ymm15,ymm47477 vpaddd ymm9,ymm9,ymm57478 7479 vpxor ymm7,ymm7,ymm17480 vpxor ymm7,ymm7,ymm27481 7482 vpaddd ymm13,ymm13,ymm57483 vpaddd ymm13,ymm13,ymm77484 vmovdqu ymm5,YMMWORD[((384-256-128))+rbx]7485 vpaddd ymm6,ymm6,YMMWORD[((128-128))+rax]7486 7487 vpsrld ymm7,ymm5,37488 vpsrld ymm1,ymm5,77489 vpslld ymm2,ymm5,257490 vpxor ymm7,ymm7,ymm17491 vpsrld ymm1,ymm5,187492 vpxor ymm7,ymm7,ymm27493 vpslld ymm2,ymm5,147494 vmovdqu ymm0,YMMWORD[((288-256-128))+rbx]7495 vpsrld ymm4,ymm0,107496 7497 vpxor ymm7,ymm7,ymm17498 vpsrld ymm1,ymm0,177499 vpxor ymm7,ymm7,ymm27500 vpslld ymm2,ymm0,157501 vpaddd ymm6,ymm6,ymm77502 vpxor ymm7,ymm4,ymm17503 vpsrld ymm1,ymm0,197504 vpxor ymm7,ymm7,ymm27505 vpslld ymm2,ymm0,137506 vpxor ymm7,ymm7,ymm17507 vpxor ymm7,ymm7,ymm27508 vpaddd ymm6,ymm6,ymm77509 vpsrld ymm7,ymm9,67510 vpslld ymm2,ymm9,267511 vmovdqu YMMWORD[(352-256-128)+rbx],ymm67512 vpaddd ymm6,ymm6,ymm127513 7514 vpsrld ymm1,ymm9,117515 vpxor ymm7,ymm7,ymm27516 vpslld ymm2,ymm9,217517 vpaddd ymm6,ymm6,YMMWORD[((-32))+rbp]7518 vpxor ymm7,ymm7,ymm17519 7520 vpsrld ymm1,ymm9,257521 vpxor ymm7,ymm7,ymm27522 7523 vpslld ymm2,ymm9,77524 vpandn ymm0,ymm9,ymm117525 vpand ymm4,ymm9,ymm107526 7527 vpxor ymm7,ymm7,ymm17528 7529 vpsrld ymm12,ymm13,27530 vpxor ymm7,ymm7,ymm27531 7532 vpslld ymm1,ymm13,307533 vpxor ymm0,ymm0,ymm47534 vpxor ymm4,ymm14,ymm137535 7536 vpxor ymm12,ymm12,ymm17537 vpaddd ymm6,ymm6,ymm77538 7539 vpsrld ymm1,ymm13,137540 7541 vpslld ymm2,ymm13,197542 vpaddd ymm6,ymm6,ymm07543 vpand ymm3,ymm3,ymm47544 7545 vpxor ymm7,ymm12,ymm17546 7547 vpsrld ymm1,ymm13,227548 vpxor ymm7,ymm7,ymm27549 7550 vpslld ymm2,ymm13,107551 vpxor ymm12,ymm14,ymm37552 vpaddd ymm8,ymm8,ymm67553 7554 vpxor ymm7,ymm7,ymm17555 vpxor ymm7,ymm7,ymm27556 7557 vpaddd ymm12,ymm12,ymm67558 vpaddd ymm12,ymm12,ymm77559 vmovdqu ymm6,YMMWORD[((416-256-128))+rbx]7560 vpaddd ymm5,ymm5,YMMWORD[((160-128))+rax]7561 7562 vpsrld ymm7,ymm6,37563 vpsrld ymm1,ymm6,77564 vpslld ymm2,ymm6,257565 vpxor ymm7,ymm7,ymm17566 vpsrld ymm1,ymm6,187567 vpxor ymm7,ymm7,ymm27568 vpslld ymm2,ymm6,147569 vmovdqu ymm0,YMMWORD[((320-256-128))+rbx]7570 vpsrld ymm3,ymm0,107571 7572 vpxor ymm7,ymm7,ymm17573 vpsrld ymm1,ymm0,177574 vpxor ymm7,ymm7,ymm27575 vpslld ymm2,ymm0,157576 vpaddd ymm5,ymm5,ymm77577 vpxor ymm7,ymm3,ymm17578 vpsrld ymm1,ymm0,197579 vpxor ymm7,ymm7,ymm27580 vpslld ymm2,ymm0,137581 vpxor ymm7,ymm7,ymm17582 vpxor ymm7,ymm7,ymm27583 vpaddd ymm5,ymm5,ymm77584 vpsrld ymm7,ymm8,67585 vpslld ymm2,ymm8,267586 vmovdqu YMMWORD[(384-256-128)+rbx],ymm57587 vpaddd ymm5,ymm5,ymm117588 7589 vpsrld ymm1,ymm8,117590 vpxor ymm7,ymm7,ymm27591 vpslld ymm2,ymm8,217592 vpaddd ymm5,ymm5,YMMWORD[rbp]7593 vpxor ymm7,ymm7,ymm17594 7595 vpsrld ymm1,ymm8,257596 vpxor ymm7,ymm7,ymm27597 7598 vpslld ymm2,ymm8,77599 vpandn ymm0,ymm8,ymm107600 vpand ymm3,ymm8,ymm97601 7602 vpxor ymm7,ymm7,ymm17603 7604 vpsrld ymm11,ymm12,27605 vpxor ymm7,ymm7,ymm27606 7607 vpslld ymm1,ymm12,307608 vpxor ymm0,ymm0,ymm37609 vpxor ymm3,ymm13,ymm127610 7611 vpxor ymm11,ymm11,ymm17612 vpaddd ymm5,ymm5,ymm77613 7614 vpsrld ymm1,ymm12,137615 7616 vpslld ymm2,ymm12,197617 vpaddd ymm5,ymm5,ymm07618 vpand ymm4,ymm4,ymm37619 7620 vpxor ymm7,ymm11,ymm17621 7622 vpsrld ymm1,ymm12,227623 vpxor ymm7,ymm7,ymm27624 7625 vpslld ymm2,ymm12,107626 vpxor ymm11,ymm13,ymm47627 vpaddd ymm15,ymm15,ymm57628 7629 vpxor ymm7,ymm7,ymm17630 vpxor ymm7,ymm7,ymm27631 7632 vpaddd ymm11,ymm11,ymm57633 vpaddd ymm11,ymm11,ymm77634 vmovdqu ymm5,YMMWORD[((448-256-128))+rbx]7635 vpaddd ymm6,ymm6,YMMWORD[((192-128))+rax]7636 7637 vpsrld ymm7,ymm5,37638 vpsrld ymm1,ymm5,77639 vpslld ymm2,ymm5,257640 vpxor ymm7,ymm7,ymm17641 vpsrld ymm1,ymm5,187642 vpxor ymm7,ymm7,ymm27643 vpslld ymm2,ymm5,147644 vmovdqu ymm0,YMMWORD[((352-256-128))+rbx]7645 vpsrld ymm4,ymm0,107646 7647 vpxor ymm7,ymm7,ymm17648 vpsrld ymm1,ymm0,177649 vpxor ymm7,ymm7,ymm27650 vpslld ymm2,ymm0,157651 vpaddd ymm6,ymm6,ymm77652 vpxor ymm7,ymm4,ymm17653 vpsrld ymm1,ymm0,197654 vpxor ymm7,ymm7,ymm27655 vpslld ymm2,ymm0,137656 vpxor ymm7,ymm7,ymm17657 vpxor ymm7,ymm7,ymm27658 vpaddd ymm6,ymm6,ymm77659 vpsrld ymm7,ymm15,67660 vpslld ymm2,ymm15,267661 vmovdqu YMMWORD[(416-256-128)+rbx],ymm67662 vpaddd ymm6,ymm6,ymm107663 7664 vpsrld ymm1,ymm15,117665 vpxor ymm7,ymm7,ymm27666 vpslld ymm2,ymm15,217667 vpaddd ymm6,ymm6,YMMWORD[32+rbp]7668 vpxor ymm7,ymm7,ymm17669 7670 vpsrld ymm1,ymm15,257671 vpxor ymm7,ymm7,ymm27672 7673 vpslld ymm2,ymm15,77674 vpandn ymm0,ymm15,ymm97675 vpand ymm4,ymm15,ymm87676 7677 vpxor ymm7,ymm7,ymm17678 7679 vpsrld ymm10,ymm11,27680 vpxor ymm7,ymm7,ymm27681 7682 vpslld ymm1,ymm11,307683 vpxor ymm0,ymm0,ymm47684 vpxor ymm4,ymm12,ymm117685 7686 vpxor ymm10,ymm10,ymm17687 vpaddd ymm6,ymm6,ymm77688 7689 vpsrld ymm1,ymm11,137690 7691 vpslld ymm2,ymm11,197692 vpaddd ymm6,ymm6,ymm07693 vpand ymm3,ymm3,ymm47694 7695 vpxor ymm7,ymm10,ymm17696 7697 vpsrld ymm1,ymm11,227698 vpxor ymm7,ymm7,ymm27699 7700 vpslld ymm2,ymm11,107701 vpxor ymm10,ymm12,ymm37702 vpaddd ymm14,ymm14,ymm67703 7704 vpxor ymm7,ymm7,ymm17705 vpxor ymm7,ymm7,ymm27706 7707 vpaddd ymm10,ymm10,ymm67708 vpaddd ymm10,ymm10,ymm77709 vmovdqu ymm6,YMMWORD[((480-256-128))+rbx]7710 vpaddd ymm5,ymm5,YMMWORD[((224-128))+rax]7711 7712 vpsrld ymm7,ymm6,37713 vpsrld ymm1,ymm6,77714 vpslld ymm2,ymm6,257715 vpxor ymm7,ymm7,ymm17716 vpsrld ymm1,ymm6,187717 vpxor ymm7,ymm7,ymm27718 vpslld ymm2,ymm6,147719 vmovdqu ymm0,YMMWORD[((384-256-128))+rbx]7720 vpsrld ymm3,ymm0,107721 7722 vpxor ymm7,ymm7,ymm17723 vpsrld ymm1,ymm0,177724 vpxor ymm7,ymm7,ymm27725 vpslld ymm2,ymm0,157726 vpaddd ymm5,ymm5,ymm77727 vpxor ymm7,ymm3,ymm17728 vpsrld ymm1,ymm0,197729 vpxor ymm7,ymm7,ymm27730 vpslld ymm2,ymm0,137731 vpxor ymm7,ymm7,ymm17732 vpxor ymm7,ymm7,ymm27733 vpaddd ymm5,ymm5,ymm77734 vpsrld ymm7,ymm14,67735 vpslld ymm2,ymm14,267736 vmovdqu YMMWORD[(448-256-128)+rbx],ymm57737 vpaddd ymm5,ymm5,ymm97738 7739 vpsrld ymm1,ymm14,117740 vpxor ymm7,ymm7,ymm27741 vpslld ymm2,ymm14,217742 vpaddd ymm5,ymm5,YMMWORD[64+rbp]7743 vpxor ymm7,ymm7,ymm17744 7745 vpsrld ymm1,ymm14,257746 vpxor ymm7,ymm7,ymm27747 7748 vpslld ymm2,ymm14,77749 vpandn ymm0,ymm14,ymm87750 vpand ymm3,ymm14,ymm157751 7752 vpxor ymm7,ymm7,ymm17753 7754 vpsrld ymm9,ymm10,27755 vpxor ymm7,ymm7,ymm27756 7757 vpslld ymm1,ymm10,307758 vpxor ymm0,ymm0,ymm37759 vpxor ymm3,ymm11,ymm107760 7761 vpxor ymm9,ymm9,ymm17762 vpaddd ymm5,ymm5,ymm77763 7764 vpsrld ymm1,ymm10,137765 7766 vpslld ymm2,ymm10,197767 vpaddd ymm5,ymm5,ymm07768 vpand ymm4,ymm4,ymm37769 7770 vpxor ymm7,ymm9,ymm17771 7772 vpsrld ymm1,ymm10,227773 vpxor ymm7,ymm7,ymm27774 7775 vpslld ymm2,ymm10,107776 vpxor ymm9,ymm11,ymm47777 vpaddd ymm13,ymm13,ymm57778 7779 vpxor ymm7,ymm7,ymm17780 vpxor ymm7,ymm7,ymm27781 7782 vpaddd ymm9,ymm9,ymm57783 vpaddd ymm9,ymm9,ymm77784 vmovdqu ymm5,YMMWORD[((0-128))+rax]7785 vpaddd ymm6,ymm6,YMMWORD[((256-256-128))+rbx]7786 7787 vpsrld ymm7,ymm5,37788 vpsrld ymm1,ymm5,77789 vpslld ymm2,ymm5,257790 vpxor ymm7,ymm7,ymm17791 vpsrld ymm1,ymm5,187792 vpxor ymm7,ymm7,ymm27793 vpslld ymm2,ymm5,147794 vmovdqu ymm0,YMMWORD[((416-256-128))+rbx]7795 vpsrld ymm4,ymm0,107796 7797 vpxor ymm7,ymm7,ymm17798 vpsrld ymm1,ymm0,177799 vpxor ymm7,ymm7,ymm27800 vpslld ymm2,ymm0,157801 vpaddd ymm6,ymm6,ymm77802 vpxor ymm7,ymm4,ymm17803 vpsrld ymm1,ymm0,197804 vpxor ymm7,ymm7,ymm27805 vpslld ymm2,ymm0,137806 vpxor ymm7,ymm7,ymm17807 vpxor ymm7,ymm7,ymm27808 vpaddd ymm6,ymm6,ymm77809 vpsrld ymm7,ymm13,67810 vpslld ymm2,ymm13,267811 vmovdqu YMMWORD[(480-256-128)+rbx],ymm67812 vpaddd ymm6,ymm6,ymm87813 7814 vpsrld ymm1,ymm13,117815 vpxor ymm7,ymm7,ymm27816 vpslld ymm2,ymm13,217817 vpaddd ymm6,ymm6,YMMWORD[96+rbp]7818 vpxor ymm7,ymm7,ymm17819 7820 vpsrld ymm1,ymm13,257821 vpxor ymm7,ymm7,ymm27822 7823 vpslld ymm2,ymm13,77824 vpandn ymm0,ymm13,ymm157825 vpand ymm4,ymm13,ymm147826 7827 vpxor ymm7,ymm7,ymm17828 7829 vpsrld ymm8,ymm9,27830 vpxor ymm7,ymm7,ymm27831 7832 vpslld ymm1,ymm9,307833 vpxor ymm0,ymm0,ymm47834 vpxor ymm4,ymm10,ymm97835 7836 vpxor ymm8,ymm8,ymm17837 vpaddd ymm6,ymm6,ymm77838 7839 vpsrld ymm1,ymm9,137840 7841 vpslld ymm2,ymm9,197842 vpaddd ymm6,ymm6,ymm07843 vpand ymm3,ymm3,ymm47844 7845 vpxor ymm7,ymm8,ymm17846 7847 vpsrld ymm1,ymm9,227848 vpxor ymm7,ymm7,ymm27849 7850 vpslld ymm2,ymm9,107851 vpxor ymm8,ymm10,ymm37852 vpaddd ymm12,ymm12,ymm67853 7854 vpxor ymm7,ymm7,ymm17855 vpxor ymm7,ymm7,ymm27856 7857 vpaddd ymm8,ymm8,ymm67858 vpaddd ymm8,ymm8,ymm77859 add rbp,2567860 dec ecx7861 jnz NEAR $L$oop_16_xx_avx27862 7863 mov ecx,17864 lea rbx,[512+rsp]7865 lea rbp,[((K256+128))]7866 cmp ecx,DWORD[rbx]7867 cmovge r12,rbp7868 cmp ecx,DWORD[4+rbx]7869 cmovge r13,rbp7870 cmp ecx,DWORD[8+rbx]7871 cmovge r14,rbp7872 cmp ecx,DWORD[12+rbx]7873 cmovge r15,rbp7874 cmp ecx,DWORD[16+rbx]7875 cmovge r8,rbp7876 cmp ecx,DWORD[20+rbx]7877 cmovge r9,rbp7878 cmp ecx,DWORD[24+rbx]7879 cmovge r10,rbp7880 cmp ecx,DWORD[28+rbx]7881 cmovge r11,rbp7882 vmovdqa ymm7,YMMWORD[rbx]7883 vpxor ymm0,ymm0,ymm07884 vmovdqa ymm6,ymm77885 vpcmpgtd ymm6,ymm6,ymm07886 vpaddd ymm7,ymm7,ymm67887 7888 vmovdqu ymm0,YMMWORD[((0-128))+rdi]7889 vpand ymm8,ymm8,ymm67890 vmovdqu ymm1,YMMWORD[((32-128))+rdi]7891 vpand ymm9,ymm9,ymm67892 vmovdqu ymm2,YMMWORD[((64-128))+rdi]7893 vpand ymm10,ymm10,ymm67894 vmovdqu ymm5,YMMWORD[((96-128))+rdi]7895 vpand ymm11,ymm11,ymm67896 vpaddd ymm8,ymm8,ymm07897 vmovdqu ymm0,YMMWORD[((128-128))+rdi]7898 vpand ymm12,ymm12,ymm67899 vpaddd ymm9,ymm9,ymm17900 vmovdqu ymm1,YMMWORD[((160-128))+rdi]7901 vpand ymm13,ymm13,ymm67902 vpaddd ymm10,ymm10,ymm27903 vmovdqu ymm2,YMMWORD[((192-128))+rdi]7904 vpand ymm14,ymm14,ymm67905 vpaddd ymm11,ymm11,ymm57906 vmovdqu ymm5,YMMWORD[((224-128))+rdi]7907 vpand ymm15,ymm15,ymm67908 vpaddd ymm12,ymm12,ymm07909 vpaddd ymm13,ymm13,ymm17910 vmovdqu YMMWORD[(0-128)+rdi],ymm87911 vpaddd ymm14,ymm14,ymm27912 vmovdqu YMMWORD[(32-128)+rdi],ymm97913 vpaddd ymm15,ymm15,ymm57914 vmovdqu YMMWORD[(64-128)+rdi],ymm107915 vmovdqu YMMWORD[(96-128)+rdi],ymm117916 vmovdqu YMMWORD[(128-128)+rdi],ymm127917 vmovdqu YMMWORD[(160-128)+rdi],ymm137918 vmovdqu YMMWORD[(192-128)+rdi],ymm147919 vmovdqu YMMWORD[(224-128)+rdi],ymm157920 7921 vmovdqu YMMWORD[rbx],ymm77922 lea rbx,[((256+128))+rsp]7923 vmovdqu ymm6,YMMWORD[$L$pbswap]7924 dec edx7925 jnz NEAR $L$oop_avx27926 7927 7928 7929 7930 7931 7932 7933 $L$done_avx2:7934 mov rax,QWORD[544+rsp]7935 7936 vzeroupper7937 movaps xmm6,XMMWORD[((-216))+rax]7938 movaps xmm7,XMMWORD[((-200))+rax]7939 movaps xmm8,XMMWORD[((-184))+rax]7940 movaps xmm9,XMMWORD[((-168))+rax]7941 movaps xmm10,XMMWORD[((-152))+rax]7942 movaps xmm11,XMMWORD[((-136))+rax]7943 movaps xmm12,XMMWORD[((-120))+rax]7944 movaps xmm13,XMMWORD[((-104))+rax]7945 movaps xmm14,XMMWORD[((-88))+rax]7946 movaps xmm15,XMMWORD[((-72))+rax]7947 mov r15,QWORD[((-48))+rax]7948 7949 mov r14,QWORD[((-40))+rax]7950 7951 mov r13,QWORD[((-32))+rax]7952 7953 mov r12,QWORD[((-24))+rax]7954 7955 mov rbp,QWORD[((-16))+rax]7956 7957 mov rbx,QWORD[((-8))+rax]7958 7959 lea rsp,[rax]7960 7961 $L$epilogue_avx2:7962 mov rdi,QWORD[8+rsp] ;WIN64 epilogue7963 mov rsi,QWORD[16+rsp]7964 DB 0F3h,0C3h ;repret7965 7966 $L$SEH_end_sha256_multi_block_avx2:7967 3207 ALIGN 256 7968 3208 K256: … … 8204 3444 DB 0F3h,0C3h ;repret 8205 3445 8206 8207 ALIGN 168208 avx2_handler:8209 push rsi8210 push rdi8211 push rbx8212 push rbp8213 push r128214 push r138215 push r148216 push r158217 pushfq8218 sub rsp,648219 8220 mov rax,QWORD[120+r8]8221 mov rbx,QWORD[248+r8]8222 8223 mov rsi,QWORD[8+r9]8224 mov r11,QWORD[56+r9]8225 8226 mov r10d,DWORD[r11]8227 lea r10,[r10*1+rsi]8228 cmp rbx,r108229 jb NEAR $L$in_prologue8230 8231 mov rax,QWORD[152+r8]8232 8233 mov r10d,DWORD[4+r11]8234 lea r10,[r10*1+rsi]8235 cmp rbx,r108236 jae NEAR $L$in_prologue8237 8238 mov rax,QWORD[544+r8]8239 8240 mov rbx,QWORD[((-8))+rax]8241 mov rbp,QWORD[((-16))+rax]8242 mov r12,QWORD[((-24))+rax]8243 mov r13,QWORD[((-32))+rax]8244 mov r14,QWORD[((-40))+rax]8245 mov r15,QWORD[((-48))+rax]8246 mov QWORD[144+r8],rbx8247 mov QWORD[160+r8],rbp8248 mov QWORD[216+r8],r128249 mov QWORD[224+r8],r138250 mov QWORD[232+r8],r148251 mov QWORD[240+r8],r158252 8253 lea rsi,[((-56-160))+rax]8254 lea rdi,[512+r8]8255 mov ecx,208256 DD 0xa548f3fc8257 8258 jmp NEAR $L$in_prologue8259 8260 3446 section .pdata rdata align=4 8261 3447 ALIGN 4 … … 8266 3452 DD $L$SEH_end_sha256_multi_block_shaext wrt ..imagebase 8267 3453 DD $L$SEH_info_sha256_multi_block_shaext wrt ..imagebase 8268 DD $L$SEH_begin_sha256_multi_block_avx wrt ..imagebase8269 DD $L$SEH_end_sha256_multi_block_avx wrt ..imagebase8270 DD $L$SEH_info_sha256_multi_block_avx wrt ..imagebase8271 DD $L$SEH_begin_sha256_multi_block_avx2 wrt ..imagebase8272 DD $L$SEH_end_sha256_multi_block_avx2 wrt ..imagebase8273 DD $L$SEH_info_sha256_multi_block_avx2 wrt ..imagebase8274 3454 section .xdata rdata align=8 8275 3455 ALIGN 8 … … 8282 3462 DD se_handler wrt ..imagebase 8283 3463 DD $L$body_shaext wrt ..imagebase,$L$epilogue_shaext wrt ..imagebase 8284 $L$SEH_info_sha256_multi_block_avx:8285 DB 9,0,0,08286 DD se_handler wrt ..imagebase8287 DD $L$body_avx wrt ..imagebase,$L$epilogue_avx wrt ..imagebase8288 $L$SEH_info_sha256_multi_block_avx2:8289 DB 9,0,0,08290 DD avx2_handler wrt ..imagebase8291 DD $L$body_avx2 wrt ..imagebase,$L$epilogue_avx2 wrt ..imagebase
Note:
See TracChangeset
for help on using the changeset viewer.