VirtualBox

Browse Source

Changeset 96218 in vbox for trunk/src/VBox/Runtime

Timestamp:

Aug 15, 2022 12:33:57 PM (2 years ago)

Author:

vboxsync

Message:

IPRT/nocrt: Fixed buggy remainder[fl] code. Added tests for it. bugref:10261

Location:

trunk/src/VBox/Runtime

Files:

: 4 edited

common/math/remainder.asm (modified) (2 diffs)
common/math/remainderf.asm (modified) (2 diffs)
common/math/remainderl.asm (modified) (2 diffs)
testcase/tstRTNoCrt-2.cpp (modified) (4 diffs)

Legend:

: Unmodified
: Added
: Removed

trunk/src/VBox/Runtime/common/math/remainder.asm

-              r96014
+              r96218
+;
+%define RT_ASM_WITH_SEH64
 %include "iprt/asmdefs.mac"
+%include "iprt/x86.mac"
 BEGINCODE
 …
 ;;
 ; See SUS.
 ; @returns st(0)
 ; @param    rd1    [ebp + 8h]  xmm0
 ; @param    rd2    [ebp + 10h]  xmm1
+; @returns  st(0) / xmm0
+; @param    rd1    [ebp + 8h]   xmm0    Dividend.
+; @param    rd2    [ebp + 10h]  xmm1    Divisor.
 RT_NOCRT_BEGINPROC remainder
+    push    xBP
+    mov     xBP, xSP
+    sub     xSP, 20h
+;int3
+        push    xBP
+        SEH64_PUSH_xBP
+        mov     xBP, xSP
+        SEH64_SET_FRAME_xBP 0
+%ifdef RT_ARCH_AMD64
+        sub     xSP, 20h
+        SEH64_ALLOCATE_STACK 20h
+%endif
+        SEH64_END_PROLOGUE
+        ;
+        ; Load the dividend into st0 and divisor into st1.
+        ;
 %ifdef RT_ARCH_AMD64
     movsd   [rsp + 10h], xmm1
     movsd   [rsp], xmm0
     fld     qword [rsp + 10h]
     fld     qword [rsp]
+        movsd   [xBP - 20h], xmm1
+        movsd   [xBP - 10h], xmm0
+        fld     qword [xBP - 20h]
+        fld     qword [xBP - 10h]
 %else
     fld     qword [ebp + 10h]
     fld     qword [ebp + 8h]
+        fld     qword [ebp + 10h]
+        fld     qword [ebp + 08h]
 %endif
+    fprem1
+    fstsw   ax
+    test    ah, 04h
+    jnz     .done
+    fstp    st1
+.done:
+%ifdef RT_ARCH_AMD64
+    fstp    qword [rsp]
+    movsd   xmm0, [rsp]
+        ;
+        ; The fprem1 only does between 32 and 64 rounds, so we have to loop
+        ; here till we've got a final result.  We count down in ECX to
+        ; avoid getting stuck here...
+        ;
+        mov     ecx, 2048 / 32 + 4
+.again:
+        fprem1
+        fstsw   ax
+        test    ah, (X86_FSW_C2 >> 8)
+        jz      .done
+        dec     cx
+        jnz     .again
+%ifdef RT_STRICT
+        int3
 %endif
+    leave
+    ret
+        ;
+        ; Return the result.
+        ;
+.done:
+        fstp    st1
+%ifdef RT_ARCH_AMD64
+        fstp    qword [rsp]
+        movsd   xmm0, [rsp]
+%endif
+        leave
+        ret
 ENDPROC   RT_NOCRT(remainder)

trunk/src/VBox/Runtime/common/math/remainderf.asm

-              r96014
+              r96218
+;
+%define RT_ASM_WITH_SEH64
 %include "iprt/asmdefs.mac"
+%include "iprt/x86.mac"
 BEGINCODE
 …
 ;;
 ; See SUS.
 ; @returns st(0)
 ; @param    rf1    [ebp + 08h]  xmm0
 ; @param    rf2    [ebp + 0ch]  xmm1
+; @returns  st(0) / xmm0
+; @param    rf1    [ebp + 8h]   xmm0    Dividend.
+; @param    rf2    [ebp + 10h]  xmm1    Divisor.
 RT_NOCRT_BEGINPROC remainderf
+    push    xBP
+    mov     xBP, xSP
+    sub     xSP, 20h
+        push    xBP
+        SEH64_PUSH_xBP
+        mov     xBP, xSP
+        SEH64_SET_FRAME_xBP 0
+%ifdef RT_ARCH_AMD64
+        sub     xSP, 20h
+        SEH64_ALLOCATE_STACK 20h
+%endif
+        SEH64_END_PROLOGUE
+        ;
+        ; Load the dividend into st0 and divisor into st1.
+        ;
 %ifdef RT_ARCH_AMD64
     movss   [rsp], xmm1
     movss   [rsp + 10h], xmm0
     fld     dword [rsp]
     fld     dword [rsp + 10h]
+        movss   [xBP - 20h], xmm1
+        movss   [xBP - 10h], xmm0
+        fld     dword [xBP - 20h]
+        fld     dword [xBP - 10h]
 %else
     fld     dword [ebp + 0ch]
     fld     dword [ebp + 8h]
+        fld     dword [ebp + 0ch]
+        fld     dword [ebp + 08h]
 %endif
+    fprem1
+    fstsw   ax
+    test    ah, 04h
+    jnz     .done
+    fstp    st1
+.done:
+%ifdef RT_ARCH_AMD64
+    fstp    dword [rsp]
+    movss   xmm0, [rsp]
+        ;
+        ; The fprem1 only does between 32 and 64 rounds, so we have to loop
+        ; here till we've got a final result.  We count down in ECX to
+        ; avoid getting stuck here...
+        ;
+        mov     ecx, 256 / 32 + 4
+.again:
+        fprem1
+        fstsw   ax
+        test    ah, (X86_FSW_C2 >> 8)
+        jz      .done
+        dec     cx
+        jnz     .again
+%ifdef RT_STRICT
+        int3
 %endif
+    leave
+    ret
+        ;
+        ; Return the result.
+        ;
+.done:
+        fstp    st1
+%ifdef RT_ARCH_AMD64
+        fstp    dword [rsp]
+        movss   xmm0, [rsp]
+%endif
+        leave
+        ret
 ENDPROC   RT_NOCRT(remainderf)

trunk/src/VBox/Runtime/common/math/remainderl.asm

-              r96014
+              r96218
+;
+%define RT_ASM_WITH_SEH64
 %include "iprt/asmdefs.mac"
+%include "iprt/x86.mac"
 BEGINCODE
 …
 ; @param    lrd2    [rbp + 20h]
 RT_NOCRT_BEGINPROC remainderl
+    push    xBP
+    mov     xBP, xSP
+        push    xBP
+        SEH64_PUSH_xBP
+        mov     xBP, xSP
+        SEH64_SET_FRAME_xBP 0
+        SEH64_END_PROLOGUE
+%ifdef RT_ARCH_AMD64
+    fld     tword [rbp + 10h + RTLRD_CB]
+    fld     tword [rbp + 10h]
+%else
+    fld     tword [ebp + 8h + RTLRD_CB]
+    fld     tword [ebp + 8h]
+        ;
+        ; Load the dividend into st0 and divisor into st1.
+        ;
+        fld     tword [xBP + 2*xCB + RTLRD_CB]
+        fld     tword [xBP + 2*xCB]
+        ;
+        ; The fprem1 only does between 32 and 64 rounds, so we have to loop
+        ; here till we've got a final result.  We count down in ECX to
+        ; avoid getting stuck here...
+        ;
+        mov     ecx, 16384 / 32 + 4
+.again:
+        fprem1
+        fstsw   ax
+        test    ah, (X86_FSW_C2 >> 8)
+        jz      .done
+        dec     cx
+        jnz     .again
+%ifdef RT_STRICT
+        int3
 %endif
+    fprem1
+    fstsw   ax
+    test    ah, 04h
+    jnz     .done
+    fstp    st1
+        ;
+        ; Return the result.
+        ;
 .done:
+    leave
+    ret
+        fstp    st1
+        leave
+        ret
 ENDPROC   RT_NOCRT(remainderl)

trunk/src/VBox/Runtime/testcase/tstRTNoCrt-2.cpp

-              r96217
+              r96218
                 || RTFLOAT64U_IS_NAN(&uNoCrtRet) \
                 || RTFLOAT64U_IS_NAN(&uCrtRet) ) ) \
+        { \
+            RTStrFormatR64(g_szFloat[0], sizeof(g_szFloat[0]), &uNoCrtRet, 0, 0, RTSTR_F_SPECIAL); \
+            RTStrFormatR64(g_szFloat[1], sizeof(g_szFloat[0]), &uCrtRet,   0, 0, RTSTR_F_SPECIAL); \
+            RTTestFailed(g_hTest, "line %u: %s%s: noCRT => %s; CRT => %s", \
+                         __LINE__, #a_Fn, #a_Args, g_szFloat[0], g_szFloat[1]); \
+        } \
+    } while (0)
+#define CHECK_DBL_SAME_RELAXED_NAN(a_Fn, a_Args) do { \
+        RTFLOAT64U uNoCrtRet, uCrtRet; \
+        uNoCrtRet.r = RT_NOCRT(a_Fn) a_Args; \
+        uCrtRet.r   =          a_Fn  a_Args; \
+        if (   !RTFLOAT64U_ARE_IDENTICAL(&uNoCrtRet, &uCrtRet) \
+            && (   !RTFLOAT64U_IS_NAN(&uNoCrtRet) \
+                || !RTFLOAT64U_IS_NAN(&uCrtRet) ) ) \
         { \
             RTStrFormatR64(g_szFloat[0], sizeof(g_szFloat[0]), &uNoCrtRet, 0, 0, RTSTR_F_SPECIAL); \
 …
+void testRemainder()
+{
+    RTTestSub(g_hTest, "remainder[f]");
+    /* The UCRT and x87 FPU generally disagree on the sign of the NaN, so don't be too picky here for now. */
+    CHECK_DBL(        RT_NOCRT(remainder)(              1.0,                    1.0), +0.0);
+    CHECK_DBL(        RT_NOCRT(remainder)(              1.5,                    1.0), -0.5);
+    CHECK_DBL_SAME_RELAXED_NAN(remainder,(              1.0,                    1.0));
+    CHECK_DBL_SAME_RELAXED_NAN(remainder,(              1.5,                    1.0));
+    CHECK_DBL_SAME_RELAXED_NAN(remainder,(             +0.0,                   +0.0));
+    CHECK_DBL_SAME_RELAXED_NAN(remainder,(             +0.0,                   -0.0));
+    CHECK_DBL_SAME_RELAXED_NAN(remainder,(             -0.0,                   -0.0));
+    CHECK_DBL_SAME_RELAXED_NAN(remainder,(             -0.0,                   +0.0));
+    CHECK_DBL_SAME_RELAXED_NAN(remainder,(         999999.0,                33334.0));
+    CHECK_DBL_SAME_RELAXED_NAN(remainder,(        -999999.0,                33334.0));
+    CHECK_DBL_SAME_RELAXED_NAN(remainder,(        -999999.0,               -33334.0));
+    CHECK_DBL_SAME_RELAXED_NAN(remainder,(         999999.0,               -33334.0));
+    CHECK_DBL_SAME_RELAXED_NAN(remainder,(      39560.32334,              9605.5546));
+    CHECK_DBL_SAME_RELAXED_NAN(remainder,(      39560.32334,          -59079.345069));
+    CHECK_DBL_SAME_RELAXED_NAN(remainder,(        +INFINITY,              +INFINITY));
+    CHECK_DBL_SAME_RELAXED_NAN(remainder,(              2.4,              +INFINITY));
+    CHECK_DBL_SAME_RELAXED_NAN(remainder,(        +INFINITY,                    2.4));
+    CHECK_DBL_SAME_RELAXED_NAN(remainder,(2.34960584706e100,       7.6050698459e+13));
+    CHECK_DBL_SAME_RELAXED_NAN(remainder,(2.34960584706e300,      -7.6050698459e-13));
+    CHECK_DBL(        RT_NOCRT(remainderf)(              1.0f,                   1.0f), +0.0f);
+    CHECK_DBL(        RT_NOCRT(remainderf)(              1.5f,                   1.0f), -0.5f);
+    CHECK_DBL_SAME_RELAXED_NAN(remainderf,(              1.0f,                   1.0f));
+    CHECK_DBL_SAME_RELAXED_NAN(remainderf,(              1.5f,                   1.0f));
+    CHECK_DBL_SAME_RELAXED_NAN(remainderf,(             +0.0f,                  +0.0f));
+    CHECK_DBL_SAME_RELAXED_NAN(remainderf,(             +0.0f,                  -0.0f));
+    CHECK_DBL_SAME_RELAXED_NAN(remainderf,(             -0.0f,                  -0.0f));
+    CHECK_DBL_SAME_RELAXED_NAN(remainderf,(             -0.0f,                  +0.0f));
+    CHECK_DBL_SAME_RELAXED_NAN(remainderf,(         999999.0f,               33334.0f));
+    CHECK_DBL_SAME_RELAXED_NAN(remainderf,(        -999999.0f,               33334.0f));
+    CHECK_DBL_SAME_RELAXED_NAN(remainderf,(        -999999.0f,              -33334.0f));
+    CHECK_DBL_SAME_RELAXED_NAN(remainderf,(         999999.0f,              -33334.0f));
+    CHECK_DBL_SAME_RELAXED_NAN(remainderf,(      39560.32334f,             9605.5546f));
+    CHECK_DBL_SAME_RELAXED_NAN(remainderf,(      39560.32334f,         -59079.345069f));
+    CHECK_DBL_SAME_RELAXED_NAN(remainderf,(         +INFINITY,              +INFINITY));
+    CHECK_DBL_SAME_RELAXED_NAN(remainderf,(              2.4f,              +INFINITY));
+    CHECK_DBL_SAME_RELAXED_NAN(remainderf,(         +INFINITY,                   2.4f));
+    CHECK_DBL_SAME_RELAXED_NAN(remainderf,(-2.34960584706e+35f,     7.6050698459e-23f));
+    CHECK_DBL_SAME_RELAXED_NAN(remainderf,(2.34960584706e+35f,      7.6050698459e-13f));
+}
 …
     testLdExp();
     testFma();
+    testRemainder();
 #if 0
 …
     ../common/math/cosf.asm \
     ../common/math/cosl.asm \
-    ../common/math/ldexp.asm \
-    ../common/math/ldexpf.asm \
     ../common/math/log.asm \
     ../common/math/logf.asm \
-    ../common/math/remainder.asm \
-    ../common/math/remainderf.asm \
     ../common/math/sin.asm \
     ../common/math/sinf.asm \

Note: See TracChangeset for help on using the changeset viewer.

Download in other formats:

© 2024 Oracle Support Privacy / Do Not Sell My Info Terms of Use Trademark Policy Automated Access Etiquette