Changeset 105172 in vbox

Timestamp:

Jul 7, 2024 12:59:59 PM (8 months ago)

Author:

vboxsync

svn:sync-xref-src-repo-rev:

163814

Message:

VMM/IEM: Implement native emitters for pmullw,paddusb,paddusw, bugref:10652

Location:

trunk

Files:

: 3 edited

include/iprt/armv8.h (modified) (2 diffs)
src/VBox/VMM/VMMAll/IEMAllInstTwoByte0f.cpp.h (modified) (3 diffs)
src/VBox/VMM/VMMAll/target-x86/IEMAllN8veEmit-x86.h (modified) (5 diffs)

Legend:

: Unmodified
: Added
: Removed

trunk/include/iprt/armv8.h

-              r105171
+              r105172
 } ARMV8INSTRVECARITHSZ;
+/**
+ * A64: Encodes ADD/SUB (vector, register).
+ *
+ * @returns The encoded instruction.
+ * @param   fSub        Flag whther this is an addition (false) or subtraction (true) instruction.
+/** Armv8 vector arithmetic operation. */
+typedef enum
+{
+    kArmv8VecInstrArithOp_Add           =                 RT_BIT_32(15),                                               /**< ADD   */
+    kArmv8VecInstrArithOp_Sub           = RT_BIT_32(29) | RT_BIT_32(15),                                               /**< SUB   */
+    kArmv8VecInstrArithOp_UnsignSat_Add = RT_BIT_32(29) |                                               RT_BIT_32(11), /**< UQADD */
+    kArmv8VecInstrArithOp_UnsignSat_Sub = RT_BIT_32(29) |                 RT_BIT_32(13)               | RT_BIT_32(11), /**< UQSUB */
+    kArmv8VecInstrArithOp_SignSat_Add   =                                                               RT_BIT_32(11), /**< SQADD */
+    kArmv8VecInstrArithOp_SignSat_Sub   =                                 RT_BIT_32(13)               | RT_BIT_32(11), /**< SQSUB */
+    kArmv8VecInstrArithOp_Mul           =                 RT_BIT_32(15) |               RT_BIT_32(12) | RT_BIT_32(11)  /**< MUL   */
+} ARMV8INSTRVECARITHOP;
+/**
+ * A64: Encodes an arithmetic operation (vector, register).
+ *
+ * @returns The encoded instruction.
+ * @param   enmOp       The operation to encode.
  * @param   iVecRegDst  The vector register to put the result into.
  * @param   iVecRegSrc1 The first vector source register.
 …
  *                      or just the low 64-bit (false).
  */
 DECL_FORCE_INLINE(uint32_t) Armv8A64MkVecInstrAddSub(bool fSub, uint32_t iVecRegDst, uint32_t iVecRegSrc1, uint32_t iVecRegSrc2,
                                                      ARMV8INSTRVECARITHSZ enmSz, bool f128Bit = true)
+DECL_FORCE_INLINE(uint32_t) Armv8A64MkVecInstrArithOp(ARMV8INSTRVECARITHOP enmOp, uint32_t iVecRegDst, uint32_t iVecRegSrc1, uint32_t iVecRegSrc2,
+                                                      ARMV8INSTRVECARITHSZ enmSz, bool f128Bit = true)
+{
     Assert(iVecRegDst < 32); Assert(iVecRegSrc1 < 32); Assert(iVecRegSrc2 < 32);
+    return UINT32_C(0x0e208400)
+    return UINT32_C(0x0e200400)
+         | (uint32_t)enmOp
          | ((uint32_t)f128Bit << 30)
-         | ((uint32_t)fSub    << 29)
          | ((uint32_t)enmSz   << 22)
          | (iVecRegSrc2 << 16)

trunk/src/VBox/VMM/VMMAll/IEMAllInstTwoByte0f.cpp.h

r105170	r105172
12925	12925	{
12926	12926	IEMOP_MNEMONIC2(RM, PMULLW, pmullw, Vx, Wx, DISOPTYPE_HARMLESS \| DISOPTYPE_X86_SSE, IEMOPHINT_IGNORES_OP_SIZES);
12927		~~return FNIEMOP_CALL_1(iemOpCommonSse2Opt_FullFull_To_Full, iemAImpl_pmullw_u128~~);
	12927	SSE2_OPT_BODY_FullFull_To_Full(pmullw, iemAImpl_pmullw_u128, RT_ARCH_VAL_AMD64 \| RT_ARCH_VAL_ARM64, RT_ARCH_VAL_AMD64 \| RT_ARCH_VAL_ARM64);
12928	12928	}
12929	12929
…	…
13238	13238	{
13239	13239	IEMOP_MNEMONIC2(RM, PADDUSB, paddusb, Vx, Wx, DISOPTYPE_HARMLESS \| DISOPTYPE_X86_SSE, IEMOPHINT_IGNORES_OP_SIZES);
13240		~~return FNIEMOP_CALL_1(iemOpCommonSse2Opt_FullFull_To_Full, iemAImpl_paddusb_u128~~);
	13240	SSE2_OPT_BODY_FullFull_To_Full(paddusb, iemAImpl_paddusb_u128, RT_ARCH_VAL_AMD64 \| RT_ARCH_VAL_ARM64, RT_ARCH_VAL_AMD64 \| RT_ARCH_VAL_ARM64);
13241	13241	}
13242	13242
…	…
13257	13257	{
13258	13258	IEMOP_MNEMONIC2(RM, PADDUSW, paddusw, Vx, Wx, DISOPTYPE_HARMLESS \| DISOPTYPE_X86_SSE, IEMOPHINT_IGNORES_OP_SIZES);
13259		~~return FNIEMOP_CALL_1(iemOpCommonSse2Opt_FullFull_To_Full, iemAImpl_paddusw_u128~~);
	13259	SSE2_OPT_BODY_FullFull_To_Full(paddusw, iemAImpl_paddusw_u128, RT_ARCH_VAL_AMD64 \| RT_ARCH_VAL_ARM64, RT_ARCH_VAL_AMD64 \| RT_ARCH_VAL_ARM64);
13260	13260	}
13261	13261

trunk/src/VBox/VMM/VMMAll/target-x86/IEMAllN8veEmit-x86.h

-              r105170
+              r105172
 /**
  * Common emitter for the paddX/psubX instructions.
  */
 #ifdef RT_ARCH_AMD64
 # define IEMNATIVE_NATIVE_EMIT_ADD_SUB_U128(a_Instr, a_fSub, a_ArmElemSz, a_bOpcX86) \
+ * Common emitter for packed arithmetic instructions.
+ */
+#ifdef RT_ARCH_AMD64
+# define IEMNATIVE_NATIVE_EMIT_ARITH_OP_U128(a_Instr, a_enmArmOp, a_ArmElemSz, a_bOpcX86) \
     DECL_INLINE_THROW(uint32_t) \
     RT_CONCAT3(iemNativeEmit_,a_Instr,_rr_u128)(PIEMRECOMPILERSTATE pReNative, uint32_t off, \
 …
     typedef int ignore_semicolon
 #elif defined(RT_ARCH_ARM64)
 # define IEMNATIVE_NATIVE_EMIT_ADD_SUB_U128(a_Instr, a_fSub, a_ArmElemSz, a_bOpcX86) \
+# define IEMNATIVE_NATIVE_EMIT_ARITH_OP_U128(a_Instr, a_enmArmOp, a_ArmElemSz, a_bOpcX86) \
     DECL_INLINE_THROW(uint32_t) \
     RT_CONCAT3(iemNativeEmit_,a_Instr,_rr_u128)(PIEMRECOMPILERSTATE pReNative, uint32_t off, \
 …
                                                                               kIemNativeGstSimdRegLdStSz_Low128, kIemNativeGstRegUse_ReadOnly); \
         PIEMNATIVEINSTR const pCodeBuf = iemNativeInstrBufEnsure(pReNative, off, 1); \
         pCodeBuf[off++] = Armv8A64MkVecInstrAddSub((a_fSub), idxSimdRegDst, idxSimdRegDst, idxSimdRegSrc, (a_ArmElemSz)); \
+        pCodeBuf[off++] = Armv8A64MkVecInstrArithOp((a_enmArmOp), idxSimdRegDst, idxSimdRegDst, idxSimdRegSrc, (a_ArmElemSz)); \
         iemNativeSimdRegFreeTmp(pReNative, idxSimdRegDst); \
         iemNativeSimdRegFreeTmp(pReNative, idxSimdRegSrc); \
 …
         uint8_t const idxSimdRegSrc = iemNativeVarSimdRegisterAcquire(pReNative, idxVarSrc, &off, true /*fInitialized*/); \
         PIEMNATIVEINSTR const pCodeBuf = iemNativeInstrBufEnsure(pReNative, off, 1); \
         pCodeBuf[off++] = Armv8A64MkVecInstrAddSub((a_fSub), idxSimdRegDst, idxSimdRegDst, idxSimdRegSrc, (a_ArmElemSz)); \
+        pCodeBuf[off++] = Armv8A64MkVecInstrArithOp((a_enmArmOp), idxSimdRegDst, idxSimdRegDst, idxSimdRegSrc, (a_ArmElemSz)); \
         iemNativeSimdRegFreeTmp(pReNative, idxSimdRegDst); \
         iemNativeVarRegisterRelease(pReNative, idxVarSrc); \
 …
 #endif
+IEMNATIVE_NATIVE_EMIT_ADD_SUB_U128(paddb, false /*a_fSub*/, kArmv8VecInstrArithSz_8,  0xfc);
+IEMNATIVE_NATIVE_EMIT_ADD_SUB_U128(paddw, false /*a_fSub*/, kArmv8VecInstrArithSz_16, 0xfd);
+IEMNATIVE_NATIVE_EMIT_ADD_SUB_U128(paddd, false /*a_fSub*/, kArmv8VecInstrArithSz_32, 0xfe);
+IEMNATIVE_NATIVE_EMIT_ADD_SUB_U128(paddq, false /*a_fSub*/, kArmv8VecInstrArithSz_64, 0xd4);
+IEMNATIVE_NATIVE_EMIT_ADD_SUB_U128(psubb, true  /*a_fSub*/, kArmv8VecInstrArithSz_8,  0xf8);
+IEMNATIVE_NATIVE_EMIT_ADD_SUB_U128(psubw, true  /*a_fSub*/, kArmv8VecInstrArithSz_16, 0xf9);
+IEMNATIVE_NATIVE_EMIT_ADD_SUB_U128(psubd, true  /*a_fSub*/, kArmv8VecInstrArithSz_32, 0xfa);
+IEMNATIVE_NATIVE_EMIT_ADD_SUB_U128(psubq, true  /*a_fSub*/, kArmv8VecInstrArithSz_64, 0xfb);
+/*
+ * PADDx.
+ */
+IEMNATIVE_NATIVE_EMIT_ARITH_OP_U128(paddb, kArmv8VecInstrArithOp_Add, kArmv8VecInstrArithSz_8,  0xfc);
+IEMNATIVE_NATIVE_EMIT_ARITH_OP_U128(paddw, kArmv8VecInstrArithOp_Add, kArmv8VecInstrArithSz_16, 0xfd);
+IEMNATIVE_NATIVE_EMIT_ARITH_OP_U128(paddd, kArmv8VecInstrArithOp_Add, kArmv8VecInstrArithSz_32, 0xfe);
+IEMNATIVE_NATIVE_EMIT_ARITH_OP_U128(paddq, kArmv8VecInstrArithOp_Add, kArmv8VecInstrArithSz_64, 0xd4);
+/*
+ * PSUBx.
+ */
+IEMNATIVE_NATIVE_EMIT_ARITH_OP_U128(psubb, kArmv8VecInstrArithOp_Sub, kArmv8VecInstrArithSz_8,  0xf8);
+IEMNATIVE_NATIVE_EMIT_ARITH_OP_U128(psubw, kArmv8VecInstrArithOp_Sub, kArmv8VecInstrArithSz_16, 0xf9);
+IEMNATIVE_NATIVE_EMIT_ARITH_OP_U128(psubd, kArmv8VecInstrArithOp_Sub, kArmv8VecInstrArithSz_32, 0xfa);
+IEMNATIVE_NATIVE_EMIT_ARITH_OP_U128(psubq, kArmv8VecInstrArithOp_Sub, kArmv8VecInstrArithSz_64, 0xfb);
+/*
+ * PADDUSx.
+ */
+IEMNATIVE_NATIVE_EMIT_ARITH_OP_U128(paddusb, kArmv8VecInstrArithOp_UnsignSat_Add, kArmv8VecInstrArithSz_8,  0xdc);
+IEMNATIVE_NATIVE_EMIT_ARITH_OP_U128(paddusw, kArmv8VecInstrArithOp_UnsignSat_Add, kArmv8VecInstrArithSz_16, 0xdd);
+/*
+ * PMULLx.
+ */
+IEMNATIVE_NATIVE_EMIT_ARITH_OP_U128(pmullw,  kArmv8VecInstrArithOp_Mul, kArmv8VecInstrArithSz_16, 0xd5);

Note: See TracChangeset for help on using the changeset viewer.

Changeset 105172 in vbox

Legend:

trunk/include/iprt/armv8.h

trunk/src/VBox/VMM/VMMAll/IEMAllInstTwoByte0f.cpp.h

trunk/src/VBox/VMM/VMMAll/target-x86/IEMAllN8veEmit-x86.h

Download in other formats: