target/arm: Convert FADDP to decodetree

author Richard Henderson <richard.henderson@linaro.org>

Fri, 24 May 2024 23:20:42 +0000 (16:20 -0700)

committer Peter Maydell <peter.maydell@linaro.org>

Tue, 28 May 2024 13:29:01 +0000 (14:29 +0100)
author Richard Henderson <richard.henderson@linaro.org>
Fri, 24 May 2024 23:20:42 +0000 (16:20 -0700)
committer Peter Maydell <peter.maydell@linaro.org>
Tue, 28 May 2024 13:29:01 +0000 (14:29 +0100)
diff --git a/target/arm/helper.h b/target/arm/helper.h

index ff6e3094f419933072c1f7de9357f662100b889c..8441b49d1f09fd5730fd08589371c18846954352 100644 (file)
--- a/target/arm/helper.h
+++ b/target/arm/helper.h
@@ -1048,6 +1048,10 @@ DEF_HELPER_FLAGS_5(gvec_uclamp_s, TCG_CALL_NO_RWG,
  DEF_HELPER_FLAGS_5(gvec_uclamp_d, TCG_CALL_NO_RWG,
                     void, ptr, ptr, ptr, ptr, i32)
  
+DEF_HELPER_FLAGS_5(gvec_faddp_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_5(gvec_faddp_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_5(gvec_faddp_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+
  #ifdef TARGET_AARCH64
  #include "tcg/helper-a64.h"
  #include "tcg/helper-sve.h"
diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode

index 84cb38f1dd0587154bcefbfa88cb809e12a301a4..d2a02365e157278debf7863bea7bc6a051882bc8 100644 (file)
--- a/target/arm/tcg/a64.decode
+++ b/target/arm/tcg/a64.decode
@@ -29,6 +29,7 @@
  &ri             rd imm
  &rri_sf         rd rn imm sf
  &i              imm
+&rr_e           rd rn esz
  &rrr_e          rd rn rm esz
  &rrx_e          rd rn rm idx esz
  &qrr_e          q rd rn esz
@@ -36,6 +37,9 @@
  &qrrx_e         q rd rn rm idx esz
  &qrrrr_e        q rd rn rm ra esz
  
+@rr_h           ........ ... ..... ...... rn:5 rd:5     &rr_e esz=1
+@rr_sd          ........ ... ..... ...... rn:5 rd:5     &rr_e esz=%esz_sd
+
  @rrr_h          ........ ... rm:5 ...... rn:5 rd:5      &rrr_e esz=1
  @rrr_sd         ........ ... rm:5 ...... rn:5 rd:5      &rrr_e esz=%esz_sd
  @rrr_hsd        ........ ... rm:5 ...... rn:5 rd:5      &rrr_e esz=%esz_hsd
@@ -737,6 +741,11 @@ FRECPS_s        0101 1110 0.1 ..... 11111 1 ..... ..... @rrr_sd
  FRSQRTS_s       0101 1110 110 ..... 00111 1 ..... ..... @rrr_h
  FRSQRTS_s       0101 1110 1.1 ..... 11111 1 ..... ..... @rrr_sd
  
+### Advanced SIMD scalar pairwise
+
+FADDP_s         0101 1110 0011 0000 1101 10 ..... ..... @rr_h
+FADDP_s         0111 1110 0.11 0000 1101 10 ..... ..... @rr_sd
+
  ### Advanced SIMD three same
  
  FADD_v          0.00 1110 010 ..... 00010 1 ..... ..... @qrrr_h
@@ -796,6 +805,9 @@ FRECPS_v        0.00 1110 0.1 ..... 11111 1 ..... ..... @qrrr_sd
  FRSQRTS_v       0.00 1110 110 ..... 00111 1 ..... ..... @qrrr_h
  FRSQRTS_v       0.00 1110 1.1 ..... 11111 1 ..... ..... @qrrr_sd
  
+FADDP_v         0.10 1110 010 ..... 00010 1 ..... ..... @qrrr_h
+FADDP_v         0.10 1110 0.1 ..... 11010 1 ..... ..... @qrrr_sd
+
  ### Advanced SIMD scalar x indexed element
  
  FMUL_si         0101 1111 00 .. .... 1001 . 0 ..... .....   @rrx_h
diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c

index a7537a5104f2d2d4f24398effb5703b209300f70..78949ab34f01d1bae1ee786916de514807e4a666 100644 (file)
--- a/target/arm/tcg/translate-a64.c
+++ b/target/arm/tcg/translate-a64.c
@@ -5210,6 +5210,13 @@ static gen_helper_gvec_3_ptr * const f_vector_frsqrts[3] = {
  };
  TRANS(FRSQRTS_v, do_fp3_vector, a, f_vector_frsqrts)
  
+static gen_helper_gvec_3_ptr * const f_vector_faddp[3] = {
+    gen_helper_gvec_faddp_h,
+    gen_helper_gvec_faddp_s,
+    gen_helper_gvec_faddp_d,
+};
+TRANS(FADDP_v, do_fp3_vector, a, f_vector_faddp)
+
  /*
   * Advanced SIMD scalar/vector x indexed element
   */
@@ -5395,6 +5402,56 @@ static bool do_fmla_vector_idx(DisasContext *s, arg_qrrx_e *a, bool neg)
  TRANS(FMLA_vi, do_fmla_vector_idx, a, false)
  TRANS(FMLS_vi, do_fmla_vector_idx, a, true)
  
+/*
+ * Advanced SIMD scalar pairwise
+ */
+
+static bool do_fp3_scalar_pair(DisasContext *s, arg_rr_e *a, const FPScalar *f)
+{
+    switch (a->esz) {
+    case MO_64:
+        if (fp_access_check(s)) {
+            TCGv_i64 t0 = tcg_temp_new_i64();
+            TCGv_i64 t1 = tcg_temp_new_i64();
+
+            read_vec_element(s, t0, a->rn, 0, MO_64);
+            read_vec_element(s, t1, a->rn, 1, MO_64);
+            f->gen_d(t0, t0, t1, fpstatus_ptr(FPST_FPCR));
+            write_fp_dreg(s, a->rd, t0);
+        }
+        break;
+    case MO_32:
+        if (fp_access_check(s)) {
+            TCGv_i32 t0 = tcg_temp_new_i32();
+            TCGv_i32 t1 = tcg_temp_new_i32();
+
+            read_vec_element_i32(s, t0, a->rn, 0, MO_32);
+            read_vec_element_i32(s, t1, a->rn, 1, MO_32);
+            f->gen_s(t0, t0, t1, fpstatus_ptr(FPST_FPCR));
+            write_fp_sreg(s, a->rd, t0);
+        }
+        break;
+    case MO_16:
+        if (!dc_isar_feature(aa64_fp16, s)) {
+            return false;
+        }
+        if (fp_access_check(s)) {
+            TCGv_i32 t0 = tcg_temp_new_i32();
+            TCGv_i32 t1 = tcg_temp_new_i32();
+
+            read_vec_element_i32(s, t0, a->rn, 0, MO_16);
+            read_vec_element_i32(s, t1, a->rn, 1, MO_16);
+            f->gen_h(t0, t0, t1, fpstatus_ptr(FPST_FPCR_F16));
+            write_fp_sreg(s, a->rd, t0);
+        }
+        break;
+    default:
+        g_assert_not_reached();
+    }
+    return true;
+}
+
+TRANS(FADDP_s, do_fp3_scalar_pair, a, &f_scalar_fadd)
  
  /* Shift a TCGv src by TCGv shift_amount, put result in dst.
   * Note that it is the caller's responsibility to ensure that the
@@ -8357,7 +8414,6 @@ static void disas_simd_scalar_pairwise(DisasContext *s, uint32_t insn)
          fpst = NULL;
          break;
      case 0xc: /* FMAXNMP */
-    case 0xd: /* FADDP */
      case 0xf: /* FMAXP */
      case 0x2c: /* FMINNMP */
      case 0x2f: /* FMINP */
@@ -8380,6 +8436,7 @@ static void disas_simd_scalar_pairwise(DisasContext *s, uint32_t insn)
          fpst = fpstatus_ptr(size == MO_16 ? FPST_FPCR_F16 : FPST_FPCR);
          break;
      default:
+    case 0xd: /* FADDP */
          unallocated_encoding(s);
          return;
      }
@@ -8399,9 +8456,6 @@ static void disas_simd_scalar_pairwise(DisasContext *s, uint32_t insn)
          case 0xc: /* FMAXNMP */
              gen_helper_vfp_maxnumd(tcg_res, tcg_op1, tcg_op2, fpst);
              break;
-        case 0xd: /* FADDP */
-            gen_helper_vfp_addd(tcg_res, tcg_op1, tcg_op2, fpst);
-            break;
          case 0xf: /* FMAXP */
              gen_helper_vfp_maxd(tcg_res, tcg_op1, tcg_op2, fpst);
              break;
@@ -8412,6 +8466,7 @@ static void disas_simd_scalar_pairwise(DisasContext *s, uint32_t insn)
              gen_helper_vfp_mind(tcg_res, tcg_op1, tcg_op2, fpst);
              break;
          default:
+        case 0xd: /* FADDP */
              g_assert_not_reached();
          }
  
@@ -8429,9 +8484,6 @@ static void disas_simd_scalar_pairwise(DisasContext *s, uint32_t insn)
              case 0xc: /* FMAXNMP */
                  gen_helper_advsimd_maxnumh(tcg_res, tcg_op1, tcg_op2, fpst);
                  break;
-            case 0xd: /* FADDP */
-                gen_helper_advsimd_addh(tcg_res, tcg_op1, tcg_op2, fpst);
-                break;
              case 0xf: /* FMAXP */
                  gen_helper_advsimd_maxh(tcg_res, tcg_op1, tcg_op2, fpst);
                  break;
@@ -8442,6 +8494,7 @@ static void disas_simd_scalar_pairwise(DisasContext *s, uint32_t insn)
                  gen_helper_advsimd_minh(tcg_res, tcg_op1, tcg_op2, fpst);
                  break;
              default:
+            case 0xd: /* FADDP */
                  g_assert_not_reached();
              }
          } else {
@@ -8449,9 +8502,6 @@ static void disas_simd_scalar_pairwise(DisasContext *s, uint32_t insn)
              case 0xc: /* FMAXNMP */
                  gen_helper_vfp_maxnums(tcg_res, tcg_op1, tcg_op2, fpst);
                  break;
-            case 0xd: /* FADDP */
-                gen_helper_vfp_adds(tcg_res, tcg_op1, tcg_op2, fpst);
-                break;
              case 0xf: /* FMAXP */
                  gen_helper_vfp_maxs(tcg_res, tcg_op1, tcg_op2, fpst);
                  break;
@@ -8462,6 +8512,7 @@ static void disas_simd_scalar_pairwise(DisasContext *s, uint32_t insn)
                  gen_helper_vfp_mins(tcg_res, tcg_op1, tcg_op2, fpst);
                  break;
              default:
+            case 0xd: /* FADDP */
                  g_assert_not_reached();
              }
          }
@@ -10982,9 +11033,6 @@ static void handle_simd_3same_pair(DisasContext *s, int is_q, int u, int opcode,
              case 0x58: /* FMAXNMP */
                  gen_helper_vfp_maxnumd(tcg_res[pass], tcg_op1, tcg_op2, fpst);
                  break;
-            case 0x5a: /* FADDP */
-                gen_helper_vfp_addd(tcg_res[pass], tcg_op1, tcg_op2, fpst);
-                break;
              case 0x5e: /* FMAXP */
                  gen_helper_vfp_maxd(tcg_res[pass], tcg_op1, tcg_op2, fpst);
                  break;
@@ -10995,6 +11043,7 @@ static void handle_simd_3same_pair(DisasContext *s, int is_q, int u, int opcode,
                  gen_helper_vfp_mind(tcg_res[pass], tcg_op1, tcg_op2, fpst);
                  break;
              default:
+            case 0x5a: /* FADDP */
                  g_assert_not_reached();
              }
          }
@@ -11052,9 +11101,6 @@ static void handle_simd_3same_pair(DisasContext *s, int is_q, int u, int opcode,
              case 0x58: /* FMAXNMP */
                  gen_helper_vfp_maxnums(tcg_res[pass], tcg_op1, tcg_op2, fpst);
                  break;
-            case 0x5a: /* FADDP */
-                gen_helper_vfp_adds(tcg_res[pass], tcg_op1, tcg_op2, fpst);
-                break;
              case 0x5e: /* FMAXP */
                  gen_helper_vfp_maxs(tcg_res[pass], tcg_op1, tcg_op2, fpst);
                  break;
@@ -11065,6 +11111,7 @@ static void handle_simd_3same_pair(DisasContext *s, int is_q, int u, int opcode,
                  gen_helper_vfp_mins(tcg_res[pass], tcg_op1, tcg_op2, fpst);
                  break;
              default:
+            case 0x5a: /* FADDP */
                  g_assert_not_reached();
              }
  
@@ -11104,7 +11151,6 @@ static void disas_simd_3same_float(DisasContext *s, uint32_t insn)
  
      switch (fpopcode) {
      case 0x58: /* FMAXNMP */
-    case 0x5a: /* FADDP */
      case 0x5e: /* FMAXP */
      case 0x78: /* FMINNMP */
      case 0x7e: /* FMINP */
@@ -11149,6 +11195,7 @@ static void disas_simd_3same_float(DisasContext *s, uint32_t insn)
      case 0x3a: /* FSUB */
      case 0x3e: /* FMIN */
      case 0x3f: /* FRSQRTS */
+    case 0x5a: /* FADDP */
      case 0x5b: /* FMUL */
      case 0x5c: /* FCMGE */
      case 0x5d: /* FACGE */
@@ -11496,7 +11543,6 @@ static void disas_simd_three_reg_same_fp16(DisasContext *s, uint32_t insn)
  
      switch (fpopcode) {
      case 0x10: /* FMAXNMP */
-    case 0x12: /* FADDP */
      case 0x16: /* FMAXP */
      case 0x18: /* FMINNMP */
      case 0x1e: /* FMINP */
@@ -11515,6 +11561,7 @@ static void disas_simd_three_reg_same_fp16(DisasContext *s, uint32_t insn)
      case 0xa: /* FSUB */
      case 0xe: /* FMIN */
      case 0xf: /* FRSQRTS */
+    case 0x12: /* FADDP */
      case 0x13: /* FMUL */
      case 0x14: /* FCMGE */
      case 0x15: /* FACGE */
@@ -11556,9 +11603,6 @@ static void disas_simd_three_reg_same_fp16(DisasContext *s, uint32_t insn)
                  gen_helper_advsimd_maxnumh(tcg_res[pass], tcg_op1, tcg_op2,
                                             fpst);
                  break;
-            case 0x12: /* FADDP */
-                gen_helper_advsimd_addh(tcg_res[pass], tcg_op1, tcg_op2, fpst);
-                break;
              case 0x16: /* FMAXP */
                  gen_helper_advsimd_maxh(tcg_res[pass], tcg_op1, tcg_op2, fpst);
                  break;
@@ -11570,6 +11614,7 @@ static void disas_simd_three_reg_same_fp16(DisasContext *s, uint32_t insn)
                  gen_helper_advsimd_minh(tcg_res[pass], tcg_op1, tcg_op2, fpst);
                  break;
              default:
+            case 0x12: /* FADDP */
                  g_assert_not_reached();
              }
          }
diff --git a/target/arm/tcg/vec_helper.c b/target/arm/tcg/vec_helper.c

index e9d7922f3035d03fb6720ea240d5e51c3b5d25a7..28989c7d7a7ce84430ff46e12f2adee6378d4880 100644 (file)
--- a/target/arm/tcg/vec_helper.c
+++ b/target/arm/tcg/vec_helper.c
@@ -2237,6 +2237,29 @@ DO_NEON_PAIRWISE(neon_pmin, min)
  
  #undef DO_NEON_PAIRWISE
  
+#define DO_3OP_PAIR(NAME, FUNC, TYPE, H) \
+void HELPER(NAME)(void *vd, void *vn, void *vm, void *stat, uint32_t desc) \
+{                                                                          \
+    ARMVectorReg scratch;                                                  \
+    intptr_t oprsz = simd_oprsz(desc);                                     \
+    intptr_t half = oprsz / sizeof(TYPE) / 2;                              \
+    TYPE *d = vd, *n = vn, *m = vm;                                        \
+    if (unlikely(d == m)) {                                                \
+        m = memcpy(&scratch, m, oprsz);                                    \
+    }                                                                      \
+    for (intptr_t i = 0; i < half; ++i) {                                  \
+        d[H(i)] = FUNC(n[H(i * 2)], n[H(i * 2 + 1)], stat);                \
+    }                                                                      \
+    for (intptr_t i = 0; i < half; ++i) {                                  \
+        d[H(i + half)] = FUNC(m[H(i * 2)], m[H(i * 2 + 1)], stat);         \
+    }                                                                      \
+    clear_tail(d, oprsz, simd_maxsz(desc));                                \
+}
+
+DO_3OP_PAIR(gvec_faddp_h, float16_add, float16, H2)
+DO_3OP_PAIR(gvec_faddp_s, float32_add, float32, H4)
+DO_3OP_PAIR(gvec_faddp_d, float64_add, float64, )
+
  #define DO_VCVT_FIXED(NAME, FUNC, TYPE)                                 \
      void HELPER(NAME)(void *vd, void *vn, void *stat, uint32_t desc)    \
      {                                                                   \
author	Richard Henderson <richard.henderson@linaro.org>
	Fri, 24 May 2024 23:20:42 +0000 (16:20 -0700)
committer	Peter Maydell <peter.maydell@linaro.org>
	Tue, 28 May 2024 13:29:01 +0000 (14:29 +0100)
target/arm/helper.h		patch \| blob \| history
target/arm/tcg/a64.decode		patch \| blob \| history
target/arm/tcg/translate-a64.c		patch \| blob \| history
target/arm/tcg/vec_helper.c		patch \| blob \| history