[v3,30/51] tcg/optimize: Use fold_masks_zs in fold_qemu_ld

Message ID	20241222162446.2415717-31-richard.henderson@linaro.org
State	Superseded
Headers	show Delivered-To: patch@linaro.org Received-SPF: pass (google.com: domain of qemu-devel-bounces+patch=linaro.org@nongnu.org designates 209.51.188.17 as permitted sender) client-ip=209.51.188.17; From: Richard Henderson <richard.henderson@linaro.org> To: qemu-devel@nongnu.org Cc: Pierrick Bouvier <pierrick.bouvier@linaro.org> Subject: [PATCH v3 30/51] tcg/optimize: Use fold_masks_zs in fold_qemu_ld Date: Sun, 22 Dec 2024 08:24:25 -0800 Message-ID: <20241222162446.2415717-31-richard.henderson@linaro.org> In-Reply-To: <20241222162446.2415717-1-richard.henderson@linaro.org> References: <20241222162446.2415717-1-richard.henderson@linaro.org> MIME-Version: 1.0 Content-Transfer-Encoding: 8bit Received-SPF: pass client-ip=2607:f8b0:4864:20::636; envelope-from=richard.henderson@linaro.org; helo=mail-pl1-x636.google.com X-Spam_score_int: -20 X-Spam_score: -2.1 X-Spam_bar: -- X-Spam_report: (-2.1 / 5.0 requ) BAYES_00=-1.9, DKIM_SIGNED=0.1, DKIM_VALID=-0.1, DKIM_VALID_AU=-0.1, DKIM_VALID_EF=-0.1, RCVD_IN_DNSWL_NONE=-0.0001, SPF_HELO_NONE=0.001, SPF_PASS=-0.001 autolearn=ham autolearn_force=no X-Spam_action: no action Precedence: list Errors-To: qemu-devel-bounces+patch=linaro.org@nongnu.org Sender: qemu-devel-bounces+patch=linaro.org@nongnu.org
Series	tcg: Remove in-flight mask data from OptContext \| expand [v3,00/51] tcg: Remove in-flight mask data from OptContext [v3,01/51] tcg/optimize: Split out finish_bb, finish_ebb [v3,02/51] tcg/optimize: Split out fold_affected_mask [v3,03/51] tcg/optimize: Copy mask writeback to fold_masks [v3,04/51] tcg/optimize: Split out fold_masks_zs [v3,05/51] tcg/optimize: Augment s_mask from z_mask in fold_masks_zs [v3,06/51] tcg/optimize: Change representation of s_mask [v3,07/51] tcg/optimize: Use finish_folding in fold_add, fold_add_vec, fold_addsub2 [v3,08/51] tcg/optimize: Use fold_masks_zs in fold_and [v3,09/51] tcg/optimize: Use fold_masks_zs in fold_andc [v3,10/51] tcg/optimize: Use fold_masks_zs in fold_bswap [v3,11/51] tcg/optimize: Use fold_masks_zs in fold_count_zeros [v3,12/51] tcg/optimize: Use fold_masks_z in fold_ctpop [v3,13/51] tcg/optimize: Use fold_and and fold_masks_z in fold_deposit [v3,14/51] tcg/optimize: Compute sign mask in fold_deposit [v3,15/51] tcg/optimize: Use finish_folding in fold_divide [v3,16/51] tcg/optimize: Use finish_folding in fold_dup, fold_dup2 [v3,17/51] tcg/optimize: Use fold_masks_s in fold_eqv [v3,18/51] tcg/optimize: Use fold_masks_z in fold_extract [v3,19/51] tcg/optimize: Use finish_folding in fold_extract2 [v3,20/51] tcg/optimize: Use fold_masks_zs in fold_exts [v3,21/51] tcg/optimize: Use fold_masks_z in fold_extu [v3,22/51] tcg/optimize: Use fold_masks_zs in fold_movcond [v3,23/51] tcg/optimize: Use finish_folding in fold_mul* [v3,24/51] tcg/optimize: Use fold_masks_s in fold_nand [v3,25/51] tcg/optimize: Use fold_masks_z in fold_neg_no_const [v3,26/51] tcg/optimize: Use fold_masks_s in fold_nor [v3,27/51] tcg/optimize: Use fold_masks_s in fold_not [v3,28/51] tcg/optimize: Use fold_masks_zs in fold_or [v3,29/51] tcg/optimize: Use fold_masks_zs in fold_orc [v3,30/51] tcg/optimize: Use fold_masks_zs in fold_qemu_ld [v3,31/51] tcg/optimize: Return true from fold_qemu_st, fold_tcg_st [v3,32/51] tcg/optimize: Use finish_folding in fold_remainder [v3,33/51] tcg/optimize: Distinguish simplification in fold_setcond_zmask [v3,34/51] tcg/optimize: Use fold_masks_z in fold_setcond [v3,35/51] tcg/optimize: Use fold_masks_s in fold_negsetcond [v3,36/51] tcg/optimize: Use fold_masks_z in fold_setcond2 [v3,37/51] tcg/optimize: Use finish_folding in fold_cmp_vec [v3,38/51] tcg/optimize: Use finish_folding in fold_cmpsel_vec [v3,39/51] tcg/optimize: Use fold_masks_zs in fold_sextract [v3,40/51] tcg/optimize: Use fold_masks_zs, fold_masks_s in fold_shift [v3,41/51] tcg/optimize: Simplify sign bit test in fold_shift [v3,42/51] tcg/optimize: Use finish_folding in fold_sub, fold_sub_vec [v3,43/51] tcg/optimize: Use fold_masks_zs in fold_tcg_ld [v3,44/51] tcg/optimize: Use finish_folding in fold_tcg_ld_memcopy [v3,45/51] tcg/optimize: Use fold_masks_zs in fold_xor [v3,46/51] tcg/optimize: Use finish_folding in fold_bitsel_vec [v3,47/51] tcg/optimize: Use finish_folding as default in tcg_optimize [v3,48/51] tcg/optimize: Remove z_mask, s_mask from OptContext [v3,49/51] tcg/optimize: Re-enable sign-mask optimizations [v3,50/51] tcg/optimize: Move fold_bitsel_vec into alphabetic sort [v3,51/51] tcg/optimize: Move fold_cmp_vec, fold_cmpsel_vec into alphabetic sort

Message ID

20241222162446.2415717-31-richard.henderson@linaro.org

State

Superseded

Headers

Received-SPF: pass (google.com: domain of
 qemu-devel-bounces+patch=linaro.org@nongnu.org designates 209.51.188.17 as
 permitted sender) client-ip=209.51.188.17;
From: Richard Henderson <richard.henderson@linaro.org>
To: qemu-devel@nongnu.org
Cc: Pierrick Bouvier <pierrick.bouvier@linaro.org>
Subject: [PATCH v3 30/51] tcg/optimize: Use fold_masks_zs in fold_qemu_ld
Date: Sun, 22 Dec 2024 08:24:25 -0800
Message-ID: <20241222162446.2415717-31-richard.henderson@linaro.org>
In-Reply-To: <20241222162446.2415717-1-richard.henderson@linaro.org>
References: <20241222162446.2415717-1-richard.henderson@linaro.org>
MIME-Version: 1.0
Content-Transfer-Encoding: 8bit
Received-SPF: pass client-ip=2607:f8b0:4864:20::636;
 envelope-from=richard.henderson@linaro.org; helo=mail-pl1-x636.google.com
X-Spam_score_int: -20
X-Spam_score: -2.1
X-Spam_bar: --
X-Spam_report: (-2.1 / 5.0 requ) BAYES_00=-1.9, DKIM_SIGNED=0.1,
 DKIM_VALID=-0.1, DKIM_VALID_AU=-0.1, DKIM_VALID_EF=-0.1,
 RCVD_IN_DNSWL_NONE=-0.0001, SPF_HELO_NONE=0.001,
 SPF_PASS=-0.001 autolearn=ham autolearn_force=no
X-Spam_action: no action
X-BeenThere: qemu-devel@nongnu.org
X-Mailman-Version: 2.1.29
Precedence: list
List-Id: <qemu-devel.nongnu.org>
List-Unsubscribe: <https://lists.nongnu.org/mailman/options/qemu-devel>,
 <mailto:qemu-devel-request@nongnu.org?subject=unsubscribe>
List-Archive: <https://lists.nongnu.org/archive/html/qemu-devel>
List-Post: <mailto:qemu-devel@nongnu.org>
List-Help: <mailto:qemu-devel-request@nongnu.org?subject=help>
List-Subscribe: <https://lists.nongnu.org/mailman/listinfo/qemu-devel>,
 <mailto:qemu-devel-request@nongnu.org?subject=subscribe>
Errors-To: qemu-devel-bounces+patch=linaro.org@nongnu.org
Sender: qemu-devel-bounces+patch=linaro.org@nongnu.org

Series

tcg: Remove in-flight mask data from OptContext | expand

Commit Message

Richard Henderson Dec. 22, 2024, 4:24 p.m. UTC

Avoid the use of the OptContext slots.

Be careful not to call fold_masks_zs when the memory operation
is wide enough to require multiple outputs, so split into two
functions: fold_qemu_ld_1reg and fold_qemu_ld_2reg.

Reviewed-by: Pierrick Bouvier <pierrick.bouvier@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 tcg/optimize.c | 26 +++++++++++++++++++++-----
 1 file changed, 21 insertions(+), 5 deletions(-)

diff --git a/tcg/optimize.c b/tcg/optimize.c
index c1305e9eab..0eeff6c6b4 100644
--- a/tcg/optimize.c
+++ b/tcg/optimize.c
@@ -2093,24 +2093,33 @@  static bool fold_orc(OptContext *ctx, TCGOp *op)
     return fold_masks_s(ctx, op, s_mask);
 }
 
-static bool fold_qemu_ld(OptContext *ctx, TCGOp *op)
+static bool fold_qemu_ld_1reg(OptContext *ctx, TCGOp *op)
 {
     const TCGOpDef *def = &tcg_op_defs[op->opc];
     MemOpIdx oi = op->args[def->nb_oargs + def->nb_iargs];
     MemOp mop = get_memop(oi);
     int width = 8 * memop_size(mop);
+    uint64_t z_mask = -1, s_mask = 0;
 
     if (width < 64) {
         if (mop & MO_SIGN) {
-            ctx->s_mask = MAKE_64BIT_MASK(width, 64 - width);
+            s_mask = MAKE_64BIT_MASK(width - 1, 64 - (width - 1));
         } else {
-            ctx->z_mask = MAKE_64BIT_MASK(0, width);
+            z_mask = MAKE_64BIT_MASK(0, width);
         }
     }
 
     /* Opcodes that touch guest memory stop the mb optimization.  */
     ctx->prev_mb = NULL;
-    return false;
+
+    return fold_masks_zs(ctx, op, z_mask, s_mask);
+}
+
+static bool fold_qemu_ld_2reg(OptContext *ctx, TCGOp *op)
+{
+    /* Opcodes that touch guest memory stop the mb optimization.  */
+    ctx->prev_mb = NULL;
+    return finish_folding(ctx, op);
 }
 
 static bool fold_qemu_st(OptContext *ctx, TCGOp *op)
@@ -2995,11 +3004,18 @@  void tcg_optimize(TCGContext *s)
             break;
         case INDEX_op_qemu_ld_a32_i32:
         case INDEX_op_qemu_ld_a64_i32:
+            done = fold_qemu_ld_1reg(&ctx, op);
+            break;
         case INDEX_op_qemu_ld_a32_i64:
         case INDEX_op_qemu_ld_a64_i64:
+            if (TCG_TARGET_REG_BITS == 64) {
+                done = fold_qemu_ld_1reg(&ctx, op);
+                break;
+            }
+            QEMU_FALLTHROUGH;
         case INDEX_op_qemu_ld_a32_i128:
         case INDEX_op_qemu_ld_a64_i128:
-            done = fold_qemu_ld(&ctx, op);
+            done = fold_qemu_ld_2reg(&ctx, op);
             break;
         case INDEX_op_qemu_st8_a32_i32:
         case INDEX_op_qemu_st8_a64_i32:

[v3,30/51] tcg/optimize: Use fold_masks_zs in fold_qemu_ld

Commit Message

Patch