[BugFix] fix mm rope (#7274)

xiaoxiaohehe001 · web-flow · commit abba29b3489f · 2026-04-14T11:36:08.000+08:00
diff --git a/fastdeploy/model_executor/layers/rotary_embedding.py b/fastdeploy/model_executor/layers/rotary_embedding.py
@@ -458,12 +458,12 @@ def __call__(self, position_ids, max_len_lst, cumsum_seqlens):
 
         # Build position_ids_3d: [bsz, max_position, 3]
         position_ids_3d = paddle.tile(
-            paddle.arange(self.max_position, dtype="int64").unsqueeze(0).unsqueeze(-1),
+            paddle.arange(self.max_position, dtype="float32").unsqueeze(0).unsqueeze(-1),
             [bsz, 1, 3],
         )
         for i in range(bsz):
             position_ids_cur = position_ids[cumsum_seqlens[i] : cumsum_seqlens[i + 1]]
-            prefix_max_position_ids = paddle.max(position_ids_cur) + 1
+            prefix_max_position_ids = paddle.max(position_ids_cur[..., 0]) + 1
             dec_pos_ids = paddle.tile(
                 paddle.arange(max_len_lst[i], dtype="int64").unsqueeze(-1),
                 [1, 3],
@@ -530,12 +530,12 @@ def __call__(self, position_ids, max_len_lst, cumsum_seqlens):
         bsz = len(cumsum_seqlens) - 1
         # position_ids_3d: [bsz, seq_len, 3]
         position_ids_3d = paddle.tile(
-            paddle.arange(self.max_position, dtype="int64").unsqueeze(0).unsqueeze(-1),
+            paddle.arange(self.max_position, dtype="float32").unsqueeze(0).unsqueeze(-1),
             [bsz, 1, 3],
         )
         for i in range(bsz):
             position_ids_cur = position_ids[cumsum_seqlens[i] : cumsum_seqlens[i + 1]]
-            prefix_max_position_ids = paddle.max(position_ids_cur) + 1
+            prefix_max_position_ids = paddle.max(position_ids_cur[..., 0]) + 1
             dec_pos_ids = paddle.tile(
                 paddle.arange(max_len_lst[i], dtype="int64").unsqueeze(-1),
                 [1, 3],
diff --git a/fastdeploy/worker/gpu_model_runner.py b/fastdeploy/worker/gpu_model_runner.py
@@ -1013,7 +1013,7 @@ def insert_tasks_v1(self, req_dicts: List[Request], num_running_requests: int =
 
         if len(rope_3d_position_ids["position_ids_idx"]) > 0 and self.enable_mm:
             packed_position_ids = paddle.to_tensor(
-                np.concatenate(rope_3d_position_ids["position_ids_lst"]), dtype="int64"
+                np.concatenate(rope_3d_position_ids["position_ids_lst"]), dtype="float32"
             )
             rope_3d_lst = self.prepare_rope3d(
                 packed_position_ids,

Original file line number	Diff line number	Diff line change
`@@ -1013,7 +1013,7 @@ def insert_tasks_v1(self, req_dicts: List[Request], num_running_requests: int =`
`1013`	`1013`
`1014`	`1014`	`if len(rope_3d_position_ids["position_ids_idx"]) > 0 and self.enable_mm:`
`1015`	`1015`	`packed_position_ids = paddle.to_tensor(`
`1016`		`- np.concatenate(rope_3d_position_ids["position_ids_lst"]), dtype="int64"`
	`1016`	`+ np.concatenate(rope_3d_position_ids["position_ids_lst"]), dtype="float32"`
`1017`	`1017`	`)`
`1018`	`1018`	`rope_3d_lst = self.prepare_rope3d(`
`1019`	`1019`	`packed_position_ids,`