fix

prishajain1 · prishajain1 · commit 4253c1984df2 · 2026-02-26T09:00:48.000+05:30
diff --git a/src/maxdiffusion/pipelines/ltx2/ltx2_pipeline.py b/src/maxdiffusion/pipelines/ltx2/ltx2_pipeline.py
@@ -637,8 +637,11 @@ def _unpack_audio_latents(
       if patch_size is not None and patch_size_t is not None:
           batch_size = latents.shape[0]
           # latents: (Batch, Seq, Dim)
-          latents = latents.reshape(batch_size, latent_length, num_mel_bins, -1, patch_size_t, patch_size)
-          latents = latents.transpose(0, 3, 1, 4, 2, 5).reshape(batch_size, -1, latent_length * patch_size_t, num_mel_bins * patch_size)
+          # Pack: (B, C, L, F) -> (B, C, L', pt, F', p) -> (B, C, L', pt, F', p) -> (B, L', F', C, pt, p) -> (B, L', F', C*pt*p)
+          # Unpack: (B, L'*F', C*pt*p) -> (B, L', F', C, pt, p) -> (B, C, L', pt, F', p) -> (B, C, L'*pt, F'*p)
+          latents = latents.reshape(batch_size, -1, num_mel_bins // patch_size, num_channels * patch_size_t * patch_size)
+          latents = latents.reshape(batch_size, latent_length // patch_size_t, num_mel_bins // patch_size, num_channels, patch_size_t, patch_size)
+          latents = latents.transpose(0, 3, 1, 4, 2, 5).reshape(batch_size, num_channels, latent_length, num_mel_bins)
           # Wait, reshape order needs to match pack? 
           # Pack: (B, C, L, F) -> (B, C, L', pt, F', p) -> (B, L', F', C, pt, p) -> (B, L'*F', C*pt*p)
           # Unpack: (B, L'*F', C*pt*p) -> (B, L', F', C, pt, p) -> (B, C, L', pt, F', p) -> (B, C, L'*pt, F'*p)
diff --git a/src/maxdiffusion/tests/ltx2_pipeline_test.py b/src/maxdiffusion/tests/ltx2_pipeline_test.py
@@ -196,7 +196,7 @@ def test_load_transformer(self, mock_load_config, mock_load_weights):
             real_model = LTX2VideoTransformer3DModel(**tiny_config, rngs=rngs)
         
         graphdef, state = nnx.split(real_model)
-        flat_state = state.to_flat_dict()
+        flat_state = nnx.to_flat_state(state)
         
         # Create mock weights that match real model structure
         # keys in flat_state are tuples like ('layer', 'kernel')