fix

prishajain1 · prishajain1 · commit 4f375aa68723 · 2026-02-23T09:13:02.000+05:30
diff --git a/src/maxdiffusion/models/ltx2/ltx2_utils.py b/src/maxdiffusion/models/ltx2/ltx2_utils.py
@@ -115,10 +115,6 @@ def get_key_and_value(pt_tuple_key, tensor, flax_state_dict, random_flax_state_d
   # Also check 'weight' because rename_key might not have converted it to kernel if it wasn't a known Linear
   flax_key_str = [str(k) for k in flax_key]
   
-  # DEBUG: Check specific keys
-  if "norm_k" in flax_key_str or "audio_caption_projection" in flax_key_str:
-       print(f"DEBUG: get_key_and_value mapping: {pt_tuple_key} -> {flax_key_str}")
-  
   if flax_key_str[-1] in ["kernel", "weight"]:
        # Try replacing with scale and check if it exists in random_flax_state_dict
        temp_key_str = flax_key_str[:-1] + ["scale"]
@@ -298,47 +294,10 @@ def load_transformer_weights(
         string_tuple = tuple([str(item) for item in key])
         random_flax_state_dict[string_tuple] = flattened_dict[key]
 
-    # DEBUG: Print keys to understand mapping
-    print("DEBUG: Top 20 keys from Checkpoint (tensors):")
-    for k in list(tensors.keys())[:20]:
-        print(k)
-
-    print("DEBUG: NON-BLOCK keys in Checkpoint:")
-    for k in tensors.keys():
-        if "transformer_blocks" not in k:
-            print(k)
-        
-    print("\nDEBUG: Top 20 keys from Flax Model (eval_shapes):")
-    for k in list(random_flax_state_dict.keys())[:20]:
-        print(k)
-
-    print("\nDEBUG: Transformer Block 0 keys from Checkpoint:")
-    found_block_0 = False
-    for k in tensors.keys():
-        if "transformer_blocks.0." in k or "transformer_blocks_0." in k:
-            print(k)
-            found_block_0 = True
-            
-    if not found_block_0:
-         # Try looking for any block
-         for k in tensors.keys():
-             if "transformer_blocks" in k:
-                 print(f"Sample block key: {k}")
-                 break
-
-    print("\nDEBUG: Global Norm/LN candidates in Checkpoint:")
-    for k in tensors.keys():
-        if "norm" in k.lower() or "ln" in k.lower():
-            if "transformer_blocks" not in k:
-                print(k)
+    for key in flattened_dict:
+        string_tuple = tuple([str(item) for item in key])
+        random_flax_state_dict[string_tuple] = flattened_dict[key]
 
-    print("\nDEBUG: Transformer Block keys from Flax Model (eval_shapes):")
-    for k in list(random_flax_state_dict.keys()):
-        k_str = str(k)
-        if "transformer_blocks" in k_str and ("attn1" in k_str or "ff" in k_str):
-             print(f"EVAL_SHAPE: {k}")
-             pass
-        
     for pt_key, tensor in tensors.items():
         renamed_pt_key = rename_key(pt_key)
         renamed_pt_key = rename_for_ltx2_transformer(renamed_pt_key)
@@ -392,15 +351,6 @@ def load_vae_weights(
       cpu = jax.local_devices(backend="cpu")[0]
       flattened_eval = flatten_dict(eval_shapes)
       
-      # DEBUG: Print keys to understand mapping
-      print("DEBUG: Top 20 keys from VAE Checkpoint (tensors):")
-      for k in list(tensors.keys())[:20]:
-          print(k)
-            
-      flax_state_dict = {}
-      cpu = jax.local_devices(backend="cpu")[0]
-      flattened_eval = flatten_dict(eval_shapes)
-      
       random_flax_state_dict = {}
       for key in flattened_eval:
           string_tuple = tuple([str(item) for item in key])
diff --git a/src/maxdiffusion/models/ltx2/transformer_ltx2.py b/src/maxdiffusion/models/ltx2/transformer_ltx2.py
@@ -807,7 +807,7 @@ def init_block(rngs):
     # 6. Output layers
     self.gradient_checkpoint = GradientCheckpointType.from_str(remat_policy)
     self.norm_out = nnx.LayerNorm(
-        inner_dim, epsilon=1e-6, use_scale=False, use_bias=False, rngs=rngs, dtype=jnp.float32, param_dtype=jnp.float32
+        inner_dim, epsilon=1e-6, use_scale=False, rngs=rngs, dtype=jnp.float32, param_dtype=jnp.float32
     )
     self.proj_out = nnx.Linear(
         inner_dim,
@@ -820,7 +820,7 @@ def init_block(rngs):
     )
 
     self.audio_norm_out = nnx.LayerNorm(
-        audio_inner_dim, epsilon=1e-6, use_scale=False, use_bias=False, rngs=rngs, dtype=jnp.float32, param_dtype=jnp.float32
+        audio_inner_dim, epsilon=1e-6, use_scale=False, rngs=rngs, dtype=jnp.float32, param_dtype=jnp.float32
     )
     self.audio_proj_out = nnx.Linear(
         audio_inner_dim,

Original file line number	Diff line number	Diff line change
`@@ -807,7 +807,7 @@ def init_block(rngs):`
`807`	`807`	`# 6. Output layers`
`808`	`808`	`self.gradient_checkpoint = GradientCheckpointType.from_str(remat_policy)`
`809`	`809`	`self.norm_out = nnx.LayerNorm(`
`810`		`- inner_dim, epsilon=1e-6, use_scale=False, use_bias=False, rngs=rngs, dtype=jnp.float32, param_dtype=jnp.float32`
	`810`	`+ inner_dim, epsilon=1e-6, use_scale=False, rngs=rngs, dtype=jnp.float32, param_dtype=jnp.float32`
`811`	`811`	`)`
`812`	`812`	`self.proj_out = nnx.Linear(`
`813`	`813`	`inner_dim,`
`@@ -820,7 +820,7 @@ def init_block(rngs):`
`820`	`820`	`)`
`821`	`821`
`822`	`822`	`self.audio_norm_out = nnx.LayerNorm(`
`823`		`- audio_inner_dim, epsilon=1e-6, use_scale=False, use_bias=False, rngs=rngs, dtype=jnp.float32, param_dtype=jnp.float32`
	`823`	`+ audio_inner_dim, epsilon=1e-6, use_scale=False, rngs=rngs, dtype=jnp.float32, param_dtype=jnp.float32`
`824`	`824`	`)`
`825`	`825`	`self.audio_proj_out = nnx.Linear(`
`826`	`826`	`audio_inner_dim,`