Formatting through pyink

Perseus14 · Perseus14 · commit 5e1d2b32a999 · 2026-01-23T08:39:23.000Z
diff --git a/src/maxdiffusion/loaders/lora_conversion_utils.py b/src/maxdiffusion/loaders/lora_conversion_utils.py
@@ -611,89 +611,79 @@ def handle_qkv(sds_sd, ait_sd, sds_key, ait_keys, dims=None):
 
 
 def translate_wan_nnx_path_to_diffusers_lora(nnx_path_str, scan_layers=False):
-    """
-    Translates WAN NNX path to Diffusers/LoRA keys.
-    Verified against wan_utils.py mappings.
-    """
-
-    # --- 1. Embeddings (Exact Matches) ---
-    if nnx_path_str == 'condition_embedder.text_embedder.linear_1':
-        return 'diffusion_model.text_embedding.0'
-    if nnx_path_str == 'condition_embedder.text_embedder.linear_2':
-        return 'diffusion_model.text_embedding.2'
-    if nnx_path_str == 'condition_embedder.time_embedder.linear_1':
-        return 'diffusion_model.time_embedding.0'
-    if nnx_path_str == 'condition_embedder.time_embedder.linear_2':
-        return 'diffusion_model.time_embedding.2'
-    if nnx_path_str == 'condition_embedder.image_embedder.norm1.layer_norm':
-        return 'diffusion_model.img_emb.proj.0'
-    if nnx_path_str == 'condition_embedder.image_embedder.ff.net_0':
-        return 'diffusion_model.img_emb.proj.1'
-    if nnx_path_str == 'condition_embedder.image_embedder.ff.net_2':
-        return 'diffusion_model.img_emb.proj.3'
-    if nnx_path_str == 'condition_embedder.image_embedder.norm2.layer_norm':
-        return 'diffusion_model.img_emb.proj.4'
-    if nnx_path_str == 'patch_embedding':
-        return 'diffusion_model.patch_embedding'
-    if nnx_path_str == 'proj_out':
-        return 'diffusion_model.head.head'
-    if nnx_path_str == 'condition_embedder.time_proj':
-        return 'diffusion_model.time_projection.1'
-
-
-
-
-    # --- 2. Map NNX Suffixes to LoRA Suffixes ---
-    suffix_map = {
-        # Self Attention (attn1)
-        "attn1.query":     "self_attn.q",
-        "attn1.key":       "self_attn.k",
-        "attn1.value":     "self_attn.v",
-        "attn1.proj_attn": "self_attn.o",
-
-        # Self Attention Norms (QK Norm)
-        "attn1.norm_q":    "self_attn.norm_q",
-        "attn1.norm_k":    "self_attn.norm_k",
-
-        # Cross Attention (attn2)
-        "attn2.query":     "cross_attn.q",
-        "attn2.key":       "cross_attn.k",
-        "attn2.value":     "cross_attn.v",
-        "attn2.proj_attn": "cross_attn.o",
-
-        # Cross Attention Norms (QK Norm)
-        "attn2.norm_q":    "cross_attn.norm_q",
-        "attn2.norm_k":    "cross_attn.norm_k",
-
-        # Cross Attention img
-        "attn2.add_k_proj":    "cross_attn.k_img",
-        "attn2.add_v_proj":    "cross_attn.v_img",
-        "attn2.norm_added_k":    "cross_attn.norm_k_img",
-
-        # Feed Forward (ffn)
-        "ffn.act_fn.proj": "ffn.0",  # Up proj
-        "ffn.proj_out":    "ffn.2",  # Down proj
-
-        # Global Norms & Modulation
-        "norm2.layer_norm": "norm3",
-        "scale_shift_table": "modulation",
-        "proj_out": "head.head"
-    }
-
-    # --- 3. Translation Logic ---
-    if scan_layers:
-        # Scanned Pattern: "blocks.attn1.query" -> "diffusion_model.blocks.{}.self_attn.q"
-        if nnx_path_str.startswith("blocks."):
-            inner_suffix = nnx_path_str[len("blocks."):]
-            if inner_suffix in suffix_map:
-                return f"diffusion_model.blocks.{{}}.{suffix_map[inner_suffix]}"
-    else:
-        # Unscanned Pattern: "blocks.0.attn1.query" -> "diffusion_model.blocks.0.self_attn.q"
-        m = re.match(r"^blocks\.(\d+)\.(.+)$", nnx_path_str)
-        if m:
-            idx, inner_suffix = m.group(1), m.group(2)
-            if inner_suffix in suffix_map:
-                return f"diffusion_model.blocks.{idx}.{suffix_map[inner_suffix]}"
+  """
+  Translates WAN NNX path to Diffusers/LoRA keys.
+  Verified against wan_utils.py mappings.
+  """
 
-    return None
+  # --- 1. Embeddings (Exact Matches) ---
+  if nnx_path_str == "condition_embedder.text_embedder.linear_1":
+    return "diffusion_model.text_embedding.0"
+  if nnx_path_str == "condition_embedder.text_embedder.linear_2":
+    return "diffusion_model.text_embedding.2"
+  if nnx_path_str == "condition_embedder.time_embedder.linear_1":
+    return "diffusion_model.time_embedding.0"
+  if nnx_path_str == "condition_embedder.time_embedder.linear_2":
+    return "diffusion_model.time_embedding.2"
+  if nnx_path_str == "condition_embedder.image_embedder.norm1.layer_norm":
+    return "diffusion_model.img_emb.proj.0"
+  if nnx_path_str == "condition_embedder.image_embedder.ff.net_0":
+    return "diffusion_model.img_emb.proj.1"
+  if nnx_path_str == "condition_embedder.image_embedder.ff.net_2":
+    return "diffusion_model.img_emb.proj.3"
+  if nnx_path_str == "condition_embedder.image_embedder.norm2.layer_norm":
+    return "diffusion_model.img_emb.proj.4"
+  if nnx_path_str == "patch_embedding":
+    return "diffusion_model.patch_embedding"
+  if nnx_path_str == "proj_out":
+    return "diffusion_model.head.head"
+  if nnx_path_str == "condition_embedder.time_proj":
+    return "diffusion_model.time_projection.1"
+
+  # --- 2. Map NNX Suffixes to LoRA Suffixes ---
+  suffix_map = {
+      # Self Attention (attn1)
+      "attn1.query": "self_attn.q",
+      "attn1.key": "self_attn.k",
+      "attn1.value": "self_attn.v",
+      "attn1.proj_attn": "self_attn.o",
+      # Self Attention Norms (QK Norm)
+      "attn1.norm_q": "self_attn.norm_q",
+      "attn1.norm_k": "self_attn.norm_k",
+      # Cross Attention (attn2)
+      "attn2.query": "cross_attn.q",
+      "attn2.key": "cross_attn.k",
+      "attn2.value": "cross_attn.v",
+      "attn2.proj_attn": "cross_attn.o",
+      # Cross Attention Norms (QK Norm)
+      "attn2.norm_q": "cross_attn.norm_q",
+      "attn2.norm_k": "cross_attn.norm_k",
+      # Cross Attention img
+      "attn2.add_k_proj": "cross_attn.k_img",
+      "attn2.add_v_proj": "cross_attn.v_img",
+      "attn2.norm_added_k": "cross_attn.norm_k_img",
+      # Feed Forward (ffn)
+      "ffn.act_fn.proj": "ffn.0",  # Up proj
+      "ffn.proj_out": "ffn.2",  # Down proj
+      # Global Norms & Modulation
+      "norm2.layer_norm": "norm3",
+      "scale_shift_table": "modulation",
+      "proj_out": "head.head",
+  }
 
+  # --- 3. Translation Logic ---
+  if scan_layers:
+    # Scanned Pattern: "blocks.attn1.query" -> "diffusion_model.blocks.{}.self_attn.q"
+    if nnx_path_str.startswith("blocks."):
+      inner_suffix = nnx_path_str[len("blocks.") :]
+      if inner_suffix in suffix_map:
+        return f"diffusion_model.blocks.{{}}.{suffix_map[inner_suffix]}"
+  else:
+    # Unscanned Pattern: "blocks.0.attn1.query" -> "diffusion_model.blocks.0.self_attn.q"
+    m = re.match(r"^blocks\.(\d+)\.(.+)$", nnx_path_str)
+    if m:
+      idx, inner_suffix = m.group(1), m.group(2)
+      if inner_suffix in suffix_map:
+        return f"diffusion_model.blocks.{idx}.{suffix_map[inner_suffix]}"
+
+  return None
diff --git a/src/maxdiffusion/loaders/wan_lora_nnx_loader.py b/src/maxdiffusion/loaders/wan_lora_nnx_loader.py
@@ -21,6 +21,7 @@
 from .. import max_logging
 from . import lora_conversion_utils
 
+
 class Wan2_1NnxLoraLoader(LoRABaseMixin):
   """
   Handles loading LoRA weights into NNX-based WAN 2.1 model.
@@ -44,21 +45,21 @@ def load_lora_weights(
     lora_loader = StableDiffusionLoraLoaderMixin()
 
     merge_fn = lora_nnx.merge_lora_for_scanned if scan_layers else lora_nnx.merge_lora
+
     def translate_fn(nnx_path_str):
       return lora_conversion_utils.translate_wan_nnx_path_to_diffusers_lora(nnx_path_str, scan_layers=scan_layers)
 
     # Handle high noise model
     if hasattr(pipeline, "transformer") and transformer_weight_name:
-        max_logging.log(f"Merging LoRA into transformer with rank={rank}")
-        h_state_dict, _ = lora_loader.lora_state_dict(
-            lora_model_path, weight_name=transformer_weight_name, **kwargs
-        )
-        merge_fn(pipeline.transformer, h_state_dict, rank, scale, translate_fn)
+      max_logging.log(f"Merging LoRA into transformer with rank={rank}")
+      h_state_dict, _ = lora_loader.lora_state_dict(lora_model_path, weight_name=transformer_weight_name, **kwargs)
+      merge_fn(pipeline.transformer, h_state_dict, rank, scale, translate_fn)
     else:
-        max_logging.log("transformer not found or no weight name provided for LoRA.")
+      max_logging.log("transformer not found or no weight name provided for LoRA.")
 
     return pipeline
 
+
 class Wan2_2NnxLoraLoader(LoRABaseMixin):
   """
   Handles loading LoRA weights into NNX-based WAN 2.2 model.
@@ -83,27 +84,24 @@ def load_lora_weights(
     lora_loader = StableDiffusionLoraLoaderMixin()
 
     merge_fn = lora_nnx.merge_lora_for_scanned if scan_layers else lora_nnx.merge_lora
+
     def translate_fn(nnx_path_str: str):
       return lora_conversion_utils.translate_wan_nnx_path_to_diffusers_lora(nnx_path_str, scan_layers=scan_layers)
 
     # Handle high noise model
     if hasattr(pipeline, "high_noise_transformer") and high_noise_weight_name:
-        max_logging.log(f"Merging LoRA into high_noise_transformer with rank={rank}")
-        h_state_dict, _ = lora_loader.lora_state_dict(
-            lora_model_path, weight_name=high_noise_weight_name, **kwargs
-        )
-        merge_fn(pipeline.high_noise_transformer, h_state_dict, rank, scale, translate_fn)
+      max_logging.log(f"Merging LoRA into high_noise_transformer with rank={rank}")
+      h_state_dict, _ = lora_loader.lora_state_dict(lora_model_path, weight_name=high_noise_weight_name, **kwargs)
+      merge_fn(pipeline.high_noise_transformer, h_state_dict, rank, scale, translate_fn)
     else:
-        max_logging.log("high_noise_transformer not found or no weight name provided for LoRA.")
+      max_logging.log("high_noise_transformer not found or no weight name provided for LoRA.")
 
     # Handle low noise model
     if hasattr(pipeline, "low_noise_transformer") and low_noise_weight_name:
-        max_logging.log(f"Merging LoRA into low_noise_transformer with rank={rank}")
-        l_state_dict, _ = lora_loader.lora_state_dict(
-            lora_model_path, weight_name=low_noise_weight_name, **kwargs
-        )
-        merge_fn(pipeline.low_noise_transformer, l_state_dict, rank, scale, translate_fn)
+      max_logging.log(f"Merging LoRA into low_noise_transformer with rank={rank}")
+      l_state_dict, _ = lora_loader.lora_state_dict(lora_model_path, weight_name=low_noise_weight_name, **kwargs)
+      merge_fn(pipeline.low_noise_transformer, l_state_dict, rank, scale, translate_fn)
     else:
-        max_logging.log("low_noise_transformer not found or no weight name provided for LoRA.")
+      max_logging.log("low_noise_transformer not found or no weight name provided for LoRA.")
 
     return pipeline
diff --git a/src/maxdiffusion/models/lora_nnx.py b/src/maxdiffusion/models/lora_nnx.py