refactor a bit

2025-01-21 10:14:16 -05:00
parent b582d340b0
commit 08a4e8a7fb
3 changed files with 23 additions and 19 deletions
--- a/src/axolotl/integrations/rrt/cli/convert.py
+++ b/src/axolotl/integrations/rrt/cli/convert.py
@@ -264,8 +264,16 @@ def save_state_dict_to_safetensors(state_dict, save_directory):


 def convert_llama_to_rrt(
-    model_name, output_dir, recurse_layers: int = 12, rank=32, alpha=32, device="mps"
+    model_name, output_dir, recurse_layers: int = 12, rank=32, alpha=32, device=None
 ):
+    if not device:
+        if torch.backends.mps.is_available():
+            device = "mps"
+        elif torch.cuda.is_available():
+            device = "cuda"
+        else:
+            device = "cpu"
+
    modules_to_recurse = [
        "self_attn.q_proj",
        "self_attn.k_proj",
@@ -329,17 +337,10 @@ def convert_llama_to_rrt(

 if __name__ == "__main__":
    # meta-llama/Llama-3.2-1B has 16 hidden layers
-    if torch.backends.mps.is_available():
-        device = "mps"
-    elif torch.cuda.is_available():
-        device = "cuda"
-    else:
-        device = "cpu"
    convert_llama_to_rrt(
        "meta-llama/Llama-3.2-1B",
        "/tmp/rrt_model",
        recurse_layers=4,
        rank=256,
        alpha=512,
-        device=device,
    )
--- a/src/axolotl/integrations/rrt/modeling/configuration_rrt_llama.py
+++ b/src/axolotl/integrations/rrt/modeling/configuration_rrt_llama.py
@@ -0,0 +1,13 @@
+from transformers import LlamaConfig
+
+
+class RelaxedRecursiveLlamaConfig(LlamaConfig):
+    """
+    Configuration for Relaxed Recursive Llama.
+    """
+
+    model_type = "llama-rrt"
+    recurse_layers: int  = 4
+    rank: int
+    alpha: int
+    use_dora: bool = True
--- a/src/axolotl/integrations/rrt/modeling/modeling_rrt_llama.py
+++ b/src/axolotl/integrations/rrt/modeling/modeling_rrt_llama.py
@@ -12,20 +12,10 @@ from transformers.models.llama.modeling_llama import apply_rotary_pos_emb, eager
    LlamaForCausalLM, LlamaModel, LlamaRotaryEmbedding

 from axolotl.integrations.rrt.modeling.linear import RelaxedRecursiveDoraLinear
+from .configuration_rrt_llama import RelaxedRecursiveLlamaConfig

 logger = logging.getLogger(__name__)

-class RelaxedRecursiveLlamaConfig(LlamaConfig):
-    """
-    Configuration for Relaxed Recursive Llama.
-    """
-
-    model_type = "llama-rrt"
-    recurse_layers: int  = 4
-    rank: int
-    alpha: int
-    use_dora: bool = True
-

 class RelaxedRecursiveLlamaMLP(nn.Module):
    def __init__(self, config: RelaxedRecursiveLlamaConfig):