fix: proprerly return causal model

2025-02-05 15:56:57 +07:00
parent 4cc60df876
commit 253dcdd0cf
1 changed files with 15 additions and 3 deletions
--- a/src/axolotl/integrations/lolcats/linear_llama/modeling_linear_llama.py
+++ b/src/axolotl/integrations/lolcats/linear_llama/modeling_linear_llama.py
@@ -79,6 +79,9 @@ class LinearLlamaForCausalLM(LlamaForCausalLM):
    Linear LLaMA model for causal language modeling.
    """
    config_class = LinearLlamaConfig
    base_model_prefix = "linear_llama"
    def __init__(self, config):
        super().__init__(config)
        self.model = LinearLlamaModel(config)
@@ -102,20 +105,29 @@ class LinearLlamaForCausalLM(LlamaForCausalLM):
        # Handle LlamaForCausalLM
        if isinstance(model, LlamaForCausalLM):
-            model = model.model
+            llama_model = model.model
        else:
            llama_model = model
        if config is None:
            raise ValueError("Missing config")
        from axolotl.integrations.lolcats.linearize_attention import convert_attention
-        new_model = convert_attention(
+        llama_model = convert_attention(
-            model,
+            llama_model,
            DictDefault(**config.attention_config),
            train_attention=train_attention,
            remove_base_attn=remove_base_attn,
        )
        # initialize the model with prior weights
        new_model = cls(config=config)
        del new_model.model  # remove the default model
        del new_model.lm_head  # remove the default lm_head
        new_model.model = llama_model
        new_model.lm_head = model.lm_head
        return new_model
    def toggle_attention(self, train: bool = True):