fix: load vocab_size

2025-02-05 23:46:59 +07:00
parent 578fa764c8
commit c15ea6b956
1 changed files with 3 additions and 1 deletions
--- a/src/axolotl/integrations/lolcats/linear_llama/modeling_linear_llama.py
+++ b/src/axolotl/integrations/lolcats/linear_llama/modeling_linear_llama.py
@@ -108,13 +108,14 @@ class LinearLlamaForCausalLM(LlamaForCausalLM):
        if config is None:
            raise ValueError("Missing config")

-        # initialize the model with prior weights
+        # initialize a new model with config
        new_model = cls(config=config)

        # remove the default model and lm_head
        del new_model.model
        del new_model.lm_head

+        # load converted model, lm_head, and vocab_size from llama model
        new_model.model = convert_attention(
            model.model,
            attention_config=config.attention_config,
@@ -122,6 +123,7 @@ class LinearLlamaForCausalLM(LlamaForCausalLM):
            remove_base_attn=remove_base_attn,
        )
        new_model.lm_head = model.lm_head
+        new_model.vocab_size = model.vocab_size

        return new_model