llama patch

2025-01-22 11:29:28 -05:00
parent b2a34380b3
commit 5f9f77f384
1 changed files with 3 additions and 3 deletions
--- a/src/axolotl/monkeypatch/llama_patch_multipack.py
+++ b/src/axolotl/monkeypatch/llama_patch_multipack.py
@@ -10,16 +10,16 @@ from axolotl.monkeypatch.utils import (

 def hijack_llama_prepare_4d_mask():
    from transformers import modeling_attn_mask_utils
-    from transformers.models.llama import modeling_llama
+    from transformers.models.llama.modeling_llama import LlamaModel

    # modeling_llama._prepare_4d_causal_attention_mask_for_sdpa = (  # pylint: disable=protected-access
-    modeling_llama._prepare_4d_causal_attention_mask_with_cache_position = (  # pylint: disable=protected-access
+    LlamaModel._prepare_4d_causal_attention_mask_with_cache_position = (  # pylint: disable=protected-access
        patched_prepare_4d_causal_attention_mask_for_sdpa
    )
    modeling_attn_mask_utils._prepare_4d_causal_attention_mask_for_sdpa = (  # pylint: disable=protected-access
        patched_prepare_4d_causal_attention_mask_for_sdpa
    )
-    modeling_llama._prepare_4d_causal_attention_mask = (  # pylint: disable=protected-access
+    LlamaModel._prepare_4d_causal_attention_mask = (  # pylint: disable=protected-access
        patched_prepare_4d_causal_attention_mask
    )
    modeling_attn_mask_utils._prepare_4d_causal_attention_mask = (  # pylint: disable=protected-access