optimize dataloading to use cache, fix model token embedding sizes

2023-05-12 13:53:27 -04:00
parent f6d1fa4a85
commit aa3c3f97ae
2 changed files with 74 additions and 14 deletions
--- a/src/axolotl/utils/models.py
+++ b/src/axolotl/utils/models.py
@@ -181,6 +181,8 @@ def load_model(
        for k, v in cfg.tokens.items():
            tokenizer.add_special_tokens({k: v})

+    model.resize_token_embeddings(len(tokenizer))
+
    if cfg.adapter and load_in_8bit and not cfg.load_4bit:
        logging.info("converting PEFT model w/ prepare_model_for_int8_training")
        model = prepare_model_for_int8_training(model)