fix #16 load best model setting when using 8bit

2023-05-07 18:30:48 -04:00
parent 550502b321
commit a4329b1068
1 changed files with 1 additions and 1 deletions
--- a/src/axolotl/utils/trainer.py
+++ b/src/axolotl/utils/trainer.py
@@ -97,7 +97,7 @@ def setup_trainer(cfg, train_dataset, eval_dataset, model, tokenizer):
        output_dir=cfg.output_dir,
        save_total_limit=3,
        load_best_model_at_end=True
-        if cfg.val_set_size > 0 and save_steps % eval_steps == 0
+        if cfg.val_set_size > 0 and save_steps % eval_steps == 0 and cfg.load_in_8bit is not True
        else False,
        ddp_find_unused_parameters=False if cfg.ddp else None,
        group_by_length=cfg.group_by_length,