make sure to multiply against the correct loss

2024-12-19 01:42:57 -05:00
parent ae545e0165
commit 00ce77e7ef
1 changed files with 1 additions and 1 deletions
--- a/src/axolotl/core/trainers/kd.py
+++ b/src/axolotl/core/trainers/kd.py
@@ -121,6 +121,6 @@ class AxolotlKDTrainer(AxolotlTrainer):
            ]

        if self.args.average_tokens_across_devices and self.model_accepts_loss_kwargs:
-            loss_kd *= self.accelerator.num_processes
+            loss *= self.accelerator.num_processes

        return (loss, outputs) if return_outputs else loss