fix eval_steps to be a sane default (#797)

* fix eval_steps to be a sane default * update docs for fractional eval_steps
2023-10-27 22:36:30 -04:00
parent 0800885e2f
commit 8b79ff0e94
23 changed files with 36 additions and 36 deletions
--- a/examples/mistral/config.yml
+++ b/examples/mistral/config.yml
@@ -26,7 +26,7 @@ wandb_log_model:

 gradient_accumulation_steps: 4
 micro_batch_size: 2
-num_epochs: 3
+num_epochs: 4
 optimizer: adamw_bnb_8bit
 lr_scheduler: cosine
 learning_rate: 0.000005
@@ -46,7 +46,7 @@ xformers_attention:
 flash_attention: true

 warmup_steps: 10
-eval_steps: 20
+eval_steps: 0.05
 eval_table_size:
 eval_table_max_new_tokens: 128
 save_steps:
--- a/examples/mistral/qlora.yml
+++ b/examples/mistral/qlora.yml
@@ -63,7 +63,7 @@ xformers_attention:
 flash_attention: true

 warmup_steps: 10
-eval_steps: 20
+eval_steps: 0.05
 eval_table_size:
 eval_table_max_new_tokens: 128
 save_steps: