use smaller pretrained models for ci (#3620) [skip ci]

* use smaller pretrained models for ci * more steps for loss check * fix tests * more train steps * fix losses
2026-04-27 13:22:56 -04:00
parent 798c8fba89
commit ac77da96da
24 changed files with 716 additions and 288 deletions
--- a/tests/e2e/test_preprocess.py
+++ b/tests/e2e/test_preprocess.py
@@ -18,7 +18,7 @@ class TestPreprocess:

        cfg = DictDefault(
            {
-                "base_model": "Qwen/Qwen2.5-0.5B",
+                "base_model": "axolotl-ai-co/tiny-qwen2-129m",
                "sequence_len": 2048,
                "val_set_size": 0.01,
                "datasets": [