axolotl/tests/e2e/multigpu/test_gemma3.py at 8eba033dc47ea95748b5c8d27cb213e6068a5387

Files

Wing Lian a85efffbef bump transformers==4.52.4 (#2800 ) [skip ci]

* bump transformers==4.52.4

* don't use hf offline for qwen tokenizer

* increase timeout

* don't use methodtype

* increase timeout

* better assertion logging

* upgrade deepspeed version too

2025-06-18 15:46:14 -04:00

3.0 KiB

Raw Blame History

View Raw

3.0 KiB Raw Blame History

3.0 KiB

Raw Blame History