axolotl/tests/e2e/test_packing_loss.py at d8cf66edbd33239bb93cd020dcba1e45ff4073be

Files

Wing Lian a85efffbef bump transformers==4.52.4 (#2800 ) [skip ci]

* bump transformers==4.52.4

* don't use hf offline for qwen tokenizer

* increase timeout

* don't use methodtype

* increase timeout

* better assertion logging

* upgrade deepspeed version too

2025-06-18 15:46:14 -04:00

1.9 KiB

Raw Blame History

View Raw

1.9 KiB Raw Blame History

1.9 KiB

Raw Blame History