upgrade transformers==5.3.0 trl==0.29.0 kernels (#3459)

* upgrade transformers==5.3.0 trl==0.29.0 kernels

* use latest deepspeed fixes

* use corect image for cleanup

* fix test outputs for tokenizer fixes upstream

* fix import:

* keep trl at 0.28.0

* handle updated API

* use latest trl since 0.28.0 doesn't work with latest transformers

* use trl experimental for pad to length

* monkeypatch trl with ORPOTrainer so liger doesn't croak

* upgrade accelerate

* more fixes

* move patch for orpotrainer

* load the imports later

* remove use_logits_to_keep

* fix loss_type arg as a list

* fetch hf cache from s3

* just manually download the missing model for now

* lint for pre-commit update

* a few more missing models on disk

* fix: loss_type internally now list

* fix: remove deprecated code and raise deprecate

* fix: remove unneeded blocklist

* fix: remove reliance on transformers api to find package available

* chore: refactor shim for less sideeffect

* fix: silent trl experimental warning

---------

Co-authored-by: NanoCode012 <nano@axolotl.ai>

This commit is contained in:

Wing Lian

2026-03-06 09:11:20 -05:00

committed by

GitHub

parent 56162f71db

commit cada93cee5

19 changed files with 81 additions and 49 deletions

									
										4

.github/workflows/tests.yml
									
										vendored
									
												View File
												
				@@ -387,8 +387,8 @@ jobs:

				      fail-fast: false

				      matrix:

				        include:

				          - cuda: 129

				            cuda_version: 12.9.1

				          - cuda: 128

				            cuda_version: 12.8.1

				            python_version: "3.11"

				            pytorch: 2.9.1

				            num_gpus: 1

upgrade transformers==5.3.0 trl==0.29.0 kernels (#3459)

4 .github/workflows/tests.yml vendored Unescape Escape View File

4

.github/workflows/tests.yml vendored

View File