axolotl

Files

Wing Lian 40a6362c92 support for mamba (#915 )

* support for mamba

* more mamba fixes

* use fork for mamba kwargs fix

* grad checkpointing doesn't work

* fix extras for mamaba

* mamba loss fix

* use fp32 and remove verbose logging

* mamba fixes

* fix collator for mamba

* set model_type on training_args

* don't save safetensors for mamba

* update mamba config to disable safetensor checkpooints, install for tests

* no evals for mamba tests

* handle save_pretrained

* handle unused safetensors arg

2023-12-09 12:10:41 -05:00

__init__.py

missing dunder-init

2023-11-06 18:33:01 -05:00

.gitignore

Support Sample packing for phi arch (#586 )

2023-09-15 15:46:54 -04:00

test_fused_llama.py

use temp_dir kwarg instead

2023-11-06 18:33:01 -05:00

test_lora_llama.py

add e2e tests for checking functionality of resume from checkpoint (#865 )