Files

Wing Lian 3ebf22464b qlora-fsdp ram efficient loading with hf trainer (#1791 )

* fix 405b with lower cpu ram requirements

* make sure to use doouble quant and only skip output embeddings

* set model attributes

* more fixes for sharded fsdp loading

* update the base model in example to use pre-quantized nf4-bf16 weights

* upstream fixes  for qlora+fsdp

2024-07-30 19:21:38 -04:00

fft-8b.yaml

bump transformers and set roundup_power2_divisions for more VRAM improvements, low bit ao optimizers (#1769 )

2024-07-19 00:47:07 -04:00

instruct-dpo-lora-8b.yml

Add a chat_template prompt strategy for DPO (#1725 )

2024-07-21 09:10:42 -04:00

instruct-lora-8b.yml

bump transformers and set roundup_power2_divisions for more VRAM improvements, low bit ao optimizers (#1769 )

2024-07-19 00:47:07 -04:00

lora-8b.yml

bump transformers and set roundup_power2_divisions for more VRAM improvements, low bit ao optimizers (#1769 )