axolotl

tocmo0nlord/axolotl

Fork 0

Commit Graph

Select branches

Hide Pull Requests

1947fix

1991test

20230920-btlm

20231212-fixes

20240216-updates

20240307-updates

20240404-lisa-determinism

3181

4bit-optimizers

775-option-to-drop-vs-truncate-on-rows-longer-than-context-length

NanoCode012-patch-1

accelerator-args-builder

activation-offloading-torchtune

activations

activeblue/main

async-grpo-patched-v2

attention_enum

attn-implementation-refactor

attn-patches

autodoc

autogptq-tests

axolotl-ci-hf

base-model-readme-update

benchmark-callbacks-next

bursteratom-doc-faq-update

chat-dataset-tool

chat-template-granite

chore/docstring-distributed

cj_tokenizer_default_prompt_template

cli-cloud-modal-math-hard

cli-refactor

codecov-pulls-only

coderabbitai/docstrings/3e51a68

coderabbitai/docstrings/QVUilv72ojQNaYsCLVNpUpfo2rK1ZU5x90oPNXYz0ZfsWzWSHca36pjgaU5JOtZOA4gNjbjVYxShdRmkm7fGSlW

coderabbitai/docstrings/b234532

colab-misc-fixes

colab-misc-fixes-test

completion-json

compute-perplexity-metrics

cp-sdpa

cuda-12.8.1

custom-modeling

custom-trainer-cls

datasets-351

datasets-refactor

debug-hf-home-cache

deepspeed-low-cpu-mem

deepspeed_0_14_4

destroy-pg

dev-base

device-mesh

devstral-support

dft

diff-transformer

diffusion-custom-loss

diffusion-custom-models

diffusion-next-token-trainer

djsaunde-patch-1

docker-base-nvcr-pytorch

docker-cleanup-20231029

docs-lint-20250212

dpo-spawn-fix

dump-config

dynamic-sft

e2e-fsdp-trainer

embeddings-resize

enable_tp

eos-hell

exp-expand-len

fa-261

fa-check

fa3-hopper

feat/beautiful-readme

feat/glm45

feat/glmflash-other

feat/liger-deepseekv3

feat/linearize

feat/lmeval-baseten

feat/phi_35_vision

feat/pref_liger

feat/soap-optim-v2

feat/spaces-ui

feat/torchao-qlora

feat/wizard

feat_hqq

feature/attn-patches

feature/enable-huggingface-dataset-revision

feature/relora-rebased

fix-ddp_find_unused_parameters

fix-l3-lora

fix-merge-lint-issue

fix-preview

fix/cce-linear

fix/cp-waste

fix/diffusion

fix/doc-key

fix/dpo-labels

fix/eval-accu

fix/gemma3-text-only

fix/gemma3n-text-attention

fix/granite-speech

fix/hpc-root

fix/issue-1-build-deps

fix/issue-2-flash-attn-install

fix/issue-3-telemetry-whitelist

fix/issue-4-deepspeed-optional

fix/issue-5-8-docs

fix/issue-6-default-attention

fix/issue-7-hf-token-check

fix/kd-trainer-num-items

fix/merge-lora-fp32

fix/replace_jackllama

fix/rl-trainer-arg

fix/vllm-version

fix/xformers

fix_kto

fixtypo

flan-no-bos

flash-attn-2_5_5

flash-attn-fix-patches-wo-sample-packing

flex_patching_update

flx_attn_support

fp8

fsdp-defaults

fsdp-fft

fsdp-fix

fsdp-qdora

fsdp2

fsdp2_fp32

fused-mlp-ez

gh-pages

grouped_lr_squashed

grpo-path

grpo-path-v2

grpo-ref-model-cleanup

grpo_liger

hamelsmu-patch-1

hf-trainer-refactor

hymba_multipack2

ia3-peft

iterable-optional

jagged-restart-lr-scheduler-v3

kd-fix-20250519-v2

kd-logits-view

kd-logprob-data

kd-trainer

kd-trainer-2

kd-trainer-pre

kd-trainer-rebased

kd-trainer-v2

kd-trainer-zscore

keep_in_memory

kernelize-scattermoe-lora

kto_fix

kwargs-refactor

latent-space

lhl-moe-aux-loss-free

liger-063

liger-065

liger-dpo

lisa

llama-4-examples

llama-4-z3

llama-dropout

llama-flash-attn-fix

llama-multipack

llama4

llama4-patches

llava

llava-train

llmcompressor-sft

llmcompressor-sft-v2

llmcompressor-sft-wing

lora-fsdp2-doc

lora-kernels-deepspeed

lora-kernels-doc-fix

lora-quant-state-offset

lora_bf16

lora_kernels_fsdp

main

main-base

map-dataset-fetcher-fix

maverick-example

merge-lora-on-complete

merge-lora-tests

merged-2554

mistral-support

mixtral_optimized

mixtral_swiglu

mm2

mm3

mm_mc_chat

modal-upgrade-builder

model-loader-refactor

moekernels

mora

multi-gpu-state

multipack

multipack-dpo

multipack-pretraining

muon-validation

nca-pair

nd_parallel

neft-v2

no-bos-tokens-packing

no-seq-len

no-zero-ds-train

offload-activations-disk

olmo-no-position_ids

online-topk-kd

openorca

openorca-fix-mask

openorca-v2

optimizer-checkpoint

optimizer-compile

optimizers-refactor

packing-attn-limit-fa2-rebased

patch_lora_post_model_load

peft-update

phi-moe

pixtral_integration

pre-commit-update

preprocess_grpo-fix

pretrain-dataset

print_venv

pytest-each-flakey

pytest-skip-s2

q-galore

quantize-ptq-cli

quartodoc

quartodoc-fix

rala

rala-v2

reentrant-w-offloading

refactor-flash-attention

relaxed-recursive-transformers

release-0.10.x

release-0.8.x

release-v0.11.x

release-v0.12.x

release-v0.13.x

release-v0.9.x

remove-gptq-warn

revert-2332-fix_sample_packing

revert-2906-checkpoint-on-step-1

revert-multipack-changes

rl-trainers-sp

runpod-sls

sac

sageattention

save_only_model

scatter_moe

scatter_moe_eric

scattermoe-lora-optim-dtypestest

scattermoe-nanotron

sdpa-cp

sdpa-multipack

seq-parallel-ring

sequence-parallelism

shampoo

shampoo-low_bit

shared-prepared-ci

sharegpt-batched

sharegpt-field-conversations

smaller-rand-model

smol-ci

soap-optim

sp-fix-masking

sp-restore-buffers

sp-rl

sp-rl-v3

split-batches-sizes

sppo

squash_position_ids

ssmi-main

stable

streaming

streaming-on-the-fly-preprocess

streaming-remote-dataset

streaming-v2

swe-rebench-rl-rebase

telemetry

telemetry-opt-in

tensor-parallel

tensorboard-loss-check

testingci

textui

tinyllama-example

tool-mpm

topk-logprobs-triton

torch-211-base

torch_tensor_parallel

tp_support

train-refactor

transformers-4511

transformers-4513

transformers-4573

transformers-4_47_0_v2

transformers-fsdp-check

transformers-itl-refactor

tui

unsloth_modules

update-examples-llama3-ez

update-lgpl

update-vllm

upgrade-liger-test

upgrade-torchao-0.15

upgrade-trl-v0.12.0_2

upgrade_liger-tr4.46.1

uv-first

uv-fixup

vendor-moe

version-dev

vllm-0191

wait-distributed-close

weight-scale-norm

xformers-wo-packing

yayi2

zero3-8bit-lora

v0.1.0

v0.10.0

v0.10.1

v0.11.0

v0.11.0.post1

v0.12.0

v0.12.1

v0.12.2

v0.13.0

v0.13.1

v0.13.2

v0.14.0

v0.15.0

v0.16.0

v0.16.1

v0.2.0

v0.2.1

v0.3.0

v0.4.0

v0.5.0

v0.5.1

v0.5.1.post1

v0.5.2

v0.6.0

v0.7.0

v0.7.1

v0.8.0

v0.8.1

v0.9.0

v0.9.1

v0.9.1.post1

v0.9.2

b76d2d1130 Update: review comments! Rahul Tuli 2025-03-26 21:57:00 +00:00
7946f89df4 Add: SFTPlugin with llmcompressor Rahul Tuli 2025-03-12 07:09:06 +00:00
5dbfa3ef1f Built site for gh-pages Quarto GHA Workflow Runner 2025-04-28 16:21:02 +00:00
1178a15ede Feat: Add qwen3 and CCE for qwen family (#2518) NanoCode012 2025-04-28 23:18:46 +07:00
51c5ba0276 Built site for gh-pages Quarto GHA Workflow Runner 2025-04-28 16:14:25 +00:00
c513487d1a support val_set_size for splitting test split from train with DPO (#2572) Wing Lian 2025-04-28 12:12:15 -04:00
3f2fbb75b1 Built site for gh-pages Quarto GHA Workflow Runner 2025-04-28 15:22:54 +00:00
dda95e6c40 add preview-docs workflow (#2432) Dan Saunders 2025-04-28 11:20:46 -04:00
14b3af3330 Built site for gh-pages Quarto GHA Workflow Runner 2025-04-28 14:13:30 +00:00
7099343c56 feat: add eos_tokens and train_on_eot for chat_template EOT parsing (#2364) NanoCode012 2025-04-28 21:11:20 +07:00
5000cb3fe7 grab sys prompt too from dataset (#2397) [skip ci] Wing Lian 2025-04-28 10:11:06 -04:00
170cdb5be9 Add Post_model_load, post_lora_load, post_train, post_train_unload function calls (#2539) divyanshuaggarwal 2025-04-28 19:40:28 +05:30
5d182a1056 Add runpod sls handler (#2530) [skip ci] Ezekiel Wotring 2025-04-28 06:08:32 -08:00
40f4ea23ab replace references to random 68m model w 135m smollm2 (#2570) [skip ci] Wing Lian 2025-04-28 10:08:07 -04:00
f1df73a798 fix(doc): clarify vllm usage with grpo (#2573) [skip ci] NanoCode012 2025-04-28 21:07:45 +07:00
d48bc7afb6 Built site for gh-pages Quarto GHA Workflow Runner 2025-04-28 04:34:18 +00:00
8b33ae1c4f Fix bug in grpo reward module import (#2571) Dhruv Mullick 2025-04-27 22:31:56 -06:00
19280435f5 Built site for gh-pages Quarto GHA Workflow Runner 2025-04-27 23:22:12 +00:00
dc4da4a7e2 update trl to 0.17.0 (#2560) Wing Lian 2025-04-27 19:19:53 -04:00
2b9a2dde4b chore: update title runpod-sls NanoCode012 2025-04-25 15:24:33 +07:00
388e950016 restore dockerfile Wing Lian 2025-04-24 13:11:00 -04:00
fb4adbb311 fix: trim allowed cuda versions NanoCode012 2025-04-24 11:22:27 +07:00
5e8abca54f use axolotl cloud image as base and various fixes Wing Lian 2025-04-23 13:22:17 -04:00
168ec339e5 chore: lint Wing Lian 2025-04-22 14:13:48 -04:00
cb7185998b remove LICENSE and fix README zeke 2025-04-14 18:33:27 -08:00
c2fc35f520 Add runpod sls handler zeke 2025-04-14 18:30:14 -08:00
5251facdd0 Built site for gh-pages Quarto GHA Workflow Runner 2025-04-26 18:17:05 +00:00
f9c7c3bb72 don't use is_main_process during config validation (#2569) Wing Lian 2025-04-26 14:14:52 -04:00
b708a1cc45 validate config to set defaults llmcompressor-sft Wing Lian 2025-04-26 13:11:25 -04:00
35a2679e12 Built site for gh-pages Quarto GHA Workflow Runner 2025-04-26 01:13:30 +00:00
caf5cb63ea add e2e smoke test for using activation/gradient checkpointing with offload (#2565) Wing Lian 2025-04-25 21:11:17 -04:00
5dba5c82a8 fix support for wandb run_name for rl trainers (#2566) [skip ci] Wing Lian 2025-04-25 21:10:54 -04:00
1a5e1f477d Built site for gh-pages Quarto GHA Workflow Runner 2025-04-25 21:17:16 +00:00
e3c9d541a7 fix: crash when pretraining_dataset with dispatch_batches is false (#2558) Chiwan Park 2025-04-26 06:15:03 +09:00
9eba0ad118 chore(doc): update docker tags on doc (#2559) [skip ci] NanoCode012 2025-04-26 04:14:48 +07:00
53dbf97d85 make cce default to true when using the plugin (#2562) [skip ci] Wing Lian 2025-04-25 17:14:26 -04:00
2c2563bc34 fix: gradient checkpointing functools.partial object has no attribute __self__ (#2563) [skip ci] Eko Julianto Salim 2025-04-26 04:02:37 +07:00
5cb3398460 don't fail on codecov upload for external contributor PRs (#2564) [skip ci] Wing Lian 2025-04-25 15:10:55 -04:00
9f52387e0d Built site for gh-pages Quarto GHA Workflow Runner 2025-04-25 14:36:13 +00:00
ae1c7ace63 Sequence parallel training context manager (#2553) Dan Saunders 2025-04-25 10:33:54 -04:00
926dc4af90 updates sp-rl-v3 Dan Saunders 2025-04-25 02:28:38 +00:00
6810f0ee19 minimize diffs to GRPO trainer Dan Saunders 2025-04-23 19:04:26 +00:00
6c65eeaaf7 finalizing SP + GRPO trainer Dan Saunders 2025-04-22 03:38:46 +00:00
7f4e4076e1 progress Dan Saunders 2025-04-18 21:35:33 +00:00
4f2d092216 subclassing constructor Dan Saunders 2025-04-17 18:37:22 +00:00
b13b6e185f stronger subclassing of TRL GRPO trainer; custom distributed sampler Dan Saunders 2025-04-17 04:06:18 +00:00
76e2d2e60b progress Dan Saunders 2025-04-14 21:02:30 +00:00
11b6803ff4 grpo sp support Dan Saunders 2025-04-09 00:46:05 +00:00
e55dce9995 fix Dan Saunders 2025-04-16 14:07:09 +00:00
9640aacfc9 fixes for batch API funcs, simplify Dan Saunders 2025-04-16 03:47:51 +00:00
5306c6acbb fix Dan Saunders 2025-04-14 14:41:52 +00:00
4ae8df16a9 adding all batch ring-flash-attn methods via single adapter Dan Saunders 2025-04-11 05:08:08 +00:00
74e7cfd28f update Dan Saunders 2025-04-11 04:06:37 +00:00
2bb5c1fe7e batch api HF adapter for ring-flash-attn; cleanup and improvements Dan Saunders 2025-04-11 03:45:34 +00:00
3f1873cc62 pytest Dan Saunders 2025-04-24 16:19:47 +00:00
072df89e0e add gather post hook, simplify, fixes Dan Saunders 2025-04-24 14:10:03 +00:00
cb7c3ee847 tweak codecov yaml Dan Saunders 2025-04-24 00:20:05 +00:00
d92ac7a41d reorg Dan Saunders 2025-04-24 00:11:37 +00:00
5816433121 nit Dan Saunders 2025-04-24 00:02:40 +00:00
e5a4e21497 simplifying Dan Saunders 2025-04-23 23:56:31 +00:00
65ae78009c simplifying Dan Saunders 2025-04-23 23:49:11 +00:00
7e5168ad74 accommodate both training context managers Dan Saunders 2025-04-23 23:40:45 +00:00
cd393fecc3 further simplifying Dan Saunders 2025-04-23 23:37:41 +00:00
bac5568bda update Dan Saunders 2025-04-23 23:30:47 +00:00
69aeae80ed updates Dan Saunders 2025-04-23 23:19:52 +00:00
cafda804ec ctx manager for SP Dan Saunders 2025-04-23 19:49:37 +00:00
daa9a58f83 Add: line about further optimizations using llmcompressor Rahul Tuli 2025-04-24 14:06:25 -04:00
ae7069e15b Merge branch 'main' into llmcompressor-sft Rahul Tuli 2025-04-24 12:37:14 -05:00
20d48cd617 Address Review Comments: * deleted redundant docs/llm_compressor.qmd * incorporated feedback in integration README.md * added llmcompressor integration to docs/custom_integrations.qmd Rahul Tuli 2025-04-23 18:00:00 -04:00
49fac6d310 Built site for gh-pages Quarto GHA Workflow Runner 2025-04-24 17:04:03 +00:00
1447beb132 make sure to validate the config before normalizing so defaults get set (#2554) merged-2554 Wing Lian 2025-04-24 13:01:43 -04:00
e766a730ba Add: .qmd file Rahul Tuli 2025-04-21 20:40:49 -04:00
7dc797860e Tests, Style, Updates Rahul Tuli 2025-04-21 20:33:59 -04:00
ff4904c8c4 Rebase and updates! Rahul Tuli 2025-04-17 17:19:59 -04:00
45b7293793 Add: llm_compressor integration documentation Rahul Tuli 2025-04-09 01:03:45 +00:00
279c7178bc Move: LLMCompressorPlugin into it's own submodule Rahul Tuli 2025-04-09 00:27:48 +00:00
e73c3709f9 Update model config Rahul Tuli 2025-04-08 23:53:29 +00:00
33562189f8 Use: absolute import Rahul Tuli 2025-04-08 23:51:49 +00:00
c057a2268f Rename: sft.yaml to sparse-finetuning.yaml Rahul Tuli 2025-04-08 23:46:32 +00:00
9d7a3809b5 Add: llcompressor installable Rahul Tuli 2025-04-08 23:35:12 +00:00
b7b24d6a64 Address review comments from @markurtz Rahul Tuli 2025-04-04 17:59:41 +00:00
8b82b8f7a1 Apply suggestions from @markurtz Rahul Tuli 2025-04-04 10:36:35 -04:00
81da58c0a1 Update llmcompressor version to latest Rahul Tuli 2025-04-03 09:37:43 -04:00
2cd5a234a7 Revert: TODO's Rahul Tuli 2025-04-02 22:54:22 +00:00
8c1af0747d Use: warning over warn Rahul Tuli 2025-04-02 22:38:31 +00:00
a06b360d99 pre commit hooks Rahul Tuli 2025-04-02 22:35:36 +00:00
0f6456a14f Add:llmcompressor instalable Rahul Tuli 2025-04-02 22:22:04 +00:00
47a333ce49 Update: review comments! Rahul Tuli 2025-03-26 21:57:00 +00:00
f9d6776c28 Add: SFTPlugin with llmcompressor Rahul Tuli 2025-03-12 07:09:06 +00:00
3179a36e87 Built site for gh-pages Quarto GHA Workflow Runner 2025-04-24 12:54:15 +00:00
66f41ec6f1 disable codecov pr annotations (#2556) Dan Saunders 2025-04-24 08:51:51 -04:00
8a645a9541 Built site for gh-pages Quarto GHA Workflow Runner 2025-04-24 05:05:55 +00:00
85053f4bd4 Fix(doc): add delinearize instruction (#2545) NanoCode012 2025-04-24 12:03:43 +07:00
0812992467 Built site for gh-pages Quarto GHA Workflow Runner 2025-04-24 04:42:03 +00:00
a4d5112ae1 builds for torch 2.7.0 (#2552) Wing Lian 2025-04-24 00:39:31 -04:00
4f64594182 Built site for gh-pages Quarto GHA Workflow Runner 2025-04-23 19:01:19 +00:00
0d691cc2a7 add base docker image with pytorch 2.7.0 and variant for cuda 12.8 (#2551) Wing Lian 2025-04-23 14:59:03 -04:00
872acc75b3 Built site for gh-pages Quarto GHA Workflow Runner 2025-04-23 14:36:00 +00:00
c4053481ff Codecov fixes / improvements (#2549) Dan Saunders 2025-04-23 10:33:30 -04:00
caa234bfdf Built site for gh-pages Quarto GHA Workflow Runner 2025-04-23 14:30:22 +00:00

... 18 19 20 21 22 ...