support for replit lm

2023-05-17 08:49:03 -04:00
parent b46bc02f0a
commit 8c2f3cb0f8
2 changed files with 67 additions and 3 deletions
--- a/examples/replit-3b/config-lora.yml
+++ b/examples/replit-3b/config-lora.yml
@@ -0,0 +1,55 @@
 base_model: replit/replit-code-v1-3b
 base_model_config: replit/replit-code-v1-3b
 trust_remote_code: true
 load_in_8bit: false
 datasets:
  - path: vicgalle/alpaca-gpt4
    type: alpaca
 dataset_prepared_path: last_run_prepared
 val_set_size: 0.05
 adapter: lora
 lora_model_dir:
 sequence_len: 2048
 max_packed_sequence_len:
 lora_r: 8
 lora_alpha: 16
 lora_dropout: 0.05
 lora_target_modules:
  - Wqkv
  - mlp_up
  - mlp_down
 lora_fan_in_fan_out:
 wandb_project: lora-replit
 wandb_watch:
 wandb_run_id:
 wandb_log_model:
 output_dir: ./lora-replit
 batch_size: 8
 micro_batch_size: 1
 num_epochs: 3
 optimizer:
 torchdistx_path:
 lr_scheduler:
 learning_rate: 0.00001
 train_on_inputs: false
 group_by_length: false
 bf16: true
 tf32: true
 gradient_checkpointing:
 early_stopping_patience:
 resume_from_checkpoint:
 local_rank:
 logging_steps: 1
 xformers_attention:
 flash_attention:
 gptq_groupsize:
 gptq_model_v1:
 warmup_steps: 20
 eval_steps: 50
 save_steps:
 debug:
 deepspeed:
 weight_decay: 0
 fsdp:
 fsdp_config:
 #special_tokens:
--- a/src/axolotl/utils/models.py
+++ b/src/axolotl/utils/models.py
@@ -163,11 +163,20 @@ def load_model(
    if not tokenizer:
        try:
            if is_llama_derived_model and "LlamaTokenizer" in globals():
-                tokenizer = LlamaTokenizer.from_pretrained(model)
+                tokenizer = LlamaTokenizer.from_pretrained(
                    model,
                    trust_remote_code=True if cfg.trust_remote_code is True else False,
                )
            else:
-                tokenizer = getattr(transformers, tokenizer_type).from_pretrained(model)
+                tokenizer = getattr(transformers, tokenizer_type).from_pretrained(
                    model,
                    trust_remote_code=True if cfg.trust_remote_code is True else False,
                )
        except:
-            tokenizer = AutoTokenizer.from_pretrained(base_model_config)
+            tokenizer = AutoTokenizer.from_pretrained(
                base_model_config,
                trust_remote_code=True if cfg.trust_remote_code is True else False,
            )
    logging.debug(f"EOS: {tokenizer.eos_token_id} / {tokenizer.eos_token}")
    logging.debug(f"BOS: {tokenizer.bos_token_id} / {tokenizer.bos_token}")