tweak to make it work when we have no explicit test split

2023-07-11 22:40:21 -04:00
parent 33814cc94e
commit f6721baf10
1 changed files with 6 additions and 5 deletions
--- a/src/axolotl/utils/data.py
+++ b/src/axolotl/utils/data.py
@@ -405,13 +405,14 @@ def load_prepare_datasets(
                        private=True,
                    )
    else:
-        dataset_train = load_tokenized_prepared_datasets(
+        # dataset_train = load_tokenized_prepared_datasets(
+        dataset = load_tokenized_prepared_datasets(
            "train", tokenizer, cfg, default_dataset_prepared_path
        )
-        dataset_test = load_tokenized_prepared_datasets(
-            "test", tokenizer, cfg, default_dataset_prepared_path
-        )
-        dataset = DatasetDict({"train": dataset_train, "test": dataset_test})
+        # dataset_test = load_tokenized_prepared_datasets(
+        #     "test", tokenizer, cfg, default_dataset_prepared_path
+        # )
+        # dataset = DatasetDict({"train": dataset_train, "test": dataset_test})

    if cfg.dataset_shard_num and cfg.dataset_shard_idx is not None:
        logging.info(