quartodoc progress

2025-03-14 14:00:29 -04:00
parent e4fd7aad0b
commit e6a7bbe9ff
5 changed files with 224 additions and 54 deletions
--- a/.gitignore
+++ b/.gitignore
@@ -181,6 +181,11 @@ prepared-datasets/
 submit.sh
 *.out*
 # Quartodoc generated files
 docs/api/*.qmd
 objects.json
 site_libs/
 typings/
 out/
--- a/_quarto.yml
+++ b/_quarto.yml
@@ -5,6 +5,8 @@ quartodoc:
  dir: docs/api
  package: axolotl
  title: API Reference
  parser: google
  sections:
    - title: Core
      desc: Core functionality for training
@@ -12,22 +14,123 @@ quartodoc:
        - train
        - evaluate
        - datasets
        - core.trainer_builder
        - core.training_args
        - core.chat.messages
        - core.datasets.chat
    - title: CLI
      desc: Command-line interface
      contents:
        - cli.main
        - cli.train
        - cli.evaluate
        - cli.args
        - cli.checks
        - cli.config
        - cli.inference
        - cli.merge_lora
        - cli.merge_sharded_fsdp_weights
        - cli.preprocess
        - cli.sweeps
        - cli.utils
        - cli.cloud.base
        - cli.cloud.modal_
    - title: Trainers
      desc: Training implementations
      contents:
        - core.trainers.base
        - core.trainers.trl
        - core.trainers.dpo.trainer
        - core.trainers.grpo.trainer
    - title: Prompt Strategies
      desc: Prompt formatting strategies
      contents:
        - prompt_strategies.base
        - prompt_strategies.chat_template
        - prompt_strategies.alpaca_chat
        - prompt_strategies.alpaca_instruct
        - prompt_strategies.user_defined
        - prompt_strategies.llama2_chat
        - prompt_strategies.completion
        - prompt_strategies.input_output
        - prompt_strategies.stepwise_supervised
        - prompt_strategies.messages.chat
        - prompt_strategies.dpo.chat_template
        - prompt_strategies.dpo.llama3
        - prompt_strategies.kto.llama3
        - prompt_strategies.orpo.chat_template
    - title: Kernels
      desc: Low-level performance optimizations
      contents:
        - kernels.lora
        - kernels.geglu
        - kernels.swiglu
        - kernels.quantize
        - kernels.utils
    - title: MonkeyPatches
      desc: Runtime patches for model optimizations
      contents:
        - monkeypatch.llama_attn_hijack_flash
        - monkeypatch.llama_attn_hijack_xformers
        - monkeypatch.mistral_attn_hijack_flash
        - monkeypatch.multipack
        - monkeypatch.relora
        - monkeypatch.llama_expand_mask
        - monkeypatch.lora_kernels
        - monkeypatch.utils
        - monkeypatch.btlm_attn_hijack_flash
        - monkeypatch.llama_patch_multipack
        - monkeypatch.stablelm_attn_hijack_flash
        - monkeypatch.trainer_fsdp_optim
        - monkeypatch.transformers_fa_utils
        - monkeypatch.unsloth_
        - monkeypatch.attention.mllama
        - monkeypatch.data.batch_dataset_fetcher
    - title: Utils
      desc: Utility functions
      contents:
        - utils.models
        - utils.tokenization
        - utils.chat_templates
        - utils.lora
        - utils.freeze
        - utils.trainer
        - utils.schedulers
        - utils.distributed
        - utils.dict
        - utils.optimizers.adopt
        - utils.data.pretraining
        - utils.data.sft
    - title: Integrations
      desc: Third-party integrations and extensions
      contents:
        - integrations.base
        - integrations.cut_cross_entropy.args
        - integrations.grokfast.optimizer
        - integrations.kd.trainer
        - integrations.liger.args
        - integrations.lm_eval.args
        - integrations.spectrum.args
    - title: Models
      desc: Custom model implementations
      contents:
        - models.mamba.modeling_mamba
    - title: Data Processing
      desc: Data processing utilities
      contents:
        - utils.collators.core
        - utils.collators.batching
        - utils.collators.mamba
        - utils.collators.mm_chat
        - utils.samplers.multipack
    - title: Callbacks
      desc: Training callbacks
      contents:
        - utils.callbacks.perplexity
        - utils.callbacks.profiler
        - utils.callbacks.lisa
        - utils.callbacks.mlflow_
        - utils.callbacks.comet_
 website:
  title: "Axolotl"
@@ -108,8 +211,8 @@ website:
        - section: "Reference"
          contents:
            - docs/config.qmd
-            - section: "API Reference"
+            - text: "API Reference"
-              contents: docs/api/**/*.qmd
+              href: docs/api/index.qmd
 >>>>>>> 5d96b2a95 (quartodoc integration)
 format:
@@ -117,3 +220,22 @@ format:
    theme: darkly
    css: styles.css
    toc: true
    # Enable better handling of line breaks in markdown
    preserve-tabs: true
    html-math-method: mathjax
    # Improved markdown processing options
    md-extensions:
      - markdown_it
      - def_list
      - attr_list
      - fenced_divs
      - tables
      - html_admonition
      - lineblocks
      - fancy_lists
    # Control whitespace handling
    whitespace: preserve
    # Process newlines in paragraphs
    wrap: preserve
    # Better line break handling
    preserve-linebreaks: true
--- a/scripts/generate_docs.py
+++ b/scripts/generate_docs.py
@@ -1,40 +0,0 @@
 #!/usr/bin/env python3
 """
 Script to generate API documentation for Axolotl using quartodoc.
 """
 import os
 import subprocess  # nosec B404
 import sys
 def run_command(cmd, check=True):
    """Run a shell command and return the result."""
    print(f"Running: {cmd}")
    result = subprocess.run(cmd, shell=True, check=False)  # nosec B602
    if check and result.returncode != 0:
        print(f"Error running command: {cmd}")
        sys.exit(result.returncode)
    return result
 def main():
    """Generate API documentation for Axolotl."""
    # Ensure we're in the project root
    if not os.path.exists("_quarto.yml"):
        print("Error: _quarto.yml not found. Run this script from the project root.")
        sys.exit(1)
    # Create the output directories if they don't exist
    os.makedirs("docs/api", exist_ok=True)
    # Generate the documentation
    print("Generating API documentation...")
    run_command("quartodoc build")
    print("Documentation generated successfully!")
    print("Run 'quarto preview' to view the documentation.")
 if __name__ == "__main__":
    main()
--- a/src/axolotl/evaluate.py
+++ b/src/axolotl/evaluate.py
@@ -8,6 +8,8 @@ from typing import Dict, Optional
 import torch
 from accelerate.logging import get_logger
 from datasets import Dataset
 from transformers.trainer import Trainer
 from axolotl.logging_config import configure_logging
 from axolotl.train import TrainDatasetMeta
@@ -25,18 +27,18 @@ LOG = get_logger("axolotl.evaluate")
 def evaluate_dataset(
-    trainer, dataset, dataset_type: str, flash_optimum: bool = False
+    trainer: Trainer, dataset: Dataset, dataset_type: str, flash_optimum: bool = False
 ) -> Optional[Dict[str, float]]:
-    """Helper function to evaluate a single dataset safely.
+    """Helper function to evaluate a single dataset.
    Args:
-        trainer: The trainer instance
+        trainer: The trainer instance.
-        dataset: Dataset to evaluate
+        dataset: Dataset to evaluate.
-        dataset_type: Type of dataset ('train' or 'eval')
+        dataset_type: Type of dataset ('train' or 'eval').
-        flash_optimum: Whether to use flash optimum
+        flash_optimum: Whether to use flash optimum.
    Returns:
-        Dictionary of metrics or None if dataset is None
+        Dictionary of metrics or None if dataset is None.
    """
    if dataset is None:
        return None
@@ -63,17 +65,14 @@ def evaluate_dataset(
 def evaluate(*, cfg: DictDefault, dataset_meta: TrainDatasetMeta) -> Dict[str, float]:
    """
-    Evaluate a model on training and validation datasets
+    Evaluate a model on training and validation datasets.
    Args:
        cfg: Dictionary mapping `axolotl` config keys to values.
        dataset_meta: Dataset metadata containing training and evaluation datasets.
    Returns:
-        Tuple containing:
+        Dictionary mapping metric names to their values.
        - The model (either PeftModel or PreTrainedModel)
        - The tokenizer
        - Dictionary of evaluation metrics
    """
    # pylint: disable=duplicate-code
    # Enable expandable segments for cuda allocation to improve VRAM usage
--- a/styles.css
+++ b/styles.css
@@ -191,3 +191,87 @@ code span.er {
    color: #5cb85c !important;
    text-decoration: none !important;
 }
 /* API Documentation Styling */
 /* Improve docstring section rendering */
 .level3 p {
    white-space: pre-line !important;
 }
 /* Format docstring sections */
 .level3 p strong {
    display: block;
    margin-top: 1em;
    font-weight: bold;
    color: var(--cyan);
 }
 /* Add spacing after sections */
 .level3 p:has(strong) {
    margin-bottom: 0.5em;
 }
 /* Format Args and Returns sections */
 p:has(code) {
    line-height: 1.6;
 }
 /* Function signatures */
 .sourceCode {
    margin-bottom: 1.5em;
 }
 /* Parameter tables */
 .doc-section-parameters table,
 .doc-section-returns table {
    margin-top: 1em;
    margin-bottom: 1.5em;
 }
 /* Make parameter and returns headers smaller */
 h2.anchored[data-anchor-id="parameters"],
 h2.anchored[data-anchor-id="returns"],
 .doc-section-parameters h4,
 .doc-section-returns h4 {
    font-size: 1.25rem;
    margin-top: 2rem;
    margin-bottom: 1rem;
    color: var(--lime);
    border-bottom: 1px solid var(--lime);
    padding-bottom: 0.3rem;
    font-family: var(--font-body);
    font-weight: 500;
    letter-spacing: normal;
 }
 /* Style documentation tables */
 table {
    width: 100%;
    margin-bottom: 1.5rem;
    border-collapse: collapse;
 }
 table th {
    background-color: #1a1a1a;
    padding: 0.5rem 1rem;
    border-bottom: 2px solid var(--greige-600);
    text-align: left;
 }
 table td {
    padding: 0.5rem 1rem;
    border-bottom: 1px solid var(--greige-600);
 }
 /* Code in table cells */
 table td code {
    background-color: transparent !important;
    padding: 0;
 }
 /* Improve spacing in parameter and return tables */
 .doc-section-parameters,
 .doc-section-returns {
    margin-top: 1rem;
 }