From 68788e419e336521eb3543aa1b6a297ea595b849 Mon Sep 17 00:00:00 2001
From: mhenrhcsen <mads@syv.ai>
Date: Sun, 1 Jun 2025 22:42:03 +0200
Subject: [PATCH] feat: add Group Relative Policy Optimization (GPRO) to RLHF
 documentation

---
 docs/rlhf.qmd | 1 +
 1 file changed, 1 insertion(+)

diff --git a/docs/rlhf.qmd b/docs/rlhf.qmd
index e0d3b55e4..af3fe8767 100644
--- a/docs/rlhf.qmd
+++ b/docs/rlhf.qmd
@@ -16,6 +16,7 @@ feedback. Various methods include, but not limited to:
 - [Identity Preference Optimization (IPO)](#ipo)
 - [Kahneman-Tversky Optimization (KTO)](#kto)
 - [Odds Ratio Preference Optimization (ORPO)](#orpo)
+- [Group Relative Policy Optimization (GPRO)](#grpo)
 - Proximal Policy Optimization (PPO) (not yet supported in axolotl, if you're interested in contributing, please reach out!)