[fix][fsdp2] clone sharded param so original full size shard can be gc'ed (#3597) [skip ci]

2026-04-11 20:22:35 -04:00
parent 122b50bad6
commit e2f69828d2
1 changed files with 7 additions and 0 deletions
--- a/src/axolotl/monkeypatch/accelerate/fsdp2.py
+++ b/src/axolotl/monkeypatch/accelerate/fsdp2.py
@@ -60,6 +60,13 @@ def fsdp2_load_full_state_dict(
                sharded_meta_param.placements,
                src_data_rank=0,
            )
+            # Clone the local shard to allow full_tensor to be freed.
+            if (
+                sharded_param._local_tensor.untyped_storage().size()
+                > sharded_param._local_tensor.nelement()
+                * sharded_param._local_tensor.element_size()
+            ):
+                sharded_param = sharded_param.clone()
        else:
            # Non-sharded parameters
            if _accelerator.is_main_process: