This commit is contained in:
Dan Saunders
2025-09-19 16:34:45 +00:00
parent d2f1e23bcd
commit 336616d659

View File

@@ -74,11 +74,11 @@ def load_hf_block(
def main() -> None: def main() -> None:
p = argparse.ArgumentParser(description="Qwen2 MoE grouped_mm benchmark") p = argparse.ArgumentParser(description="Qwen2 MoE grouped_mm benchmark")
p.add_argument("--bsz", type=int, default=8) p.add_argument("--bsz", type=int, default=8)
p.add_argument("--seq", type=int, default=1024) p.add_argument("--seq", type=int, default=512)
p.add_argument("--hidden", type=int, default=4096) p.add_argument("--hidden", type=int, default=1024)
p.add_argument("--inter", type=int, default=14336) p.add_argument("--inter", type=int, default=2948)
p.add_argument("--experts", type=int, default=32) p.add_argument("--experts", type=int, default=8)
p.add_argument("--top_k", type=int, default=4) p.add_argument("--top_k", type=int, default=2)
p.add_argument("--dtype", choices=["bf16", "fp16", "fp32"], default="bf16") p.add_argument("--dtype", choices=["bf16", "fp16", "fp32"], default="bf16")
p.add_argument("--iters", type=int, default=50) p.add_argument("--iters", type=int, default=50)
p.add_argument("--warmup", type=int, default=10) p.add_argument("--warmup", type=int, default=10)