[Kernel] Add back batch size 1536 and 3072 to MoE tuning (vllm-projec…

…t#5242)
joerunde · Jun 4, 2024 · bdbb931 · bdbb931
1 parent 8dddd6b
commit bdbb931
Showing 1 changed file with 3 additions and 1 deletion.
diff --git a/benchmarks/kernels/benchmark_moe.py b/benchmarks/kernels/benchmark_moe.py
@@ -254,7 +254,9 @@ def main(args: argparse.Namespace):
     use_fp8 = args.dtype == "fp8"
 
     if args.batch_size is None:
-        batch_sizes = [1, 2, 4, 8, 16, 32, 64, 128, 256, 512, 1024, 2048, 4096]
+        batch_sizes = [
+            1, 2, 4, 8, 16, 32, 64, 128, 256, 512, 1024, 1536, 2048, 3072, 4096
+        ]
     else:
         batch_sizes = [args.batch_size]