[Bugfix] Fix flag name for max_seq_len_to_capture (vllm-project#4935)

kerthcet · rshaw@neuralmagic.com · commit 42abcff9a8c7 · 2024-07-14T21:36:02.000Z
Signed-off-by: kerthcet &lt;kerthcet@gmail.com&gt;
diff --git a/vllm/engine/arg_utils.py b/vllm/engine/arg_utils.py
@@ -356,9 +356,9 @@ def add_cli_args(
                             help='Maximum context length covered by CUDA '
                             'graphs. When a sequence has context length '
                             'larger than this, we fall back to eager mode. '
-                            '(DEPRECATED. Use --max-seq_len-to-capture instead'
+                            '(DEPRECATED. Use --max-seq-len-to-capture instead'
                             ')')
-        parser.add_argument('--max-seq_len-to-capture',
+        parser.add_argument('--max-seq-len-to-capture',
                             type=int,
                             default=EngineArgs.max_seq_len_to_capture,
                             help='Maximum sequence length covered by CUDA '