[Minor] Fix small typo in llama.py: QKVParallelLinear -> QuantizationConfig (vllm-project#4991)

pcmoritz · dtrifiro · commit 5e00fc703e91 · 2024-05-31T12:13:38.000+02:00
diff --git a/vllm/model_executor/models/llama.py b/vllm/model_executor/models/llama.py
@@ -57,7 +57,7 @@ def __init__(
         hidden_size: int,
         intermediate_size: int,
         hidden_act: str,
-        quant_config: Optional[QKVParallelLinear] = None,
+        quant_config: Optional[QuantizationConfig] = None,
         bias: bool = False,
     ) -> None:
         super().__init__()