Set position_ids name for optimum-intel based modeling. Fix for model…

… destroy
luo-cheng2021 · Mar 8, 2024 · 504704c · 504704c
1 parent 1866b77
commit 504704c
Showing 1 changed file with 7 additions and 5 deletions.
diff --git a/vllm/worker/model_runner.py b/vllm/worker/model_runner.py
@@ -467,6 +467,7 @@ def callback(m: Matcher) -> bool:
                     position_ids_parameter.append(opset13.parameter(shape=[-1, -1], dtype=np.int64, name="position_ids"))
                     print('CREATED A NEW position_ids PARAMETER')
                 replace_node(mapping[position_ids].get_node(), position_ids_parameter[0])
+                position_ids_parameter[0].get_output_tensor(0).set_names({'position_ids'})
                 print('APPLIED position_ids PARAMETER INSTEAD OF attention_mask-BASED SUB-GRAPH')
                 return True
 
@@ -574,11 +575,12 @@ def load_model(self) -> None:
 
     def __del__(self):
         # Order is important
-        del self.model.ov_request
-        del self.model.model
-        if gc: # when app is being destroyed the module may not be available
-            gc.collect()
-        del self.model.ov_node_factory
+        if hasattr(self.model, 'ov_node_factory'):
+            del self.model.ov_request
+            del self.model.model
+            if gc: # when app is being destroyed the module may not be available
+                gc.collect()
+            del self.model.ov_node_factory
 
     def set_block_size(self, block_size: int) -> None:
         self.block_size = block_size