突然无法获取collections列表 #38438
突然无法获取collections列表
#38438
-
部署:2.4.5 k8s集群 外置kafka/etcd/minio 现象: 突然无法获取collections
已经确定目前kafka正常,重启pod无效,依旧timed out,kafka端显示无消息生产,milvus消费端也消费不到数据... |
Beta Was this translation helpful? Give feedback.
Answered by
yhmo
Dec 13, 2024
Replies: 2 comments 8 replies
-
补充proxy日志:
|
Beta Was this translation helpful? Give feedback.
0 replies
-
[kafka/kafka_consumer.go:138] ["consume msg failed"] [topic=by-dev-rootcoord-dml_1] [groupID=querynode-64-by-dev-rootcoord-dml_1_454555578458527444v0-true] [error="Local: Timed out"] 这是调用kafka客户端的Consumer接口超时了,多半是集群和kafka之间的连接出现了变化。 |
Beta Was this translation helpful? Give feedback.
8 replies
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
kafka的连接只跟milvus.yaml里的配置相关:
milvus/configs/milvus.yaml
Line 202 in c1f9158
readTimeout是超时设置,默认10秒。一般不会有这么大的message需要10秒,它可能就是单纯地连不上。
kafka连不上的话,其他奇奇怪怪的报错日志会很多。
kafka里主要保存的是insert/upsert/delete的数据作为write-ahead-log,以及time-tick msg,这些write-ahead-log等待querynode,datanode消费,然后datanode把数据落盘,kafka里的已消费的数据就不再有用。假设所有在kafka中的数据都已经被datanode消费并落盘,那么你是可以更换kafka集群的。