我最近已经更新了我们的群集到VMware ESXi 7.0更新3.经过几天随机虚拟机冻结。屏幕上没有显示消息。在VM事件中,我看到了此消息:
在(05)VCPU-0 - NVME-VMM:控制器级通过CC.EN在(05)VCPU-0 - NVME-Core上的NVME0上的比特转换:执行控制器regs和队列的部分复位。在(05)VCPU-1 - NVME-VMK:NVME0:0:忽略完成[ignorecmp = 0]。在(05)VCPU-8 - NVME-VMM:意外的CQ#8门铃写入:prevhead = 46,newhead = 47,size = 256,forilegight = 0 in(05)vcpu-0 - vix:[vmxcommands.c:7182]:vmautomation_handleclihltevent。没做什么。在(05)vcpu-0 - msghint:msg.monitorevent.halt(05)+ VCPU-0 - 客户机操作系统已禁用CPU。关闭电源或重置虚拟机。
在虚拟机中,我没有看到任何错误报告。只有在机器锁起来的时候才会弹出这个。
kernel: [28667.084637] nvme nvme0: I/O 197 QID 14 timeout, aborting kernel: [28667.084716] nvme nvme0: Abort status: 0x0 kernel: [28697.292556] nvme nvme0: I/O 197 QID 14 timeout, reset controller kernel: [28697.356676] nvme nvme0: 15/0/0 default/read/poll queues
虚拟机配置nvme控制器,虚拟磁盘放置在通过光纤通道nvme映射到nvme存储的卷上。
将ESXi版本降至7.0更新后,问题消失了。VMware告诉我它可能与内核错误有关。
会是什么问题呢?