Home

【vCenter】vSphere Clustering Service (vCLS)虚拟机异常处理

今天在公司的实验环境中部署新版本的vCenter 8.0 U1,部署完成后发现多出一个虚拟机

环境

物理服务器是一台某信服OEM的浪潮服务器

ESXi版本

vCenter版本

故障现象

vCLs虚拟机一直在尝试重启,但是一直失败,集群DRS开启,也报错:vSphere DRS functionality was impacted due to unhealthy state vSphere Cluster Services caused by the unavailability of vSphere Cluster Service VMs. vSphere Cluster Service VMs are required to maintain the health of vSphere DRS.

查看官网:

vSphere7.0 Update1新引入了vSphere Clustering Service,简单来说,把一部分控制平面的功能,从vCenter中解耦,并且分布式的由最多3个轻量级虚拟机per Cluster(VMware PhotonOS)分担。当ESXi少于3个时,vCLS虚拟机个数等于ESXi个数。

排障

继续查看日志

翻阅资料“MWAIT”没有开启

描述

MWAIT 指令提供提示以允许处理器进入依赖于实现的优化状态。有两个主要的目标用途:地址范围监视器和高级电源管理。MWAIT 的两种用法都需要使用 MONITOR 指令。

CPUID.01H

.MONITOR[位3]指示处理器中MONITOR和MWAIT的可用性。设置后,MWAIT 只能在特权级别 0 上执行(在任何其他特权级别上使用都会导致无效操作码异常)。操作系统或系统BIOS可以通过使用IA32_MISC_ENABLE MSR来禁用该指令;禁用 MWAIT 将清除 CPUID 功能标志并导致执行生成无效操作码异常。

该指令的操作在非 64 位模式和 64 位模式下是相同的。

ECX 指定 MWAIT 指令的可选扩展。EAX 可能包含诸如处理器应进入的首选优化状态之类的提示。第一个实现 MWAIT 的处理器仅支持 EAX 和 ECX 的零值。后来的处理器允许设置 ECX[0] 以启用屏蔽中断作为 MWAIT 的中断事件(见下文)。软件可以使用CPUID指令来确定处理器支持的扩展和提示。

于是安全关闭虚拟机后重启主机

  1. 进到BIOS设备,页面比较传统,进到高级电源管理

  1. CPU C State Control

  1. 启用MWAIT

F10保存重启

故障消失

VMware 网络 存储 AI