【VMware ESXi】【NVIDIA】VMware ESXi安装NVIDIA GPU显卡硬件驱动和配置vGPU

在 VMware ESXi 中部署 NVIDIA vGPU,与普通桌面显卡驱动安装不同,必须使用 NVIDIA vGPU 对应的企业软件包,并且要严格匹配 ESXi 版本、GPU 型号和服务器兼容列表。
一、驱动软件准备
从 NVIDIA 软件下载站 获取驱动。这里使用的是 vGPU 对应的软件入口,不是普通消费级显卡的驱动下载页面。

按照 ESXi 版本下载对应安装包。安装包里通常同时包含:
- ESXi 主机驱动
- 客户机虚拟机驱动
GPU 显卡和物理服务器兼容性一定要先查:
https://www.nvidia.com/zh-cn/data-center/resources/vgpu-certified-servers/
二、安装显卡驱动
1、把驱动 .vib 上传到主机 /tmp 目录,开启 SSH,并将主机切换到维护模式后执行:
esxcli software vib install -v /tmp/****.vib #安装驱动注意使用绝对路径
虽然安装完成后可能提示 Reboot required: false,但仍然建议重启主机,确保驱动被正确加载。重启后再退出维护模式。
2、驱动加载完成后,还需要启动主机的 xorg 服务。xorg 是 ESXi 为虚拟机提供 3D 加速能力的重要服务。
3、可以用下面的命令确认驱动是否已经正确加载:
vmkload_mod -l | grep nvidia
4、再通过 nvidia-smi 验证 GPU 是否正常工作。如果无报错,并且能看到卡信息,说明主机侧基本正常。

5、修改图形设备的活动类型:进入“配置 -> 图形 -> 编辑”。

默认是“共享”,这里改成“直接共享”,然后重启 xorg 服务。
6、再编辑虚拟机,添加共享 PCI 设备并选择对应的 NVIDIA vGPU 配置文件。


GPU 配置文件本质上决定了显存规格。这里还需要勾选“预留所有内存”,否则虚拟机无法正常开机。
7、在虚拟机内部安装与主机端版本一致的 NVIDIA 客户机驱动。版本不一致很容易导致异常。

安装驱动后,重启虚拟机,在控制台界面,看到“黑屏”,这是正常的。使用远程桌面RDP协议登录,或者Horizon连接服务器的方式登录。

设备管理器里如果能看到对应显卡,也说明驱动已经安装成功。
补充说明
- 这类环境一定要先查兼容性,不兼容时
nvidia-smi往往会持续报错。 - ESXi 主机驱动版本和虚拟机驱动版本尽量保持一致。
- vGPU 场景下,内存预留、图形模式和许可证配置都可能影响最终是否可用。