Home

【VMware ESXi】【NVIDIA】VMware ESXi安装NVIDIA GPU显卡硬件驱动和配置vGPU

在 VMware ESXi 中部署 NVIDIA vGPU,与普通桌面显卡驱动安装不同,必须使用 NVIDIA vGPU 对应的企业软件包,并且要严格匹配 ESXi 版本、GPU 型号和服务器兼容列表。

一、驱动软件准备

NVIDIA 软件下载站 获取驱动。这里使用的是 vGPU 对应的软件入口,不是普通消费级显卡的驱动下载页面。

按照 ESXi 版本下载对应安装包。安装包里通常同时包含:

  • ESXi 主机驱动
  • 客户机虚拟机驱动

GPU 显卡和物理服务器兼容性一定要先查:

https://www.nvidia.com/zh-cn/data-center/resources/vgpu-certified-servers/

二、安装显卡驱动

1、把驱动 .vib 上传到主机 /tmp 目录,开启 SSH,并将主机切换到维护模式后执行:

esxcli software vib install -v /tmp/****.vib #安装驱动注意使用绝对路径

虽然安装完成后可能提示 Reboot required: false,但仍然建议重启主机,确保驱动被正确加载。重启后再退出维护模式。

2、驱动加载完成后,还需要启动主机的 xorg 服务。xorg 是 ESXi 为虚拟机提供 3D 加速能力的重要服务。

3、可以用下面的命令确认驱动是否已经正确加载:

vmkload_mod -l | grep nvidia

4、再通过 nvidia-smi 验证 GPU 是否正常工作。如果无报错,并且能看到卡信息,说明主机侧基本正常。

5、修改图形设备的活动类型:进入“配置 -> 图形 -> 编辑”。

默认是“共享”,这里改成“直接共享”,然后重启 xorg 服务。

6、再编辑虚拟机,添加共享 PCI 设备并选择对应的 NVIDIA vGPU 配置文件。

GPU 配置文件本质上决定了显存规格。这里还需要勾选“预留所有内存”,否则虚拟机无法正常开机。

7、在虚拟机内部安装与主机端版本一致的 NVIDIA 客户机驱动。版本不一致很容易导致异常。

安装驱动后,重启虚拟机,在控制台界面,看到“黑屏”,这是正常的。使用远程桌面RDP协议登录,或者Horizon连接服务器的方式登录。

设备管理器里如果能看到对应显卡,也说明驱动已经安装成功。

补充说明

  • 这类环境一定要先查兼容性,不兼容时 nvidia-smi 往往会持续报错。
  • ESXi 主机驱动版本和虚拟机驱动版本尽量保持一致。
  • vGPU 场景下,内存预留、图形模式和许可证配置都可能影响最终是否可用。
VMware 网络 存储