Re: [闲聊] 欸不是,买个显卡还要买驱动= =

楼主: liweilee (简单男人)   2023-04-10 01:34:11
※ 引述《AKSN74 (AKS-74n)》之铭言:
: ※ 引述《MACROSS2K (MACROSS2K)》之铭言:
: : 由于proxmox不是NVIDIA支援项目,所以我猜proxmox是设计成直接读取
: : 给其他hypervisor用的驱动程式,例如VMware ESXi
: : 但因为可能有license锁,所以可能要花时间去改动一些细节才能
: : 让proxmox利用
: 这边多解释一下好了,虽然说推文内也有人提到部分
: Proxmox基本上底层的Hypervisor即是Linux KVM,这部分NVIDIA目前也已经支援了
: 大约是2020还2021年的时候开放的,且一样需要授权才可以使用
: 而且记得没错还需要在本地端装一个授权管理服务器
: 而在KVM的实现方式,基本上跟NVIDIA原本差不多
: 就是利用Linux Kernel内的Mediated device这个driver(简称mdev)
: 并且配合VFIO (KVM主流的GPU passthrough用driver)来实现
: 简单来说,NVIDIA驱动会先根据使用者想要的vGPU规格,生成几个vGPU后
: 由mdev统一纳管,再透过VFIO把这些vGPU给挂载进去,就是这么简单
: 因为两者之间是可以直接连动的,所以不需要把vGPU的VID:PID先写在开机参数内
: 就可以实现单卡生成多个vGPU,并passthrough给多个VM使用
: 关于这个还有几个题外话
: 1. mdev同时也支援Intel的vGPU,称为GVT-g
: 但目前还不支援ARC的GPU,就算有估计也是从ARC PRO支援起
: 2. NVIDIA开放KVM也能使用NVIDIA vGPU功能后没多久,也移除了自己家的驱动对于
: 在KVM上做passthrough的限制,记得是2021年的事情
: 否则过去要passthrough N卡需要做不少设定
: 3. 其实在NVIDIA宣布vGPU全面开放支援KVM之前,早就可以在KVM上面使用vGPU了(2016年)
: 只是那时候是RedHat独占,必须要购买RHEL才可以用
※ 引述《AKSN74 (AKS-74n)》之铭言:
: ※ 引述《MACROSS2K (MACROSS2K)》之铭言:
: : 由于proxmox不是NVIDIA支援项目,所以我猜proxmox是设计成直接读取
: : 给其他hypervisor用的驱动程式,例如VMware ESXi
: : 但因为可能有license锁,所以可能要花时间去改动一些细节才能
: : 让proxmox利用
: 这边多解释一下好了,虽然说推文内也有人提到部分
: Proxmox基本上底层的Hypervisor即是Linux KVM,这部分NVIDIA目前也已经支援了
: 大约是2020还2021年的时候开放的,且一样需要授权才可以使用
: 而且记得没错还需要在本地端装一个授权管理服务器
: 而在KVM的实现方式,基本上跟NVIDIA原本差不多
: 就是利用Linux Kernel内的Mediated device这个driver(简称mdev)
: 并且配合VFIO (KVM主流的GPU passthrough用driver)来实现
: 简单来说,NVIDIA驱动会先根据使用者想要的vGPU规格,生成几个vGPU后
: 由mdev统一纳管,再透过VFIO把这些vGPU给挂载进去,就是这么简单
: 因为两者之间是可以直接连动的,所以不需要把vGPU的VID:PID先写在开机参数内
: 就可以实现单卡生成多个vGPU,并passthrough给多个VM使用
: 关于这个还有几个题外话
: 1. mdev同时也支援Intel的vGPU,称为GVT-g
: 但目前还不支援ARC的GPU,就算有估计也是从ARC PRO支援起
: 2. NVIDIA开放KVM也能使用NVIDIA vGPU功能后没多久,也移除了自己家的驱动对于
: 在KVM上做passthrough的限制,记得是2021年的事情
: 否则过去要passthrough N卡需要做不少设定
: 3. 其实在NVIDIA宣布vGPU全面开放支援KVM之前,早就可以在KVM上面使用vGPU了(2016年)
: 只是那时候是RedHat独占,必须要购买RHEL才可以用
Proxmox的PCI(e) pass through我的建议是不适合初学者,最好是有经验
能自己解决问题的人再来用。
如果是很重要的机器,请谨慎使用,并不是说这个东西不好装或设定,
而是就算你现在系统都装好,使用上也都没问题,
但难保下一次更新就整个不能用了。
去年五月初才发生,一更新就整个PCIE pass through都死去。
当时不管是什么设备passthrough全都挂(GPU/RAID卡/HBA卡/USB等等)
Known Issues->PCI(e) pass through related
https://pve.proxmox.com/wiki/Roadmap#7.2-known-issues
GPU Passthrough Issues After Upgrade to 7.2
https://reurl.cc/Gel4LW
Issue after upgrade to 7.2.3
https://reurl.cc/NqE4gQ
GPU Passthrough throws driver error 43
https://reurl.cc/n7Rr36
当时是要自行把linux kernel设回旧的才行。
https://pve.proxmox.com/wiki/Host_Bootloader
作者: bluezero000 (窝草)   2023-04-10 07:35:00
n卡这个真的可以玩超久,崩溃的error43
作者: chugliang (嘴炮无敌....)   2023-04-10 09:54:00
天啊...y
作者: tomsawyer (安安)   2023-04-10 10:05:00
pve不要乱更新我以为是常识
楼主: liweilee (简单男人)   2023-04-10 10:53:00
那就要请官方多宣导这个常识了,我是没看过官方Proxmox使用说明文件或官方讨论区有人在讨论串里提到这个。
作者: MACROSS2K (MACROSS2K)   2023-04-10 12:48:00
其实passthrough是相对于host OS而言,管理端要清楚当前PCI装置的分配状况,如果重复占用会造成guestOS无法开机
楼主: liweilee (简单男人)   2023-04-10 13:51:00
上面例子跟管理端设定没关系。简单来说是proxmox ve跟linux kernel搭配(主要是system frame buffer跟vendor-reset)出了问题。有兴趣可以上面第一个连结官方页面里面的连结都点进去看看,太多了我就不贴上来了。
作者: Shigeru777 (茂茂)   2023-04-10 14:43:00
proxmox前几天手贱7.3升7.4... 坏到变成要全部重安装还好是研究用途 没多少重要资料
作者: wei115 (ㄎㄎ)   2023-04-10 15:22:00
真假= = 最近升级内存有关机的机会 就狂下apt upgrade欸,还好我只有一张显卡的设定跑掉,照wiki跑一遍流程就好惹
作者: Wangsl (Wang)   2023-04-11 23:09:00
我也刚进门就撞到,7.3 LSI卡好好直通的都没问题,重装7.4所有设定都一样操作也一样直通就是坏的…

Links booklink

Contact Us: admin [ a t ] ucptt.com