Re: [闲聊] 欸不是,买个显卡还要买驱动= =

楼主: MACROSS2K (MACROSS2K)   2023-04-08 22:32:27
另外开一篇
在Docker/Container概念开始流行之前,多重环境同时执行的概念
从"模拟",也就是用软件进行binary translation,这种只靠CPU进行软件运算的
环境
到"虚拟",在原生硬件上建立多个"楚门的世界",并且都享有原生硬件效能
到"函式库共用",同指令集架构的软件,如果函式库相同,则直接引用
不须要再建立那么多楚门的世界
2013年开始的GPU虚拟化只是当时要兴起的硬件虚拟化浪潮其中一环
而且还吃力不讨好,因为要牵动从硬件层,韧体层到软件层全部的设计
2020年的安培架构资料中心产品A100,多重执行实体Multiple Instance GPU
某种程度上解决了对于硬件依赖性的虚拟化方案
试想一下,如果今天GPU装在一个还没支援PCI IOMMU的平台上
那GPU硬件虚拟化便无用武之地,例如ARM
而MIG的作法提供了简单的驱动程式层隔离,脱离对硬件虚拟化平台的依赖
MIG方案其实设计得很细,在不依赖硬件虚拟化的前提下,instance profile
把CUDA core数量,VRAM,硬件编解码单元的划分方式都考虑进去了
除了等分切割,还支援混和规模切割(例如切一个大一点的VRAM instance
然后把剩下的VRAM都用最小单位切割)
而且文中提到,这些instance可以各自执行不同变量类型的workload
FP32,BF16,FP64,TF32...
那vGPU呢?
这其实不太能跟MIG拿来比较,因为vGPU其实是作为虚拟桌面解决方案
的,他的设计是从远端桌面环境体验去设计的,而MIG仅能执行"运算"
更新说明虚拟化等级:
Host OS->最常见的使用情境,就是安装一个例如Windows 10/11,RHEL,SLES
Guest OS->虚拟机当中运行的OS
Hypervisor->虚拟机管理软件,用来沟通其下层的资源提供来源与虚拟机群
不论资源来源提供是原生硬件还是CPU进行软件模拟
Level 0虚拟化 -> 虚拟机管理员hypervisor直接控制硬件,没有预先安装
Host OS,hypervisor自己就是host OS,例如VMware ESXi,Citrix XenServer
Level 1虚拟化 -> 一开始的Host OS还在,但退化成虚拟机的角色作为
管理接口,改由hypervisor核心来控制硬件,开机一样会进原本的OS GUI
例如Hyper-V,SuSE Xen kernel,此时该虚拟机被定义为Parent
Level 2虚拟化 -> Host OS当中安装hypervisor,对硬件没有控制权,仅作为
一个应用程式来执行,例如VMware Workstation,Oracle Virtual Box
Parallels Desktop
原po的方案我想应该是level 0,虽然proxmox我没有接触过
vGPU的方案是在这环境下,hypervisor(此处为proxmox)透过驱动程式
控制GPU,并且利用驱动程式提供的功能建立vGPU
这个vGPU是一种"子项目","子分支",大概是这样的概念
vGPU可以提供1/1到1/n(n视该卡型号提供的分割而定)GPU硬件的效能
并且占用PCI bus形成硬件通道,让guest OS可以使用
上面提到的控制权是一个很重要的点
Host OS上了驱动程式,则Host OS核心可以透过驱动程控该硬件
其他OS核心无法控制,在虚拟化环境中则是
Hypervisor控制了GPU,因此guest OS无法直接控制GPU,顶多只能透过
软件来"分"一些GPU效能
如果希望要guest OS群都能享受原生硬件存取,免去软件转译的效能耗损
1. Passthrough
叫hypervisor不要用,不上驱动程式,并且设定为passthrough
成为等待指派的资源,接着guest OS来占用,带着这张硬件开机
然后guest OS得到这张硬件,比照host OS方式安装驱动,享受该卡全部
硬件效能,但也因此当要调度硬件时,必须要先关虚拟机,造成downtime
2. SR-IOV
GPU卡建立一些硬件通道,让这些硬件通道分布在PCI bus上
guest OS可以占用这些硬件通道,虽然只能得到1/n的GPU效能
但在需要调度效能的时候,因为hypervisor控制硬件,所以不会受限
于任何guest OS独占,只要GPU还有剩余可调度效能,随时可以变换规划
由于proxmox不是NVIDIA支援项目,所以我猜proxmox是设计成直接读取
给其他hypervisor用的驱动程式,例如VMware ESXi
但因为可能有license锁,所以可能要花时间去改动一些细节才能
让proxmox利用
作者: DsLove710 (DoraApen)   2023-04-08 22:34:00
你干嘛不上一篇编辑就好 洗文章?
楼主: MACROSS2K (MACROSS2K)   2023-04-08 22:37:00
不好意思,我很少回文,版面操作不是很熟悉,感谢指教
作者: E6300 (漂流木村拓哉)   2023-04-08 22:44:00
嘘一楼 PTT现在文章数没什么用
作者: wertyorz (落天雪夏)   2023-04-08 22:47:00
那就推回来...至少人家还是有心
作者: scarbywind (有事烧纸)   2023-04-08 22:48:00
这么多字你想洗还洗不出来
作者: Fezico (尬广跟上)   2023-04-08 22:52:00
这一两篇单字我都看得懂,但组再一起没有一个词看得懂原PO真的专业户,有空再边google边看到底是在说明什么东西
作者: AbeNana (安部菜々)   2023-04-08 22:57:00
好不容易有专业文
楼主: MACROSS2K (MACROSS2K)   2023-04-08 22:57:00
感谢,希望分享一些商用产品的测试经验对各位有帮助
作者: Arbin (路人_Lv菜逼八)   2023-04-08 23:00:00
以前没有官方支援vGPU,要搞GPU资源隔离或是切割的做法还满邪门的
作者: wei115 (ㄎㄎ)   2023-04-08 23:13:00
感谢 涨知识了 我对vGPU其实也没什么研究 就单纯觉得现代PC应该可以完全虚拟化 想玩玩看
作者: oldmove (T_T)   2023-04-08 23:14:00
一楼打的出来这些字吗? 笑死
作者: ceming (闪乱カグラ)   2023-04-08 23:21:00
不然你来讲
作者: DsLove710 (DoraApen)   2023-04-08 23:22:00
我打不出来 真是抱歉 但我觉得能编辑为啥不编辑文章又不是很旧或是相隔很多篇
楼主: MACROSS2K (MACROSS2K)   2023-04-08 23:24:00
我刚试着编辑文章,发现并不是只编辑内文而是连留言都一并显示,有点看不懂这样是否会动到版面proxmox我没有接触过,也蛮好奇它提供到什么程度
作者: DsLove710 (DoraApen)   2023-04-08 23:29:00
补推
作者: justicebb   2023-04-08 23:33:00
专业文求洗好吗
作者: mrme945   2023-04-08 23:33:00
这种有料的文越多越好,虽然我看不懂QQ
作者: rx1304 (^_^)   2023-04-08 23:34:00
没事,讨论就好别在意 没啥大不了的
作者: ksng1092 (ron)   2023-04-08 23:35:00
虽然专业,不过有电虾点吗XD
作者: smallreader (小读者)   2023-04-08 23:36:00
编辑文章的留言底下换行 不去动到留言的行不会有事的编辑期间新增的推文也不用担心洗掉 但手机App要担心
作者: Fezico (尬广跟上)   2023-04-08 23:39:00
有阿,极客湾就搞过虚拟化GPU四开虚拟机器打CS。应该是?是极客湾还是某科技,我忘了。但概念大概雷同?
作者: smallreader (小读者)   2023-04-08 23:42:00
极客湾没错
作者: scarbywind (有事烧纸)   2023-04-08 23:44:00
四等分显卡 不过是hyperV
作者: pcfox (京极元狐)   2023-04-08 23:45:00
这种专业文多洗一点才好 不像某大湿整天废文
作者: wei115 (ㄎㄎ)   2023-04-08 23:47:00
之前看GPU虚拟化技术上多难的的文章 结果nv好像已经克服了20系显卡被人发现只要改id就能解锁vGPU,只是不想下放消费级= =
作者: Fezico (尬广跟上)   2023-04-08 23:49:00
能用跟足够用我个人是觉得两回事。能用应该好解决但是足够用就是问题惹,经过层层转译堆叠被吃掉的不知多少
作者: mrme945   2023-04-08 23:53:00
问个不专业的问题,一般消费级显卡有办法虚拟化吗?有时候不想动到电脑的东西想在VM里面测试一些东西
作者: Fezico (尬广跟上)   2023-04-08 23:57:00
楼上可以参考一下我前面说的那个极客湾搞事影片,原理应该相似。
作者: wei115 (ㄎㄎ)   2023-04-09 00:01:00
显卡虚拟化理论上需要有硬件支援 20系消费级显卡很多只要改id就可以解锁虚拟化能力(vgpu_unlock) 不过还有hyperV、GPU分区之类不用硬件支援的方法 还在研究中
作者: not5566 (非5566)   2023-04-09 00:14:00
还宁可这种文多洗几篇 不然还要去看原文的耶
作者: Simonfenix (Livingfailure)   2023-04-09 00:17:00
作者: not5566 (非5566)   2023-04-09 00:18:00
虚拟化给推
作者: jaspergod (神游)   2023-04-09 00:20:00
受益良多,之前在研究计算卡都很少讨论...或是能力不足找不到,只能看NV官方说明超怕找错方向XD 所以以纯AI计算来讲MIG系列应该比较适合
作者: masutaka (taka=米嘎)   2023-04-09 00:21:00
专业文推
作者: zseineo (Zany)   2023-04-09 00:32:00
作者: LordSo (Yesterday)   2023-04-09 00:36:00
就内容来说开一篇不过份啦 只是这标题会很难找
作者: smallreader (小读者)   2023-04-09 00:41:00
标题难找不是问题 不然有谁还记得以解决的标题是什么还是一样每次都有人把#找出来XDDD
作者: dos01 (朵斯01)   2023-04-09 00:47:00
恩恩 跟我想得差不多
作者: b325019 (望月)   2023-04-09 00:47:00
你只要孤狗ptt 以解决就能看到那篇www
作者: tomsawyer (安安)   2023-04-09 01:11:00
找以解决有啥难的 找推=100跟请益不就得了
作者: chugliang (嘴炮无敌....)   2023-04-09 02:27:00
这边显卡虚拟化讲得不赖阿~我做系统整合的都不熟~惭愧
作者: MK47 (和牛第一)   2023-04-09 02:34:00
推有料文
作者: james111222 (阿斯巴勒)   2023-04-09 04:13:00
一楼是在嘘啥,这么有料的文章我还巴不得原PO多洗几篇平常都只用到level2,连原理都不知道,专业文收藏
作者: gogowow   2023-04-09 05:44:00
这内容推文是要打多久 一楼是在凶几点
作者: JKGOOD   2023-04-09 06:26:00
科普分享有什么好嘘?
作者: waldo34 (可鲁丁)   2023-04-09 06:53:00
作者: widec (☑30cm)   2023-04-09 07:15:00
原来不是只有我看不懂 XDDDD 太专业了
作者: DivineSX (H是不行的)   2023-04-09 07:20:00
推专业
作者: darkangel119 (星星的眷族)   2023-04-09 07:41:00
一楼很行的话 麻烦多洗几篇文章啊
作者: JustBecauseU (ki)   2023-04-09 08:04:00
一楼有事吗
作者: fanyuzeng (TaiwanBigalow)   2023-04-09 08:06:00
好啦人家都道歉了别这么凶啦XD
作者: Lailungsheng (原来我是萧远山...)   2023-04-09 08:43:00
我感觉到第一次翻开计算机概论时看到的光
作者: kaltu (ka)   2023-04-09 08:48:00
windows subsystem又是另一个坑,tensorflow windows版不能用GPU但WSL的Linux on Windows版可以
作者: jacklin2002   2023-04-09 08:58:00
用心分享推
作者: smallsir2000 (养报纸)   2023-04-09 09:22:00
嗯嗯,跟我想的差不多
作者: winiel559 (大汉天威)   2023-04-09 10:00:00
tensorflow win可以用gpu啊 我四年多前就用过1060了推优文
作者: proletariat (Die Ruinen von Athen)   2023-04-09 10:15:00
PUSH
作者: paul40807 (ㄏㄏ弟)   2023-04-09 10:26:00
proxmox好像没办法切割一般游戏显卡如3080成vGPU 说是不支援虚拟化 要运算卡才可以
作者: microviewer (MicroV)   2023-04-09 10:44:00
push! 谢谢分享
作者: kaltu (ka)   2023-04-09 10:48:00
tensorflow只有旧版可以,四年前当然可以,新版就不行了
作者: Oqfyian (多啦米老鼠)   2023-04-09 10:52:00
1楼这么气喔
作者: jaspergod (神游)   2023-04-09 11:05:00
tf现在新版也都还可以啊,windows环境下还是可以调用GPU阿...我觉得新版还比旧版(之前是1.14)方便一点点,虽然环境搞起来还是挺繁琐就是了==
作者: orzno (囧rz)   2023-04-09 11:18:00
推专业
作者: Litfal (Litfal)   2023-04-09 11:18:00
现在虚拟化的效能很不错,损失也不大,但问题是到client中间还是有一堆延迟和瓶颈
作者: hankchen1728 (选课好困难)   2023-04-09 11:21:00
推专业文!
作者: atpx (秋雨的心情)   2023-04-09 11:30:00
推, 优质文
作者: kaltu (ka)   2023-04-09 11:43:00
我的旧版指是2.10以前,从2.11开始windows停止支援GPU
作者: qazwsxedcedc (qazwsxedcedc)   2023-04-09 12:26:00
推这篇
作者: jaspergod (神游)   2023-04-09 12:42:00
真假 抱歉 我以为2.8算新的了XD
作者: commandoEX (卡曼都)   2023-04-09 12:45:00
tensorflow官网文件提到用pip安装Windows支援GPU
作者: lovebbqjim   2023-04-09 13:09:00
帮推,专业文可以多来几篇
作者: waiter337 (给开司一罐苏格登)   2023-04-09 13:18:00
你把一堆伞乱资讯总结专业文 给推
作者: tomsawyer (安安)   2023-04-09 14:03:00
tf已经没有windows原生gpu了 要wsl2才能支援
作者: fly02094484 (面粉)   2023-04-09 14:25:00
作者: EYESOFDARKKE   2023-04-09 14:45:00
长知识推。 工作上有用到proxmox,但是只用到xeon内建GPU给VM用而已XD
作者: god70541 (懒得想)   2023-04-09 14:52:00
1楼快点写一篇专业文来洗
作者: leehom309536 (907)   2023-04-09 15:14:00
嗯,跟我想得一样,我以为大家会这样说
作者: Ryzen1700 (KABAN)   2023-04-09 15:20:00
这种文再多我也不介意呀
作者: jjjj6 (lalala)   2023-04-09 15:32:00
推专业文
作者: Amulet1 (AmuletHeart)   2023-04-09 16:45:00
这是免费可以看的吗
作者: gugimi (gugimi)   2023-04-09 17:18:00
作者: illya65536 (illya65536)   2023-04-09 17:47:00
下次还是编辑就好...
作者: fmp1234 (刁民H)   2023-04-09 19:18:00
只懂到passthrough,SR-IOV还是很模糊。
作者: as222as222a (W9450Kk)   2023-04-09 19:40:00
推专业文
作者: israelii (chris)   2023-04-09 20:02:00
这是专业文吧,看了半天还是看不懂,感觉很专业!
作者: TacoEater (ABBBB ABBAAA)   2023-04-09 20:48:00
Proxmox是在qemu/kvm上套一层自己的接口,算level 1MXGPU其实有打出市场,Instinct MI系列一直混的不差,只是消费级看得到吃不到,开源支援几乎是零最近还有一种玩法是GPU-over-IP,直接跳过硬件层
作者: amows ( ™)   2023-04-09 22:03:00
虽然不太了解 不过推专业
作者: Severine (赛非茵)   2023-04-09 22:11:00
一楼有猫饼 帮推专业文
作者: amin0811 (阿明)   2023-04-09 22:15:00
这篇超专业好吗...有本事自己打一篇别只出张嘴...
作者: qoodboy26 (三百页)   2023-04-09 22:48:00
一楼也洗一篇这么长的
作者: v86861062 (数字人:3)   2023-04-09 23:12:00
推推
作者: dsin (dior)   2023-04-09 23:18:00
推专业
作者: winiel559 (大汉天威)   2023-04-09 23:27:00
原来tf新版不支援了 感谢资讯
作者: dmeiki (熊麻吉)   2023-04-10 09:43:00
推,感谢分享
作者: froce (froce)   2023-04-10 11:47:00
这种文还不够格新开一篇,待会来看看一楼都写些什么神级论文发在PTT。科科TF可以在windows下用GPU啦,就算到WSL2下也是要把windows下该装的CUDA装好之前装2.10还有,2.11我就不清楚了
作者: ry3298 (null)   2023-04-10 18:39:00
作者: d630200x (DOGE)   2023-04-11 12:51:00
我是码农我看不懂,我好废
作者: saedn (~自挂东南枝~)   2023-04-11 17:57:00
可以敲碗就下集吗??
作者: g36maid (过膝袜学姐)   2023-04-14 09:16:00
专业给推

Links booklink

Contact Us: admin [ a t ] ucptt.com