[菜单] 500K/1000K 机器学习 Audio/Vision 用两台

楼主: hizuki (ayaka)   2020-06-10 12:43:06
前几天的文章可能没有说明清楚,购入的是两台机器
一台是vision部门使用的,另外一台是audio部门使用的。
大家可以看到两台机器对VRAM的需求完全不同。
Vision的机器是完全我经手的
model: Supermicro 4029GP-TVRT
CPU (中央处理器):Intel Xeon Silver 4216 x 2
MB (主机板):Supermicro X11DGO-T
RAM (内存):DDR4 RDIMM 2666Mhz 32G x 14
VGA (显示卡):nVidia Tesla V100 SXM2 32G x 2
SSD (固态硬盘):M.2 480G SATA
Intel OPtane D4800X 375G
RAID :LSI MegaRaid 9460 4GB cache
HDD : ST2400MM0129 2.4TB SAS x 10
PSU (电源供应器):2200W x 4
总价 (未税/含税):USD 35800
因为Vison这边用户有八九位,将来GPU安装完八块后,是会有二十位同事
在使用这台机器,所以硬盘采取了传统模式,利用SSD cache加速。
另外由于适用的trainning场景batch size比较大,所以VRAM单块就配置很大了。
将来利用NVLink和PCIe p2p都会有比较好的表现。这边特别提一下,我们使用
的调度器horovod有支援多GPU分发。
而audio组他们实在等不及AMD到货,所以还是购入了Intel产品。
CPU (中央处理器):Intel Gold 5218R x 2
MB (主机板):Supermicro X11DPG-OT-CPU
RAM (内存):32G DDR4 3200Mhz RDIMM x4
VGA (显示卡):nVidia RTX 2080Ti 11G x 4
SSD (固态硬盘):Intel DC P4510 8T
PSU (电源供应器):2000W x 4
其它 (自填):NVLink bridge 3 Slot x 2
总价 (未税/含税):USD 17500 左右
他们最多就三位在用这台机器,所以规格就比较阳春。另外因为batch size比较小,
其实一块显示卡就足够了。
: 推 hotdogee : 这价格我会拿单路Epyc+4张TITAN RTX 06/08 12:20
: → hotdogee : 双路epyc一样是128条pcie,需要超过64核才会用双路 06/08 12:22
: → hotdogee : 这单双路16通道却只拿4条内存跑双通道也太浪费 06/08 12:28
: → hotdogee : 是双路EPYC主机板不OK而已吧,因为没什人用 06/08 12:30
: → hotdogee : 单路主机板很好买 06/08 12:30
可惜迟了一步
: 推 a2470abc : ram够吗? 好奇如果是跑影像 资料量长蛮快的 06/09 02:20
: → a2470abc : 本来想提NUMA的问题 但是看到AMD交不出来就了了 06/09 02:21
Vision那台是RAM大很多,其实RAM的作用主要是图片读取成HSV的cache会放在RAM中,
也就是Linux shm中
而您看到的是audio的机器,我是不熟悉他们的场景。
至于NUMA,如果没有虚拟化或者PCIe过CPU搬运,似乎问题不大。

Links booklink

Contact Us: admin [ a t ] ucptt.com