[菜单] 200k 实验室深度学习主机

楼主: EEQQ102938 (EEer)   2023-03-30 17:33:34
赶毕业跑深度学习实验,但目前工作站太烂,所以跟老师拿一笔钱升级工作站。
原本想锁定两张3090或两张4090进行升级的,但厂商说他们没有3090了,所以开了一张有两
个4090的单,但有点超过预算,想请各位帮忙健检一下,看看哪里可以换@@,还没口试就花
教授一堆钱,很抖QQ
已买/未买/已付订金(元):未买
预算/用途:200K 实验室深度学习机
CPU (中央处理器):Intel i9-13900
MB (主机板):华硕Z790-A GAMING WIFI主机板
RAM (内存):芝奇幻锋 D5-5600 32G * 2
VGA (显示卡):技嘉GeForce RTX4090 GAMING OC * 2
Cooler (散热器):Noctua NF-A14 PWM 14cm风扇 * 4
SSD (固态硬盘):Samsung 980 PRO 2TB NVMe M.2
PSU (电源供应器):全汉HYDRO PTM PRO 1200W ATX3.0 * 2
CHASSIS (机壳):Phanteks ENTHOO ELITE电脑机壳
水冷:NZXT Kraken X73 水冷散热器
其它 (自填):
总价 (未税/含税):235000 (含税)
另外想请问,听说40系列没有nvlink了,那这样我是不是不能把两张卡合在训练模型?我主
要用tensorflow的package,tf的strategy可以把两张4090的ram合在一起看吗?如果不行的
话是不是买一张4090就好了...
作者: dos01 (朵斯01)   2023-03-30 17:35:00
不用砍啦 反正教授的钱也是花学校的钱 学校的钱也是花研究计画预算 研究计画的预算又来自缴税的钱 然后你又迟早会缴税 想想这其实也是花你自己的钱 直接买了啦!
作者: encorek22554 (二宝)   2023-03-30 17:37:00
多卡训练一直都跟nvlink无关吧
楼主: EEQQ102938 (EEer)   2023-03-30 17:39:00
如果batch大一点或模型大一点的话,一张卡24G可能不够用…
作者: Zenryaku (前略)   2023-03-30 17:40:00
实验室不直接找厂商弄吗…
作者: sugoyeee (sugoyeee)   2023-03-30 17:40:00
板不需要a有更好的选择 要拿d5就拿超过6000的
楼主: EEQQ102938 (EEer)   2023-03-30 17:41:00
原文有说这是厂商报的单喔!
作者: Zenryaku (前略)   2023-03-30 17:42:00
哦没看到 抱歉先把三星的ssd换掉 烂厂商问题一堆
作者: rewisyoung (小月儿)   2023-03-30 17:42:00
20万预算 有没有考虑用GA100啊
作者: Zenryaku (前略)   2023-03-30 17:43:00
电源不用两台1200吧 哪吃那么多电需要2400w风扇可以不用买猫头鹰的,而且这颗不是A12*25没特别强然后内存也不用买芝奇的,芝奇也是特别贵的那种,时脉至少买到6000
作者: blacknate (Nate)   2023-03-30 18:10:00
放个高速的HDD吧,SSD挂掉模型找不回来会呕死深度学习吃SSD的程度很可怕的,尤其是YOLO 那一类图像的吃很重记得查一下你用的框架版本,万一硬件太新不支援就哭了
作者: cmcer (lazyman)   2023-03-30 18:15:00
怕掉资料就组raid吧
作者: blacknate (Nate)   2023-03-30 18:17:00
楼上说得对,组raid,不然你光是保内把ssd操坏就有得受了
作者: johnjohnlin (嗯?)   2023-03-30 18:20:00
学校破10万不是要公开招标吗然后双卡请买HEDT以上
作者: mrme945   2023-03-30 18:23:00
这张主板不妥吧,只有第一槽是x16,下面两槽都只有x4频宽而已
作者: mayolane (mayolaneisyagami)   2023-03-30 18:26:00
有破10万要招标这回事吗,仪器随便几十万没有听说过招标欸
作者: mrme945   2023-03-30 18:31:00
主板直接用W680的吧,华硕那张也不贵,只是我也不知道这两槽那么近能不能装两张4090就是了,另外内存看能不能找到ECC的,跑起来比较稳,比速度重要多了
作者: nasa930022 (卤公伯禽)   2023-03-30 18:31:00
实验室经费自己买的不用招标吧
作者: remia81   2023-03-30 18:42:00
建议先去TWCC测试一下你的训练多卡到底能不能用tf多卡训练很谜
作者: TingLinDick   2023-03-30 18:46:00
我也是配置两张4090,但机壳因为怕散热有问题,所以是用矿机架加pcie延长线让两张显卡有空间,两张同时跑的话会蛮热的,所以机壳的散热最好问一下厂商可不可行
作者: bear1414 (story)   2023-03-30 18:47:00
主板不行 风冷占3点多槽 你第二张卡只剩PCIe 3.0 x1除非你用延长线速度建议至少要有PCIE3.0 X8 (=PCIE4.0 X4)另外你要跑的是哪个领域 CPU 13700系列就非常足够了训练若单卡VRAM够 多卡可以同时跑不同超参数的提高效率另外 你这台要放实验室还是24小时冷气server room?
作者: yenchieh1102 (香蕉史塔克)   2023-03-30 19:16:00
实验室来张A6000啊
作者: bear1414 (story)   2023-03-30 19:16:00
现在A6000不好 要6000 ADA才够快
楼主: EEQQ102938 (EEer)   2023-03-30 19:19:00
看下来目前应该是换主板,储存从SSD换HDD,Ram换频率高一点的吗@@
作者: mesmerising (mesmerising)   2023-03-30 19:27:00
实验室拿一堆信仰外观税的零件好难懂
作者: blacknate (Nate)   2023-03-30 19:30:00
ML重点是ram大才能做cache,频率其实没那么重要
作者: mrme945   2023-03-30 19:36:00
不是要你SSD换HDD,是要你多准备空间存放模型的,SSD坏掉还有得救,SSD还是要有,只是换别家的吧,980Pro还有0E问题
作者: fuct (添财)   2023-03-30 19:36:00
为了你的毕业花那么多钱喔,真好
作者: GooglePixel (谷哥批索)   2023-03-30 20:01:00
怎么不直接买server 效能非家用级能比
作者: dos01 (朵斯01)   2023-03-30 20:03:00
SSD你还是要有 HDD只是多放备用的
作者: GooglePixel (谷哥批索)   2023-03-30 20:05:00
当我没说 光一个data center等级GPU就爆预算==
作者: Snowman (人生大老马.....)   2023-03-30 20:07:00
10万以上是可以选择公开招标 100万以上才是强制公开招标
作者: johnjohnlin (嗯?)   2023-03-30 20:30:00
可是写限制招标文件很麻烦
作者: TingLinDick   2023-03-30 20:44:00
如果训练需要较大的VRAM的话,我是用pytorch DDP去处理,TF的没用过
作者: Aquarius126 (Aquarius126)   2023-03-30 20:45:00
之前弄两张3090塞机壳里面热到哭 只好弄矿架在外面跑qq
作者: fuless (富贵险中求)   2023-03-30 20:58:00
怎么看都像台信仰机 哪间学校硕
作者: cor1os (大丈夫だ问题ない)   2023-03-30 22:25:00
信仰?零件没有AMD哪来的信仰(笑)
作者: HotDogCC (0.38别骗)   2023-03-30 22:42:00
如果你今年确定毕业,买个pcie4的SSD用完就滚了,坏了给学弟负责(x
作者: kidd232 (KIDD)   2023-03-31 00:17:00
这台太羊了
作者: jahnson   2023-03-31 00:34:00
实验室禁用冷笋
作者: GLTyang   2023-03-31 10:55:00
原来实验室可以自己组电脑 我以为都会想要用工业电脑XDDD
作者: oppoR20 (R20)   2023-03-31 11:54:00
实验室可以用自组啊 看过不少台了不过通常都是找厂商报价 让她帮你买零件让她帮你组 最后有问题还是可以找厂商
作者: dc0244 (dc0244)   2023-03-31 13:08:00
内存拿6000以上的比较有意义t-create 6000 32G*2双通道这种的不贵
作者: bear1414 (story)   2023-04-01 12:50:00
做深度学习内存速度影响不太 挑便宜的就可以了

Links booklink

Contact Us: admin [ a t ] ucptt.com