[请益] 公司主机集中做机器学习分布式运算

楼主: hooboa1122 (伯乐)   2019-10-04 12:27:23
我们公司工程师都配备一台10万元 2080显卡
要做深度学习deep learning计算之用
因为人数越来越多 为了把运算资源更有效利用
我们想要评估
把这些主机放到机房集中 专做pytorch运算
每个工程师只配一台mac mini与机房主机连线用
请问一下
1.这样的想法是否可行呢?
2.是否有合适的国内厂商可建议?
3.这样的费用会花到多少呢?
4.如果采用Cloud GPU
依大家的经验 会比较便宜吗?
https://cloud.google.com/gpu/?hl=zh-tw
作者: goodga ( )   2019-10-04 15:14:00
钱的问题,最后会觉得一人一台最便宜...
作者: blackhippo (PH6.0 微.酸民)   2019-10-04 15:19:00
去年做VDI+GPU lab借张卡..光是卡+license问业务差不多可以买20台主机..
作者: chang0206 (Eric Chang)   2019-10-04 16:29:00
有,但是费用会很吓人....cloud GPU更不用说一个月一两千美金一台,组一台PC都有剩
作者: freeunixer (御剑客)   2019-10-04 17:32:00
光买专用的显卡就贵死你,用 1060 加旧版驱动挡着用...
作者: asdfghjklasd (好累的大一生活)   2019-10-04 18:10:00
可以..不过有多少钱要做?
作者: VictorZ (月下的猫)   2019-10-05 00:17:00
试试看装CentOS然后把那几台主机串在一起当丛集共用资源,再开VDI出来,但是驱动那些要自己处理。
作者: antigenius (喵~)   2019-10-05 08:25:00
给你关键字 kubeflow花钱请一个做aws flow的DevOps帮你做poc先
作者: darktasi (桃园达克大叔)   2019-10-05 16:18:00
说到最后还是预算问题有兴趣我可以站内你
作者: changmary (changmary)   2019-10-06 11:26:00
集中贵资源最大化 分散便宜很多
作者: atrix (班班)   2019-10-10 00:11:00
麻烦死了,大部分方案都只适合所有人都是超高等级人才的环境

Links booklink

Contact Us: admin [ a t ] ucptt.com