GTC Taipei 2018黄仁勋演讲
http://bit.ly/2sUmI1S
AI芯片龙头NVIDIA公司举办GTC 2018技术大会,于2018年5月30、31日于台北举行。CEO黄
仁勋宣称十年前推出NVIDIA GPU运算架构CUDA,已经累计下载了800万次,在过去五年里
增加了五倍。
黄仁勋谈到摩尔定律将于2028到尽头,现在需要扩展它的极限。传统半导体有摩尔定律,
但CUDA GPU创造了不同的定律。GPU每隔五年就达到10倍的效能成长,也针对算法不断
的改善。传统服务器的庞大、耗电,通过NVIDIA的GPU有了根本性的改变。他说,在计算
领域用了越多的GPU,其实就是越省钱!
从机器学习到深度学习,已衍生出无数种不同的神经网络、模型,随着应用的增加,也越
来越复杂。为了要应付这些复杂的神经网络计算,现有的小型GPU其实很难以负担,但如
果把个别的GPU通过高效能的互联结构结合起来,形成一个巨大的GPU,就可以创造出过去
不可能达成的计算成果。于是,DXG-2 Server就是互联了16颗GPU,形成一个庞大的GPU架
构,共享统一的内存空间,通过最新的NVLink技术,使GPU和GPU之间可以用比PCIE快20
倍的效率互相沟通。
HGX-2超级计算机平台
HGX-2超级计算机是刚释出的新产品,同样可以串联16个Tesla V100,速度达到
2Peta-FLOPS,同样,这还是第一款人工智能和高效能运算统一的平台HPC。 换句话说
HGX-2就是一个服务器平台,可进行科学计算或是高精度模拟,也可以进行AI训练。这正
可以解决CPU效能扩张速度变慢的问题,GPU大规模平行计算有了更好的发展空间。
DGX-2深度学习机
DGX-2 是一台专门用于人工智能训练和/或推理任务的桌面计算机。DGX-2 可提供 10 倍
于上一代 Nvidia DGX-1 的深度学习效能,整体功耗为为 10KW,重 350 磅,售价39.9
万美元。
机器人平台Isaac及处理器Jetson Xavier
Isaac机器人平台,针对制造、物流、农业和建筑等机器人应用而推出,可作为终端消耗
HGX-2和DGX-2的运算力。基于Isaac平台的Jetson Xavier处理器,包括了1个Volta
Tensor Core GPU、1个8核ARM64 CPU、2个NVDLA深度学习加速器、1个影像处理器、1个视
觉处理器和1个视讯处理器,预定价格为1299美元。被用于现场模拟、判断和模拟环境测
试,而更多的资料则会交给云端进行,并最终同步到所有机器人之中。 (705字;图1)
以下内容出自GTC2018 黄仁勋演讲简报:
大幅升速的电脑运算
GPU运算从一个优异的GPU开始,但它的潜力只有在我们优化整个堆叠时才会展现