【NVIDIA GTC 2020】一切都是为了 AI,今年有剑桥超级电脑、Arm 还有 DPU
https://www.inside.com.tw/article/21153-NVIDIA-GTC-2020
Inside 2020/10/06 Chris / 核稿编辑:李柏锋
受到疫情影响,NVIDIA 每年一度的 GPU 技术大会(GTC)也全部移到线上举行。今年主题
其实某种程度上来说很简单:AI,AI,还是 AI!但到底要怎么把 GPU 运用在各行各业的
AI 上,就是 NVIDIA 想做的大哉问了,执行长黄仁勋也一口气在线上主题演讲中发表了多
项重量级讯息。
NVIDIA Omniverse 是即时线上的 GPU 3D 模拟协作平台,使用了 Pixar 所开发的开源 3D
场景、档案格式(Universal Scene Description),可以让设计师、开发者直接在线上
对 3D 建模进行协作,举个例子,像台湾、美国的动画团队就可以直接在 Omniverse 上开
3D 专案绘制动画,或是让汽车工程师在 Omniverse 的 3D 环境里同时模拟与调整自动功
能。目前 Adobe、Autodesk、Bentley Systems、Robert McNeel&Associates 和 SideFX
都进入了 Omniverse 线上支援。Omniverse 于 2019 年 3 月首次发表,但今天释出 Open
Beta。
公布英国剑桥的医学超级电脑:Cambridge-1!
之前 NVIDIA 在收购 Arm 时曾提到将在英国剑桥建立一个新的全球 AI 研究中心,并投资
一台最先进的 Arm-powered AI 超级电脑:今天有了最新进展,虽然并非 Arm-powered 架
构,但 NVIDIA 今天公开基于 NVIDIA DGX SuperPOD 架构,英国史上性能最高的超级电脑
“Cambridge-1”!
Cambridge-1 耗费约 4000 万英镑,效能可达 400 petaflops AI 性能和 8 petaflops的
Linpack 性能,挤身进世界 500 大超级电脑第 29 名,还是世界前三大最节能的超级电脑
之列。面对武汉肺炎的迫切公卫挑战,Cambridge-1 主要会运用在医疗领域、生命科学上
。
除此之外, NVIDIA 也公布医疗 AI 模型 NVIDIA Clara Discovery 跟 Cambridge-1 搭配
,透过跟 GSK 等公司合作,使用重要遗传、基因组数据库提供预先训练的 AI 模型和特定
的应用程序框架,来加速药物、疫苗的设计和开发流程;除了具备整合医疗影像的能力之
外,NVIDIA Clara Discovery 甚至还具备自然语言处理能力,可以让研究人员利用特定于
生物医学的语言模型来组织、理解医学文献、论文与数据库,帮助整理现有治疗方法和其
他重要疗法的关联。
另外要提的是,Cambridge-1 也是 NVIDIA DGX SuperPOD 架构的火力展示,NVIDIA DGX
SuperPOD 可让各企业、组织在数周内就能组装极为强大的 AI 超级电脑,将以 20 个为一
个模组的方式进行销售,并运用 NVIDIA Mellanox InfiniBand网络技术相互串联,其 AI
运算效能为 100 petaflops 起跳,并可扩增到 700 petaflops。其丛集规模从 20 个到
140 个独立的 NVIDIA DGX A100TM 系统不等。
AI 云端串流影像平台:NVIDIA Maxine
同样因应武汉肺炎疫情之下的远端工作需求,NVIDIA 发表了由 GPU 加速的 AI 云端串游
影像平台 NVIDIA Maxine,它可以一边使用基于对抗网络的 AI 影像压缩技术降低串流影
像的资料流量(降到 H.264 的 10 分之 1!),另一方面可以透过 GPU,为远端工作串流
视讯提供高超画质、聚焦、降噪、亮脸等 AI 功能,而且已经跟三大公有云 Google Cloud
、AWS、 Microsoft Azure 以及 ORACLE 开始合作,同时还能搭配自然语言 AI Javis 自
动生成字幕。
全新的处理器类种:瞄准资料中心的 NVIDIA 资料处理器 DPU
以前我们有中央处理器 CPU、图形处理器 GPU,但显然 NVIDIA 认为这些都还不够,在之
前跟 VMware 一起携手,用 NVIDIA 的可编程设计“BlueField-2 DPU”推出了混合云架构
。
那 DPU 是什么呢?今天黄仁勋进一步介绍,当代的资料中是由软件定义的,也让资料中需
要更灵活得架构兼顾效能与耗能,因此针对大量资料需求设计了一种全新的处理器:资料
处理器 DPU。某种程度上可以把 DPU 视为集三个关键要素于一身的 SOC,首先事实上搭载
多核 CPU 并搭配高速网络端子、各种可程式定义的加速引擎,让原本 CPU 进行的多项工
作流程让 DPU 负担,CPU 本身可以把算力集中在更重要核心运用上。
而 NVIDIA 今天推出的,就是 BlueField-2 DPU 产品线,BlueField-2 DPU,搭载 Arm 架
构 8 核心 Cortex-A72 并具备 NVIDIA Mellanox Connext-6 SmartNIC 的所有特点,可以
完全由软件定义并提供 200 Gbps 的数据传输速率,加速资料中心的资安、传输和储存等
关键工作,实现等同多达 125 颗 CPU 的任务效能。
BlueField-2X DPU 则拥有 BlueField-2 DPU 的所有关键特性,并加上 NVIDIA Ampere
GPU 的 AI 功能加以强化用在更大量的影像上传处理;而为了能够让开发人员在 DPU 加速
的资料中心用软件构建应用程式,NVIDIA 还推出类似于 NVIDIA CUDA 的 GPU 加速的开发
工具——DOCA 软件开发工具包。
BlueField DPU 未来还会推出 BlueField-3、3X 以及 BlueField-4 两代产品,届时都会
导入 Arm 的新型 CPU 架构;其中 BlueField-4 整体效能将会是 BlueField-2 的 1000
倍左右。
边缘运算 NVIDIA EGX AI 加入 Ampere 与 DPU
针对大型物联网等边缘运算需求,NVIDIA 今天更新了原本的 EGX 平台计画成为“NVIDIA
EGX AI”,把刚刚发表的 BlueField-2 DPU 以及 Ampere GPU 整合在单一 PCIe 卡上,试
图透过易于部署的云端原生应用软件堆叠加速边缘运算。
除此之外,今天也发表了平价只要 59 美金的 Jetson Nano 2GB 开发套件,为开发者提供
了更便宜、更好上手的人工智能、机器人入门级套件,在 JetPack SDK 的支援下包含
NVIDIA 容器运行时间和完整的 Linux 软件开发环境,同时在 CUDA-X 加速运算堆叠下,
在自动驾驶汽车、工业物联网、医疗、智慧城市等领域也创造出突破性的 AI 产品。
NVIDIA 与 Arm 的整合计画
先前 NVIDIA 正式以 400 亿美元并购 Arm,引发业界巨大震撼,而今天黄仁勋进一步公布
了双方的整合计画,首先 BlueField-2 DPU 就是一个很明显的例子,NVIDIA 将会在资料
中心、边缘运算、超级电脑等领域积极将 Arm 架构整合进 NVIDIA 的产品设计中。
心得:
昨天老黄讲了超多东西的
找了一篇比较详细的贴上来
主要是未来发展老黄要走向AI处理、资料中心的火力展示
另外谈ARM收购时答应要给英国的超级电脑也初步介绍了
(所以英国你要同意了吗?)
最后就是 DPU !!!!
一个DPU = 125个X86的CPU
而这个DPU不但快、还要更快
https://i.imgur.com/FQKBrfo.png
预计在2023年升级两代后的DPU会比初代还要快一千倍
(所以是一个DPU = 125000个CPU吗!?)
最后
整个Keynote可以到这个网址收看
https://www.youtube.com/playlist?list=PLZHnYvH1qtOYOfzAj7JZFwqtabM5XPku1
有繁中字幕
NVDA喷喷喷!!!