华为启动‘鲲鹏+升腾’双引擎计算战略
http://bit.ly/35bA0Iu
2019年11月29日,为布局运算产业,华为与鹏城实验室持续合作在深圳共同发布鹏城云脑Ⅱ一期,正式开启明年(2020) 千P级AI集群应用。目前,鹏城云脑算力为100P FLOPS。
华为采用'鲲鹏+升腾'双引擎启动计算战略,以Atlas 900 AI集群搭载鲲鹏、升腾处理器作为鹏城云脑Ⅱ的基础,同时注入澎湃算力,未来将应用于AI领域,例如:计算机视觉、自然语言、自动驾驶、智慧交通、智慧医疗等各类基础性研究与探索。
以Atlas人工智能计算平台为基础,打造面向'端、边、云'的全场景AI基础设施方案。华为智能计算业务部总裁马海旭表示:“华为Atlas人工智能计算平台基于华为升腾系列AI处理器,通过模块、板卡、小站、AI服务器、集群等丰富的产品形态,打造面向'端、边、云'的全场景AI基础设施方案,覆蓋深度学习领域推理和训练全流程。Atlas 900是Atlas系列的旗舰产品,未来希望通过Atlas 900与鹏城云脑Ⅱ的合作,共同建设千P级AI集群应用,加速各行业智能化升级。”
华为AI集群Atlas 900,由数千颗升腾910 AI处理器组成。在衡量AI计算能力的标准ResNet-50图片分类模型下,Atlas 900只需59.8秒就完成了训练,在同等精度下比原世界纪录快10秒。Atlas 900凭借其强大算力,可广泛应用于科学研究与技术创新,比如天文探索、气象预测、自动驾驶、石油勘探等领域。Atlas 900拥有以下特性:
强劲算力:数千颗升腾910 AI处理器互联,半精度(FP16)算力达256-1024 PFLOPS,相当于50万台PC机的演算;采用SoC设计,整合了AI演算、通用算力和I/O,有效提升训练效率。
高速集群网络:采用HCCS、PCIe 4.0、100G以太三类高速互联方式,梯度同步时延缩短10%~70%;独创iLossless 智能无损交换算法,对全网流量进行实时的学习训练,实现网络零丢包与端到端微秒级时延。
高效散热:采用柜级绝热密闭系统,液冷占比可大于95%,系统能效比小于1.1。
截至目前,基于升腾910和310 AI处理器,华为推出了Atlas 900 AI集群、Atlas 800 AI服务器、Atlas 500 智能小站、Atlas 300 AI加速卡和Atlas 200 AI加速模块,完成了Atlas全系列产品布局,覆蓋云、边、端全场景以提供训练和推理演算。