原文标题:
“不拿坦克车钻巷子!” 刘峻诚力推高效省电NPU让人工智能更普及
原文连结:
https://www.ctwant.com/article/355473/
发布时间:
2024-08-11 06:00
记者署名:
陈曼侬
原文内容:
“CPU (中央处理器)像坦克车,一开始设计功能主要是打仗用,GPU(图形处理器)就
像是卡车,主要拿来载货物;NPU(神经处理器)则是小客车,能在小城市内跑来跑去,
专为AI而生。”耐能(Kneron)创办人暨执行长刘峻诚向CTWANT记者解释,AI时代大家最
常听见的三种处理器差异何在。
辉达(Nvidia)创办人兼执行长黄仁勋在今年6月的台大演讲时提及,从1964年IBM创造出
第一片CPU到现在,电脑已诞生60年,但 CPU升级速度已减低,须处理的资料量却大幅成
长,而辉达在2006年推出CUDA技术,让GPU可应用于图像处理以外的计算,也成为AI计算
的主要动力。
“CPU+GPU的平行运算模式,才能提供等量的加速运算能力”黄仁勋表示,若以单颗CPU运
算需要1秒时间的资料量,搭配GPU加速运算,则只需要0.01秒的时间,且仅需3倍能耗、
1.5倍的装置成本,等于省下了98%的装置成本、97%的能源,“所以你买越多GPU,就省更
多钱”。
业内人士向CTWANT记者解释,因手机与电脑的应用及计算变多,业界在标准积体电路(IC
)外,另外订制ASIC专用(特殊应用)电路,毕竟“专用的比通用的好”,例如Google研
发出TPU(Tensor Processing Unit张量处理器),用于大量低精度计算,但生产厂商少,
价格昂贵,刘峻诚的NPU和TPU的概念很像,但“他抓住低价的利基市场,所以在终端使用
量会比较多。”
业内人士进一步说明,如果没有NPU,传统笔电使用AI助手,很容易遇到效能网络塞车的
问题,而耐能的NPU主打在没有网络状态下也能运算,特别是物体与人脸辨识,如今AI应
用更广泛,使用GPU有成本贵及耗电问题,让NPU业者更有底气推广,“让CPU、GPU去做它
本来要做的事,就是解方。”
而现在常听见的NPU,就是刘峻诚2015年创业时打造的全新计算模型“神经网络处理器”
(Neural Networks Processing Unit),这个“可重组式人工智能神经网络”的专利,
像一堆乐高积木,当要支持语音AI模型时,可透过指令集重组,要支持图像AI时再次重新
组合,由于可支援多种神经网络模型,保持架构精简,处理 AI 模型运算时,具有性能和
功耗上的优势。
早在2018年,CTWANT记者曾访问过刘峻诚,当时AI议题还不热,他在解释NPU概念时,主
打是在离线状态下,能让手机或电脑继续学习和执行复杂的深度学习演算,能让AI更平民
化。
时隔六年,他跟CTWANT记者的解释更具象,“CPU就像是坦克车,但有一天人类盖了小型城
市,大家发现GPU这卡车比较方便,“我们的NPU就是小客车,虽然市面上的驾驶都习惯开
卡车,但若有一天油价涨了两、三百倍,大家就会被逼迫去试着开小客车。”
刘峻诚说“国际级的云端大厂是目前GPU的主要买家,但因为实在太贵、太耗电,就像某
个货运公司的卡车队伍,正在强迫司机要换小客车,这件事情正在发生,你就等著看吧!
”
除了云端,NPU芯片架构在终端产品上的能见度的确越来越多,目前高通骁龙X系列处理器
,就是主打专为AI应用设计的NPU,高效能、更省电;耐能去年3月也宣布自研的人工智能
系统芯片KL720打入高通的产品线,用在高通机器人RB1平台与RB2平台中。
Arm在4月发表因应边缘AI运算的第三代NPU产品“Arm Ethos-U85”,其效能相比上一代
Ethos-U65提升4倍、功耗能源转换效率提高20%,可用在工厂自动化和商用监视器或智慧
家庭摄影机等应用。
今年6月的Computex电脑展上,CTWANT记者就在Intel展区中,看到多项跟NPU有关的实机展示
。像是技嘉Aorus 15笔电的展示,过去可用手势拨放或停止影音播放程式,当时是利用
CPU与GPU来处理分析,透过镜头来识别手势,现在则使用NPU独立处理。
刘峻诚曾引用大摩报告指出,到2027年,NPU的市占率将会超过GPU,不过Google
DeepMind杰出科学家纪怀新向CTWANT记者说,“我认为五到十年内,GPU的地位还不会被
取代”不过现在的确有很多人在思考用更多元的方式去解决,也是好事一件。
心得/评论:
就算GPU的问题不在于太贵,耗电严重的问题也会让台湾难以快速建构大型的运算中心,至少桃园以北的电网就无法承担。
要克服耗电的问题,要嘛就学微软盖新型小型核电厂,否则就只能另发展一条专走NPU的路线,建构以NPU为主的运算中心?