※ 引述《waitrop (嘴砲无双)》之铭言
: 现在业界单纯说AI芯片是太笼统的说法了,
: 为了获得最高效能与最高CP值,
多嘴插句话,除了Training跟Infer差异外,其实真的要细分还有从硬件、软件的优化,
从最上层到底层跟硬件的结合才能够把edge computing提升到产品落地阶段。
像是阁下说的自然语言这块把Transformer从软件层面做降维优化、新一代更轻量的CNN模型
,还有既有的半精度FP8这种跟指令集优化,另外这几年学界比较有研究的从Complier上做
优化通用矩阵乘法。
我反而不觉得有所谓电子垃圾这一回事,这块目前还是一个没有一统江山的通用规范出来反
而是有很多值得尝试的空间。
最后,真的有办法解决就是找到一个新的通用矩阵乘法可以并行化同时让时间复杂度跟计算
复杂度降到最低,这个目前数学家找了十多年都不一定可以找到了,所以大厂才会想从指令
、硬件下手优化。
大概4酱~