称 AI 仍处于“拨接时代”!Cerebras 发表全球最快 AI 推论解决方案
https://technews.tw/2024/08/30/startup-cerebras-new-ai-processor/
目标挑战 NVIDIA、专门开发 AI 运算系统的新创公司 Cerebras 宣布发表“Cerebras
Inference”AI 推论工具平台,努力打破 NVIDIA 在 AI 芯片市场垄断局面。
外媒《金融时报》(Financial Times)报导,包括 Cerebras、d-Matrix 和 Groq 等小
型公司的目标是在 AI 芯片市场中获得市占率,并将重点放在更便宜、专运行 AI 模型的
芯片上。
Cerebras 全新的“Cerebras Inference”平台以 CS-3 芯片为基础,芯片只有餐盘大小
。该公司宣称,这个解决方案 AI 推理速度比 NVIDIA Hopper 芯片快 20 倍,成本仅五
分之一。
Cerebras 执行长 Andrew Feldman 指出,“击败 800 磅大猩猩(意指 NVIDIA)的方法
,是将更好的产品推向市场,我们已从(NVIDIA)那抢走不少有意义的客户”。
CS-3 芯片没采用 NVIDIA 所使用的独立高频宽内存(HBM)芯片,而是提供另一种直接
将内存内置于芯片中的架构。Feldman 指出,其优势在于内存使用方式,因为内存
频宽的限制,会限制 AI 芯片推论速度,因此将逻辑芯片和内存结合至单一大芯片中,
可提供“几个量级的速度”。
也因此,Cerebras 的芯片不像 GPU 和其他处理器,需要接口连接内存才能存取资讯。
彭博社报导,Cerebras 这个方法依赖由单片硅晶圆制成的巨型芯片。透过这种新技术,
Cerebras 的芯片功能比传统同类产品强,但传统硬件无法容纳这些超大尺寸芯片,必须
设计专容纳这些芯片的电脑。
Feldman 形容,“直到今天,我们还处于拨接时代,没多少 GPU 可拼凑在一起,实现这
个目标”,而他的电脑将颠覆 AI 产业,使 AI 系统反应更迅速,如同转换到高速网络。
据悉,Cerebras 已提交一份首度在公开募股中出售股票的保密计画,同时建立自家资料
中心,试图将芯片销售给微软、亚马逊等云端服务供应商。
小标题
另一间新创公司 d-Matrix 也有同样的野心。
d-Matrix 计画今年底全面推出自有芯片平台 Corsair。d-Matrix 创办人 Sid Sheth 指
出,该公司将产品与 Triton 等开放式软件搭配,目前 NVIDIA 最大客户支持使用
Triton 等开放软件。应用程式开发人员不喜欢被某种特定工具所束缚,人们也逐渐发现
受 NVIDIA 的 AI 软件平台 Cuda 限制。
d-Matrix 由创办人 Sid Sheth 于 2019 年创立,在新加坡国有基金淡马锡领投的 B 轮
融资中筹得 1.1 亿美元,不到一年便启动新一轮融资。d-Matrix 目标是在今年或明年初
筹集 2 亿美元以上资金。
另一间 AI 推理竞争对手 Groq 本月从 BlackRock Private Equity Partners 领投的投
资者那筹集 6.4 亿美元,估值为28亿美元。知情人士透露,芯片制造商 Graphcore 上个
月被软银以略高于 6 亿美元收购,少于 2016 年成立以来筹资约 7 亿美元的风险资金。