[新闻] 三位台湾AI专家发起DeepSeek R1改造计画

楼主: shala (沙罗)   2025-02-09 09:19:40
1.媒体来源:
iThome
2.记者署名:
文/王宏仁 | 2025-02-08发表
3.完整新闻标题:
三位台湾AI专家发起DeepSeek R1改造计画,要打造繁中版开源授权的推理模型
4.完整新闻内文:
这项计画将以DeepSeek R1为基础来进行改造,透过重新训练模型的方式,并以开源授权
释出模型权重,也就是采取开放权重的策略释出,最后还会打造新的模型身份与品牌
OpenAI去年发表了新一代推理模型o1之后,让众人看到GAI开始媲美真人博士或软件开发
高手般的解题能力,掀起了新一轮的大型语言模型竞赛。春节期间,以开放权重释出的De
epSeek R1模型,大幅降低了这一波推理模型竞赛的门槛,成了全球AI产业的热门焦点,
开始浮现客制化推理模型的趋势。
台湾也有三位AI专家,在2月7日发起了一项台湾制造大型语言模型计画,专案代号“自由
钢普拉”(FreedomGunpla R1),希望募资3千万元,预计在3月底释出第一版预览的推理
模型。
这款引起全球AI圈热议的DeepSeek R1模型,在论文中揭露了多项媲美甚至超越OpenAI o1
推理模型的能力,因为可以部署到本地端,来避免企业自己的机敏资料上传到网络,而引
起AI圈的重视,不过,R1模型简体版用户协议中提到自己通过三项中国AI法规的备案,也
让外界担心这款模型生成的内容偏重于对齐中国价值。
因此,台湾有三位不同AI领域的专家,发起了这项重新改造DeepSeek R1,来打造对齐多
元价值的繁体中文版推理模型计画“自由钢普拉”。这三位发起人,包括了AI PM助理新
创MeetAndy AI创办人薛良斌,Taiwan LLM开发者林彦廷以及云端游戏软件开发供应商Ubi
tus的执行长郭荣昌。
薛良斌是台湾生成式AI年会主办人,也是知名售票平台KKTIX和MLOps新创InfuseAI的共同
创办人,由他来负责募集这项模型改造计画的资源。
林彦廷则是具有中文大型语言模型训练经验的专家,他刚结束了在Meta的实习,参与了Me
ta训练Llama模型的过程。林彦廷将负责FreedomGunpla R1的模型训练工作。而最后一位
郭荣昌则拥有大规模GPU丛集管理经验,旗下公司曾获得Nvidia破亿元投资,也拥有亚洲
最大的GPU农场。郭荣昌将负责算力架构和管理。
台湾目前也有几款繁中版大型语言模型,主要以Meta释出的Llama模型为基础来客制训练
,但薛良斌认为,Llama 3模型不够聪明,甚至用以“太笨了”来形容,他指出,如果想
要打造出自主能力的AI代理,使用媲美O1等级推理能力的模型是最低标准。
这项计画的技术重点包括了,将以DeepSeek R1为基础来进行改造,透过重新训练模型的
方式,并以开源授权释出模型权重,也就是采取开放权重的策略释出,最后还会打造新的
模型身份与品牌。薛良斌强调,这不只是一个技术专案,更是一项文化工程,因为这是一
项多元价值观的对齐任务。
预计分三阶段来实现目标,第一阶段先对齐西方价值观,可能导致模型推理能力下滑,薛
良斌评估,很高机率达成这个里程碑。第二阶段再进一步让变笨的模型变得聪明,这部分
则需要投入更多资源来验证。这项计画的终极目标是,不论使用者用繁体中文或是英文时
,这款模型的表现可以比使用简体中文更好。
这项计画希望募资3千万元,将由财团法人开放文化基金会(OCF)处理募资,专款专用,
透过这笔资金,希望至少可以训练两次模型。在时程上,初步预计2025年3月底前释出第
一版预览模型,开始搜集早期测试者的意见回馈后快速迭代,再释出最终的版本。
5.完整新闻连结 (或短网址)
https://www.ithome.com.tw/news/167280
6.备注:
台湾专家以日本自由钢普拉之名站在中国DeepSeek的肩膀上。
熟悉的台湾味,纯正浓郁,请国人储值支持。

Links booklink

Contact Us: admin [ a t ] ucptt.com