楼主:
DDDDRR (QQ)
2025-02-10 15:02:32※“新闻”标题须为原新闻标题且从头张贴 ※
1.新闻网址︰
https://ithome.com.tw/news/167280
※ 请附上有效原文连结或短网址 ※
2.新闻来源︰
ithome
3.完整新闻标题
三位台湾AI专家发起DeepSeek R1改造计画,要打造繁中版开源授权的推理模型
※ 内文请完整转载标题 请勿修改与删减 ※
※ 注意发文标题 为原始新闻标题从头张贴 切勿修改与删减 ※
4.完整新闻内容︰
OpenAI去年发表了新一代推理模型o1之后,让众人看到GAI开始媲美真人博士或软件开发高手般的解题能力,掀起了新一轮的大型语言模型竞赛。春节期间,以开放权重释出的DeepSeek R1模型,大幅降低了这一波推理模型竞赛的门槛,成了全球AI产业的热门焦点,开始浮现客制化推理模型的趋势。
台湾也有三位AI专家,在2月7日发起了一项台湾制造大型语言模型计画,专案代号“自由钢普拉”(FreedomGunpla R1),希望募资3千万元,预计在3月底释出第一版预览的推理模型。
这款引起全球AI圈热议的DeepSeek R1模型,在论文中揭露了多项媲美甚至超越OpenAI o1推理模型的能力,因为可以部署到本地端,来避免企业自己的机敏资料上传到网络,而引起AI圈的重视,不过,R1模型简体版用户协议中提到自己通过三项中国AI法规的备案,也让外界担心这款模型生成的内容偏重于对齐中国价值。
因此,台湾有三位不同AI领域的专家,发起了这项重新改造DeepSeek R1,来打造对齐多元价值的繁体中文版推理模型计画“自由钢普拉”。这三位发起人,包括了AI PM助理新创MeetAndy AI创办人薛良斌,Taiwan LLM开发者林彦廷以及云端游戏软件开发供应商Ubitus的执行长郭荣昌。
薛良斌是台湾生成式AI年会主办人,也是知名售票平台KKTIX和MLOps新创InfuseAI的共同创办人,由他来负责募集这项模型改造计画的资源。
林彦廷则是具有中文大型语言模型训练经验的专家,他刚结束了在Meta的实习,参与了Meta训练Llama模型的过程。林彦廷将负责FreedomGunpla R1的模型训练工作。而最后一位郭荣昌则拥有大规模GPU丛集管理经验,旗下公司曾获得Nvidia破亿元投资,也拥有亚洲最大的GPU农场。郭荣昌将负责算力架构和管理。
台湾目前也有几款繁中版大型语言模型,主要以Meta释出的Llama模型为基础来客制训练,但薛良斌认为,Llama 3模型不够聪明,甚至用以“太笨了”来形容,他指出,如果想要打造出自主能力的AI代理,使用媲美O1等级推理能力的模型是最低标准。
这项计画的技术重点包括了,将以DeepSeek R1为基础来进行改造,透过重新训练模型的方式,并以开源授权释出模型权重,也就是采取开放权重的策略释出,最后还会打造新的模型身份与品牌。薛良斌强调,这不只是一个技术专案,更是一项文化工程,因为这是一项多元价值观的对齐任务。
预计分三阶段来实现目标,第一阶段先对齐西方价值观,可能导致模型推理能力下滑,薛良斌评估,很高机率达成这个里程碑。第二阶段再进一步让变笨的模型变得聪明,这部分则需要投入更多资源来验证。这项计画的终极目标是,不论使用者用繁体中文或是英文时,这款模型的表现可以比使用简体中文更好。
这项计画希望募资3千万元,将由财团法人开放文化基金会(OCF)处理募资,专款专用,透过这笔资金,希望至少可以训练两次模型。在时程上,初步预计2025年3月底前释出第一版预览模型,开始搜集早期测试者的意见回馈后快速迭代,再释出最终的版本。
※ 请完整转载原文 请勿修改内文与删减 ※
5.附注、心得、想法︰
靠 这比起750还在洗地更危险吧
三位不知道哪来的专家 竟然要募资3千万
用中国ds为基础弄出繁体中文版本的
追根究底这个没用的ds
政府到底管不管阿
真的弄出来也不能让他出现在台湾吧?
※ 40字心得、备注 ※
※ “Live”、“新闻”、“转录”、“旧闻”及 转录他方内容之文章
每日发文数总上限为3篇,自删与板主删除,同样计入额度 ※