[新闻] 防AI“统派化” 数发部打造台湾主权AI

楼主: lycppt (清)   2025-05-09 12:34:20
自由时报
防AI“统派化” 数发部打造台湾主权AI训练语料库
2025/05/09 12:07
https://img.ltn.com.tw/Upload/business/page/800/2025/05/09/5037550_1.jpg
数发部长黄彦男今天在台东大学演讲,特别说明建构台湾主权AI。(记者黄明堂摄)
〔记者黄明堂/台东报导〕在AI时代,中国拥大量资料,将造成AI运算模式大中国化,特别
是产生政治上偏见;有鉴于此,数位发展部部长黄彦男今天在台东大学演讲时提到,数发部
正在打造台湾主权AI训练语料库,由机关先行,并鼓励企业释出资料,并订定授权条款,消
弭资料用于AI训练涉及的智慧财产权疑虑。
黄彦男应台东大学之邀,今天在向师生专题演讲时,讲述AI产业五大政策工具,特别提到,
台湾的资料量在世界上相当少,AI的大语言模型很容易搜寻到中国的资料,形成中国观点,
政治上的偏见更是可以想像,所以台湾要有自己的资料模型,把台湾本土资料拿出来,供AI
大语言模型训练。
黄彦男说,为精进台湾生成式AI对话引擎,数发部已着手请各部会开放出超过5万笔资料,
包括语文、历史、地理、动植物及国家文化记忆库等各个层面,还有业务资料、政策法规等
文本资料逾1600项,已提供国科会打造台湾价值的可信任生成式AI,调整模型来适应台湾的
语言文化及社会价值。
数发部也征集高品质正体中文语料,采用台湾文化特色与观点,繁体中文块状资料具备语意
连贯性,内容完整且流畅,非仅由数字图表或修列式文字构成;由于更多的资料是在民间企
业,当务之急也是要订法法律条款,请企业释出资料,无偿供AI训练使用。
黄彦男说,打造台湾主权AI训练语料库,是由政府机关先行, 持续扩大文本资料开放,偕
同智慧财产局与台湾学者共同研拟“台湾主权AI训练语料授权条款”及相关使用规范,以消
弭资料用于AI训练之疑虑。
https://ec.ltn.com.tw/article/breakingnews/5037550

Links booklink

Contact Us: admin [ a t ] ucptt.com