[新闻] 切割？中研院再声明：AI模型套用中国资料 poeta PTT批踢踢实业坊

[新闻] 切割？中研院再声明：AI模型套用中国资料

楼主: poeta (键盘诗人) 2023-10-11 13:25:25

1.媒体来源自由
2.记者署名:记者杨媛婷／台北报导
3.完整新闻标题:切割？中研院再声明：AI模型套用中国数据库为研究员个人发布
4.完整新闻内文:
由中研院所开发的繁体中文AI语言模型“CKIP-Llama-2-7b”被踢爆使用中国建置的资料
库后，9日已下架，中研院称这只是该院资讯所研究员的个人研究，中研院10日再强调，
该模型是研究人员自行发布，将厘清是否违规，并会成立“生成式AI风险研究小组”，提
供研究员指引。
有民众日前透过中研院所开发的CKIP模型（CKIP-Llama-2-7b），提问我国“国庆日”是
何时，得到的答案是“10月1日（中国国庆）”，又继续提问“我国国歌”是哪一首，得
到的答案为“《义勇军进行曲》（中国国歌）”。
该资讯在网络迅速流传后，中研院承认，该模型使用来自中国的任务资料集（COIG），并
表示该模型建置仅花30万元经费，主要研究目标是协助让meta开发的Llama2大型语言模型
具备更好的繁体中文处理能力，将明清人物的生平进行自动化分析，建构自动化的历史人
物、事件、时间、地点等事理图谱。
中研院昨天再发表4点声明强调，CKIP模型是该院个别研究员主持的词库小组实验性研究
，模型还在测试，并且由该研究人员自行发布试用版；还有将厘清相关事件是否违反规定
，中研院将规划成立“生成式AI风险研究小组”，深入了解AI对社会的冲击，并提供研究
人员指引，避免类似事件再度发生。
中研院指出，繁体中文语料库是发展台湾大型语言模型重要基础，将整合繁体中文词知识
库，投入资源并规划管理机制；并称该院已举行数次生成式AI相关会议，将扩大召集AI跨
领域研究人员，用团队方式进行跨域研究。
5.完整新闻连结 (或短网址)不可用YAHOO、LINE、MSN等转载媒体:
https://news.ltn.com.tw/news/life/breakingnews/4454616
6.备注:
※ 一个人一天只能张贴一则新闻(以天为单位)，被删或自删也算额度内，超贴者水桶，请注意
※ 备注请勿张贴三日内新闻(包含连结、标题等)

继续阅读

[问卦] 熊孩子？是在熊三洨？？SaintSeven Re: [新闻] 马文君卷潜舰国造泄密今现身欲澄清却快bulden Re: [新闻] 柯文哲要求“办3场辩论再比民调” 侯wolf30141 [新闻] 网友嫌三字经刺耳　朱学恒回呛“刺你妈Xqazxc1156892 [问卦] 凤梨廖老大超派台湾都这种咖在红？dinhan [新闻] 国庆焰火无人机表演取消卢秀燕：以巴冲nk11208z [问卦] 第三次世界大战是不是快了？WeiU Re: [问卦] 不小心按到嘘要补推回来才对吧==？felixden Re: [新闻] 比ISIS残暴！哈玛斯闯聚落屠杀　40娃惨tigotigo [问卦] 为啥越南自由行饭店都只有报一天？FA88124