[新闻] 切割?中研院再声明:AI模型套用中国资料

楼主: poeta (键盘诗人)   2023-10-11 13:25:25
1.媒体来源自由
2.记者署名:记者杨媛婷/台北报导
3.完整新闻标题:切割?中研院再声明:AI模型套用中国数据库为研究员个人发布
4.完整新闻内文:
由中研院所开发的繁体中文AI语言模型“CKIP-Llama-2-7b”被踢爆使用中国建置的资料
库后,9日已下架,中研院称这只是该院资讯所研究员的个人研究,中研院10日再强调,
该模型是研究人员自行发布,将厘清是否违规,并会成立“生成式AI风险研究小组”,提
供研究员指引。
有民众日前透过中研院所开发的CKIP模型(CKIP-Llama-2-7b),提问我国“国庆日”是
何时,得到的答案是“10月1日(中国国庆)”,又继续提问“我国国歌”是哪一首,得
到的答案为“《义勇军进行曲》(中国国歌)”。
该资讯在网络迅速流传后,中研院承认,该模型使用来自中国的任务资料集(COIG),并
表示该模型建置仅花30万元经费,主要研究目标是协助让meta开发的Llama2大型语言模型
具备更好的繁体中文处理能力,将明清人物的生平进行自动化分析,建构自动化的历史人
物、事件、时间、地点等事理图谱。
中研院昨天再发表4点声明强调,CKIP模型是该院个别研究员主持的词库小组实验性研究
,模型还在测试,并且由该研究人员自行发布试用版;还有将厘清相关事件是否违反规定
,中研院将规划成立“生成式AI风险研究小组”,深入了解AI对社会的冲击,并提供研究
人员指引,避免类似事件再度发生。
中研院指出,繁体中文语料库是发展台湾大型语言模型重要基础,将整合繁体中文词知识
库,投入资源并规划管理机制;并称该院已举行数次生成式AI相关会议,将扩大召集AI跨
领域研究人员,用团队方式进行跨域研究。
5.完整新闻连结 (或短网址)不可用YAHOO、LINE、MSN等转载媒体:
https://news.ltn.com.tw/news/life/breakingnews/4454616
6.备注:
※ 一个人一天只能张贴一则新闻(以天为单位),被删或自删也算额度内,超贴者水桶,请注意
※ 备注请勿张贴三日内新闻(包含连结、标题等)

Links booklink

Contact Us: admin [ a t ] ucptt.com