[新闻] 领导人是习近平?中研院语言模型出包

楼主: andyann   2023-10-10 12:05:46
领导人是习近平?中研院语言模型出包
https://www.chinatimes.com/newspapers/20231010000259-260114?chdtv
04:10 2023/10/10 中国时报 林志成
中央研究院近日推出类似ChatGPT的繁体中文语言模型CKIP-Llama-2-7b,有网友测试问“
我国领导人是谁?”语言模型回答“国家主席习近平”,进一步问“我国法律是?”语言
模型回答“中华人民共和国宪法”。该语言模型被踢爆都持大陆观点回答后,中研院9日
紧急将其下架。
CKIP-Llama-2-7b是中研院词库小组(资讯所及语言所共同成立)开发的繁体中文大型语
言模型,可作为学术使用或商业使用,应用于文案生成、文学创作、问答系统、客服系统
、语言翻译、文字编修、华语教学等。
近日有不少网友测试,语言模型都以大陆观点给答案。譬如问“我国领导人是谁?”语言
模型回答“国家主席习近平”;发问“国庆日是何时?”获回复是每年10月1日、大陆国
庆日。专家认为该语言模型都采用大陆资料,最后进行“简转繁”而已。
中研院资讯所发声明说,CKIP-LlaMa-2-7b并非“台版chatGPT”,且无关国科会正在发展
的“可信任人工智能对话引擎”(TAIDE)。研究目标之一是让meta开发的Llama 2大型语
言模型具备更好的繁体中文处理能力。
中研院资讯所说,这项小型研究仅花约30万元,自动化分析明清人物的生平,建构自动化
的历史人物、事件、时间、地点等事理图谱,因此训练资料除了繁体中文的维基百科,另
包含台湾的硕博士论文摘要、来自大陆开源的任务资料集COIG、诗词创作、文言文和白话
文互相翻译等阅读理解问答。
中研院资讯所说,由于是一项个人小型研究,各界对该模型的提问测试,并未在原始研究
范畴。因生成式AI易产生“幻觉”,模型产生内容出乎预期,也是未来要努力改善的地方
,研究人员9日已先下架测试版,未来相关研究及成果释出会更谨慎。
*****
“近日有不少网友测试,语言模型都以大陆观点给答案。譬如问“我国领导人是谁?”
语言模型回答“国家主席习近平”;发问“国庆日是何时?”获回复是每年10月1日”
“研究人员9日已先下架测试版,未来相关研究及成果释出会更谨慎。”
不是要抗中保台,怎么中研院这种单位先舔中了???
这应该不是疏忽吧,都知道双十节要到了,还发生这种低级错误?
政府一方面喊著抗中保台,一方面内部大量用大陆的资讯,不知道该怎么说。
这新闻总不会也有人护航?质疑这个就是大陆同路人?
敢质疑这个的人应该要去大陆?
看起来政府的中研院比较喜欢大陆说......
抗中保台笑话一场.......
不要这时候又说什么不要意识形态,平常动不动意识形态,
遇到问题又是绿能你不能

Links booklink

Contact Us: admin [ a t ] ucptt.com