[新闻] 领导人是习近平？中研院语言模型出包 andyann PTT批踢踢实业坊

[新闻] 领导人是习近平？中研院语言模型出包

楼主: andyann 2023-10-10 12:05:46

领导人是习近平？中研院语言模型出包
https://www.chinatimes.com/newspapers/20231010000259-260114?chdtv
04:10 2023/10/10 中国时报林志成
中央研究院近日推出类似ChatGPT的繁体中文语言模型CKIP-Llama-2-7b，有网友测试问“
我国领导人是谁？”语言模型回答“国家主席习近平”，进一步问“我国法律是？”语言
模型回答“中华人民共和国宪法”。该语言模型被踢爆都持大陆观点回答后，中研院9日
紧急将其下架。
CKIP-Llama-2-7b是中研院词库小组（资讯所及语言所共同成立）开发的繁体中文大型语
言模型，可作为学术使用或商业使用，应用于文案生成、文学创作、问答系统、客服系统
、语言翻译、文字编修、华语教学等。
近日有不少网友测试，语言模型都以大陆观点给答案。譬如问“我国领导人是谁？”语言
模型回答“国家主席习近平”；发问“国庆日是何时？”获回复是每年10月1日、大陆国
庆日。专家认为该语言模型都采用大陆资料，最后进行“简转繁”而已。
中研院资讯所发声明说，CKIP-LlaMa-2-7b并非“台版chatGPT”，且无关国科会正在发展
的“可信任人工智能对话引擎”（TAIDE）。研究目标之一是让meta开发的Llama 2大型语
言模型具备更好的繁体中文处理能力。
中研院资讯所说，这项小型研究仅花约30万元，自动化分析明清人物的生平，建构自动化
的历史人物、事件、时间、地点等事理图谱，因此训练资料除了繁体中文的维基百科，另
包含台湾的硕博士论文摘要、来自大陆开源的任务资料集COIG、诗词创作、文言文和白话
文互相翻译等阅读理解问答。
中研院资讯所说，由于是一项个人小型研究，各界对该模型的提问测试，并未在原始研究
范畴。因生成式AI易产生“幻觉”，模型产生内容出乎预期，也是未来要努力改善的地方
，研究人员9日已先下架测试版，未来相关研究及成果释出会更谨慎。
*****
“近日有不少网友测试，语言模型都以大陆观点给答案。譬如问“我国领导人是谁？”
语言模型回答“国家主席习近平”；发问“国庆日是何时？”获回复是每年10月1日”
“研究人员9日已先下架测试版，未来相关研究及成果释出会更谨慎。”
不是要抗中保台，怎么中研院这种单位先舔中了？？？
这应该不是疏忽吧，都知道双十节要到了，还发生这种低级错误？
政府一方面喊著抗中保台，一方面内部大量用大陆的资讯，不知道该怎么说。
这新闻总不会也有人护航？质疑这个就是大陆同路人?
敢质疑这个的人应该要去大陆？
看起来政府的中研院比较喜欢大陆说......
抗中保台笑话一场.......
不要这时候又说什么不要意识形态，平常动不动意识形态，
遇到问题又是绿能你不能

继续阅读

Re: [讨论] 为什么几个人讲话需要三百多万制作费？freddy50301 [新闻] 把“潜舰协力商GL”搞错成“伦敦GL杂货DoncicInPTT [讨论] 马文君案应该是不用玩了 miler22020 [新闻] 哈佛学生组织发表亲巴勒斯坦声明校友愤oceanplus [讨论] 钱都花了就办吧Mimmature Re: [新闻]抛废考监不必修宪柯文哲:不提名、停预算win8719 Re: [讨论] 为什么几个人讲话需要三百多万制作费？windom [黑特] 改成台湾就好像尼德兰改回荷兰Supasizeit Re: [讨论] 挺以色列就是支持侵略他国h80733 Re: [讨论] 离岸风机被小犬台风吹倒了没?yychiuchang