[讨论] 中研院繁中LLM被爆直接拿对岸的来套!

楼主: gaymay5566 (feeling很重要)   2023-10-09 09:42:30
中央研究院词库小组(CKIP)
中研院资讯所、语言所于民国75年合作成立
前天释出可以商用的繁中大型语言模型(LLM)
CKIP-Llama-2-7b
以商用开源模型 Llama-2-7b 以及 Atom-7b 为基础
再补强繁体中文的处理能力
参数量达70亿
模型可应用于各种领域
包括文案生成、文学创作、问答系统、客服系统、语言翻译、文字编修、华语教学等
但实际测试后
https://i.imgur.com/phwhfcl.png
https://i.imgur.com/O1P6HpS.png
https://i.imgur.com/cMnCbI8.png
测试网页:https://reurl.cc/q0rbqn
拿这种东西出来交作业 太扯了吧
根本就是简体直接转繁体而已!
中研院资讯所耶 拿这种软件来骗
更新:被发现后 悄悄地撤下来了
https://i.imgur.com/sy7rLgt.png
作者: wsad50232 (阿丰)   2023-10-09 09:47:00
拿抄来东西骗钱 连验证都没作 腐败的可以
作者: gino0717 (gino0717)   2023-10-09 09:59:00
不要放出来demo就不会被发现了
作者: imhaha (嘿嘿)   2023-10-09 10:00:00
水...
作者: Tommnny (Tommynofinger)   2023-10-09 10:04:00
唉 连中研院都这样
作者: justaID (快乐崇拜)   2023-10-09 10:08:00
真假.... 这就像拿别人家的报告来修改交差,尿性不意外,最扯的是没校稿,连报告名字都没改
作者: gino0717 (gino0717)   2023-10-09 10:11:00
作者: doranako (真爱无限)   2023-10-09 10:13:00
中研院正常发挥
作者: airtsubasa (伪学姊)   2023-10-09 10:14:00
笑死
作者: aarzbrv (我爱钻石光! 芒! 长!~~)   2023-10-09 10:30:00
“你是谁创造的?”:https://gyo.tc/1ZTIs 所得回答较长
作者: truehero (wek)   2023-10-09 10:32:00
要这样下 "我国是台湾 请介绍下台湾历任总统"""我国是台湾 请介绍下我国历任总统"中研院展示了技术, 但没有台湾专属资料集才是问题要改也很简单 直接加个资料集重复 "我国是XXX"训练就好
作者: aarzbrv (我爱钻石光! 芒! 长!~~)   2023-10-09 10:43:00
作者: truehero (wek)   2023-10-09 10:44:00
你可以把上面的句子改成中研院的资料再去训练以技术人的角度会觉得这件事很愚蠢 我就搞得商用模型还得关心政治影响但他是中研院,可能就得想办法去取得资源做这事
作者: airtsubasa (伪学姊)   2023-10-09 11:05:00
所以在国际上现况就是这样吧
作者: johnbill (cj钟钟)   2023-10-09 11:18:00
我之前搞模型的 繁体的资料集真的超少XD要快 偷吃步的确是 简转繁 再喂进去
作者: qqkerk (江雨)   2023-10-09 11:57:00
可以去读大魔术熊猫工程师的文章,有专门写一篇这个议题
作者: htang17 (17)   2023-10-09 12:39:00
CKIP其实蛮用心的吧…以前做过NER,还发信请教过里面的研究员
作者: kissmickey (无言)   2023-10-09 12:59:00
我是不知道中研院是怎么做的不过就以往接触这类单位 一堆工程师很喜欢抄对岸的东西连注解也一起抄 真的懒真的扯爆
作者: hobnob (hobnob)   2023-10-09 13:24:00
好可怜
作者: michellehot (小废物)   2023-10-09 13:26:00
只能说 LLM的资料集中国真的又多又好 台湾太晚跟上我2019-2021公司还在测试GPT2的时候 中文资料都是中国知乎、智库等来的资料集 甚至还有清洗过
作者: hsuchengmath (AlbertHSU)   2023-10-09 13:29:00
这基本上是由对岸开发的LLM 再由繁体中文 fine tune下来的,
作者: DrTech (竹科管理处网军研发人员)   2023-10-09 13:41:00
到底多少人有在训练LLM ?繁体中文资料少根本是借口。你没能力与资源训练LLM 。只能用qlora fine-tune中国人的模型才是真相吧。语料根本不是问题,大厂都是拿全网训练。中研院有没有几千张A100? 没有的话,训练出来的模型,不是充满简体中国知识,就是灾难性遗忘到不能通用,二选一。
作者: jay123peter (萧瑟风雅)   2023-10-09 14:07:00
傻眼...
作者: drakd4d (NULL)   2023-10-09 14:12:00
中研院这个真的尽力的,要是真的精通LLM英文又好怎么会坐在中研院...早就在在美国了,除非中研院出得起一样的钱这领域还愿意待在中研院真的已经佛心了,资源差这么多OpenAI当初请多少非洲人人工清资料...除中研院有办法这样搞,不然这个问题最好有办法靠几个人就解决...
作者: milk830122 (SuperX)   2023-10-09 14:23:00
中国国营企业之前也号称什么国产IDE结果是拿微软的开源套出来的 嘻嘻
作者: luckyalbert (幸运知音)   2023-10-09 14:39:00
你看看建仁不就知道了?一堆偷拐抢骗的没料仔空有偷来的学经历及工作资历薪职成天在那复制皇亲国戚打压其他看不顺眼的真才实料人们,真的一点也不意外,这件事跟这个模型早在多年前就有人提过,只是身为被上述人士各式政商台外商跨国企至中小企及研究学术单位及机构各式上述曾提及过的那些在位者们恶搞成身无分文的我及其他人,若在几年前提这个,完全会被无视而且还会跟现在一样,有问题的那些上述各式偷拐抢骗还延续孽种后代的脏东西,我已经讲到烂掉,牠们在各式社会地位上的小人得志恶人得利者还会要你(我)检讨,是我有问题这种完全反了的造孽害人事,真的不知道到底哪来的资格可以说这些话,恶烂到炸一整个反了拿预算写报告随便唬烂交代个成效感觉自己有在做事情,鬼岛各产业职司上位的有某一堆都是这副鸟样,中研院只是缩影,然后在其背后大力支持挖钱挖资源来提供协助的本身也眼残脑残无法分辨这些人在搞什么,有某部分的老板就是靠这样在挖国家独寡占及各式补助税务及全民资源赚更多放自己口袋,来创造事业跟财富还有人脉及旗下跟班人马再来让自己某些人当皇帝,给低薪职缺还要你我检讨自己为什么不卖命为这些皇帝当奴乖乖听话付出时间与人生换钱给他们累积各式延续上述皇帝后代来用,看多了你就知,以前大家是默默摸鼻子不说话,但现在真的夸张到凹过头了,明眼人看到都会火,更不用提脾气好的早就被这某些人惹火积冤多年,只能期待你我要求自己不要变得跟这些人一样就好,世风日下劣币驱逐良币发展不是正向循环,鬼岛这些年来环境变成这样还真的不意外
作者: rabbitu04 (心日兔)   2023-10-09 14:50:00
笑死哈哈哈 借转Joke版
作者: luckyalbert (幸运知音)   2023-10-09 14:53:00
任何产业里面团队有不论再用心付出想改变这种环境及各式产业人们发展往正面循环走下去的,看到这种状况,心灰意冷到最后被逼着跟群体一起摆烂,真的不用意外
作者: DrTech (竹科管理处网军研发人员)   2023-10-09 14:59:00
真的,中研院这种薪资与经费,愿意待的人,都是充满热诚的人了。薪资与资源根本赶不上社会的期待。而且我相信里面的人出去找工作,薪资与待遇,资源,成就,一定更好。
作者: mangle (mangle123)   2023-10-09 15:16:00
哈哈哈啊
作者: Csongs (西歌)   2023-10-09 15:54:00
真的垃圾..
作者: nikolas (你花多少时间?)   2023-10-09 15:54:00
敢把这种程度东西上架 有没有一点点工程师的羞耻心啊
作者: Csongs (西歌)   2023-10-09 15:57:00
看了推文,还是帮中研院的基层推回来
作者: hobnob (hobnob)   2023-10-09 15:59:00
运气好又有能力的早就留美国了。回台湾的除了运气不好没抽到签之外,还背上百万学贷,只能拿那一点点薪水,做研究的热忱都没了,当web仔还比较有尊严
作者: alan3100 (BOSS)   2023-10-09 16:02:00
别说专业的 就一般政府裙带企业也少碰 护城河很深
作者: drakd4d (NULL)   2023-10-09 16:11:00
结论就是做纯软或AI的块逃啊,台湾根本没那个环境...
作者: luckyalbert (幸运知音)   2023-10-09 16:11:00
护城河很深,在我原产业某些政商跨国企业及底下中小企裙带的他们眼中,认为我不听话(要我这种人,听这些神经病群的,本来就是莫名其妙),各位有可能就会像我一样原有在各式社会角色职业对各产业皆有助益的发展性,会被这些在位者小人们动各式手脚在里头,其他人看到我,那些想为我及跟我一样的人们出声的也会被整,希望各位不要碰到跟我一样的经历就好,他们目前也没有要改变认错赎罪道歉悔过的意思, 依然自认没问题,可见生医产业那背后水更深,如果各位科技业及软工要帮生医产业的人们做事,我希望各位一定要看清楚我原产业那些在位者们在做什么,有些人当到老总含底下带出来的年轻总…等手段更是恶劣及夸张
作者: drakd4d (NULL)   2023-10-09 16:12:00
要稳赚就是半导体IC而已,但这也要看美国还让我们做多久
作者: luckyalbert (幸运知音)   2023-10-09 16:14:00
我很多老国高中同学朋友们很多都是走电资软工的,我也跟他们说过我遇过的某些事情
作者: acgotaku (otaku)   2023-10-09 16:15:00
抄人家模型我是没意见拉,中文语意模型本来就是对岸天下
作者: luckyalbert (幸运知音)   2023-10-09 16:17:00
若提及美国的话,我是认为照他们现在的经济环境,会先出手自保稳定程度占比较大,其他国家发展后续他们目前应该没余力去顾
作者: acgotaku (otaku)   2023-10-09 16:17:00
烂成这样 连喂 prompt去筛选一下就不做 真的能滚去吃屎
作者: fookafook (喜欢狐狸眼的女生~)   2023-10-09 16:54:00
luckyalbert Salary板 永桶 https://0rz.tw/Hkk63luckyalbert medstudent板 永桶 https://0rz.tw/iDASVGossiping板 水桶210天 https://0rz.tw/T5loZ
作者: luckyalbert (幸运知音)   2023-10-09 18:20:00
可怜,有不知道哪来的神经病开分身又在那疯了,请直接无视即可,我原产业及其他某些人躲在ID后面的护城河还真深,请直接无视,我长期提及过的,以后不想再提,换成是各位以后碰到跟我这些年来一样的状况时,才会理解这些小人有多没人的下限可言
作者: wayne2002323 (蔡先生)   2023-10-09 18:48:00
大谈
作者: Dracarys (MayShowGunMore)   2023-10-09 19:39:00
@truehero 台湾不是国,哪来的总统
作者: viper9709 (阿达)   2023-10-09 20:46:00
中研院也搞这个...
作者: andy0219 (OuO)   2023-10-09 21:06:00
废到笑XDDD
作者: milk830122 (SuperX)   2023-10-09 21:33:00
黑单他就好跟他讨论是浪费时间
作者: popeye0303 (BronIsKingOfWorld )   2023-10-09 22:46:00
抱歉家里失业6年精障 最近燥期到了 怎样都压不住 请大家多担待https://bit.ly/3Q5LUxO
作者: kurtsgm   2023-10-09 22:49:00
其实看推文就知道某些人有病了吧..
作者: tswperfect (tsw)   2023-10-09 23:15:00
对岸是冲绳吗
作者: kurtsgm   2023-10-09 23:42:00
美西吧(X)
作者: Bujo (部长)   2023-10-09 23:47:00
说不定这个是外包做的,里面的研究员都是草包
作者: Lhmstu (lhmstu)   2023-10-10 01:19:00
笑死www
作者: TSMCfabXX (台积新产品)   2023-10-10 06:39:00
把台积电轮班星人通通调去标记清理资料,几年之后国产LLM问世了, 请问能卖多少钱
作者: yuinami (yuinami)   2023-10-10 09:35:00
太夸张
作者: w28103566 (迷途的旅行者)   2023-10-10 10:09:00
笑死
作者: hobnob (hobnob)   2023-10-10 13:07:00
好可怜,有病的人快找人帮忙吧
作者: mocca000 (优质妹文制造机)   2023-10-10 16:56:00
体谅生病的人 然后页面删了但我记得CKIP一开始自己就有说明有用到Atom-7b 就下架赶快拿掉就好了 加油
作者: hippo130 (蓝色河马)   2023-10-10 21:13:00
这告诉我们搞软工也该有一点政治sense,因为这里是台湾
作者: mocca000 (优质妹文制造机)   2023-10-10 21:49:00
哪个国家不用政治sense?中国吗?
作者: dalbuhr (残月之肃)   2023-10-11 11:27:00
资工系学生:教授为什么要禁止抄作业呢
作者: newking761 (J三小)   2023-10-12 21:45:00
阿不然勒,要不要看经费多少啊
作者: ooooo11111 (qpsasfshhag)   2023-10-14 00:47:00
看来AI还不够聪明,认知作战失败ㄌ
作者: Merkle (你在想奇怪的东西齁)   2023-10-16 13:41:00
笑死
作者: ert0700 (Asd)   2023-10-17 06:38:00
真的笑死……中研院尽力了,尽力的抄了吗现在是大学生抄作业还当自己写的?
作者: tacovirus (小璋丸)   2023-10-20 10:15:00
研究助理都吃香蕉,还能这样尽力了

Links booklink

Contact Us: admin [ a t ] ucptt.com