Re: [闲聊] AI翻译484比机翻顺?

楼主: tsubasawolfy (悠久の翼)   2023-07-29 19:57:05
: 大意就是顾及语言和文化的差异无法直译
: 它就直接用另一个语言写新故事
: 总之AI是会以可读性为优先 自己再创作或加油添醋的
: 跟机翻那种逐字逐句对照可以方便校阅或学习单字是完全两种概念
这比较像ChatGPT的翻译跟上一世代的机器翻译的世代差异
chatgpt使用的是两种语言之间的机率相似度去重组,换言之你可以把它看作
它知道两种语言的...本质? 然后透过本质去转换后输出。
直接用这个影片内的图解释
https://youtu.be/hph9OeKjg3w?si=rIi1yUkjZfgM_W4j
这部影片是在讲能不能用ChatGPT能不能让我们跟鲸鱼对话
里面有提到上一世代的机器翻译(已经用了机器学习的翻译机)
https://i.imgur.com/LNph0hM.png
两种语言的翻译需要一个编码器跟解码器
左边的编码器先把This dog is black转换成对应向量(数值)
https://i.imgur.com/pJVUfyX.png
然后再把这些数值经过法语的解码器转换成相对应的法语 (逐字逐句翻)
https://i.imgur.com/M2wNu3Y.png
https://i.imgur.com/aJNMJ0c.png
但是这种方法需要你已经了解另一个语言后,才能做出相对应的解码器
就像罗塞塔石碑那样,别人已经帮你刻好相对应的语言转换在上面
如果要拿来翻译鲸语是不可能的,所以它们才想用ChatGPT的方式
chatgpt一样是各语言都拆解编码转换成数值,依照出现频率跟相对应机率做出文字云
https://i.imgur.com/Fs5WjjN.png
https://i.imgur.com/2JgWkBj.png
然后把这些文字云叠在一起,找出两种语言高度重叠区域,再进行A语言转换成B语言
当然转换输出的语言也要根据该语言的游戏规则(对GPT来说是排列组合不同)去输出
https://i.imgur.com/pByVDWZ.png
https://i.imgur.com/o38Zib7.png
我觉得这种找出语言之间高度相似处转换,就有点像找出那句话的本质??
例如 桌上有一颗苹果 代表你说的就是桌子上有一颗苹果在那边的这个情境or事实
然后把这个事实用不同语言描述一次,而不是传统的点对点的逐句机器翻译
但是这种方式就是需要大量的语言文字去搞出那个 文字银河系 (不是云等级)
回到那个影片
所以想要用这种方式去翻译抹香鲸鲸语是有可能,多亏冷战已经收集了很多年的海底声音
但是但是这是各种鲸鱼的资料,还要先过滤出各种鲸鱼的叫声才有可能建立
抹香鲸自己的鲸语银河系去翻译成人类语言
作者: LawLawDer (肉肉的)   2023-07-29 20:03:00
好屌…
作者: Wardyal (Wardyal)   2023-07-29 20:05:00
你鲸鱼语言的Dataset没正确的Label怎么训练所以靠出现机率就能得出意思吗
作者: reader2714 (无毁的湖光)   2023-07-29 20:06:00
好像也有要把dna编码当作语言去翻译的研究
作者: labbat (labbat)   2023-07-29 20:13:00
无label就unsupervised呗
作者: smart0eddie (smart0eddie)   2023-07-29 20:18:00
人跟鲸鱼的认知会一样吗
作者: cloki (夜云天)   2023-07-29 20:36:00
就不管认知一不一样直接用实际存在的频率数据去练吧先把那些东西分群然后再进一步训练去提高准确率
作者: longlongint (华哥尔)   2023-07-29 21:17:00
可以做出能跟鲸鱼对话的AI 但人还是不懂只好把小孩送进去一起从小学鲸鱼雨
作者: smart0eddie (smart0eddie)   2023-07-29 21:28:00
认知不一样你两群就不一样啊

Links booklink

Contact Us: admin [ a t ] ucptt.com