[闲聊] 哈利波特成为AI界学习用普世圣经

楼主: STAV72 (刁民党党务主委)   2023-12-27 19:35:26
AI:赞颂万母之母莉莉丝,智慧之果的恩赐者\[J.K. 罗琳]/。
话说回来如果偷偷换成哈缀本不知道会发生什么事?
https://technews.tw/2023/12/27/harry-potter-in-ai-researches/
学术界超夯!研究人员最爱用《哈利波特》衡量 AI 技术理解成效
作者 林 妤柔 | 发布日期 2023 年 12 月 27 日 12:37
学术界超夯!研究人员最爱用《哈利波特》衡量 AI 技术理解成效
J.K. 罗琳的《哈利波特》在全球造成轰动,现在学术界正使用这套畅销书来测试生成式
AI 系统如何学习和提供资讯。
根据彭博社报导,越来越多研究人员利用《哈利波特》来试验生成式 AI 技术,因为该系
列影响力深远,书中又有广泛的语言数据和复杂的文字游戏。透过回顾《哈利波特》一系
列研究和学术论文,能了解 AI 前沿研究,以及该技术面临的最棘手问题。
最近在论文〈谁是哈利波特?LLMs 近似反学习〉(Who’s Harry Potter? Approximate
Unlearning in LLMs)中揭露大型语言模型(LLM)选择性遗忘讯息的新技术。由于 AI
聊天机器人建立在大量线上数据上,可能包括受版权保护的资料和有误内容,导致 AI 公
司面临侵权诉讼或大众监督问题。
因此这篇论文作者、微软 Azure 技术长 Mark Russinovich 和 Ronen Eldan 已证明,可
对 AI 模型进行修改或编辑,删除任何有关《哈利波特》一书中存在的知识,包括人物和
情节,而不会影响 AI 系统的整体决策和分析能力。
Russinovich 和 Eldan 表示,之所以选择《哈利波特》是因为他们耳熟能详。
Russinovich 表示,“研究界会更容易评估我们的技术所产生的模型,并亲自确认内容确
实已经被‘消除学习’”。
另项研究中,西雅图华盛顿大学、加州大学柏克莱分校和艾伦研究所的研究人员开发新语
言模型“Silo”,可删除数据以降低法律风险。不过他们在稍早发布的论文中提到,如果
只在版权过期书籍或政府档案等低风险文本上进行训练,模型性能会明显下降。
为深入研究,研究人员利用《哈利波特》来研究单篇文本是否影响 AI 系统性能。他们创
建两个资料储存库,即网站和文档的集合。第一个资料储存库包括除了《哈利波特》第一
部以外所有已出版书籍;另个数据库包括除第二部以外的所有系列书籍,以此类推。
研究人员发现衡量 AI 模型的准确性标准时,当《哈利波特》从资料储存库中移除,困惑
度会变更加严重。
在开放存取的科学研究数据库 arXiv 上,与《哈利波特》有关的最新论文包括〈霍格华
兹魔药开发的机器学习〉(Machine learning for potion development at Hogwarts)
、〈大型语言模型与《哈利波特》的相遇〉(Large Language Models Meet Harry
Potter)和〈用基于 Transformer 模型的人工智能检测奇幻文学中的咒语〉(
Detecting Spells in Fantasy Literature with a Transformer Based Artificial
Intelligence)。
AI 研究引用《哈利波特》至少已有十年之久,但随着学术界和技术专家将重点放在能处
理自然语言并给出相关答案的 AI 工具上,情况变得越来越普遍;即使不是研究的核心内
容,《哈利波特》也是研究人员最喜欢参考的文学作品。
Researchers Have a Magic Tool to Understand AI: Harry Potter
(首图来源:pixabay)
作者: s175 (ㄏㄏ)   2023-12-27 19:36:00
ai:你再使用禁止字,我就对你索命咒
作者: vin850411 (BlackBear)   2023-12-27 19:37:00
SJW:你说谁的《哈利波特》
作者: ymsc30102 (囧脸葱)   2023-12-27 19:38:00
到处都是梅林的胡子
作者: hutao (往生堂买一送一)   2023-12-27 19:51:00
这些论文标题真的很像哈利里的书名w

Links booklink

Contact Us: admin [ a t ] ucptt.com