[新闻] 拒训练AI 新闻媒体封杀ChatGPT

楼主: VVin (VV)   2023-08-26 23:42:00
拒训练AI 新闻媒体封杀ChatGPT
https://img.ltn.com.tw/Upload/news/600/2023/08/26/133.jpg
萤幕上显示生成式人工智能机器人ChatGPT和开发公司OpenAI的标志。(法新社档案照)
2023/08/26 05:30
〔编译管淑平/综合报导〕
生成式人工智能机器人ChatGPT的资料取用愈加受到争议,包括纽约时报、有线电视新闻
网(CNN)、路透及澳洲广播公司(ABC)知名新闻机构,都已封锁开发ChatGPT的OpenAI
,利用网络爬虫程式撷取其网站内容,用于训练AI系统。
英国卫报廿五日报导,OpenAI的网络爬虫程式“GPTBot”会扫描网页,收集资料,用于AI
大型语言模型以及内容生成。科技媒体“Verge”披露纽时封杀GPTBot的消息后,卫报进
一步发现,包括CNN、路透、芝加哥论坛报、澳洲广播公司(ABC)和澳洲社区新闻集团(
ACM)也都已禁止网络爬虫在其网站抓取资料。
从这些网站的robots.txt档案中可见允许网络爬虫程式造访哪些页面的程式码。报导指出
,这些新闻媒体都是在八月加入封锁指令,除了ChatGPT,也不让同样用于AI的开放网络
数据库Common Crawl的网络爬虫CCBot访问网页。
像ChatGPT所用的大型语言模型,仰赖收集庞大资讯来训练,使其能够以类似人类语言模
式回答使用者的问题,但是运作这些AI机器人的公司,对于其数据库中储存有版权内容的
问题,都紧守口风。
吁为生成式AI制定规范
CNN向澳洲版卫报证实,近期封锁了GPTBot的访问权。路透发言人说,“智慧财产是我们
业务的命脉,我们势必要保护我们的内容版权”。纽时发言人说,网站服务约定条款最近
更新,“更清楚表明禁止抓取我们的内容,用于AI训练和开发”。
ChatGPT刮起生成式人工智能机器人旋风后,全球新闻机构都正面临是否使用人工智能于
新闻收集,以及其新闻内容可能会被收集用于训练AI的问题。法新社和Getty Images等新
闻、出版组织日前才签署公开信,呼吁为生成式AI机器人制定规范,包括“生成AI模型所
用训练的所有内容透明度”,以及使用有版权内容,须取得版权所有人同意等。
https://news.ltn.com.tw/news/world/paper/1601432

Links booklink

Contact Us: admin [ a t ] ucptt.com