[新闻] 拒训练AI 新闻媒体封杀ChatGPT VVin PTT批踢踢实业坊

[新闻] 拒训练AI 新闻媒体封杀ChatGPT

楼主: VVin (VV) 2023-08-26 23:42:00

拒训练AI 新闻媒体封杀ChatGPT
https://img.ltn.com.tw/Upload/news/600/2023/08/26/133.jpg
萤幕上显示生成式人工智能机器人ChatGPT和开发公司OpenAI的标志。（法新社档案照）
2023/08/26 05:30
〔编译管淑平／综合报导〕
生成式人工智能机器人ChatGPT的资料取用愈加受到争议，包括纽约时报、有线电视新闻
网（CNN）、路透及澳洲广播公司（ABC）知名新闻机构，都已封锁开发ChatGPT的OpenAI
，利用网络爬虫程式撷取其网站内容，用于训练AI系统。
英国卫报廿五日报导，OpenAI的网络爬虫程式“GPTBot”会扫描网页，收集资料，用于AI
大型语言模型以及内容生成。科技媒体“Verge”披露纽时封杀GPTBot的消息后，卫报进
一步发现，包括CNN、路透、芝加哥论坛报、澳洲广播公司（ABC）和澳洲社区新闻集团（
ACM）也都已禁止网络爬虫在其网站抓取资料。
从这些网站的robots.txt档案中可见允许网络爬虫程式造访哪些页面的程式码。报导指出
，这些新闻媒体都是在八月加入封锁指令，除了ChatGPT，也不让同样用于AI的开放网络
数据库Common Crawl的网络爬虫CCBot访问网页。
像ChatGPT所用的大型语言模型，仰赖收集庞大资讯来训练，使其能够以类似人类语言模
式回答使用者的问题，但是运作这些AI机器人的公司，对于其数据库中储存有版权内容的
问题，都紧守口风。
吁为生成式AI制定规范
CNN向澳洲版卫报证实，近期封锁了GPTBot的访问权。路透发言人说，“智慧财产是我们
业务的命脉，我们势必要保护我们的内容版权”。纽时发言人说，网站服务约定条款最近
更新，“更清楚表明禁止抓取我们的内容，用于AI训练和开发”。
ChatGPT刮起生成式人工智能机器人旋风后，全球新闻机构都正面临是否使用人工智能于
新闻收集，以及其新闻内容可能会被收集用于训练AI的问题。法新社和Getty Images等新
闻、出版组织日前才签署公开信，呼吁为生成式AI机器人制定规范，包括“生成AI模型所
用训练的所有内容透明度”，以及使用有版权内容，须取得版权所有人同意等。
https://news.ltn.com.tw/news/world/paper/1601432

继续阅读

[新闻] 普里格津座机非飞弹击落VVin [新闻] 绝不屈服川普帐号复活首PO口卡照VVin [新闻] 中国放弃清零2个月超额死亡近200万人VVin [新闻] 菲澳南海两栖攻击演习模拟夺岛VVin [新闻] 莫习会互释善意缓和边境对峙VVin [新闻] 雨水短缺酿干旱巴拿马运河限航令维持一年hvariables [新闻] 拜登政府跨大西洋五国商议机制纳入意大利hvariables [新闻] 阿根廷入金砖国家政商反应两样情hvariables [新闻] 中国债务传9兆美元压力大 skyhawkptt [新闻] 沙特要建核电站或以称采中国竞标向美施压skyhawkptt