笑死!你连开源意思都搞错,难怪鸡同鸭讲
开源是指系统开源可不包括训练资料开源
而这种抓取他人资料来从事训练的行为
在国外被称为Webcrawler网络爬虫,至少牵涉到下列几种法律问题
1. 著作权侵害
著作权法保护原创性之著作,而美国著作权法除了要求受保护之著作必须原创性之外,尚
必须附着于一定媒介物。2007年美国联邦第九巡回上诉法院在Perfect 10, Inc. v.
Amazon.com乙案中,指出电脑内存、网络服务器都是一种媒介,因此附着于内存
或服务器的软件程式码,如有原创性,亦可受著作权保护。
网页上之具有原创性的著作内容物受到著作权保护,因此未经授权爬取网页上之受保护之
著作内容,将构成侵害网页内容之著作权,并无疑问。
2. 违反使用者条款
多数商业网站均订有使用者条款,以规范到访和或使用网站之条件,用户必须根据对这些
条款之约定到访或使用网站。尽管,网页爬取行为展现科技的新用途,然而这种行为可能
因为使用者违反使用者条款以抓取网页资料,因而引发违反使用者协议之争议。
多数情况下,目标网页主张网络爬虫违反使用者条款之举证责任,往往较主张著作权侵权
之举证责任为高。后者,网页抓爬之目标网页仅须证明为网页所有人与抓爬标的为受著作
权保护之标的已足。证明违反使用者条款,网页抓爬之目标网页不但须证明使用者条款具
拘束力且可执行、且必须证明抓爬的行为违反适用者条款、以及抓爬行为构成目标网页之
损害。
2007年在Southwest Airlines Co. v. BoardFirst, LLC案,被告BroadFirst的软件提
供一项商业服务,以协助西南航空的客户,利用西南航空公司的“开放”座位政策与办理
登机手续(check in)以获得飞机优先座位之利益。在本案由于网页的使用者条款用语明
确限制网页使用者作为非个人与商业用途之使用,因此,法院认为被告的行为属于使用者
条款所欲规范的范围且与条款之内容直接相关,因此不同意被告主张该使用者条款欠缺明
确而无执行力。本案审理之德州地方法院,因而判定被告BoardFirst使用西南公司网页之
行为,已违反了西南航空的网页中使用者条款,因为条款禁止使用者利用网页为个人与非
商业目的用途(personal and non-commercial purpose)。
3. 电脑诈欺与滥用
美国法院认为网络爬取行为如果违反网站使用者条款,同时可能违反电脑诈欺滥用法案(
Computer Fraud and Abuse 简称CFAA),该法案禁止“未经授权”或“逾越授权”进入
电脑、网络、服务器或数据库。一般而言,只要电脑是公开可进入,并且不受密码或其他
保护安全措施,法院拒绝认定网络爬虫任何造访网页行为违反CFAA。然而当网络爬虫进入
受保护之网页,且网页透过技术措施防止未经授权之进入网页,或有明确停止未经授权之
警告通知,则有可能构成违反CFAA法案。以下有2案涉及进入网页抓取资料是否违反CFAA
为审理。
4.不公平竞争之违法行为
2022年9月,公平交易委员会(下称公平会)以公处字第111070号处分书,将抄袭竞争对
手网站及APP经蒐集整理之资料而混充为自身网站及APP内容之行为,认定为榨取他人努力
成果而足以影响交易秩序之显失公平行为,违反公平交易法第25条规定并处以罚锾
原告北京某信息技术有限公司诉称,其运营的某网站主要服务汽车消费者投诉受理,消费
者在网站提交针对汽车质量问题的投诉后,网站会与汽车厂商联系并督促解决。自2014年
成立以来,该网站已累计处理了约39万条消费者投诉信息,建立起了包括消费者投诉处理
、汽车产品缺陷问题检测等为一体的服务体系。
2021年6月,原告发现,被告北京某公司运营的网站中有52000余条消费者投诉信息与
原告网站展示的信息相同或者近似,且投诉日期均晚于或等同于原告网站上的日期,部分
投诉信息的附图中甚至还带有原告水印。此外,被告网站显示的投诉编号数量超过11万,
但无处于该网站投诉流程中“完成”状态的投诉信息,原告认为,被告网站的投诉数量及
处理进展均为虚构。原告遂将被告诉至法院。
法院经审理认为,原告主张权利的5万余条用户投诉信息系经过长期经营、管理、维
护而形成的数据信息,能够给原告带来特定的社会效益和经济效益,属于其市场竞争优势
,应当受到法律保护。被告在其网站中使用原告网站5万余条投诉信息的行为,本质上是
不正当利用原告网站投诉信息、违法将该信息据为己有的行为,违反了诚实信用原则和公
认的商业道德,给原告造成了实际损失,应当适用反不正当竞争法一般条款予以规制。此
外,被告在其网站虚构投诉数量及处理进展等行为,容易造成相关公众对其网站经营规模
、影响力、服务效率产生误认,亦构成虚假宣传的不正当竞争行为。最终,法院判决被告
停止涉案不正当竞争行为、消除影响,并赔偿原告105万元。
※ 引述《dakkk (我是牛我反刍)》之铭言:
: OpenAI的open不也就是开源的意思
: 从openAi获取资料来建自己Ai到底有什错?
: 我们所有人也都是站在前人的巨人肩膀往前看
: 不晓得在不爽什么