Re: [新闻] OpenAI:已掌握DeepSeek盗用模型证据

楼主: treasurehill (宝藏岩公社及资源应用上)   2025-01-30 12:14:50
其实这种抓取他人数据再行训练行为绝对是违法的
就连中国自己的人民法院判决都认为这种盗用他人网站数据的行为构成不正竞争
我是不知道一旦追诉起来,中国还有什么脸面对美方的指控
这铁定会成为下一波贸易制裁的主要争点
http://yn.people.com.cn/BIG5/n2/2022/0330/c361322-35199254.html
法院经审理认为,原告主张权利的5万余条用户投诉信息系经过长期经营、管理、维护而
形成的数据信息,能够给原告带来特定的社会效益和经济效益,属于其市场竞争优势,应
当受到法律保护。被告在其网站中使用原告网站5万余条投诉信息的行为,本质上是不正
当利用原告网站投诉信息、违法将该信息据为己有的行为,违反了诚实信用原则和公认的
商业道德,给原告造成了实际损失,应当适用反不正当竞争法一般条款予以规制。此外,
被告在其网站虚构投诉数量及处理进展等行为,容易造成相关公众对其网站经营规模、影
响力、服务效率产生误认,亦构成虚假宣传的不正当竞争行为。最终,法院判决被告停止
涉案不正当竞争行为、消除影响,并赔偿原告105万元。
而且就算在法律上的追诉行为无效,拥有数据所有权者也不是没有反制的方法
他只要在输出的数据上加上隐密的干扰讯息即可
这样就会严重影响直接抓取数据来进行训练者的训练结果的正确性
这招在之前的商业数据库就常常被使用
不管是明码或浮水印都可为数位识别的足迹追踪
在AI时代更可以用此手段来干扰抓取资料者的训练成果
让他GIGO
别别这种蒸鰡效果是基于原有资料的基础上加工
如果原本的资料无法回答的问题
蒸鰡出来的结果也不可能超越
所以这种抄袭手法最多只有短期功效,长期来说是不可能超越数据拥有者的
顶多满足一下民族自信心而已
※ 引述《VXcc (挖靠是逆风)》之铭言:
: https://imgur.com/7jQICgp
: Deepseek主打就是蒸馏法,就是高效的AI抄袭工具
: 哥尔D系柯 不只要抄,还要开源
: 开起来大抄袭时代
: 人人有600万就能参加慈善AI抄袭大赛
: 目的也很简单就是对付美国的AI封杀
: 一来减少对硬件的需求
: 二让认真发展算力的AI都像个白痴,人人都可以抄
: 投入再多,轻轻松松就能被学走8成功力,减少投资者继续投资的意愿
: 美国都封锁中国的AI发展,你觉得他会在意抄不抄吗

Links booklink

Contact Us: admin [ a t ] ucptt.com