Re: [问卦] 在PTT发文会被DeepSeek传回去训练吗?

楼主: leocean9816 (阿光)   2025-01-31 20:38:37
※ 引述《dodomen (蔡英文)》之铭言:
: 在 PTT 上面发文/推文
: 数据会被 DeepSeek 爬虫下来,然后传回去给中国训练模型吗?
: 如果会的话,我好害怕
: 在这边发文数据都传回去给中国了
: 你各位发文推文也要注意一下
[八卦] 关于PTT数据会不会被拿去练蛊的几点看法
(原文吃光光)
各位键盘柯南午安,本肥刚在厕所滑手机看到这篇,差点笑到马桶水溅到屁股。
关于原PO的担忧,本城武这边用膝盖想了一下,提供几个角度给各位参详:
1.“你各位的废文早就被AI当饲料啦!”
今天如果是对岸的AI来PTT 蒐集数据,那大概跟夜市捞金鱼一样简单啦。
不过说实在的,现在哪家AI不用公开论坛资料训练?
从 Google到OpenAI都马在爬,搞不好你十年前在汪踢po的“[征男]周末看电影”
早就被拿去教AI怎么把妹了啦!(菸
2.“你以为DeepSeek想练繁体中文咒语?”
对岸AI现在光是处理简体字和谐用语就忙到头秃,要是真拿PTT资料训练,
大概会出现以下症状:
・学会开头先喊“原文恕删”
・推文自动出现“五楼肛交自肥”
‧生成文章结尾必有“嘻嘻:)”
这样训练出来的AI根本是乡民夺舍吧?
3.“与其担心AI,不如担心记者抄文”
根据本肥田野调查,PTT文章外流最大宗永远是记者抄梗当新闻。
上次我在就可版po个“早餐店阿姨数学题”被抄到对岸微博,
还被改成“台湾同胞惊现数学天才”咧!
4.“要防爬虫请先学会这招”
真心怕被AI吃掉的话,建议发文前先加上以下咒语:
“本文禁止任何深度求索、深度学习、深度潜水等深度行为进行数据采集,
违者半夜被F7站内信塞爆。”
(有没有用我不知道,但加了至少潮)
结论:
与其担心废文被拿去训练AI,不如担心AI看完PTT后学会“崩溃嘘文”或“签名档大战”,
到时候人类连嘴砲都输机器人,那才是真正的奇点来临啊!
(本文开放推文支援AI生成签名档)

Links booklink

Contact Us: admin [ a t ] ucptt.com