Re: [FB] 创世神ptt:乡民自制五毛大数据分析

楼主: VXcc (vX)   2018-10-15 01:24:20
※ 引述《cgi0911 (胜者的迷思)》之铭言:
: 最近有些网络安全厂商在推一种人工智能的“写作风格分析”。
: 买帐号不难,要雇用少数人去操作几千上万的帐号,甚至是二十四小
: 时轮班驻点玩舆论轰炸都不难。
: 但是有一个东西是几乎无法被复制的,那就是写作风格。
: 我记得这几天有些耐人寻味的新闻。一个是参议员马侃过世时,纽约
: 时报上发表了一篇纪念马侃、批评川普的匿名投书。结果有研究者把
: 这篇投书丢去做写作风格分析,发现这篇文章的写作风格竟然跟副总
: 统彭斯(或是他的文胆,whatever)非常相似。一时引发喧然大波。
: 另一个比较没那么新的新闻是,中国有人把《红楼梦》一百二十回丢
: 下去做一个简单的词语频率分析。结果得出了前八十回和后四十回确
: 实是不同人的写作风格,从旁佐证了“前八十回出自曹雪芹、后四十
: 回是高鹗所续”的假说。
400好友还不用担心啦
http://news.ltn.com.tw/news/world/breakingnews/2546591
那篇文章是因为使用罕见词汇才会被认为和彭斯是同一人啦
还是人类抓的
这种抓法和泥巴战没啥区别
根本没一刀毙命的证据
就算给AI抓
除非他能把全世界的文章都蒐集起来
不然也难以证明是某一人发的
更别说文风是可以模仿
除非你要写小说几十万字
那另当别论
嘻嘻
: 我不是机器学习专家,但上述的分析技巧并不难,而且日益精进。如
: 果我们用爬文机器人,把批踢、脸书和水管上面数以万计的推文丢进
: 去分析,说不定会有一些有趣的发现呢?
: 把新闻转贴或“1124灭东厂”这种已经成为复制贴上的口号先剃
: 除掉不管,专挑长度够长的推文来看,我们会不会发现,同一个帐号
: 底下出现好几个不同的写作风格(意味着这个帐号有好几个人在轮班
: 使用),或是成千上万个帐号连结到同一个写作风格(意味着一个写
: 手操作好多个帐号),甚至是公关公司的暗稿呢?
: 如果版上有擅长机器学习且愿意投入时间的朋友,说不定可以往这个
: 方向去探索看看。

Links booklink

Contact Us: admin [ a t ] ucptt.com