Re: [问卦] 有没有文本分析的八卦?

楼主: emptie ([ ])   2014-09-17 03:15:44
※ 引述《StubbornLin (键盘创业家)》之铭言:
恕删
: 有没有语意分析的八卦阿? 想听听 NLP (Nature Language Processing)
: 的专家有什么样的看法,用程式下去对八卦版的文章做分析应该会有很有趣的结果
其实这个我之前就写过了(想看的自己a我,不过这篇不是照着打的…有点出入是正常)
只是文章没什么人回应然后一下子就沉了…
我想说的就是PTT的设计太差
1. 文章数上限问题
我知道资源不是无限的,但是ptt跟其他论坛比起来
能找到2年前文章的机率趋近于0
PTT的八卦板,就是台湾人对任何事件的健忘之缩影
八卦板人多的时候一周可以回收掉大概10000篇文章
连data都没有是要怎么文本分析
2. 没有好的跨板讨论功能
Ctrl+X 不是很好的解决方案,
那叫做在两边发一样的东西
常有人问为什么八卦板现在一堆无关八卦的文章
就只是因为没有更适合的地方可以去而已
3. 搜寻功能很烂
完全不能搜寻内文
为了[=]阅读方便
大家回文时会 Re: 原标题
但是这样造成文章的识别度很低,
标题完全没有意义
有意义的内文却不能搜寻
4. 推文系统超级烂
推出去之后就变成作者的私产,
想删除就删除修改就修改
完全没有主体性
只有文章原作者拥有媒体权力
能推的文字数量太少
要在推文进行讨论根本是自虐
至少做到像是这样再说吧
不要只依照时间顺序排序,这根本对阅读没有帮助
像是这样的树形图+高亮表示
NetizenA : 今天晚上的八卦板不平静
NetizenB : @NetizenA 对呀
NetizenC : @NetizenB 连胜文开分身,吱吱崩溃XDDDDDDDDD
NetizenD : @NetizenB 吱吱崩溃XDDDDDDDDD
NetizenE : @NetizenB 吱吱崩溃XDDDDDDDDD
Xeonlian : 呛我呛够了没?
以上纯属范例,无关任何政党与个人。
1.3.4.这三点导致党工很好养,很难抓
2.是间接造成1.的原因
如果依照大家有事情去专版的话
以现在专版的数量如此庞大,
文章不会被碎纸机回收那么多,那么快
但是就是因为有些话题很难界定
一个General-discussion板是大家心中的渴望
这点是不会消失的。
我知道ptt一开始设计的初衷或许不是为了进行严肃的讨论设计的
也知道ptt一开始没有像现在这么多人用
我也知道ptt是个人治的地方,人非完美,制度总会出错……
但如果想要杜绝外力的干扰创造优质的讨论空间
是该做点改变了。
作者: donotpush ( )   2014-09-17 03:30:00
好像很专业 推一下
作者: alog (A肉哥)   2014-09-17 03:34:00
用ruby or python走ssh bbsu@ptt.cc就可以做机器人有些潮潮工程师会用nodejs写robot不然你可以把你怀疑是党工的人通通加入好友就可以固定扫ip或学我做一个robot扫整个线上的user定期记录ip位置方法人想的 其实没这么困难而且连中国网站都在封存八卦版的文章了你就做一个middleware解就好
作者: noneed2argue (ha)   2014-09-17 04:22:00
确实呢帮认真原PO推
作者: shevchenco (冬肥)   2014-09-17 05:59:00
其实没看懂,但是好像有道理

Links booklink

Contact Us: admin [ a t ] ucptt.com