Re: [转录] 用机器学习判定红楼梦后40回是否曹雪芹

楼主: freeunixer (御剑客)   2016-07-07 01:17:50
※ 引述《mited (太郎)》之铭言:
: 知乎:用机器学习判定红楼梦后40回是否曹雪芹所写
: https://zhuanlan.zhihu.com/p/21421723
: 所以,我们就更有信心说曹老先生没有写后40回了。
: 更多的机器学习有趣的玩法,我会在学习的过程中慢慢尝试的。以上。
→ episold: 很有趣 但是以词汇频率来推断作者 这feature太粗略了 07/06 23:36
→ episold: 再想想怎样把“写作风格”变成特征吧 07/06 23:41
在中文系,很早以前就用这种方法在探讨真伪的问题,
对于理盲滥情光嘴炮,只会喊母猪的十万酸民众来说...
啊,不是,不好意思,这里不是我的主战场.
我的意思是,对于大多数凑热闹的人来说,只看声光特效爆炸规模还有女主角有没有露,
但是对于有些坚持看门道的人来说,他们很在乎真假问题,比如说:
                  伪 经
在远古时代,没有引擎更没有网络的时候,佛经传布非常局部,
你在北京看到最新最热的佛经,有可能在闽、粤从来没听过.
有很多会是只听说有这部经,但根本不知里面写什么的情况.于是
所谓的托名伪作就会出现.
基本上这东西是这样,不信都没事,信了就麻烦,为什么,因为不能乱信.信错会出大事.
每个人都说他有一本梦遗大师译的经,结果拿出来一对,靠夭,怎么每本内容都很不一样...
这下你要怎么办?观落阴?掷爻?还是扶鸾?
跼限于时代性、地域性及个人背景,每个人会有每个人的一些翻译特性.
比如说,鸠摩罗什译的金刚经,完全没有用到 空 这个字.
     玄奘    一堆经,名词译法都跟前人不太一样,如,他不用 阿修罗 这译名.
因此,有人会用语言学的一些方法,来检视一些有争议的所谓 oo 人的译/著,
当然,这有些基本条件要满足,就是要有其它可信的作品可以参考,不然,
如果传闻某作者的著作就只有那么 101 本要辨真伪,可能还是佛、菩萨自己来比较快...
作者: rpg1234pk (giveme5)   2016-07-07 01:37:00
为什么书版要提母猪什么的,实在想嘘你...
作者: hereiam1022 (回旋舞)   2016-07-07 06:55:00
推to 1F,客观引用无须介怀。
作者: rainveil (多栗)   2016-07-07 09:30:00
作者: descent (“雄辩是银,沉默是金”)   2016-07-07 18:28:00
作者: tak1130 (他们在争什么?)   2016-07-08 06:03:00

Links booklink

Contact Us: admin [ a t ] ucptt.com