[问题] word2Vec 自然语言处理 中文语料库

楼主: zero0o0o8279   2017-07-06 14:50:05
最近在研究sentiment analysis
练习了一下如何使用word2vec
可是大多数范例好像都是用英文的
想试试看中文的效果如何,不知道有没有已处理好的中文语料库可以使用,
还是都要自己先收资料,做好断词等等处理才行呢?
小的刚入门还不太懂,若讲到的词有观念错误或是奇怪的地方还请各位高手多多指教~
作者: hsnuyi (羊咩咩~)   2017-07-06 15:00:00
中研院有词库 有人把它抓下来整理好 放在github上 断词的话 以前是都用jieba 现在好像有更好的
作者: BigBank ( )   2017-07-06 15:31:00
用维基百科去处理
楼主: zero0o0o8279   2017-07-06 15:42:00
有找到中研院的可是连结好像都挂了 再去github看看维基的话 不太懂要怎么处理那个原始档 可以指点一下方向吗
作者: a75468 (GB Lin)   2017-07-06 16:08:00
作者: minikai (一肚子拐)   2017-07-06 23:50:00
最近公司也在处理中文断词 真的有比Jieba好用的吗?
作者: hsnuyi (羊咩咩~)   2017-07-08 01:50:00
我是在p2看到的 可是我最爱很多个 一时找不到...
作者: dppman (*^o^*)   2017-07-08 19:18:00
可以分享一下GitHub 上整理的中研院的资源吗?
作者: bluecadence (Maxwell's demon)   2017-07-08 20:00:00
我记得中研院的词库要收钱了 如果没记错的话
作者: Shane7 (轩柒)   2017-07-14 17:33:00
中文维基百科 再自己断词

Links booklink

Contact Us: admin [ a t ] ucptt.com