PTT
Submit
Submit
选择语言
正體中文
简体中文
PTT
Python
[问题] word2Vec 自然语言处理 中文语料库
楼主:
zero0o0o8279
2017-07-06 14:50:05
最近在研究sentiment analysis
练习了一下如何使用word2vec
可是大多数范例好像都是用英文的
想试试看中文的效果如何,不知道有没有已处理好的中文语料库可以使用,
还是都要自己先收资料,做好断词等等处理才行呢?
小的刚入门还不太懂,若讲到的词有观念错误或是奇怪的地方还请各位高手多多指教~
作者: hsnuyi (羊咩咩~)
2017-07-06 15:00:00
中研院有词库 有人把它抓下来整理好 放在github上 断词的话 以前是都用jieba 现在好像有更好的
作者:
BigBank
( )
2017-07-06 15:31:00
用维基百科去处理
楼主:
zero0o0o8279
2017-07-06 15:42:00
有找到中研院的可是连结好像都挂了 再去github看看维基的话 不太懂要怎么处理那个原始档 可以指点一下方向吗
作者:
a75468
(GB Lin)
2017-07-06 16:08:00
https://github.com/zake7749/word2vec-tutorial
作者:
minikai
(一肚子拐)
2017-07-06 23:50:00
最近公司也在处理中文断词 真的有比Jieba好用的吗?
作者: hsnuyi (羊咩咩~)
2017-07-08 01:50:00
我是在p2看到的 可是我最爱很多个 一时找不到...
作者:
dppman
(*^o^*)
2017-07-08 19:18:00
可以分享一下GitHub 上整理的中研院的资源吗?
作者:
bluecadence
(Maxwell's demon)
2017-07-08 20:00:00
我记得中研院的词库要收钱了 如果没记错的话
作者:
Shane7
(轩柒)
2017-07-14 17:33:00
中文维基百科 再自己断词
继续阅读
[问题] 命令列数学排版的问题
LessonWang
[问题] python 编码
gn301046
[问题] 输出到档案时数据不完全
dogs1231992
[问题] 请问一个在matplotlib 显示中文的问题
MrPanda
[问题] CIFAR-10, ImageNet dataset 格式
dppman
[问题] 呼叫C 函式的问题
vgy
[问题] 网页定位卡关
yimean
[问题]复数 浮点数 有理数的一些问题
LessonWang
[问题] BeautifulSoup select class filter
cocoaswifty
[问题] AttributeError:..has no attribute 'ENTER'
yimean
Links
booklink
Contact Us: admin [ a t ] ucptt.com