[问题类型]:
程式咨询(我想用R 做某件事情,但是我不知道要怎么用R 写出来)
[软件熟悉度]:
新手(没写过程式,R 是我的第一次)
[问题叙述]:
我有30个用结巴断词后的txt档,想要使用tm包做文字探勘
问题在我没有办法让读进来的档案断开成一个一个干净的词
都会变成以下情况
" target="_blank">" class="img-responsive" />输入到tm包里的Corpus之后无法清除空白
尝试用过Rwordseg包里的segmentCN和strsplit都不行
[程式范例]:
http://ideone.com/imbirW
[环境叙述]:
R version 3.3.1 (2016-06-21)
Platform: x86_64-w64-mingw32/x64 (64-bit)
Running under: Windows >= 8 x64 (build 9200)
[关键字]:
文字探勘 tm