Re: [问题] 跑文字mining的错误讯息

楼主: psinqoo (零度空間)   2015-06-25 00:09:16
library(tm)
library(tmcn)
library(Rwordseg)
x1 <-read.csv(file.choose(),header=T)#读入资料
x2 <-Corpus(VectorSource(x1))#向量格式
x3 <- tm_map(x2, removePunctuation)#去除标点符号
x4 <- tm_map(x3, removeNumbers)#去除数字
x5 <- tm_map(x4, function(word) {
gsub("[A-Za-z0-9]", "", word)
})#清除大小写英文与数字
#inspect(d.corpus )#看内容
x6 <- tm_map(x5,segmentCN, nature = TRUE)#断词
x7 <- Corpus(VectorSource(x6))
相同问题 执行到 x7
一样出现
Error in UseMethod("meta", x) :
no applicable method for 'meta' applied to an object of class "character"
应该是升级 tm 包 后产生??
x7有谁知道这段如何改
※ 引述《nh2 (nh)》之铭言:
: [问题类型]:
:
: 程式咨询(我想用R 做某件事情,但是我不知道要怎么用R 写出来)
:
: [软件熟悉度]:
: 请把以下不需要的部份删除
: 入门(写过其他程式,只是对语法不熟悉)
: [问题叙述]:
: 请简略描述你所要做的事情,或是这个程式的目的
: [环境叙述]:
:
: mac Rstudio, R3.2
:
: corp = Corpus(DirSource("./text/combine/"))
: head(corp)
: corp = tm_map(corp, stripWhitespace)
: corp = tm_map(corp, removePunctuation)
: corp = tm_map(corp, removeNumbers)
: corp = tm_map(corp, function(word){
: gsub("[A-Za-z0-9]","",word)})
: corp = tm_map(corp, PlainTextDocument)
: corp = tm_map(corp, removeWords,stopwords("english"))
: # 中文 stop words
: stopss = stopwordsCN()
: corp = tm_map(corp,removeWords, stopss)
: # 中文断词
: corp2 = tm_map(corp, content_transformer(segmentCN))
: corp2 = tm_map(corp, content_transformer(segmentCN), returnType = 'tm')
: corp2 <- tm_map(corp, content_transformer(segmentCN), nature = TRUE)
: corp2 <- tm_map(corp, function(sentence) {
: noun <- lapply(sentence, function(w) {
: w[names(w) == "n"]
: })
: unlist(noun)
: })
: corp3 = Corpus(VectorSource(corp2))
: 跑到最后一行就出现错误讯息写:
: Error in UseMethod("meta", x) :
: 没有适用的方法可将 'meta' 套用到 "character" 类别的物件
: 本来有想过是资料夹里文件编码的问题
: 但是文件有中有英文,中文小弟用程式转成UTF8 ~~
: 另一个问题是不知道各位面对很多big5码,有什么方式比较快转成utf8的?
作者: obarisk (OSWALT)   2015-06-25 17:55:00
segmentCN得到的结果不是vector
楼主: psinqoo (零度空間)   2015-06-25 18:00:00
那该如何转?
作者: penolove (丑兽的女朋友)   2015-06-27 01:13:00
x7[i]=paste(unlist(x7[i]),collapse =", ")*x6才对 自己是这样做
作者: obarisk (OSWALT)   2015-06-27 06:27:00
把上面写成function,喂给tm_map

Links booklink

Contact Us: admin [ a t ] ucptt.com