[问题] Excel字串的处理

楼主: qazzzzz (小不点)   2014-10-30 17:07:19
[问题类型]:
程式咨询(我想用R 做某件事情,但是我不知道要怎么用R 写出来)
[软件熟悉度]:
新手
[问题叙述]:
我的资料Excel档里面有两个column,
第一个column他是id,第二的column是他的名字
因为他的名字都会有一些不必要的符号,
所以我想把一些符号改成空格
可是不太会用for loop...
请问要如何针对column 2 检查每一个名字的每一个字母呢?
谢谢~
例如: 将"<" 及 ">" 变空格
┌───┬────┐
│ id1 │name<1> │ →name 1
├───┼────┤
│ id2 │n<2>tea │ →n 2 tea
├───┼────┤
│ id3 │juice<3>│ →juice 3
└───┴────┘
作者: koai (可笑的自以为...)   2014-10-30 17:51:00
gsub(">"," ",gsub("<"," ",data[,2]))
作者: Edster (Edster)   2014-10-30 22:34:00
如果是这样你必须先定义什么是要保留的文字.而什么是要被取代的.比如说你可以定义 letters (英文字母) 是要保留的.其余全部转成空白.library(stringr)x = c("xz", "123", "gcb5c")y = rep(list(character(100)),length(x))for(i in 1:length(x)) for(j in 1:nchar(x[i]))y[[i]][j] = str_sub(x[i], j, j)unique(unlist(y))你就得到所有的字符, 再用上面的教学取代.
作者: obarisk (OSWALT)   2014-10-31 10:07:00
keyword regexp punctgsub("[[:punct:]]", "", string)

Links booklink

Contact Us: admin [ a t ] ucptt.com