楼主:
memphis (让你喜欢这世界~)
2016-01-04 15:21:30如何用 dplyr 移除特定条件的 row (有NA的情况)
ex:
ID <- c(1:10)
VAL <- c(1,2,3,NA,5,6,7,NA,9,10)
data <- data.frame(ID, VAL, stringsAsFactors=F)
###
如果我不要5以下的
我不能写 data %>% filter(VAL >= 6)
会没有 NA
也许可以改成 data %>% filter(VAL >= 6 & is.na(VAL))
可是万一资料有其他的东西 例如空格, 小老鼠之类的?
有没有什么办法是 "选到符合条件的, 然后移除那些row" ?
作者:
cywhale (cywhale)
2016-01-04 15:47:00如果写 data[-which(VAL <= 5),] 符合你所要的吗?
setdiff(data, data %>% filter(VAL < 6))data %>% setdiff(filter(., VAL < 6))setdiff后来dplyr有新增方法使用于data.frame
楼主:
memphis (让你喜欢这世界~)
2016-01-04 16:15:00HI cywhale 根据经验, 那样写如果which=0, 资料会爆掉喔要先 s <- which(VAL <= 5) 再判断 if(!is.na(s[1]))
疑问,为啥which会出现0?which(data$VAL <= 5) 应该只会出现1~nrow(data)吧
楼主:
memphis (让你喜欢这世界~)
2016-01-04 16:22:00喔喔 感恩~ c大正解, 这样写起来就很dplyr style如果资料里没有<=5的 就会选空, 结果等于 integer(0)所以一般过which 我都会塞到一个s 然后判断有没有东西
喔喔 你说NULL喔,我懂了!!我在想0是什么XDDsetdiff配上%>%是真的满dplyr style XD
楼主:
memphis (让你喜欢这世界~)
2016-01-04 16:59:00补充: 可是c大的方法好看, 速度非常慢 因为是df的setdiff
作者:
cywhale (cywhale)
2016-01-04 17:00:00ya 我忘记null这状况,通常我也都会加个判断式再做..
楼主:
memphis (让你喜欢这世界~)
2016-01-04 17:03:00data %>% slice(setdiff(1:nrow(.),which(VAL<6)))上面这个让setdiff回到比两个vector, 只是看起来就丑点
作者:
cywhale (cywhale)
2016-01-04 21:28:00If original column contains "@" as memphis saidthen the column become character, and these solutionswill differ from data[-which(VAL<=5),] for VAL='10'