[问题] dplyr 移除特定条件

楼主: memphis (让你喜欢这世界~)   2016-01-04 15:21:30
如何用 dplyr 移除特定条件的 row (有NA的情况)
ex:
ID <- c(1:10)
VAL <- c(1,2,3,NA,5,6,7,NA,9,10)
data <- data.frame(ID, VAL, stringsAsFactors=F)
###
如果我不要5以下的
我不能写 data %>% filter(VAL >= 6)
会没有 NA
也许可以改成 data %>% filter(VAL >= 6 & is.na(VAL))
可是万一资料有其他的东西 例如空格, 小老鼠之类的?
有没有什么办法是 "选到符合条件的, 然后移除那些row" ?
作者: cywhale (cywhale)   2016-01-04 15:47:00
如果写 data[-which(VAL <= 5),] 符合你所要的吗?
作者: celestialgod (天)   2016-01-04 16:07:00
setdiff(data, data %>% filter(VAL < 6))data %>% setdiff(filter(., VAL < 6))setdiff后来dplyr有新增方法使用于data.frame
楼主: memphis (让你喜欢这世界~)   2016-01-04 16:15:00
HI cywhale 根据经验, 那样写如果which=0, 资料会爆掉喔要先 s <- which(VAL <= 5) 再判断 if(!is.na(s[1]))
作者: celestialgod (天)   2016-01-04 16:21:00
疑问,为啥which会出现0?which(data$VAL <= 5) 应该只会出现1~nrow(data)吧
楼主: memphis (让你喜欢这世界~)   2016-01-04 16:22:00
喔喔 感恩~ c大正解, 这样写起来就很dplyr style如果资料里没有<=5的 就会选空, 结果等于 integer(0)所以一般过which 我都会塞到一个s 然后判断有没有东西
作者: celestialgod (天)   2016-01-04 16:28:00
喔喔 你说NULL喔,我懂了!!我在想0是什么XDDsetdiff配上%>%是真的满dplyr style XD
楼主: memphis (让你喜欢这世界~)   2016-01-04 16:59:00
补充: 可是c大的方法好看, 速度非常慢 因为是df的setdiff
作者: cywhale (cywhale)   2016-01-04 17:00:00
ya 我忘记null这状况,通常我也都会加个判断式再做..
楼主: memphis (让你喜欢这世界~)   2016-01-04 17:03:00
data %>% slice(setdiff(1:nrow(.),which(VAL<6)))上面这个让setdiff回到比两个vector, 只是看起来就丑点
作者: celestialgod (天)   2016-01-04 17:40:00
我原本要贴这个XD:http://pastebin.com/P468HC0L不过看到cy大用-which就想说算了~~原来有差异的QQ
作者: cywhale (cywhale)   2016-01-04 21:28:00
If original column contains "@" as memphis saidthen the column become character, and these solutionswill differ from data[-which(VAL<=5),] for VAL='10'

Links booklink

Contact Us: admin [ a t ] ucptt.com