[问题] 补遗失值 mice 包 太慢

楼主: f496328mm (为什么会流泪)   2016-12-18 00:31:58
文章分类提示:
- 问题: 当你想要问问题时,请使用这个类别。
建议先利用 google 爬文,如输入
“想查询的关键字 site:www.ptt.cc/*/R_Language/”。
[问题类型]:
程式咨询(我想用R 做某件事情,但是我不知道要怎么用R 写出来)
[软件熟悉度]:
入门(写过其他程式,只是对语法不熟悉)
[问题叙述]:
请问有没有其他的packages
补遗失值的方法,mice虽然可以,但是太慢了,
我的data,length (row*col) 有100万个数字,
(4w 个 row,26 个 col)
missing value 有1.1万笔,
要跑 3min
[程式范例]:
library(mice)
x=rnorm(100)
x[sample(100,20)]=NA
x=matrix(x,ncol=5)
x
complete( mice( x ) )
[关键字]:
mice , missing value
作者: cywhale (cywhale)   2016-12-18 00:47:00
data.table(x); for(j in colnames(dt)) {set(dt, j=j,value=ifelse(is.na(dt[[j]]),0,dt[[j]]))}
作者: clansoda (小笨)   2016-12-18 11:04:00
要先观察缺失值是随机缺失还是某些因素缺失如果是外来因素导致缺失,用rough的方法反而是增加noise对你的预测反而是种危害,与其增加noise不如移除这些足的讯号
作者: cywhale (cywhale)   2016-12-18 14:40:00
好像搞错意思sorry,所以要补内插?你想补内插的方式为何?
作者: clansoda (小笨)   2016-12-18 14:41:00
mlr也有可以inputation的用途,不妨试试
作者: Wush978 (拒看低质媒体)   2016-12-19 11:08:00
mice是column based 的填补missing value嘛?有办法做切割后用平行运算来跑嘛?
作者: clansoda (小笨)   2016-12-19 21:09:00
mice package的作者有一个manual有介绍 我忘了在哪

Links booklink

Contact Us: admin [ a t ] ucptt.com