Re: [问题] aggregation on list of data frames celestialgod PTT批踢踢实业坊

Re: [问题] aggregation on list of data frames

楼主: celestialgod (å¤©) 2015-02-24 17:38:01

> [问题叙述]:
>
> 有个 list of data frames，
> 想用 row name 当做 key 来 aggregate 多个 data frame
>
>
> [程式范例]:
>
> l = list()
> l[[1]] = data.frame(row.names=c('a','b','c','d'), x=c(1,2,3,4))
> l[[2]] = data.frame(row.names=c('d','c','b','a'), x=c(1,2,3,4))
>
> 希望可以得到所有 data frame 的 aggregation 结果，如：平均
>
> mean(x)
> a 2.5
> b 2.5
> c 2.5
> d 2.5
提供一些方法@@
library(magrittr)
library(data.table)
library(dplyr)
# 1.
l %>% rbindlist(.) %>% data.frame(label = l %>%
lapply(row.names) %>% do.call(c, .)) %>%
aggregate(x ~ label, ., mean)
# 2.
l %>% lapply(function(x) data.frame(label = row.names(x), x)) %>%
rbindlist(.) %>% group_by(label) %>% summarise(mean(x))
# 3.
Reduce(function(x, y) merge(x, y, by="row.names", all=FALSE) %>%
set_rownames(row.names(x)), l) %>% .[,4:7] %>% apply(1, mean)
第一种是根据原PO改的
我觉得第二种是最简单理解，也最简单写的方法XD 我比较推荐这个
第三种方法有点tricky...我觉得速度应该也不快不推荐 (慢在merge)
3/1补充第四种
library(plyr)
l %>% lapply(name_rows) %>% rbindlist(.) %>%
group_by(.rownames) %>% summarise(mean(x))
最近在看plyr的manual，发现plyr有提供直接把row.names转成col的function
这样写起来整个function更精简

继续阅读

Re: [问题] 想利用data.table将Rawdata切割字段celestialgod [问题] 想利用data.table将Rawdata切割字段squallscer [问题] (已解决)安装quantmod套件出现错误a828203 [问题] shiny 做的 web 读取 NT name ?koai [问题] shiny 接数据库后 tablepsinqoo [问题] R 使用不同gee指令会有不收敛的情况tokyo291 [问题] 是否能透过指令中止其他程式mode710517 [问题] plotGoogleMapspsinqoo Re: [问题] eval 使用问题andrew43 [问题] eval 使用问题Tolkien