Re: [问题] CSV资料切割

楼主: haitairoutzu (海苔肉粽)   2023-02-23 10:24:14
※ 引述《locka (locka)》之铭言:
: library(tidyverse)
: library(readr)
: # 产生测试资料
: demo <- tibble(variable=1:16,
: id1=rnorm(16),
: id2=rnorm(16),
: id3=rnorm(16),
: id4=rnorm(16))
: write_csv(demo, "demo.csv")
: # 使用read_csv_chunked() 每4row切割并输出成一个新的档案
: callback_f <- function(x, pos) write_csv(x, paste0("chunk_",pos%/%4,".csv"))
: read_csv_chunked("demo.csv", DataFrameCallback$new(callback_f), chunk_size=4
)
: 结果如下:
: 原资料
: https://i.imgur.com/y3GmbSh.jpg
: 输出4个档案
: https://i.imgur.com/5b2pzEi.jpg
作者: lycantrope (阿宽)   2023-02-23 11:02:00
如果分析都套用一样的func,分组后用groupby处理
作者: locka (locka)   2023-02-23 14:03:00
设一个存放结果的dataframe,在callback function里面把算出来的结果加到那个dataframe就好啦~callback function就是设定每个读取的chunk做同样的运算,不用再特别groupby

Links booklink

Contact Us: admin [ a t ] ucptt.com