PTT
Submit
Submit
选择语言
正體中文
简体中文
PTT
R_Language
[问题] 读取3GB的csv档 资料太大
楼主:
f496328mm
(为什么会流泪)
2016-07-21 17:43:14
请问要怎么读取3GB的资料
有没有比较有效率的方法?
我有用read.csv去读
但是光要把3GB读到电脑的RAM中 就要花很多时间(我读个几百MB的就要一分左右)
而且3GB我可能要超过16G的RAM去读他 可能更多 因为我电脑只有16G
想要再加RAM到32G 只怕这样还吃不下3G的DATA 要进行分析更是困难
分批读是一个方法
但有没有比read.csv更好的套件去读这样的data
毕竟3GB以目前的BIG DATA 应该不算大吧
会需要用到hadoop吗?
谢谢
作者: GetRobin (Rrr)
2016-07-21 18:28:00
可以用用看fread
http://www.inside-r.org/packages/cran/data.table/doc
s/fread
作者:
celestialgod
(天)
2016-07-21 18:32:00
3G fread + 16G内存就可以处理了完全用不到hadoop
作者:
Wush978
(拒看低质媒体)
2016-07-22 00:01:00
检查一下你的型态是不是你要的
继续阅读
[问题] R做相关矩阵
Tampa
[问题] Rstudio 目录
Chris7462
[问题] 资料属性
developme223
[公告] 套件分享征文活动
celestialgod
[情报] R 语言入门课程(8/29 ~ 8/30,南科)
wanggz
[问题] read.csv 无法读取问题
ireullin
[问题] 用for循环找曲线上点的问题
milk9420milk
[问题] Solve function小问题
goat1214
[问题] rvest,RCurl,curl,httr in linux
leebochen521
[问题] xgboost regression
clansoda
Links
booklink
Contact Us: admin [ a t ] ucptt.com