[问题类型]:
效能咨询(我想让R 跑更快)
[软件熟悉度]:
使用者(已经有用R 做过不少作品)
[问题叙述]:
小弟有个3.8G多的csv档,但只想要随机读取1/10的row
fread好像没read specific rows的指令,
难道只能读整个档案再select row了吗?
这样好没效率呀.....
若要cross-validation的话光I/O就跑死了....
想请问有没有更效率一点方法呢?
谢谢了
[程式范例]:
参考网络用fread + nrow and skip 写了一下,但是更慢Orz.....
但也是预料中啦XDD
http://pastebin.com/gW9W1GmN
[关键字]:
fread