[问题] 把物件存成.RData会比较快吗?(shinyapp)

楼主: locka (locka)   2019-03-14 22:06:52
[问题类型]:
意见调查(我对R 有个很棒的想法,想问问大家的意见)
效能咨询(我想让R 跑更快)
[软件熟悉度]:
使用者(已经有用R 做过不少作品)
[问题叙述]:
各位版友好,想请问大家开发 shinyapp 的时候会先把资料存成 .RData 再读取吗?
例如读取外部档案:
原本是在 runApp() 的时候执行 data <- read.csv("xxx.csv")
改成先用 save(data, file="data.RData") 存成 .RData
这样 runApp() 的时候直接执行 load("data.RData")
又或者, 我有些物件是用 lapply 函数做成的
一样先存成 .RData 执行 app 的时候直接 load
这样就不用每次执行程式都要跑一次 lapply 函数
理论上这样应该会比较快...吗?
更明确的说,当部属到 shinyapps.io 上的时候,这样会不会比较快
不晓得有没有高手可以指点一下,或是分享自己的经验。
谢谢!
[关键字]:
shiny, shinyapps.io, RData
作者: celestialgod (天)   2019-03-14 22:33:00
我觉得就depends on哪个读取快耶
作者: celestialgod (天)   2019-03-15 01:18:00
那应该是feather最快
楼主: locka (locka)   2019-03-14 23:43:00
不管是 lapply(), read.csv() 还是 load() 都是写在 global.R 里喔,我只是在思考前两者的速度跟后者的速度谁快谁慢??
作者: cywhale (cywhale)   2019-03-14 23:12:00
如涉传输就难说了,我都在自架server,not shinyapps.io
楼主: locka (locka)   2019-03-14 23:19:00
即便是自架server,run的时候也是要传输不是吗?
作者: celestialgod (天)   2019-03-14 23:35:00
写在global.R 就会只要读一次不就好了吗?
楼主: locka (locka)   2019-03-14 22:48:00
请问有什么方法可以协助我判断读取时间吗?好像不能单从档案大小来看,我不太晓得shiny读取外部档案跟执行函式有没有用什么可能会是瓶颈的方式,比方说如果读取外部.RData是用streaming的方式读取,那一定就会很慢吧…可是又觉得执行函式要多做计算很浪费资源…不如事先算好再读取就好…抱歉,回复的有点乱
作者: cywhale (cywhale)   2019-03-14 22:44:00
可以直接测看看时间啊,如果运算很复杂当然load RData快
作者: jack155861 (萧)   2019-03-17 20:48:00
Feather 比 csv txt rdata SQLite 快
楼主: locka (locka)   2019-03-17 22:42:00
感谢两位分享,第一次听到 feather 来研究看看!
作者: cywhale (cywhale)   2019-03-18 22:28:00
如果可以接受binary格式,feather, fst都可试看看

Links booklink

Contact Us: admin [ a t ] ucptt.com