[问题] 如何缩短判断的时间 phoenixlife PTT批踢踢实业坊

[问题] 如何缩短判断的时间

楼主: phoenixlife (键盘小底迪) 2015-03-18 00:02:45

目前手上有700多万笔资料
每一笔都有时间点(时:分:秒)
然后我想把每一笔资料作归类
每5秒为一个区隔
例如: 00:00:04的资料会被归类到 00:00:00的bucket(用TreeMap实作)
小弟我的作法是先建立好所有时段bucket
每读一笔资料就会去判断是在哪个时段bucket (从00:00:00 一直加5秒至24:00:00结束)
但这样很慢
有更快的作法吗
谢谢

作者: LPH66 (-6.2598534e+18f) 2015-03-18 00:06:00

时分秒标签要分类很累, 不如全部换成秒来算

作者: mars90226 (火星人) 2015-03-18 00:15:00

用楼上作法搭配精巧的算数应该可以用array来做

楼主: phoenixlife (键盘小底迪) 2015-03-18 00:20:00

感觉全部用秒数算好像会快一点试试看 thx

作者: csieflyman (风之骄子) 2015-03-18 12:44:00

你的精确度到秒一天也才86400秒而且还每5秒分bucket700万笔资料不会重复吗? 怎会是用TreeMap? 应该是multimap吧你的key value是什么?

楼主: phoenixlife (键盘小底迪) 2015-03-18 13:29:00

我的calue值可以用array 去存在那个时段的资料valuekey是时段

作者: csieflyman (风之骄子) 2015-03-18 13:47:00

用 guava collection library 依照资料特性及你读写的需求选择 ListMultimap 或 SetMultimap 的实作如果资料彼此独立可试试开多个 thread 写入此时要使用 Multimaps.synchronizedSetMultimap(com.google.common.collect.SetMultimap<K, V>) 达到 thread safe一开始建立 multimap 物件时要给预估的容量假设资料平均分配那就是 700万除以bucket数量避免过多rehashing700万笔数目也不小可开启JDK附的Jvisualvm工具看memory 使用状况调大 heap size

楼主: phoenixlife (键盘小底迪) 2015-03-18 16:54:00

嗯嗯谢谢各位大大的建议

继续阅读

[问题] ARRAYLIST的问题sp3me [问题] 输入文字自动分类hadoo [问题] 日期格式转不出来purin88 [问题] 至巨匠电脑学程式找工作libra1005 [问题]Android模拟器手势缩放,JSON,Eclips的问题purin88 [J2EE] Restful Jersey问题请教OoShiunoO [征求]OCPJP考卷两张k22662266 [问题] 想请问撰写android app的问题Hawk123 Fw: [问卦] 图论 & 组合论对资工人重要吗?Zorich Re: [文件] JAVA新手爬文须知VCLee