[问题] pandas 问题

楼主: lance5487 ( )   2018-02-04 14:24:02
不好意思,小弟是pandas新手,想请问pandas的问题,请各位大大帮帮小弟忙QQ
假设今天有一个df
df= UserID time
A 16:01
A 16:03
A 16:04
A 16:07
A 16:08
B 17:10
B 17:11
想统计根据groupby UserID后 以 X 分钟时间内统计的平均,众数,最大值
假设以五分钟为例
A
16:01 5分钟后为 16:06 => 共 3 笔 (16:01,16:03,16:04)
16:03 5分钟后为 16:08 => 共 4 笔 (16:03,16:04,16:07,16:08)
16:04 5分钟后为 16:09 => 共 3 笔 (16:04,16:07,16:08)
16:07 5分钟后为 16:12 => 共 2 笔 (16:07,16:08)
16:08 5分钟后为 16:13 => 共 1 笔 (16:08)
平均:(1+2+3+3+4)/5=3.6
最大值:4笔
众数:3笔
最后整理成
USERID 平均 众数 最大值
A 3.6 3 4
B 1.5 1或2(1.5是最好) 2
作者: aaaba (小强)   2018-02-04 15:45:00
https://tinyurl.com/yc2h7h2u啊,你的好像不适用上例,抱歉推错https://i.imgur.com/zda60xR.png
楼主: lance5487 ( )   2018-02-05 21:19:00
哇呜 感谢楼上帮忙 我后来有想到方法 除以5取商数然后再groupby那个字段

Links booklink

Contact Us: admin [ a t ] ucptt.com