[问题] 请问关于时间相关的data做散布图的方式

楼主: koow ( )   2020-12-14 01:36:23
各位前辈好~
小弟几天卡在一个做图的想法 想请教各位前辈
我有一组资料 是每天不定时(有可能9:30 也有可能10:15之类的)
开始后每一分钟对应一个Y值
所以假设时间长度一年 那就是有365组data
每组data有Y1(开始后第一分钟的值),Y2(开始后第二分钟的值).....etc
小弟最终想做的是
开始后的第X分钟 VS 对应的Y值 所有的资料的散布图
目前我想到的作法是 先令dataframe每一列为 [开始后第X分钟,对应Y值]
然后散布图第一个X值就抓 dataframe[X=1]出来 以此类推
这样做的缺点感觉是 dataframe 的index会非常多
不知道版上的各位前辈还有没有更好建议的做法呢?
感谢各位~~
作者: Starcraft2 (来自星海的你)   2020-12-14 07:06:00
index多也是还好, 就365*24*60 ~= 52万5千笔主要是你想要画出来分析什么?每周/每月/每季的趋势?需要细到分钟还是group by到每天或每小时就可以了还是有什么其他作图的目的
作者: LP9527 (ㄊㄇ抽菸都去)   2020-12-14 08:12:00
先把每天时间减一减不就好了吗喔不是 你这个资料应该要画曲线图
楼主: koow ( )   2020-12-14 08:59:00
举例 我想观察以最后结果(阴天 or 晴天)来说 假设Y是湿度那我是不是阴天的话 每天起始点后每分钟的溼度 几乎都大于晴天 我想观察的是这种趋势 并且来做ML分类 或是 回归的一些应用 但我想先全部画在图上看趋势 XD 所以才有这个问题
作者: LP9527 (ㄊㄇ抽菸都去)   2020-12-14 14:59:00
要看每个时间点与多index看起来你的问题很矛盾,要嘛你找别种图呈现, 要嘛就统计数一数
作者: lycantrope (阿宽)   2020-12-16 17:05:00
用column去分类时间,再groupby去分群作图

Links booklink

Contact Us: admin [ a t ] ucptt.com