楼主:
yimean (温柔杀手)
2020-01-28 23:09:18各位版上的大大晚上好,我正在写一个资料分析,目前卡关了。
请高手指导一下,感恩。
我的原始资料如下
品名 出货数量 出货日期
165 667 7000 2019-01-04
169 667 5000 2019-03-20
167 667 6000 2019-06-05
168 667 6000 2019-06-05
164 667 9000 2019-10-02
170 667 3500 2019-10-02
166 667 7000 2019-12-03
其中165,169,167.....,166是原本的资料序号
也就是说,这个资料是我已经经过处理的资料。
我想要做的事情是把每个月分的资料作统计预,计资料应该是长成下方两种其中一种
Type1:
出货数量 出货月份
7000 01
5000 03
12000 06
12500 10
7000 12
Type2:
M=[01,03,06,10,12]
V=[7000,5000,12000,12500,700]
我有试过for loop加上if判断,但是最后都卡在index的问题解决不了。
这个用SQL几行就解决了。
不过最近在学习Pandas的Dataframe操作所以就想拿来做做看。
结果~~卡关~~~真的是有点丢脸,但是问题还是要解决,不然我时间就白花了。
恳请高手指点一下,感恩。
作者:
poototo (poototo)
2020-01-28 23:55:00df=df.set_index(["出货日期"])以时间序列做index,然后设取样频率resample,asfreq...相关用法及参数下得好,比SQL更简单或者新增一个月份字段来groupbydf['月']=df['出货日期'].map(lambda x:x[5:7])
把出货日期转datetime再groupby月份感觉比较好
作者:
OrzOGC (洞八达人.拖哨天王)
2020-01-29 02:02:00有时上一下stackoverflow就会晃然大悟:N小时前的我是在蠢什么的...这么简单的东西搞老半天
楼主:
yimean (温柔杀手)
2020-01-29 10:42:00感谢p大, T大跟O大 我已经成功取得月分了,但是我画不了图
group by后好像变成series不是dataframe 所以不太能用index方式取值可以试试plt(V.index, V.values)
楼主:
yimean (温柔杀手)
2020-01-29 12:03:00@T大感谢回应,还是不行,我把V.index跟V.values印出来我最终找到这个解法S=V.unstack()plt.bar(V.index, S.values) 但是我不知道为什么。
作者:
karco (karco)
2020-01-29 12:21:00因为shape不同啊一个是(5,)一个是(5,1)所以他说mismatch因此做unstack后两个shape都是(5,)就能画了
楼主:
yimean (温柔杀手)
2020-01-29 14:40:00@k大,原来如此,感谢指导。这一路走来真是漫长呢哈哈。
作者:
poototo (poototo)
2020-01-29 20:49:00用jupyter看显示出的样子久了,可以看出V是Seriesseries.to_frame().plot.bar() 转成df再画也OK你就不用拆x跟y,也可以同年份多字段的bar一次画出来