[问题] pandas resample 遗失资料

楼主: nathan7812 (nathan)   2018-06-07 22:03:50
请问各位前辈
我在做resample的时候form daily to weekly
daily 的资料里并没有NaN
但是转换成weekly后就多了21row的NaN
爬了很多文都找不到原因
请问大家这是什么原因呢?
Input:
df_ohlc = df.resample('W').agg({'Open': 'first',
'High': 'max',
'Low': 'min',
'Close': 'last'})
print('count df_ohlc weekly null value:'+str(df_ohlc.isnull().sum()))
Output:
count df_ohlc weekly null value:Open 21
High 21
Low 21
Close 21
dtype: int64
Open High Low Close
Date
2014-12-21 NaN NaN NaN NaN
2015-01-04 NaN NaN NaN NaN
2015-01-18 NaN NaN NaN NaN
2015-01-25 NaN NaN NaN NaN
2015-02-22 NaN NaN NaN NaN
2015-03-01 NaN NaN NaN NaN
2015-04-26 NaN NaN NaN NaN
2015-05-03 NaN NaN NaN NaN
2015-05-10 NaN NaN NaN NaN
2015-08-02 NaN NaN NaN NaN
2015-08-09 NaN NaN NaN NaN
2015-08-23 NaN NaN NaN NaN
2015-11-29 NaN NaN NaN NaN
2015-12-20 NaN NaN NaN NaN
2016-02-14 NaN NaN NaN NaN
2016-04-10 NaN NaN NaN NaN
2016-04-24 NaN NaN NaN NaN
2016-06-12 NaN NaN NaN NaN
2016-07-17 NaN NaN NaN NaN
2016-07-24 NaN NaN NaN NaN
2016-07-31 NaN NaN NaN NaN
附上2014-11-26~2018-06-06 0050.TW.csv档https://tinyurl.com/ybffoxlt
作者: kiloxx (名器)   2018-06-07 22:46:00
有几周没开盘阿!如新年连假之类的
楼主: nathan7812 (nathan)   2018-06-08 12:03:00
K大提到的问题我回去检视后,好像不仅止于放假的问题?
作者: bazoo (surfers'paradise)   2018-06-08 13:24:00
你的原始资料缺的很严重喔,很多天都没资料
楼主: nathan7812 (nathan)   2018-06-08 13:29:00
谢谢B大提醒,原档真的缺的很严重,冏rz结论上来说明一下,yahoo finance的历史资料真的缺很大,在找不到其他api之前,只能自己爬了。

Links booklink

Contact Us: admin [ a t ] ucptt.com