pandas读档的问题

楼主: iphone2003 (307)   2018-05-21 14:21:55
大家好
我现场有大概2000份档案,每个都要用pandas去读
可是有个问题是这些档案的columns数量可能不太一样
比方说有的档案有8个columns,但有的却有10个
我现在希望每个档案的column名称都以那10个columns的为主
而如果当下读的档案是属于8个columns的那种,那多出来的那两个columns里面的资料就
都用NaN呈现即可
直接设df.columns = [我希望的那10个columns]
这样显然不行
有想到读档时就用names参数设定,不过手边没有电脑还没试过这样可不可以
请问这样的话要怎么做呢?
谢谢!
作者: eri820503 (snoopyahoo)   2018-05-21 14:53:00
pd.concat([df1,df2]) df1是旧的 df2是要加入的
楼主: iphone2003 (307)   2018-05-22 20:19:00
研究了一下似乎真的只能先建好df后再并了...谢谢!
作者: clsmbstu   2018-05-24 18:54:00
这2000份档案是想存成2000个df还是一个大df啊?感觉做法会不同 @@

Links booklink

Contact Us: admin [ a t ] ucptt.com