pandas读档的问题 iphone2003 PTT批踢踢实业坊

pandas读档的问题

楼主: iphone2003 (307) 2018-05-21 14:21:55

大家好
我现场有大概2000份档案，每个都要用pandas去读
可是有个问题是这些档案的columns数量可能不太一样
比方说有的档案有8个columns，但有的却有10个
我现在希望每个档案的column名称都以那10个columns的为主
而如果当下读的档案是属于8个columns的那种，那多出来的那两个columns里面的资料就
都用NaN呈现即可
直接设df.columns = [我希望的那10个columns]
这样显然不行
有想到读档时就用names参数设定，不过手边没有电脑还没试过这样可不可以
请问这样的话要怎么做呢？
谢谢！

作者: eri820503 (snoopyahoo) 2018-05-21 14:53:00

pd.concat([df1,df2]) df1是旧的 df2是要加入的

楼主: iphone2003 (307) 2018-05-22 20:19:00

研究了一下似乎真的只能先建好df后再并了...谢谢！

作者: clsmbstu 2018-05-24 18:54:00

这2000份档案是想存成2000个df还是一个大df啊？感觉做法会不同 @@

继续阅读

[问题] PySide2安装alfredisabug [问题] 爬虫问题MAGICXX [问题] 比map_async快速省时的方法shaly0815 Re: [问题] Linux环境询问pip3 套件安装管理问题Neisseria [问题] Linux环境询问pip3 套件安装管理问题x246libra Re: [闲聊] pipenv dramaeight0 [征求] Python家教~ 三重大安lay911225 [闲聊] pipenv dramaabc2090614 [问题]关于 string formattingccydt [问题] tensorflow的纯计算怎么那么慢？king00000000