楼主:
ruisme (RU)
2017-05-15 22:29:48各位前辈大家好,小弟想询问有关pandas中dataframe问题
问题描述:
有两个table我称它为A与B,里面的字段都一样,第一栏是ID
(同一个table中ID有可能重复所以我没有把ID设为index)
我要做一个新的table(下称C),以A为基础,将B表格中ID也出现在A的资料加到C中
我的解法是用for循环,具体程式码如下:
http://tinyurl.com/m37co8j
问题就出在这个for,若是AB两个table的资料都各有数十万笔,光跑这个for循环
就很花时间了,更别提后续的分析
请问有没有不用for循环的解法?
题外话:
小弟今天要处理的资料集有可能是接近千万笔,请问有没有比pandas更快的分析工具?
先谢谢各位了