各位版友好,想请教关于dataframe的问题
假设我现在有一份表格(df)如下
A B C D
a 1 2 3
b 1 2 3
c 4 5 6
a 1 2 3
a 1 2 3
c 4 5 6
请问有方法计算重复的row分别出现几次吗?
目前知道 df[df.duplicated()].count() 可以得到所有重复出现的row的总次数
还有 df.drop_duplicates() 可以删除重复的资料
现在想新增一个column放重复次数,再将重复的部分删掉
希望能做成
A B C D count
a 1 2 3 3
b 1 2 3 1
c 4 5 6 2
但找不太到怎么先把重复几次记下来再删掉
希望版友指点,先感谢各位!