楼主:
DKnex (DK)
2022-07-21 14:31:44大家好,小弟完全新手
目前手边有笔CSV资料原本是[48023 rows x 10 columns]
我目标是:
1.将CSV里面10个column筛选其中3个即可
2.从这3个columns当中的“Rank”筛选只出现1的值
3.筛选完变[553 rows x 3 columns]
然后再从url_hash当中,筛选重复出现至少5次或以上的值
4.最后保留这些值输出成新的CSV档案
code如下:
https://imgur.com/a/QdjZrET
我现在只进行到目标2,但我发现输出新的CSV只有把档案从10个columns变成3个
并没有只保留Rank只出现1的值 (还是[48023 rows x 3 columns])
我猜测是没把数据写成dataframe所以存不了我筛选的资料
但实在看不懂dataframe要如何操作我的目标2和3
希望能得到各位的指点,先谢谢大家。