[问题] csv选取资料后如何存盘?

楼主: DKnex (DK)   2022-07-21 14:31:44
大家好,小弟完全新手
目前手边有笔CSV资料原本是[48023 rows x 10 columns]
我目标是:
1.将CSV里面10个column筛选其中3个即可
2.从这3个columns当中的“Rank”筛选只出现1的值
3.筛选完变[553 rows x 3 columns]
然后再从url_hash当中,筛选重复出现至少5次或以上的值
4.最后保留这些值输出成新的CSV档案
code如下:
https://imgur.com/a/QdjZrET
我现在只进行到目标2,但我发现输出新的CSV只有把档案从10个columns变成3个
并没有只保留Rank只出现1的值 (还是[48023 rows x 3 columns])
我猜测是没把数据写成dataframe所以存不了我筛选的资料
但实在看不懂dataframe要如何操作我的目标2和3
希望能得到各位的指点,先谢谢大家。
作者: noshortcut4u (幽门羣)   2022-07-21 15:05:00
你在df筛选的rank的那边要重新assign给df
作者: lycantrope (阿宽)   2022-07-21 15:09:00
df[df["rank"]==1]只是筛选,并没有改变原始dfassign, df = df[df["rank"]==1]

Links booklink

Contact Us: admin [ a t ] ucptt.com