Re: [问题] 想请问有更有效率的写法吗? Neisseria PTT批踢踢实业坊

Re: [问题] 想请问有更有效率的写法吗?

楼主: Neisseria (Neisseria) 2014-08-24 16:25:25

如果直接用 dict 或是 set
会比用 list 转 set 所用的时间少
使用 timeit 模组测得时间，单位是秒，重复 100000 次。
dict: 8.84833312035
set: 8.80254411697
list: 12.5947060585
最后，附上我写的测试程式，可供参考
http://pastebin.com/AhmHfPPC
※ 引述《sariel0322 (sariel)》之铭言：
: 我想把一个列数相当多的csv档案
: 把里面重复的列数给删除掉
: 我只能想到这种写法:
: import csv
: rows = []
: a = 0
: o = open("output.csv","w")
: f = open("input.csv","r")
: for row in csv.reader(f):
: rows.append(row[0]+","+row[1]+","+row[2]+","+row[3]+","+row[4]+","+row[5]+","+row[6]+","+row[7]+","+row[8]+","+row[9]+","+row[10])
: for i in set(rows):
: o.write(i+"\n")
: f.close()
: o.close()
: 但由于行数非常多，资料量也大(csv档案约400mb)
: 因此全部跑完可能需要五天(有写个计数器来大约计算过，为了节省空间没列出来)
: 想请问有没有更有效率的写法

作者: LiloHuang (十年一刻) 2014-08-24 17:14:00

努力推文后才发现有人回了 XD

继续阅读

[问题] AWS simpleDB and Djangosean72 [问题] 想请问有更有效率的写法吗?sariel0322 Re: [问题] PyQt5写的.pyw不能跑Neisseria [问题] PyQt5写的.pyw不能跑annisat [问题] 停止正在执行 3rd party lib 的 thread carylorrk [问题] 请问发行套件以及下载套件观念问题maxjoiny [问题] 档案读取与资料使用问题wsqa [问题] 反斜线\在python的处理hsushipei Re: [问题] 用Python 写 shellgargoyle005 [问题] docs.scipy.orgfischcheng