[问题] 请问有什么办法加快这个 for loop 吗？ CaptPlanet PTT批踢踢实业坊

[问题] 请问有什么办法加快这个 for loop 吗？

楼主: CaptPlanet (ep) 2018-02-27 23:53:13

有list_a, list_b两个list
list_a 有大约 70000 个 elements
list_b 大约 3 million 个 elements
程式大致如下：
res_li = []
for x in list_b:
try:
res_li.append(list_a.index(x))
except:
res_li.append("")
对 list_b 中的每一个 element
在 list_a 中找到一样 element 把他的 index 加到新的 list 中
随着 iteration 增加速度变得越来越慢，
想请教各位为何会有这个现象以及有什么方法加速这个 for loop 呢？
谢谢各位高手

作者: uranusjr (â†é€™äººæ˜¯è¶…ç´šç¬¨è›‹) 2018-02-28 00:03:00

简单的方法是把 list_a 的 index 用 dict cache 起来每个 b 里的值都要在 a 从头找一次当然会慢

楼主: CaptPlanet (ep) 2018-02-28 00:21:00

感恩已解决

作者: Yshuan (倚絃) 2018-02-28 00:51:00

做一个 dict([(v, i) for i, v in enumerate(list_a)])用空间换取时间这样...res_li = map(lambda k: new_dict.get(k, ""), list_b)

作者: thefomalhaut (The Fomalhaut) 2018-02-28 08:53:00

cython or numpy?

作者: uranusjr (â†é€™äººæ˜¯è¶…ç´šç¬¨è›‹) 2018-02-27 16:03:00

简单的方法是把 list_a 的 index 用 dict cache 起来每个 b 里的值都要在 a 从头找一次当然会慢

楼主: CaptPlanet (ep) 2018-02-27 16:21:00

感恩已解决

作者: Yshuan (倚絃) 2018-02-27 16:51:00

做一个 dict([(v, i) for i, v in enumerate(list_a)])用空间换取时间这样...res_li = map(lambda k: new_dict.get(k, ""), list_b)

作者: thefomalhaut (The Fomalhaut) 2018-02-28 00:53:00

cython or numpy?

作者: secondsee (窝ㄎ唷) 2018-02-28 10:36:00

或可用set找出交集, 直接拿去list_a比对check = set(list_a) & set(list_b)res_li = [i for i,x in enumerate(a) if x in check]

作者: vfgce (小兵) 2018-02-28 11:58:00

楼上的解法有误...也没有比dict快.Y大解法ok,只是map回传的是iterator,再转成list似乎没有比直接用list comprehension快.

继续阅读

[问题]PDF内页连结cccheng [问题] 如何从binary图片档取出pixel资讯?wtleader01 [问题] 网络爬虫使用pd.read_html时发生问题opengood5566 [问题] 学习PyQt5lukelu [问题] jupyter使用问题swampni [问题] line爬虫遇到问题coolching [问题] 资料结构参考书推荐sseeaann [问题] df.to_csv 输出档案的格式跑掉了OnePiecePR Fw: [问题] 在IRkernel中安装套件clsmbstu [资讯] 精通 Python：运用简单的套件进行现代运biojay