PTT
Submit
Submit
选择语言
正體中文
简体中文
PTT
Python
[问题] for循环搭配regex效率问题
楼主:
hateli
(kk)
2019-02-22 11:01:42
小弟菜鸟 想询问一下各位
目前写的一个程式是要在2000篇文件中以regex找寻关键字出现与否 (以某些特征出现)
而关键字的列表约有600万个字
导致运算速率非常慢
如果想增进效率
不知能从什么方面着手?谢谢
作者:
shala
(沙罗)
2019-02-22 11:25:00
列表内的项目有600万个的意思?
楼主:
hateli
(kk)
2019-02-22 11:29:00
是的 另外是字典不是列表 内文打错了~
作者:
w0005151
(蓝厅)
2019-02-22 11:42:00
关键字彼此不会重叠吗?可以试试看把常出现的放前面
作者:
s860134
(s860134)
2019-02-22 12:10:00
丢平行?
作者:
cutekid
(可爱小孩子)
2019-02-22 12:55:00
FlashText
作者:
AndCycle
(AndCycle)
2019-02-22 15:51:00
哪种类型的文件? 单纯txt的话直接换工具比较快
作者:
TitanEric
(泰坦)
2019-02-22 20:28:00
允许预处理吗 先把单字在哪个文件那一行记起来 之后用regex搜
楼主:
hateli
(kk)
2019-03-07 11:49:00
谢谢大家回答,最后用flashtest解决了,之前推文没送出*text
继续阅读
[问题] heroku+django休眠问题
as30385438
[讨论] Python语法是不是不太严谨?
zo6596001
[教学] 交互式图片 - Bokeh
brad0315
[问题] Python 侦错中修改程式码
nevikw39
Re: [问题] 请教如何背景执行?
rexyeah
[问题] 请教如何背景执行?
Sagbtoautumn
[心得] 分享 金融开源data package
f496328mm
[问题] 安装CUDA 9.0 遇到问题
sssh
[问题] 新手求助安装套件相关问题
Curson
[问题] 请问tensorflow动态训练模型怎么输出
stst82431
Links
booklink
Contact Us: admin [ a t ] ucptt.com