[问题] for循环搭配regex效率问题

楼主: hateli (kk)   2019-02-22 11:01:42
小弟菜鸟 想询问一下各位
目前写的一个程式是要在2000篇文件中以regex找寻关键字出现与否 (以某些特征出现)
而关键字的列表约有600万个字
导致运算速率非常慢
如果想增进效率
不知能从什么方面着手?谢谢
作者: shala (沙罗)   2019-02-22 11:25:00
列表内的项目有600万个的意思?
楼主: hateli (kk)   2019-02-22 11:29:00
是的 另外是字典不是列表 内文打错了~
作者: w0005151 (蓝厅)   2019-02-22 11:42:00
关键字彼此不会重叠吗?可以试试看把常出现的放前面
作者: s860134 (s860134)   2019-02-22 12:10:00
丢平行?
作者: cutekid (可爱小孩子)   2019-02-22 12:55:00
FlashText
作者: AndCycle (AndCycle)   2019-02-22 15:51:00
哪种类型的文件? 单纯txt的话直接换工具比较快
作者: TitanEric (泰坦)   2019-02-22 20:28:00
允许预处理吗 先把单字在哪个文件那一行记起来 之后用regex搜
楼主: hateli (kk)   2019-03-07 11:49:00
谢谢大家回答,最后用flashtest解决了,之前推文没送出*text

Links booklink

Contact Us: admin [ a t ] ucptt.com