楼主:
MAGICXX (逢甲阿法)
2020-11-07 16:15:46我现在用爬虫去抓资料
可是有时候在下载还没完成之前 他就又去重新找新的资料 然后就会少抓一笔资料
然后就会跳过一笔资料 害我的资料常常会有缺少
请问一下 selenium 有没有 "档案下载完成之后 再做接着的动作" 这种机制
谢谢
作者:
pig98520 (CheinFeng)
2020-11-07 17:41:00加一个检查档案是否存在的机制?
楼主:
MAGICXX (逢甲阿法)
2020-11-07 18:00:00可是 我下载的档案都是随机的乱码 有办法判别吗?而且其实都很小 他们下载很快 点了下载之后 因为他服务器端处理下载会有延迟 才会发生下载错误的问题...
作者:
lambo (Lambo)
2020-11-07 18:06:00已经知道延迟 不然就sleep一下?
楼主:
MAGICXX (逢甲阿法)
2020-11-07 18:27:00设太短会没用 设太长等很久...我刚刚试了一下 大概200~300个档案会跳一次 很讨厌....
土炮一下,搜索下载资料夹档案有没有.tmp之类,下载中档案印象chrome会有不同副档名
楼主:
MAGICXX (逢甲阿法)
2020-11-08 03:10:00因为资料名称是乱码 没办法先放在for里面给他跑最后我还是给他sleep...虽然我觉得应该有方法才对...
作者:
LP9527 (ㄊㄇ抽菸都去)
2020-11-08 11:08:00用 “档案数量 ”作判断啊..
作者:
s860134 (s860134)
2020-11-10 09:14:00档案数量和 .temp 应该是合理解
楼主:
MAGICXX (逢甲阿法)
2020-11-11 11:53:00我最后是去比对 如果没有crdownload 就继续抓这样