[问题] 档案下载完毕后 才继续

楼主: MAGICXX (逢甲阿法)   2020-11-07 16:15:46
我现在用爬虫去抓资料
可是有时候在下载还没完成之前 他就又去重新找新的资料 然后就会少抓一笔资料
然后就会跳过一笔资料 害我的资料常常会有缺少
请问一下 selenium 有没有 "档案下载完成之后 再做接着的动作" 这种机制
谢谢
作者: pig98520 (CheinFeng)   2020-11-07 17:41:00
加一个检查档案是否存在的机制?
楼主: MAGICXX (逢甲阿法)   2020-11-07 18:00:00
可是 我下载的档案都是随机的乱码 有办法判别吗?而且其实都很小 他们下载很快 点了下载之后 因为他服务器端处理下载会有延迟 才会发生下载错误的问题...
作者: lambo (Lambo)   2020-11-07 18:06:00
已经知道延迟 不然就sleep一下?
楼主: MAGICXX (逢甲阿法)   2020-11-07 18:27:00
设太短会没用 设太长等很久...我刚刚试了一下 大概200~300个档案会跳一次 很讨厌....
作者: andy19960407 (258698)   2020-11-07 22:49:00
直接先判定好要下载哪些资料 在for 起来载勒?
作者: Pieteacher (pieteacher)   2020-11-07 22:52:00
time.sleep()
作者: ripple0129 (perry tsai)   2020-11-08 00:23:00
土炮一下,搜索下载资料夹档案有没有.tmp之类,下载中档案印象chrome会有不同副档名
楼主: MAGICXX (逢甲阿法)   2020-11-08 03:10:00
因为资料名称是乱码 没办法先放在for里面给他跑最后我还是给他sleep...虽然我觉得应该有方法才对...
作者: TitanEric (泰坦)   2020-11-08 09:11:00
https://reurl.cc/R1Er7g感觉可以用以上chrome内建机制解
作者: LP9527 (ㄊㄇ抽菸都去)   2020-11-08 11:08:00
用 “档案数量 ”作判断啊..
作者: annheilong (方格子)   2020-11-09 10:22:00
你有办法下载档案就会知道档名吧?
作者: s860134 (s860134)   2020-11-10 09:14:00
档案数量和 .temp 应该是合理解
楼主: MAGICXX (逢甲阿法)   2020-11-11 11:53:00
我最后是去比对 如果没有crdownload 就继续抓这样

Links booklink

Contact Us: admin [ a t ] ucptt.com