[问题] Rselenium操作chrome爬取IE限定网页问题

楼主: nico831116 (P)   2020-06-17 09:39:45
[问题类型]:
程式咨询(我想用R 做某件事情,但是我不知道要怎么用R 写出来)
[软件熟悉度]:
使用者(已经有用R 做过不少作品)
[问题叙述]:
情境1:
我想要抓取某个只能限定IE开启的网页。
状况大体上是用IE开的话可以看到html下面有head>div>table等等,我想要抓table里的
元素。
但是用chrome开的话只能看到head,下面就都没有东西了。
情境2:
因为是公司的电脑有权限问题,我无法安装IE的driver。
情境3:
Google driver可以安装,我可以用Rselenium启动chrome爬取网页。
情境4:
我已尝试在Chrome上安装附加元件IE-tab,并使用Rselenium开启。但由于IE-tab是模拟
器的关系,我无法抓取用IE-tab所显示的网页元素。
问题:
请问有什么方法可以突破这个难关?
或者有什么其他的方式与思路可以让我使用chrome爬取IE限定网站,想请各位版大开示一
下……
2020/6/20更新
发现好像是因为该网页只能使用IE文件模式7和8,而非浏览器模式的问题。
不晓得Chrome有没有办法更改文件模式?
[关键字]:
Rselenium
作者: empireisme (empireisme)   2020-06-17 17:30:00
不然不要用R爬用python爬可以吗
作者: andrew43 (讨厌有好心推文后删文者)   2020-06-17 18:07:00
IE限定是怎么个限定法?连HTML都不给吗?
作者: whs2009 (欧森)   2020-06-17 19:57:00
限定用IE开是因为和有ActiveX的元件还是server有方式辨识client端采用chrome而block呢? 如果是透过user-agent来block 其他浏览器可以尝试去改chrome的user agent 或是 Window name来避开XD
作者: andrew43 (讨厌有好心推文后删文者)   2020-06-18 15:23:00
非IE但改过user-agent伪装IE6/7也不行吗?
作者: whs2009 (欧森)   2020-06-20 18:51:00
透过wdman package 的 IE driver 有办法吗

Links booklink

Contact Us: admin [ a t ] ucptt.com