[问题] 爬虫伪元素问题

楼主: ks110159 (HFDragon)   2018-05-23 15:02:49
小弟最近在练习简单的爬虫
使用bs抓取资料
但每每遇到 ::before ::after 之间的资料
像抓取以下中国时报的新闻标题 都无法顺利抓取
https://i.imgur.com/mnC6a0p.jpg
爬了一下文发现是非html的部分
想请问有什么方法可以解决这种js的问题
作者: tlaceruse   2018-05-23 16:40:00
关键找 js 怎么吃资料进来的。如果真的找不到 那就直接模拟开启浏览器选元素 一般都选得到 但吃资源问题
楼主: ks110159 (HFDragon)   2018-05-23 17:50:00
请问t大 模拟浏览器选元素是使用selenium吗
作者: HybridSC (VisionS)   2018-05-25 02:25:00
selenium
楼主: ks110159 (HFDragon)   2018-05-25 09:06:00
谢谢h大

Links booklink

Contact Us: admin [ a t ] ucptt.com