Re: [问题] 网络爬虫抓不到标签<img>的src属性 rexyeah PTT批踢踢实业坊

Re: [问题] 网络爬虫抓不到标签<img>的src属性

楼主: rexyeah (ccccccc) 2018-11-11 21:29:57

不在意速度的话...
from selenium import webdriver
from bs4 import BeautifulSoup
url = 'https://v.comicbus.com/online/comic-103.html?ch=924'
browser = webdriver.PhantomJS()
browser.get(url)
html = browser.page_source
soup = BeautifulSoup(html, 'html.parser')
img_url = 'https:%s' % soup.find('img', {'id': 'TheImg'})['src']
print img_url
====
不过其实phantomjs已经deprecated了，但还是可以用。
上面那段我自己跑过，可以抓到，只是真的很慢
※ 引述《bugbug777 (sil)》之铭言：
: 大家好，小鲁是个网络爬虫新手
: 最近想来写一个下载图片的网络爬虫
: 这里附上简短的程式码
: <img border="0" id="TheImg" name="TheImg"/>
: 似乎抓不到src的这个属性，请问这是为什么？
: 图示8comic的海贼王924话图片
:

作者: bugbug777 (sil) 2018-11-11 21:55:00

请问用火狐可以嘛还是你只是随便挑一个浏览器用@@a

楼主: rexyeah (ccccccc) 2018-11-11 22:06:00

都可以我只是顺手用个default headless的driver

作者: bugbug777 (sil) 2018-11-11 22:15:00

谢谢你喔还贴出完整的程式码

作者: zo6596001 (超帅肥宅) 2018-11-12 00:34:00

我在上一串贴的图用火狐，是因为在Linux比较好装

继续阅读

[已解决] 网络爬虫抓不到标签<img>的src属性bugbug777 [问题] tkinter print另一个执行中的py档的方法st40182 [问题] 有关dict用法 (DFS找有向图中的cycle)skyHuan [问题] if 的判断是否有特殊限制?jasonhsu14 [问题]python爬虫中html选取元素问题cscscs56 [问题] 简单面试问题jkkert [问题] 如何安装另一个anaconda promptbewilderment [问题] xlwings excel插图透明化caron0225 [问题]爬虫-汇率运算问题cscscs56 [问题] python正规表示式如何做？han999

Re: [问题] 网络爬虫 抓不到标签<img>的src属性

Re: [问题] 网络爬虫抓不到标签<img>的src属性