[问题] beautifulsoup 抓网站资料

楼主: nomind (Take it easy)   2016-02-23 19:43:01
想要抓的资料是 http://store.hp.com/us/en/cat/Laptops
Shop Now 所有连出去的连结
写过其他的爬虫程式,底下的方法都可以用,不知道为什么这个网站抓不到想到的资料
homePage = requests.get("http://store.hp.com/us/en/cat/Laptops")
homeSoup = BeautifulSoup(homePage.text.encode("utf-8"),"html.parser")
for data in homeSoup.find_all('a',{"class":"details"}):
print(data.get("href"))
麻烦大家帮忙解惑,谢谢
作者: Ziom (Oquainogen)   2016-02-23 20:44:00
把"html.parser"的参数取消就可以了耶可以改用其他像"html5lib"会比较少出问题
楼主: nomind (Take it easy)   2016-02-23 21:19:00
成功了! 感谢

Links booklink

Contact Us: admin [ a t ] ucptt.com