[问题] 爬虫遇到一样的class如何筛选

楼主: skyivan (官人)   2017-08-31 16:31:03
各位好,我看书试着依样画葫芦抓台彩首页的开奖号码
抓威力彩可以,但想抓大乐透时遇到问题
仔细一看发现有好几种商品的class都是contents_box02,用find只能得到第一个
只抓得到威力彩
用find_all可以同时找到好几个商品
但不知道如何只抓第三个class为contents_box02的div
想请教如何处理,程式码如下
import requests
from bs4 import BeautifulSoup
url="http://www.taiwanlottery.com.tw"
html=requests.get(url)
sp=BeautifulSoup(html.text, 'html.parser') #解析原始码
data1=sp.find_all('div',{'class':'contents_box02'})
print(data1)
作者: blue14753 (blue14753)   2017-08-31 16:41:00
print(data1[2]) ?
作者: wennie0433   2017-08-31 22:14:00
换个html5lib or lxml 解析看看
作者: coeric ( )   2017-09-01 11:02:00
print(data1[2]) 即可
楼主: skyivan (官人)   2017-09-01 11:22:00
原来这么简单...问题解决了,感谢楼上几位的回答

Links booklink

Contact Us: admin [ a t ] ucptt.com