使用python 3.5版本
最近想摸一下beautifulsoup的功能
所以想爬broadway的网站,写个简易查询时刻表等功能
问题是这样的
先附上code
url= 'https://www.nyc.com/broadway_tickets/'
html = urllib.request.urlopen(url).read()
soup BeautifulSoup(html, 'html.parser')
dramaName = soup.find_all('h2')
dramaList = []
for i in dramaName:
Print(i.string)
dramList.append(i.string)
剧名是放在h2 底下,但我用find_all去找body底下的h2标签
只能找出局部的资讯,没办法找出所有的剧名
爬了一下stackflow, 有看到有些网站支援问题
有尝试把html.parser换成lxml,但问题还是存在
想请问有可能朝哪个方向去解决这问题呢?
谢谢