url = 'http://www.58b.tv/vod-play-id-87084-sid-0-pid-1.html'
html = urllib.request.Request(url,headers = headers)
req = urllib.request.urlopen(html).read().decode('utf-8')
soup = BeautifulSoup(req,features = 'lxml')
这是我喂给beautifulsoup的程式码
我要抓取的内容是那个网页里面的"xfplay://dna.xxxxxxxx"也就是"先锋传送门"那里的连结
但我发现beautifulsoup怎么样也抓不到
于是我直接print(soup)来看
发现没有那个"xfplay://"
怎么会这样@@ 该怎么办
作者: Kazimir (Kazimir) 2018-07-11 17:18:00
那个网址看起来是js组出来的 我觉得你要是不想动脑筋就用web-driver跑一遍自然有 不然的话你看response 293行那段应该是给js的资料 我猜应该可以用这个拼出下一层然后再从第二个档案拿拨放器的url