[问题] 用BeautifulSoup解析的网页码与原本不同

楼主: ponwar87123 (干我屁事喔北七)   2018-07-11 12:09:06
url = 'http://www.58b.tv/vod-play-id-87084-sid-0-pid-1.html'
html = urllib.request.Request(url,headers = headers)
req = urllib.request.urlopen(html).read().decode('utf-8')
soup = BeautifulSoup(req,features = 'lxml')
这是我喂给beautifulsoup的程式码
我要抓取的内容是那个网页里面的"xfplay://dna.xxxxxxxx"也就是"先锋传送门"那里的连结
但我发现beautifulsoup怎么样也抓不到
于是我直接print(soup)来看
发现没有那个"xfplay://"
怎么会这样@@ 该怎么办
作者: Kazimir (Kazimir)   2018-07-11 17:18:00
那个网址看起来是js组出来的 我觉得你要是不想动脑筋就用web-driver跑一遍自然有 不然的话你看response 293行那段应该是给js的资料 我猜应该可以用这个拼出下一层然后再从第二个档案拿拨放器的url
作者: TakiDog (多奇狗)   2018-07-12 02:47:00
.name .herf 可以直接取值 没记错的话等等name 在network 他是个封包吧,看你浏览器喂给他什么去处理
楼主: ponwar87123 (干我屁事喔北七)   2018-07-13 01:33:00
那我应该怎么取得那个封包呢
作者: TakiDog (多奇狗)   2018-07-13 19:26:00
看你那个封包怎么传带了什么资讯,用Python仿造出来,依照你的说法你要的网址就在回应中

Links booklink

Contact Us: admin [ a t ] ucptt.com