[问题] 用BeautifulSoup解析的网页码与原本不同 ponwar87123 PTT批踢踢实业坊

[问题] 用BeautifulSoup解析的网页码与原本不同

楼主: ponwar87123 (干我屁事喔北七) 2018-07-11 12:09:06

url = 'http://www.58b.tv/vod-play-id-87084-sid-0-pid-1.html'
html = urllib.request.Request(url,headers = headers)
req = urllib.request.urlopen(html).read().decode('utf-8')
soup = BeautifulSoup(req,features = 'lxml')
这是我喂给beautifulsoup的程式码
我要抓取的内容是那个网页里面的"xfplay://dna.xxxxxxxx"也就是"先锋传送门"那里的连结
但我发现beautifulsoup怎么样也抓不到
于是我直接print(soup)来看
发现没有那个"xfplay://"
怎么会这样@@ 该怎么办

作者: Kazimir (Kazimir) 2018-07-11 17:18:00

那个网址看起来是js组出来的我觉得你要是不想动脑筋就用web-driver跑一遍自然有不然的话你看response 293行那段应该是给js的资料我猜应该可以用这个拼出下一层然后再从第二个档案拿拨放器的url

作者: TakiDog (多奇狗) 2018-07-12 02:47:00

.name .herf 可以直接取值没记错的话等等name 在network 他是个封包吧，看你浏览器喂给他什么去处理

楼主: ponwar87123 (干我屁事喔北七) 2018-07-13 01:33:00

那我应该怎么取得那个封包呢

作者: TakiDog (多奇狗) 2018-07-13 19:26:00

看你那个封包怎么传带了什么资讯，用Python仿造出来，依照你的说法你要的网址就在回应中

继续阅读

[问题] heroku django 重新导向问题Liliummy [问题] selenium模拟登入信箱但帐密不同页waterlovers [问题] 时间复杂度分析sean72 [问题] Dataframe mean平均值问题powerkshs [问题] 如何爬虫爬取同一个网页不同标签的超连结ponwar87123 [问题] windows 命令模式下的python xxx.py IPescorpion [问题] javascript K 线图撷取yshihyu Re: [问题] 自动点击网页Hsins [问题] 自动点击网页WENroger [问题] 请问如何将程式码以pdf输出yiche