[问题] 卦板用request取得之原始码不合

楼主: DaKyu (丹明)   2018-01-26 17:28:50
大家好,
我目前刚开始藉Su Billy大大的简单爬虫教学video初学python爬虫
遇到有个小问题,
就是我用request抓卦板的原始码时
-
res = request.get('https://www.ptt.cc/bbs/Gossiping/index.html')
print(res.text)
-
印出的原始码跟实际卦板网页的原始码对不上,
而是显示像是PTT入口页面的内容 如下图
https://imgur.com/gmTQFY9
BUT!
我用Salary, Tech_job跟表特等其他板测试, 却都没有问题@@
想请问卦板的内容有何特殊之处吗?
我对前端的html和CSS等语言完全不熟, 只学过基础的python
望大家指教,谢谢板友Orz
作者: uranusjr (←這人是超級笨蛋)   2018-01-26 17:31:00
Session 问题, 你 request 里面没按过那个 18 禁按钮
作者: leo850611 (Victorique)   2018-01-27 17:14:00
貌似模拟Google爬虫可绕过那个按钮
作者: penut85420 (PenutGGorz)   2018-01-29 14:25:00
可以用Selenium去点那个按钮
作者: galeondx   2018-03-06 04:36:00

Links booklink

Contact Us: admin [ a t ] ucptt.com