[问题] 抓取网页html source code?

楼主: smilekerker (科科:))   2015-01-23 18:10:04
刚要学怎么抓网页source code
再来解析自己要的资讯
结果第一步抓code就死掉了= =
譬如我想抓的网页是PCHOME 股市的某页
http://pchome.megatime.com.tw/rank/sto0/ock03.html
然后写了这个小程式
http://imgur.com/cMjJRCR
但是回传只有这样的讯息
http://imgur.com/UWLSyIH
请问这样是哪里有错误吗?
还是这网页不能这样读?
麻烦指点一下
谢谢 :)
作者: uranusjr (←這人是超級笨蛋)   2015-01-23 18:53:00
网上搜寻 ajax
楼主: smilekerker (科科:))   2015-01-23 19:16:00
这是ajax的特殊语法吗? 那我再去查查 谢谢 :)
作者: secondsee (窝ㄎ唷)   2015-01-23 19:23:00
这个网址就是只会吐这段html给你,你所看到的东西是因为browser去执行了里面的javascript改写到了原本的body
楼主: smilekerker (科科:))   2015-01-23 19:36:00
好的,看来是这样QQ,那有其他快速简洁的方法可以获得原始码的吗?
作者: secondsee (窝ㄎ唷)   2015-01-23 19:48:00
urllib2.urlopen(url,'is_check=1').read()
楼主: smilekerker (科科:))   2015-01-23 19:52:00
居然这么简单!! 万分感谢!!

Links booklink

Contact Us: admin [ a t ] ucptt.com