[问题] 抓取网页html source code? smilekerker PTT批踢踢实业坊

[问题] 抓取网页html source code?

楼主: smilekerker (科科:)) 2015-01-23 18:10:04

刚要学怎么抓网页source code
再来解析自己要的资讯
结果第一步抓code就死掉了= =
譬如我想抓的网页是PCHOME 股市的某页
http://pchome.megatime.com.tw/rank/sto0/ock03.html
然后写了这个小程式

但是回传只有这样的讯息

请问这样是哪里有错误吗?
还是这网页不能这样读?
麻烦指点一下
谢谢 :)

作者: uranusjr (â†é€™äººæ˜¯è¶…ç´šç¬¨è›‹) 2015-01-23 18:53:00

网上搜寻 ajax

楼主: smilekerker (科科:)) 2015-01-23 19:16:00

这是ajax的特殊语法吗? 那我再去查查谢谢 :)

作者: secondsee (窝ㄎ唷) 2015-01-23 19:23:00

这个网址就是只会吐这段html给你,你所看到的东西是因为browser去执行了里面的javascript改写到了原本的body

楼主: smilekerker (科科:)) 2015-01-23 19:36:00

好的，看来是这样QQ，那有其他快速简洁的方法可以获得原始码的吗?

作者: secondsee (窝ㄎ唷) 2015-01-23 19:48:00

urllib2.urlopen(url,'is_check=1').read()

楼主: smilekerker (科科:)) 2015-01-23 19:52:00

居然这么简单!! 万分感谢!!

继续阅读

[问题]该怎样将json档转成CSV? allen511081 Re: [问题] python 档案上传gn00618777 [问题] python 档案上传gn00618777 [问题] 一行表列 ['cat','dog','rabbit'] 的字符fourdollars [问题]Visual Studio 2013 安装MySQL出现问题BLKD [问题] 下载的资料不见了 !!!pttsasho [问题] Django template language eric111043 [问题] 想请问有关Python的书籍jayzhuang [问题] func default value 的 list 没有清掉changyuheng Re: [问题] 在客户端的网页显示gn00618777

Contact Us: admin [ a t ] ucptt.com