PTT
Submit
Submit
选择语言
正體中文
简体中文
PTT
Python
[问题] 抓取网页html source code?
楼主:
smilekerker
(科科:))
2015-01-23 18:10:04
刚要学怎么抓网页source code
再来解析自己要的资讯
结果第一步抓code就死掉了= =
譬如我想抓的网页是PCHOME 股市的某页
http://pchome.megatime.com.tw/rank/sto0/ock03.html
然后写了这个小程式
http://imgur.com/cMjJRCR
但是回传只有这样的讯息
http://imgur.com/UWLSyIH
请问这样是哪里有错误吗?
还是这网页不能这样读?
麻烦指点一下
谢谢 :)
作者:
uranusjr
(â†é€™äººæ˜¯è¶…級笨蛋)
2015-01-23 18:53:00
网上搜寻 ajax
楼主:
smilekerker
(科科:))
2015-01-23 19:16:00
这是ajax的特殊语法吗? 那我再去查查 谢谢 :)
作者:
secondsee
(窝ㄎ唷)
2015-01-23 19:23:00
这个网址就是只会吐这段html给你,你所看到的东西是因为browser去执行了里面的javascript改写到了原本的body
楼主:
smilekerker
(科科:))
2015-01-23 19:36:00
好的,看来是这样QQ,那有其他快速简洁的方法可以获得原始码的吗?
作者:
secondsee
(窝ㄎ唷)
2015-01-23 19:48:00
urllib2.urlopen(url,'is_check=1').read()
楼主:
smilekerker
(科科:))
2015-01-23 19:52:00
居然这么简单!! 万分感谢!!
继续阅读
[问题]该怎样将json档转成CSV?
allen511081
Re: [问题] python 档案上传
gn00618777
[问题] python 档案上传
gn00618777
[问题] 一行表列 ['cat','dog','rabbit'] 的字符
fourdollars
[问题]Visual Studio 2013 安装MySQL出现问题
BLKD
[问题] 下载的资料不见了 !!!
pttsasho
[问题] Django template language
eric111043
[问题] 想请问有关Python的书籍
jayzhuang
[问题] func default value 的 list 没有清掉
changyuheng
Re: [问题] 在客户端的网页显示
gn00618777
Links
booklink
Contact Us: admin [ a t ] ucptt.com