PTT
Submit
Submit
选择语言
正體中文
简体中文
PTT
Python
[问题] python抓网页资料问题
楼主:
sariel0322
(sariel)
2014-12-23 21:40:26
不好意思又来发问,而且这次不知道算不算纯python问题
想请问一下,我用beautifulsoup来抓取网页资料
想要抓的是这个网页按下"perform"的资料
原本的网址:http://web.expasy.org/cgi-bin/peptide_mass/peptide-mass.pl?P35225
按下后会跑出这一类的资料
http://ppt.cc/xTj1
但是这些资料的网址却变成:http://web.expasy.org/cgi-bin/peptide_mass/peptide-mass.pl
用beautifulsoup抓的时候就变成错误了,用这网址当然也不能用
想请问一下,我该怎么抓附图的资料
作者:
Seudo
(进击的三笠)
2014-12-23 23:28:00
requests.post(url,data={'protein':'P35225'}).text
作者:
Thisisnotptt
(这不是PTT)
2014-12-23 23:55:00
http://pastebin.com/McZWCQq7
你试试看行不行,有用到mechanize套件送出相对应的POST他就会给你对的资料了
楼主:
sariel0322
(sariel)
2014-12-30 23:36:00
好像不行...一楼可以读,但是重要的table的资料出不来
作者:
Seudo
(进击的三笠)
2014-12-31 17:49:00
form都填完就会有table资料了
http://pastebin.com/bXMu52QX
继续阅读
[问题] Django仿做网页部分功能
tino9808
[闲聊] Rusthon
changyuheng
Re: [问题] 透过 Python 即时更新 Excel
largesperm
Re: [问题] 大量资料程式抓取
alibuda174
[问题] 大量资料程式抓取
sariel0322
Re: [问题]我写的爬虫只会爬到第一个符合条件的
Seudo
[问题]我写的爬虫只会爬到第一个符合条件的
elmo56
[问题]scrapy如何将item的资料成对的储存起来?
allen511081
Re: [问题] function 的默认值
Seudo
[问题] function 的默认值
ql4au04
Links
booklink
Contact Us: admin [ a t ] ucptt.com