PTT
Submit
Submit
选择语言
正體中文
简体中文
PTT
Python
[问题] 新手发问
楼主:
cow1487
(JOKER)
2016-05-29 18:56:31
小弟目前刚刚开始在学习爬虫,可以抓取到附图的超连结,但不知道如何将后面的一些文
字(标题、发布时间、发布的地点等...)抓取下来,网站本身结构有些复杂,不能单单用
标签抓下来,经过发问之后,得到的回应是能透过URL定位资讯后,再透过(例
:20+[span-title].length+2)将位置定下来,之后透过循环抓取资料,但不知道该如何下
手,来此请求各位大大的帮助。
http://screenshot.net/0ol0vs3?tw
作者:
kenduest
(小州)
2016-05-29 19:10:00
用 BeautifulSoup 拆解网页内容会单纯很多
继续阅读
[问题] for 问题
soul810707
Re: [问题] 正规表示法"*?"
darkk6
Re: [问题] 正规表示法"*?"
darkk6
[问题] 正规表示法"*?"
cryinrain
[问题] Django Cache
Segundus
[闲聊] 求pycon票1张(社会人士)
raya11600
Re: [问题] Python List筛选-重复元素
dream0830
[问题] 关于 plotly 内 gauge chart 的指针调整
tacosung
[征人] 急征Web scraping/网页大数据挖掘工程师
jiarjia
[问题] 爬虫出现问题
proud
Links
booklink
Contact Us: admin [ a t ] ucptt.com