[问题] 新手发问 cow1487 PTT批踢踢实业坊

[问题] 新手发问

楼主: cow1487 (JOKER) 2016-05-29 18:56:31

小弟目前刚刚开始在学习爬虫，可以抓取到附图的超连结，但不知道如何将后面的一些文
字(标题、发布时间、发布的地点等...)抓取下来，网站本身结构有些复杂，不能单单用
标签抓下来，经过发问之后，得到的回应是能透过URL定位资讯后，再透过(例
:20+[span-title].length+2)将位置定下来，之后透过循环抓取资料，但不知道该如何下
手，来此请求各位大大的帮助。
http://screenshot.net/0ol0vs3?tw

作者: kenduest (小州) 2016-05-29 19:10:00

用 BeautifulSoup 拆解网页内容会单纯很多

继续阅读

[问题] for 问题soul810707 Re: [问题] 正规表示法"*?"darkk6 Re: [问题] 正规表示法"*?"darkk6 [问题] 正规表示法"*?"cryinrain [问题] Django CacheSegundus [闲聊] 求pycon票1张(社会人士)raya11600 Re: [问题] Python List筛选-重复元素dream0830 [问题] 关于 plotly 内 gauge chart 的指针调整tacosung [征人] 急征Web scraping/网页大数据挖掘工程师jiarjia [问题] 爬虫出现问题proud