[问题] 新手发问

楼主: cow1487 (JOKER)   2016-05-29 18:56:31
小弟目前刚刚开始在学习爬虫,可以抓取到附图的超连结,但不知道如何将后面的一些文
字(标题、发布时间、发布的地点等...)抓取下来,网站本身结构有些复杂,不能单单用
标签抓下来,经过发问之后,得到的回应是能透过URL定位资讯后,再透过(例
:20+[span-title].length+2)将位置定下来,之后透过循环抓取资料,但不知道该如何下
手,来此请求各位大大的帮助。
http://screenshot.net/0ol0vs3?tw
作者: kenduest (小州)   2016-05-29 19:10:00
用 BeautifulSoup 拆解网页内容会单纯很多

Links booklink

Contact Us: admin [ a t ] ucptt.com