PTT
Submit
Submit
选择语言
正體中文
简体中文
PTT
Python
Re: [问题] python网络爬虫,怎么抓取表格内容
楼主:
okeyla
(小宝)
2017-07-22 10:32:46
※ 引述《okeyla (小宝)》之铭言:
: 我想一次抓取全家便利店全省的商店资讯,
: 观察到是他以每个县市命名为各自的.php, 然后各县市商店都在对应的php里面.
: idea是先抓取各县市的php名称放入list,
: 再以此list带出各县市的网页, 再取出商店资讯.
: 目前卡在这儿, 找不着标签...
: import requests
: from bs4 import BeautifulSoup
: res = requests.get('http://www.allergen.com.tw/famistore.php')
: res.encoding = 'utf-8'
: #print res.text
: soup = BeautifulSoup(res.text)
: # 跑个loop挑出famiKeelung.php, famiTaipei.php... etc.
: print soup.select('.td') <
作者:
LessonWang
(橘白Cat)
2017-07-22 11:00:00
css selector 不是只有class和id选择器而已啊xd话说原po怎不想使用lxml的etree以及HTMLParser搭配浏览器的xpath checker很快就抓的到资料啦xd
http://i.imgur.com/9K0wnq3.jpg
这些href属性值应该是你要的部分吧
http://i.imgur.com/n3Ef8Lu.jpg
作者: AlaRduTP (Eden)
2017-07-22 11:32:00
http://i.imgur.com/12Cwg4L.png
继续阅读
[问题] python网络爬虫,怎么抓取表格内容
okeyla
[问题] 请问编辑器对物件的提示功能
LeonH
[问题] list的维度怎么算
LessonWang
[问题] 爬虫 多家公司股市新闻
henrycc
Re: [问题] GUID 字串格式转换
uranusjr
Re: [问题] GUID 字串格式转换
LessonWang
[问题] GUID 字串格式转换
LwHow
[闲聊] python 对硬盘操作
j5128709
[问题] list比对
LaughPoint
Re: [问题] 关于list的append方法
zerof
Links
booklink
Contact Us: admin [ a t ] ucptt.com