[问题] 用beautifulsoup抓网页中的表格 cawaiilulu PTT批踢踢实业坊

[问题] 用beautifulsoup抓网页中的表格

楼主: cawaiilulu (across) 2017-08-04 03:50:07

要抓一个wiki page中的表格以计算
但是我只会作到抓下整个html码
接下来就不知道怎么作
https://en.wikipedia.org/wiki/World_Series_television_ratings
像以上这样
请问我要怎么样才能够只抓下 1984~年的收视率表格?
Television ratings by year, 1984 – present
python3 谢谢

作者: ntumath (math mad) 2017-08-04 08:30:00

bf = Beautiful(url,'html.parser')target = bf.findAll('table')[1]想做计算可以用pandas，先熟悉用bf抓contents吧

作者: coeric ( ) 2017-08-04 11:14:00

楼上的汤被偷了........pandas很强，但也很鸡肋遇到一些很乱的网页时所要的资讯尽乱塞在表格很奇怪的地方而且还是分开的我就放弃pandas，改回归原始的美丽的汤不过，用美丽的汤，也是得突破千万难关才有办法抵达就是同你说的 ("div", {class}:...昨天在捞统联客运的讯息时，差点没吐血........就你说的一样是看html找标签按F12 进到开发人员模式去看

作者: ntumath (math mad) 2017-08-04 21:24:00

要是只抓这种一页的资讯，怕麻烦就用xpath或css一键复制会用到特别标注id,class这种的通常是需要抓同个架构下差不多的内容，但是怕重新request的时候改变xpath的那种

继续阅读

[问题]PyCharm无法显示中文的问题schedule6666 Re: [问题] scikit-learn模型训练绩效backprog [问题] Django的ajax问题ShiaoJW [征才] 研究助理_利用工程科技减少路杀拯救石虎 lockq [问题] 使用Python写web的好公司?bubbleking Re: [问题] 如何将list,string 转成个别的tuple元素(已解决)angleevil [问题] 如何将list,string 转成个别的tuple元素(已解决)angleevil Re: [问题] scikit-learn模型训练绩效backprog [问题] scikit-learn模型训练绩效sya0706 [问题] 字符的matrix?LessonWang