[问题] 爬虫 Beautifulsoup4 一些小困难

楼主: asd860079 (U戏boy)   2017-10-05 06:29:14
大家好,小弟算python新手
爬虫和写稍微有点规模的python小程式都是第一次
遇到了一点小问题所以上来请教
今天我试着想要抓取LOL game history的一些数据
透过Json把下面static的部分抓完了
但还是有些资讯没包刮在那份Json里面
所以还是想说回到一开始的方法 去抓显示页的资讯
最后在抓英雄名称的时候遇到了一点问题
如图,我的程式码和输出结果长这样
https://imgur.com/1kJzxTM.jpg
我最多只能抓到这样
但是我只想要 'data-rg-id'后面的英雄名而已
其他还试过item.select('data-rg-id') ...等等自己凭感觉乱打的一些code
但不是error就是 空白 (没有print出任何东西)
print出20个空list[] 好像是最接近的了(?
https://imgur.com/LVg5qdJ.jpg
这个是主要的问题
还有一个小问题就是有没有其他写法可以优化执行的速度 XD
因为上面这样console出来都要花个30秒左右
好像稍嫌慢了一点(?
以上,还请各位大大不吝赐教
小弟第一次在本版发文,如有违规或不妥还请告知
作者: coeric ( )   2017-10-05 08:11:00
页面?
作者: lizkarina (lizka)   2017-10-05 15:34:00
Attribute selectors 看一下吧。https://goo.gl/ai2fj

Links booklink

Contact Us: admin [ a t ] ucptt.com