[问题] BeautifulSoup 新手问题

楼主: bluefantasia (镜华)   2018-03-14 11:56:01
各位前辈好,小弟
刚开始接触Python,最近刚学到BeautifulSoup做爬虫
于是就想要试着实做看看,但是看了老半天还是不是很了解
soup.get_text、soup.content等差别
还有bs4.element.Tag到底有那些指令是可以用的
目前小弟用yahoo的电影排行做练习,程式码如下:
作者: froce (froce)   2018-03-14 16:00:00
楼主: bluefantasia (镜华)   2018-03-14 16:13:00
感谢f大,但是我目前用上面程式码跑的结果是如下:['2'] <div class="rank_txt">红雀</div>前面的[2]用content提出来,但是后面名字却提不出来find_all我看到可用加关键字,但是片名似乎无法?
作者: froce (froce)   2018-03-14 16:33:00
因为你的Title第1个会是None(bs4没找到),当然不会有contcontents可以给你抓啊。https://ideone.com/2K5hXn你可以看我改过的范例
楼主: bluefantasia (镜华)   2018-03-14 16:58:00
f大的结果就是我想做出来的啊(泣)~但想请问一下if A and B一般是两者成立,所以这边是两者都有找到才print出来的意思吗?
作者: froce (froce)   2018-03-14 17:04:00
对,没找到会传回 None,None typeˉ当然不会有contents等属性,你要程式印出 None.contents,我们可爱的蟒蛇当然会生气气的跟你说“你唬我喔”。所以要检查传回结果都不是 None,才能存取contents属性。另外可以去学 pyquery,学会你也会用 CSS selector 了。
楼主: bluefantasia (镜华)   2018-03-15 04:51:00
收到,感谢f大的指点

Links booklink

Contact Us: admin [ a t ] ucptt.com