PTT
Submit
Submit
选择语言
正體中文
简体中文
PTT
Python
[问题] BeautifulSoup 新手问题
楼主:
bluefantasia
(镜华)
2018-03-14 11:56:01
各位前辈好,小弟
刚开始接触Python,最近刚学到BeautifulSoup做爬虫
于是就想要试着实做看看,但是看了老半天还是不是很了解
soup.get_text、soup.content等差别
还有bs4.element.Tag到底有那些指令是可以用的
目前小弟用yahoo的电影排行做练习,程式码如下:
作者:
froce
(froce)
2018-03-14 16:00:00
http://beautifulsoup.readthedocs.io/zh_CN/latest/#id27
find_all()应该会是你要的
楼主:
bluefantasia
(镜华)
2018-03-14 16:13:00
感谢f大,但是我目前用上面程式码跑的结果是如下:['2'] <div class="rank_txt">红雀</div>前面的[2]用content提出来,但是后面名字却提不出来find_all我看到可用加关键字,但是片名似乎无法?
作者:
froce
(froce)
2018-03-14 16:33:00
因为你的Title第1个会是None(bs4没找到),当然不会有contcontents可以给你抓啊。
https://ideone.com/2K5hXn
你可以看我改过的范例
楼主:
bluefantasia
(镜华)
2018-03-14 16:58:00
f大的结果就是我想做出来的啊(泣)~但想请问一下if A and B一般是两者成立,所以这边是两者都有找到才print出来的意思吗?
作者:
froce
(froce)
2018-03-14 17:04:00
对,没找到会传回 None,None typeˉ当然不会有contents等属性,你要程式印出 None.contents,我们可爱的蟒蛇当然会生气气的跟你说“你唬我喔”。所以要检查传回结果都不是 None,才能存取contents属性。另外可以去学 pyquery,学会你也会用 CSS selector 了。
楼主:
bluefantasia
(镜华)
2018-03-15 04:51:00
收到,感谢f大的指点
继续阅读
[教学] python import xlwing 问题
gecer
[问题] CMD执行速度
bckkt
[问题] no module named、 cannt import name
letmeloveyou
[问题]算法 k distinct letters
suhang
Re: [问题] 跑Keras的model正常GPU使用率会是多少
pipidog
[问题] gurobi 最佳化 多重解问题
jasonfghx
[问题] Pycharm安装library问题
HybridSC
[问题] 新手pycharm skimage一直装不好
jerryhsieh30
[问题] Selenium xpath 读取href的问题
zo6596001
[问题]PYTHON 新手请教,如何重复运行程式
xmsun
Links
booklink
Contact Us: admin [ a t ] ucptt.com