[问题] Beautifulsoup的问题

楼主: kanako (我是香民)   2014-03-10 11:04:28
我在解析网页时遇到某个字段tag的层数不固定
可能的例子:
1.<div>范例</div>
2.<div><div>范例</div></div>
3.<div><div><p>范例</p></div></div>
想请问一下我要如何处理以上三种状况,才能正确取出范例这两个字?
只能用regular expression吗?
谢谢
作者: jokester (蛮王科科)   2014-03-10 12:09:00
可以po一下代码吗? 我用BeautifulSoup.getText()就拿到
作者: qwertmn (抽筋)   2014-03-11 01:45:00
In [1]: from bs4 import BeautifulSoupIn [2]: body = BeautifulSoup('<div><div><p>范例</p></dIn [3]: body.text这样抓不到妈?

Links booklink

Contact Us: admin [ a t ] ucptt.com