PTT
Submit
Submit
选择语言
正體中文
简体中文
PTT
Python
[问题] Beautifulsoup的问题
楼主:
kanako
(我是香民)
2014-03-10 11:04:28
我在解析网页时遇到某个字段tag的层数不固定
可能的例子:
1.<div>范例</div>
2.<div><div>范例</div></div>
3.<div><div><p>范例</p></div></div>
想请问一下我要如何处理以上三种状况,才能正确取出范例这两个字?
只能用regular expression吗?
谢谢
作者:
jokester
(蛮王科科)
2014-03-10 12:09:00
可以po一下代码吗? 我用BeautifulSoup.getText()就拿到
作者: qwertmn (抽筋)
2014-03-11 01:45:00
In [1]: from bs4 import BeautifulSoupIn [2]: body = BeautifulSoup('<div><div><p>范例</p></dIn [3]: body.text这样抓不到妈?
继续阅读
[问题] ipython notebook 执行顺序?
kusoayan
Re: [闲聊] 魏老师的挑战状2
weijr
Fw: [请益] 我的需求用python是否适合?
orangeforest
[问题] tempelate与tempelatetags
IDanceAlong
[闲聊] 魏老师的挑战状2
changyuheng
[闲聊] 在 M$ 环境下读档
apua
Re: [问题] 字串处理 - 简化程式码
pycontw
[问题] 有没有人写过python平行处理
tonykai
Re: [问题] 字串处理 - 简化程式码
auoauo
Re: [问题] 网络上有关于资料结构使用Python的教学
Neisseria
Links
booklink
Contact Us: admin [ a t ] ucptt.com