小弟是python新手 最近刚开始学习爬虫
但是最近遇到一个问题 就是怎么都移除不了<li>
以下部分是程式码
import urllib.request
import re
from bs4 import BeautifulSoup as bs4
page = urllib.request.urlopen('http://health.udn.com/disease/sole/185');
html = str(page.read(),'utf-8')
soup = bs4(html, 'html.parser')
s = soup.select('.outbreak > ul')
s = s[0]
print(s)
输出结果为:
<ul><li>随年龄增长而提高。男性大于45岁,女性大于55岁,又男性发生率高于女性。
</li><li>患有高血压、糖尿病、高血脂等疾病者。尤其糖尿病患常合并有三高,加上多
重代谢异常,坏胆固醇容易囤积在血管内,造成大规模阻塞病变。</li><li>情绪容易紧
张、易怒、忧虑和恐慌者。</li><li>过度劳累、生活压力大者。</li><li>缺乏规律运动
习惯者。</li><li>胆固醇、血脂肪及三酸甘油脂数值过高者。</li><li>菸瘾者,因抽烟
会加速粥状动脉硬化。</li><li>冠状动脉心脏病患者,或有冠状动脉心脏病家族史者。
患者因动脉硬化血管腔狭窄,很容易造成阻塞。</li></ul>
烦请各位高手指点了 谢谢大家