[资讯] HTML解析库 requests-html

楼主: vi000246 (Vi)   2018-03-15 17:47:07
GithubL:https://github.com/kennethreitz/requests-html
文件:http://html.python-requests.org/
刚在github看到 觉得很实用就分享一下
这套件可以用来解析html
支援javascript render
不需要特地用selenium就能取得js渲染过的html
也支援复杂的CSS选择器与xpath语法
还能自动翻页,我不知道这怎么实现的 还满厉害的
之前都是用xpath搭配正规表达式硬干
这套件看起来还满方便的
作者: uranusjr (←這人是超級笨蛋)   2018-03-15 18:06:00
自动翻页就是用猜的, 没什么魔法
作者: HenryLiKing (HenryLiKing)   2018-03-15 21:42:00
有支援JS有点猛欸 为什么啊?!
作者: Sunal (SSSSSSSSSSSSSSSSSSSSSSS)   2018-03-15 23:00:00
用了pyppeteer 是Puppeteer的非官方py版本会下载安装Chromium~~~
作者: gbllggi (gbllggi)   2018-03-15 23:57:00
推推

Links booklink

Contact Us: admin [ a t ] ucptt.com