我误解了,实际跑下去应该是网页中 tag 判断有问题把 'lxml' parser 换成 'html.parser' 会好一点但是 DOM 的结构感觉还是和预想的有差距print(sp.find_all('table')[1]) 看一下尾端内容原本的 parser 爬得并不完整程式码中的 sp 就已经没抓到 "净利(损)归属于:"后的所有 <tr> tag 所以你在抓的时候抓不到可能 bs 本身有问题,直接拿 lxml.etree 来做是可以的
https://goo.gl/fGJCYt 这是改写过的版本