[问题] 新手爬虫问题

楼主: giveme520   2016-07-26 23:31:53
在练习抓资料上网找网页照打
然后卡在 IndexError: list index out of range
教网页只说打[0]
但是我抓的网页出来空格多很多
http://imgur.com/a/xR1PN
是要改成多少数值呢? 谢谢
作者: ccvs (kisS x Sis)   2016-07-27 12:02:00
你有先看过DOM的文件吗空格是因为node中没有strong这个标签
楼主: giveme520   2016-07-29 12:59:00
@@ 可是我用infolite看是strong说..
作者: tacovirus (小璋丸)   2016-07-29 13:36:00
Python 写爬虫欢迎来这我的 GitHub 抄http://tinyurl.com/juhodhr
楼主: giveme520   2016-07-30 23:07:00
感谢!
作者: kimball (我在抗拒什么...)   2016-07-31 03:03:00
你 .product-content 那行抓到的 list,里面有很多元素没有 strong 的标签。 更精确的说是有些有,有些没有没有的元素,你再用 strong 去抓,就会抓不到东西,变成空的 list。 空的list就没东西了,用索引取值自然爆error解法之一是加一个逻辑, 如 if len(item)==0: 再抓strong
楼主: giveme520   2016-07-31 16:34:00
谢谢 我再试试!以前只学过ㄧ点VB和JAVA都还回去了

Links booklink

Contact Us: admin [ a t ] ucptt.com