哈囉,我正在用Python写一个自动抓图程式,想要从HTML码中抓出href的连结。
使用Selenium 的 find_element_by_xpath ,但不管怎么样都抓不出连结。
HTML码如下:
...
<li><a class="AAA XXX" href="连结1">View</a></li>
<li><a class="AAA" href="连结1">Download</a></li>
<li><a class="BBB" href="连结2">Download Large Version</a></li>
...
程式码如下:
try :
# 优先下载大图(连结2)
target = driver.find_element_by_xpath("//a[@class='BBB']")
print(target.text)
except:
# 没有大图
try:
# 下载小图 (连结1)
target = driver.find_element_by_xpath("//a[@class='AAA']")
print(target.text)
except:
# 连结没有图片
print ("nothing")
输出结果:
Download Large Version
上网查了一下,改成
target = driver.find_element_by_xpath("//a[@class='BBB']/@href")
输出结果则是:
nothing
请问一下,要怎么让xpath读出href的连结呢?
还是有什么更好的方法呢?