[问题] wget 下载网页 src="//..."

楼主: VElysian (くるみ)   2018-08-31 22:32:59
如题
用 wget 下载的网页含有图片
网址:
https://www.mobile01.com/newsdetail/26682/eric-bike
图片:
src="//attach.mobile01.com/attach/201808/mobile01-abfe7e57cf816f7fb5fdcf08d1e98b34.jpg"
假设原始码为 src="//image.jpg"
wget 遇到这样的连结都无动于衷,
导致下载的网页不完整。
请问有没有解决办法,感激不尽!
作者: kenduest (小州)   2018-08-31 23:59:00
下载的命令完整参数是 ?
楼主: VElysian (くるみ)   2018-09-01 00:17:00
wget -HpkKE url找到 manual 中 --convert-file-only 有写The rest of the URL has been left untouched,including the net path ("//") which would otherwisebe processed by Wget and converted to the effectivescheme (ie. "http://").可是下载的档案里还是 src="//... 啊 ><"
作者: newversion (海纳百川)   2018-09-01 00:21:00
试试看 -m 或 -r
楼主: VElysian (くるみ)   2018-09-01 00:45:00
结果还是一样:wget -HpkKE -r -l 1 url
作者: Hevak (Arthow Eshes)   2018-09-01 01:52:00
你要从浏览器的角度去思考,看到 // 浏览器会自动把 // 转成跟当前页面一样协定比方说你网页在 https://,当下页面的 src="//开头网址"就会被当成 src="https://两斜线后面都一样" 处理
作者: hijkxyzuw (i,j,k) ×(x,y,z)   2018-09-01 13:15:00
用 --convert-links

Links booklink

Contact Us: admin [ a t ] ucptt.com