※ 引述《n0bp6gjo3 ()》之铭言:
: ※ 引述《qq320 (QQ糖)》之铭言:
: : 推 P2:原来是个zip档,里面装有画面片段@@ 06/26 07:22
: : 推 qq320:有人知道怎么抓吗 都抓不下来 Q_Q 06/26 07:41
: : 推 ian90911:查看原始码 搜寻zip 找src 复制 把斜线取代 06/26 08:54
: : 其实从天开放新功能后 有不少绘师都开始上传动画
: : 但是不管怎么试都抓不下来
: : 查原始码找zip的方法也试过 但还是会出现403 Forbidden
: : 想请问有人找到能成功抓图的方法了吗?
: : 感恩 Q_Q
: 照上述方法后找到src这段
: 大概是为了防止被抓取造成流量过大
: 所以他们在原始码里面加了\
: 正常的网址是 http:// 这样
: 添加\过后的的是 http:\/\/
: 所以只要把网址内的\移除就可以正常下载了
: 还要自行还原好麻烦啊
其实那不是防止流量过大的问题,而是JavaScript本身的设定
(以下是程式码解说,没接触过的请直接跳最后看结论)
以illust_id=44315162这个“ora ora ora!”来说
其程式码(写在<script>......</script>里面)是这个样子:
(有些段落太长所以我截断了)
pixiv.context.illustId = '44315162';
pixiv.context.illustTitle = 'ora ora ora!';
pixiv.context.userId = '3681080';
pixiv.context.userName = 'NueNya';
pixiv.context.hasQuestionnaire = false;
pixiv.context.embedId = '44315162_34d64224341854b8019b057ea6a049ca';
pixiv.context.explicit = false;
pixiv.context.illustSize = [500, 313];
pixiv.context.ugokuIllustData = {
"src":"http:\/\/i1.pixiv.net\/img-zip-ugoira\/
img\/2014\/06\/26\/02\/26\/36\/44315162_ugoira600x600.zip",
"mime_type":"image\/jpeg",
"frames":[
{
"file":"000000.jpg",
"delay":100
},
{
"file":"000001.jpg",
"delay":100
}
]
};
pixiv.context.ugokuIllustFullscreenData = {
"src":"http:\/\/i1.pixiv.net\/img-zip-ugoira\/
img\/2014\/06\/26\/02\/26\/36\/44315162_ugoira1920x1080.zip",
"mime_type":"image\/jpeg",
"frames":[
{
"file":"000000.jpg",
"delay":100
},
{
"file":"000001.jpg",
"delay":100
}
]
};
从这边可以看的出来其网址是写在pixiv.context.ugokuIllustData
以及pixiv.context.ugokuIllustFullscreenData这两个物件里面的src属性
由于“/”字符本身在JavaScript里面是个特殊字符
(“//”在JavaScript代表其后文字都视为注解,
也就是说如果维持“http://......”的文字不变的话,
程式会把“//”后面的字符都当作是注解,到时程式就会挂掉不能执行)
为了避免程式不能执行,因此当一个网址用字串的方式存进去的时候,
JavaScript会自动把/都加上“\”字符
(“\”字符是JavaScript指定的特殊字符,加在其后面的字元会变回本来的意思,
例如“\/”在JavaScript代表的是“字符/”而不是“特殊符号/”)
所以说,这不是Pixiv在刁难人,
而是因为如果不这么写,Pixiv就会挂掉不能看了
(单纯指网页不能看,不是服务器不能用)