Re: [问题] 哪个浏览器配合插件可以边浏览边备份网站

楼主: danny0838 (道可道非常道)   2014-07-27 02:30:33
※ 引述《Sam0907 (列)》之铭言:
: 所以想找个浏览器可以达成边浏览就永久备份到电脑硬盘
: 包含文字以及图片
: 以及包含强力的搜寻功能,可以在备份的档案中输入个关键字就可以查到想查的资料
: 或者是用浏览的日期进行搜寻
可以试试 Firefox + ScrapBook X + AutoSave
https://github.com/danny0838/firefox-scrapbook/wiki/Intro-%28zh-tw%29
https://github.com/danny0838/firefox-scrapbook/wiki/Addons-%28zh-tw%29
这样的组合可以在浏览特定网址时自动撷取整个页面,
包括文字、图片、样式通通抓下来。
ScrapBook X 内建还算不错的全文搜寻功能,
支援多关键字以 and not 连结,也支援 regexp 搜寻。
效能方面,
我有个测试数据是从 1825 个资料项(共 1.27 GB)中搜寻某关键词,
找出 1917 笔结果,过程不到 3 秒钟。
不过搜寻前必须先建立快取,
1825 个资料项从头建立全文搜寻快取约 3~4 分钟,
如果是建立后再重建(无更新的会自动略过),大约 20 秒以内完成。
就字面上来说,应该都符合原问的需求,
只是...实际上可能不见得有想像中的好用...
首先,每浏览一个网页就撷取,会拖慢速度。
其次,现在很多网页的肥胖程度是超乎想像的,
比如,用 ScrapBook X 撷取一个脸书页面,
包含完整的文字、图片、样式,大概要 1.6 MB,
脸书很多图片、样式表是重复的,每撷取一页就复制一次,很浪费空间。
我们简单算一下,假设一天看 100 个网页,每个网页平均 1.5MB,
那么一年后将会吃掉 1.5*100*365/1024 = 53.5 GB 的硬盘空间。
当然,如果是专看图多的动漫网站,那绝对不只。
另外,很多 Web 应用程式其实没有真正的换页,像脸书、噗浪、gmail,
往往是在同一个网页动态加载新的讯息串、新的信件等内容,
由于这不是“换页”,因此 AutoSave 不会在加载这些东西后自动储存,这也要留意。
我个人不觉得备份所有网页是很有用的事,
顶多看到觉得有价值的页面手动备份一下就好,
其他网页若是无预警挂点,也多半有机会可以从 Google Cache 或 Web Archive 找回。
不过每个人的需求不同,要不要用,要怎么用,就看施主囉。
作者: karst10607 (谁可以协助我开板?)   2014-07-27 10:54:00
记得加上这个 破解封锁右键套件RightToClick
作者: wingtilldie (振断双翼)   2014-08-21 23:28:00
破右键根本Ctrl+Shift+I就好了
作者: sanbis (方正無法達成,那麼有沒H)   2013-01-15 00:52:00
装了 autosave 可以说把整个浏览历史全都记录下来了~前提是你不在乎速度变慢~毕竟撷取是需要时间的只是不知道有没有办法快速启用/停用 autosave ?毕竟从头到尾都被 save 下来的话很难说效率到底有没有增加
作者: drift024   2013-02-07 04:23:00
请教一下假设A与B网页有相互连结 而且A、B都有撷取网页那有办法让他自动连结起来吗? 目前是A为撷取的状态进入A后点内部的B连结是连到网络的版本而不是撷取版本
作者: noonee (我和烤肉间只差一撮孜然)   2013-04-19 01:35:00
另外一个特殊的问题是 scrapbook似乎只能用其专门格式存起有时候想存个别不同页面 同时分享给别人的话就会不方便虽然那时候可以用mht格式 但是就不是scrapbook 了

Links booklink

Contact Us: admin [ a t ] ucptt.com