网页剪贴簿 (WebScrapBook) 2.0.0b 测试版
https://github.com/danny0838/webscrapbook/tree/devel-2.0
这是旧版 Firefox 附加元件 ScrapBook X 的后继版本,
主要功能是忠实撷取网页及管理、加注、编辑、全文搜寻。
跨平台支援 Fx > 57 和 Chromium 系的桌面及 Android 行动版浏览器。
测试版安装方法:
1. 至上述网址 => Code => Download ZIP => 解压缩至任意位置
2. Chrome:
开启浏览器扩充功能管理页面 => 加载未封装项目 => 选择解压缩后的 src 目录
Firefox:
- 进入解压缩后的 src 目录,删除 manifest.json (或更名),
将 manifest-firefox.json 更名为 manifest.json
- 开启浏览器扩充功能管理页面 => 选项按钮下拉选择 [对附加元件除错] =>
加载暂用附加元件 => 选择解压缩后的 src/manifest.json
2.* 测试版的后端服务器也必须为 2.* 以上版本
1. 至后端服务器版本库测试版分支:
https://github.com/danny0838/PyWebScrapBook/tree/devel-2.0
Code => Download ZIP => 解压缩至任意位置
2. 打开命令列进入该目录,执行以下命令,即可安装测试版:
python -m pip install -U .
测试完以后若要回复原来的版本,可到命令列进入其他目录(不可在此目录下)
反安装后再重新安装 webscrapbook 套件即可:
python -m pip uninstall webscrapbook
python -m pip install -U webscrapbook
主要更动:
1. 搜寻功能改为在后端服务器实现,以避免预先下载整个全文快取吃掉太大流量。
2. 后端服务器更动及增加许多 API,支援直接操作剪贴簿内容。
对剪贴簿的操作大部分从浏览器套件转移至由后端服务器统一管理,
以提升系统稳定性。
同时改进浏览器套件与后端服务器之间的资料传输效率。
3. 后端服务器支援新配置值,更改部分命令列参数格式。
例如 wsb cache 现在可针对每个剪贴簿设定不同的快取及静态站台页面规格。
4. 预计在后端服务器的 web 接口加入剪贴簿编辑功能,
以便未安装浏览器套件者可直接编辑(不过目前接口难产中orz)
5. 预计改良或移除汇入/汇出功能
主要是因为现代浏览器的套件框架无法任意指定目录做批次汇出,
导致汇出功能难以实用化。
加上 WebScrapBook 有实做跨剪贴簿复制功能,
应该足够大部分资料整理或备份使用。
这方面如有好的想法欢迎提出。
6. 其他可能预计更动或新增的功能可参见讨论串:
https://github.com/danny0838/PyWebScrapBook/issues/65
https://github.com/danny0838/webscrapbook/issues/338
欢迎试用及发表意见/许愿。