Re: [闲聊] 起点网站部分文字无法转繁体

楼主: gusion   2020-11-29 23:22:14
最近做了一个chrome extension,把起点自定义的编码转换回去。
虽然基本功能已经有了,但其他功能还很简陋
暂时还不打算上架,有兴趣的可以先下载试用看看。
连结如下↓
https://github.com/lyroazo/qidian-proofreader/archive/v0.1.0.zip
安装方式:
1. 下载扩充功能压缩档并解压缩
2. 打开chrome扩充功能页面,或者连到chrome://extensions/
3. 打开开发人员模式
4. 点选加载未封装项目
5. 选取解压缩的资料夹
辨识时间大约是加载完内文后约6~7秒钟
辨识完会有讯息视窗跳出来
有时候辨识会有问题,可以重新整理换一个编码组合
另外我有做快取功能,遇到以前辨识过的组合,就不用重新辨识,会快一点
由于我对javascript不是很熟,所以开发比较慢
也欢迎大家fork回去自己魔改
最后附上原始码连结
https://github.com/lyroazo/qidian-proofreader/tree/master
※ 引述《linzero (【林】)》之铭言:
: : 有问题的会变成这样
: : https://imgur.com/AOI8K6K
: : 推 BenShiuan : https://i.imgur.com/dmI1ooe.jpg 看起来不像正常 10/31 14:41
: 显示 伴随着
: 字码 伴随#58016
: 58016转16进位是E2A0
: Unicode码里E000~EFFF是私人造字区
: 也就是大家遵守的规范里没定义
: 这区是让人自己私下定的
: 这区的字如何显示是看个别系统而定
: 比方把 冏rz 挤成一个字的宽度字形图像
: 定义成E001
: 这样字码是E001(#57345)就会显示成 冏rz
: 但在别的系统就不是
: 可能无法显示(不支持这字码定义)
: 或者显示别的(比如别系统定义成 ^_< )
: 应该是起点拿去定义中文字用
: 而起点网站系统有对应字
: 在起点系统上可以被正常显示
: 而换个系统会有问题
: (所以有些盗版网站会有显示 #....或看来像是乱码 的情况吧)
: 简转繁的机制
: 是把UNICODE码里的简体字转成UNICODE码对应的繁体字
: 而这区自订区的字,简繁转换机制无法处理
: 仍然用该字码(像E2A0)
: 而这字码是靠起点系统显示的
: 所以简繁转换用自己的字形
: 起点自订的字用自己订的字形
: 且这自订字形看来对应的是简体
: 才造成两者简繁、字形不同的情况吧
: 不过 着 这个字UNICODE码里也有
: 不知起点为何要另外定义

Links booklink

Contact Us: admin [ a t ] ucptt.com