看到版友们对 Unicode Ext A/B/C/D 等汉字进行编码,
我觉得相当感激也相当佩服。
但不知道行易公司还没有投入资源在这方面的工作?
毕竟出于版本统一和专利权及著作权的考量等等,
由官方制订一份标准码表似乎是比较适合的,
如果官方资源不足,或许也可以跟网络上热心的使用者们合作,
使用者来编码,官方进行公布并提供其他使用者纠错,
最后再由官方作最后仲裁并公布标准标码?
关于呒虾米的码表,我觉得有几点可考虑改进的地方,
一、对 Unicode Ext A/B/C/D 等扩充提供标准编码
二、由于字集扩充,有一些以前定义不清楚的字根应该要厘清,
以前订的字根有可能不够用,需要扩充,
例如:“卝”到底要不要加订为“R”?
三、标准码表不要放进太多容错码,以免造成混乱和重码率的提高,
我个人偏好仓颉那样的方式,繁简相对字写法不同,拆法就不同,
最好只根据相容于中日台韩各地区的标准写法来编码,
容错码只在字根相近容易辨识错误时采用。
四、有些码漏编了,例如:“啇”应该要有“XO”的拆法。
五、简中模式时,不完全是照简体写法来拆码的,
例如:“马”的简体拆法被订为“MFA”,
但实际写法却应该是“MEE”。
六、目前码表中有许多“暗藏字根”的存在,
一样造成码表的混乱和重码率的提高,
例如:“牙 = Y”、“为 = W”、“轻的右上 ES 部分 = S”、
“犮去掉一点 = X”、“对的左半边 = F”、
“会去掉上面的 A = D”等,
甚至有“胡 = FU”,“加上偏旁的喿 = LT”。
这些暗藏规则下的编码,要不就应该去除,
要不就应该制订公开的规则,一并采用。
七、老生常谈的一码字二码字重订问题,
我个人觉得一码字放了一堆数字确实浪费,
数字之外的一码字也有一些其实不足以放到一码字的。
二码字要考量字频和好记,最好都是头码加尾码为主,
已被占用则可考虑采用头尾加 V 。
个人觉得次常用字打三码尚可接受,
一个字要打四码的话,不知道是不是因为我习惯快打模式的关系,
总是会觉得怪怪的。 XD
※ 编辑: blueantares 来自: 220.132.124.68 (01/30 13:37)
※ 编辑: blueantares 来自: 220.132.124.68 (01/30 14:02)