[转录] 一篇关于"重码字的问题"的文章

楼主: Bolty ( )   2011-03-30 04:15:42
近日在网络上闲逛,发现了行列发明人廖明德先生在网络上发表了一篇关于"重码字问
题"文章。相信可以让许多人更了解,如何订定"重码字顺序"以及"简码与特别码编排"的原
则。以下为转录内容,希望对大家有所帮助。
===============================================================================
问:为何“减”这字既无特码,亦无简码呢?此字的使用频率也不低的说!
答:特别码的安排有其考虑因素,除了要有适合的空位、字频高优先外,也要考虑记忆的
难度,太难记忆硬安排的结果是没人使用。
以"减"字而言,在13053字里字频排序为864,算是使用率不低,但以它的字根码想安排在
首首(38 38)有"沝"字,首二(38 19)有"尖"字,首三(38 10)有"江"字,首尾(38 26)有"
渢"字,二三有"左"字, 二尾有"戊"字,三三有"比"字,三尾有"长"字,尾尾有"丝"字,
所以几乎是没有可助记的空位放特别码。现在字集加大,要安排特别码更没有空间了。
再说一级简码,"减"的第一个字根键位是[3v],但这个位置的一级简码的十个字,每个都
比"减"字频高,所以一级简码轮不到它。
而二级简码因为有很多字不可能记忆,所以只能依规则(第二个字根码的第一个数字)来摆
放,而"减"字的第二个字根码(19)的第一个数字是1,只能摆第1个位置,但那位置已被两
根的本字"尖"字占了。所以它也没能被摆进二级简码。
问:又“尝、宠、惯……等等”这些字使用率不低,却排在重码字的次选项(首选字通常
都有简特码可用)。
答:重码字应以正常输入的情况来考虑,因大多数行列使用者是以正常编码来输入,这样
就够用了,他们并不想去记特别码,简码也是用久了自然记住的才使用,一级简码还可以
,要记二级简码就比较难了。反而要记住重码字是第几个还比较容易。
上列这些重码字的使用频率在倚天时代编码时就有依据教育部的字频资料排序设计,昨天
我特地比对新的字频资料(中研院的平衡语料库+网络论坛字频,其实也不够新),1庞2宠
及 1实2惯的排序仍是正确的,而"尝"字字频有比"当"强一些,但差距不大,而“当、庞
、实”这三个被排在前面的重码字也都有被收进二级简码。虽然“重码次选字挪至首选项
”我认为并不适合,但你说的也有另一种道理,也许可考虑把第二重码字“尝、宠、惯”
放进二级简码。当时只想到要把字频最高的放进简码。
谈到重码字也要提到历史:在倚天时代因当时电脑内存非常珍贵,当时对照表必需尽量
压缩,只能用内码排序,这样才可以不记内码,行列每次敲键都可能是30个键其中的一个
,而每个字最多会有4键,又要把一二级简码的资讯也记进去,这样每个字只能用3个
byte来记录, Big5的13053字集行列对照表总共只有39K,当它被加载内存仍保持压缩
格式,程式是将每个敲进来的键先压缩成5个bit再去和对照表进行bit比对,当时对照表
不可能用字频排序,只能在对照表的档头针对必需调整的96个重码字作记录,每当出现重
码字就拿这96个字来比对,如果该字有被包含就是最高频字,即时将它调到第一个重码字
显示位置。。
而这些重码字序就这样被定下来了,到了WINDOWS一直延用,时间往前推进,虽然人们用
字习惯会随环境改变,字频序会跟着变,但输入法对照表却不能随意跟着变动,因使用者
在不同系统间或前后版本间重复字的顺序如果不一致会很困扰,有些行列使用者用了十几
二十年,一切都已变成直觉,听到要调整重码字序,可能都要跳起来了,且不同输入系统
间很难一齐更新,像微软系统内含的输入法更新可不是容易的事,作输入法就是要考虑很
多。
如果要改可能来一次大改版,直接用字频表来作对照表,输入时一面按键就把最高频的字
从头列出当作简码,新近推出的行列10数字输入法 就是直接用字频排序对照表,老刀已
把它实现在LIME系统供智慧型手机使用者下载使用,我自己试用还蛮理想的。
转录网址http://hyperrate.com/thread.php?tid=21714
作者: MichaelHsin (BBS之虫)   2011-03-30 11:58:00
话说 win7 内建行列的 3v0^7^ “温”被改到第一个了同时用 XP 和 win7 就很困扰 XD
作者: beastkay (呣)   2011-05-10 21:09:00
若要说怕老用家们不习惯新的编码,这点廖老师多虑了啊。微软怎能忍受输入法老用家一成不变地进而减退适应力呢?而且在96码之后行列官方亦提供了较XP更新的编码表……令人不解的是,像"满"字明明很好打,却编入特码。而将很难打的"减"字,摒于简特码天堂之门外……简特码收编指法难度高的常用字,效率应高于以字频收编。输入法最终都应该以“输入效率”论其优劣。编码合理与否(简特码之编码合理与否)真有如此重要?以上是长年以来的使用感想,在下愿意多花一些时间记码。……来换取输入中文时,能更轻松、省力的指法。
作者: daouz (Dao )   2011-07-24 09:50:00
完全不考虑用哪只指头敲了几次按键吗....连那么遥远的“减”都还有这种依理论不依人性的说法...

Links booklink

Contact Us: admin [ a t ] ucptt.com