Re: [闲聊] 中国科幻小说常见的老梗 汉语程式语言

楼主: xobear (圈圈叉叉的熊)   2018-05-11 22:01:16
※ 引述《paresky (paresky)》之铭言:
: 说一个没有直接关系但可证明中文也不一定简洁的证据。
: 英文翻译成中文的时候,用Word算出来的中文字数大约会是英文字数1.5倍。
: 真的要简洁可能要靠文言文吧。
: (但文言文政治不正确呀)
: 志鸟村要开新书期待中。
这个说法不太正确。
英文一个“word”(数个字母组合)可以代表一个意义;
但中文很多时候一个“字”是没办法代表一个意义的。
例如:吉、他,这两个字分开和合在一起意义是天差地远。
因此在做NLP(自然语言处理)的时候,中文直接做效率很差,通常要先做断词处理。
所以我认为直接比字数没办法表示复杂度。
回到原话题,我还是觉得中文写程式比较不好。
之前有人提到了,用中文编码的话compile一定会比英文还久。
从信息论的角度来看,英文26个字母使用率最多的e和最少的z,也不过差一百多倍。
中文我不知道常用字和罕见字的数量差异,但我想最常用前一百字的使用率,相对于使用频率一万以后的字,应该远远超过一百倍。
换句话说,中文的资讯可压缩率应该远大于英文,复杂度也是啊!
也可以这么说,中文写程式就是会又臭又长,转译机械语言也会更久。
ps.看来很多道友都是资讯产业的,讨论好热烈啊XD
ps2.我不是资工毕业的,半路转行软工,有错还请指正。
作者: chungminchun (酸旻)   2018-05-12 09:51:00

Links booklink

Contact Us: admin [ a t ] ucptt.com