[请问] 关于语言 为什么英文字母有相同频率啊?

楼主: neiltsang (CatLulu)   2020-01-03 16:58:18
如题
英文中用的最多的是e 再来是t a这些排下去
照理说每个作家风格不同 写的文章领域不一样 内容手法不同
而且文章体裁那么多 剧本 或 法律条文等等
我网络上自己找英文文章
去算字母出现频率 发现资料跟跟维基对比 几乎不超过1%
还是以字母频率来说 统计上1%其实算很多?
不然这也太神奇了吧
有懂统计或语言的大大知道为什么吗 这些又可以应用在哪边?
(除了霍夫曼编码 似乎也可以拿来判断文章是否异常?如果z超过5%之类的)
作者: Schottky (顺风相送)   2020-01-03 17:07:00
应用的话,太过简单的加密可以光靠统计频率辨认出是英文甚至可以光看出现频率就知道哪个是 e
作者: emptie ([ ])   2020-01-03 18:11:00
考虑发音的话,元音跟字音的比例不太能太悬殊不然根本念不出来

Links booklink

Contact Us: admin [ a t ] ucptt.com