※ [本文转录自 Gossiping 看板 #1WJC77Ti ]
作者: mayaman ( 马雅人) 看板: Gossiping
标题: Re: [问卦] 机器学习有可能让我们懂马雅文吗
时间: Sat Mar 13 21:44:35 2021
※ 引述《Firstshadow (凯留酱><")》之铭言:
: 嗨嗨
: 大家晚上好压压ka~
: 就是喇
: 小鲁弟妹窝最近在接触自然语言
: 发现
: 每个语文都有一套自己标准的架构
: 而马雅文也被证明不是图惹 而是象形文字
: 这样的话
: 运用现代的技术
: 有可能用那个什摸机器学习什么的大数据还有AI
: 来让我们更深入了解马雅文吗 ==
: 毕竟小鲁弟妹窝 从小开始
: 玩世纪帝国、世纪帝国2 都选马雅人哒
: 所以蛮想懂哒
: so, 有没有机器学习有没有可能让我们懂马雅文的八卦ㄋ~
: わたし、気になります~
: http://i.imgur.com/n1VzFhV.jpg
: (づ′・ω・)づ ~
你说的这个问题,我蛮有兴趣的。
因为,学会马雅文字一直是我从小的梦想。
所以我自学,也花钱到国外请教最厉害的学者。
目前已经略有小成,也开课教一些社会人士解读的方法啦。
其实马雅文字不是特别容易,除非长期接触,否则也不是很好懂。
所以,我还蛮期待可以用机器学习的方式来解读马雅文字。
我自己不太懂机器学习的界线跟极限是什么?
因此这篇文,我想要讲一下马雅文字解读的几个困难处。
再请懂机器学习或是AI的乡民们,评估看看是不是有办法。
就看看是我教你比较快,还是教会机器比较快啦
第一点!
玛雅文字不是纯粹的象形文字,一个马雅文字可以有三种基本型态。
分别是纯象形、表音、象形混合表音的型态。有些人会用中文的六书
来理解,但是本人觉得还是有些差异,所以不太喜欢用六书来解释。
关于这点,我举“Pakal”(盾牌)的三种型态写法。
https://imgur.com/rOSStB0
从我整理的这个图片,就可以看到一个字基本上有三种不同型态的写法。
而且,这三种书写型态没有规则,完全按照书写者当下的决定。
这个是解读的第一个最简单的困难。
第二点!
玛雅文字有些特殊分类的马雅文字。像是历法类的文字,就没有不同型态的问题。
马雅主要有三种历法,其余的历法种类零零总总则不超过十种。网络上有些马雅
历法能量的学派说有二十种或是三十种,其实是乱说。
常用的三种历法是长纪年历、哈布历、卓尔金历。后两种,我在YT上有拍影片,
可以自己参考一下,长纪年历的影片配合末日预言,最近要拍。
https://youtu.be/hN8UxBspa8I
这类文字比较简单,比较有规律。所以也是最早被破解的马雅文字。
我想要机器学习比较简单。
第三点! CVC原则
玛雅文字既然可以拼音,所以那些像是图案的字符,可以表示语音。
不过,马雅文跟日文有点像,一个音节用一个字符表示。但是马雅语的语尾却
会以子音结尾。因此,如果语言要书写成文字,就要写成补一个元音,行成音
节。
元音有A、E、I、O、U五个。要补充哪个音节,大多数状况由前一个音节的元音
决定。像是第一点提到的Pakal,写成拼音型态时,结尾是子音L。
因此,前一个音节是Ka,所以写成拼音型文字时,结尾要补上A这个音。
Pakal(a),但是唸出来时A不发音。
但是,玛雅文字并不是严格遵照CVC原则的,虽然有些原则可以依循,不过,
还是要看书写者的选择,也有可能结尾元音与前一个音节的元音不同的情形。
第四点! 字符变换原则
这点在我的教学经验里,算是比较困难的。
玛雅文字是没有统一跟固定的写法的。前面提到三种类型的字。
基本上都会因为写作者的写法,而产生无限多种变化。
在象形型态的文字中,有可能出现几个重要的辨识点,再加上许多让人与其他字
混淆的变化。所以,如果要解读,就是要神入马雅人的心态跟文化脉络。
另外,同样的情形也会混在表音兼象形型态的情形里,例如下面这个例子
https://imgur.com/xjKlm3h
以上这些字都代表yotoot,某人某地的房子。
而且不是全部的写法,只是其中一个部分。
在拼音型文字中,则是每个音节都会有许多不同的写法。
这个就是我去美国学习的老师David Stuart在18岁时候发现的规则。
字符变换原则。
例如Na这个音节,可以有以下的各种写法
https://imgur.com/tVbCrpv
至于何时出现,一样没有规则,按照书写者当时的设计。
如果是个三个音节的字,每个音节有三种写法,可能会有27种可能性。
第五点 各种融合原则
理论上马雅文字是一个方块,每个方块可以代表一个单词,也可以代表两个单词。
甚至也有前半部分是前一个字后半部分的音节,后半部分是后面一个字的前半部分
音节。
又还有不同字词可以融合的。
像是Chum、Tun这两个单字,可以融合成一个字。
如果中规中矩的写法是这样
https://imgur.com/8nz2zhu
前半部分是Chum,后半部分是Tun
但是也可以融合成这样。
https://imgur.com/r01M6Ke
把Chum 跟 Tun融合成一个字符。
同样的,配合字符变换原则,也可以变化出很多种不同的写法。
但是最炸锅的事情是,这五个原则都会混在一起发生。
而且没有规律
以上,大概就是这五点,请大家再评估一下。
我之前有开直播简单讲过,也欢迎大家参考。
https://youtu.be/2KrMWU6J6E4