其实是有机会啦,说让机器理解应该目前是不可能,但是让机器帮助人们理解应该是非
常可行的。
就你提到的文字的特性我目前想的到的有以下一些可以被机器学习应用的性质:
1. 文字都是方块
2. 文字有拼接特性
这些影像辨识就很有用啦
我们有一堆 data 文章(我想像的文章是像埃及壁画那样,一张画里有许多文字,并在
描述一个事件),可以抓到文章大概的方向。于是借由影像辨识去分析这篇文章中某个
文字出现的频率。
接着我们就有文章-文字的对应。这个方法理论上应该可以非常巨大地帮助猜文字的意义
。不用自己慢慢翻文献,东西马上生给你XD
或是我们可以把一个已知是拼接的字分开,直接应用上影像辨识去找所有字中有这个部
分的字。这也可以很快地整理出一堆有的没的。
也可以用一样的想法,去把一个不知道的字分开,去搜索看有没有类似拼接的字,有就
是拼接,没找到可以猜可能是融合字。
其实能延伸的地方还很多。比较简单的像是上面的方法文字是用一个方块做单位,可以
延伸变成两个以上的方块做单位,都能够快速找到对应出现的地方以及频率。
以上是我想像中的解读方式,然后简单想一下给一些机器学习可以帮忙的地方XD