Re: [问卦] 机器学习有可能让我们懂马雅文吗

楼主: stmilk (我男的)   2021-03-14 00:37:57
其实是有机会啦,说让机器理解应该目前是不可能,但是让机器帮助人们理解应该是非
常可行的。
就你提到的文字的特性我目前想的到的有以下一些可以被机器学习应用的性质:
1. 文字都是方块
2. 文字有拼接特性
这些影像辨识就很有用啦
我们有一堆 data 文章(我想像的文章是像埃及壁画那样,一张画里有许多文字,并在
描述一个事件),可以抓到文章大概的方向。于是借由影像辨识去分析这篇文章中某个
文字出现的频率。
接着我们就有文章-文字的对应。这个方法理论上应该可以非常巨大地帮助猜文字的意义
。不用自己慢慢翻文献,东西马上生给你XD
或是我们可以把一个已知是拼接的字分开,直接应用上影像辨识去找所有字中有这个部
分的字。这也可以很快地整理出一堆有的没的。
也可以用一样的想法,去把一个不知道的字分开,去搜索看有没有类似拼接的字,有就
是拼接,没找到可以猜可能是融合字。
其实能延伸的地方还很多。比较简单的像是上面的方法文字是用一个方块做单位,可以
延伸变成两个以上的方块做单位,都能够快速找到对应出现的地方以及频率。
以上是我想像中的解读方式,然后简单想一下给一些机器学习可以帮忙的地方XD
作者: ah937609 (客兄)   2021-03-14 00:39:00
楼下 马雅人
作者: tmacfly (LoliMania萝莉狂热)   2021-03-14 00:48:00
我觉得比较可行的方法是词向量 而不是影像辨识欸
楼主: stmilk (我男的)   2021-03-14 01:00:00
词向量问题在我们不了解这些字的意思吧,那个是上那个是下也不清楚呀XD 我的理解啦而且我的目标取向是由人类理解文字,在马雅文字的规则没确定下前,用词向量的概念(上下文字与中间的字的关系)去解可能会有问题。我的词向量是用word2vec的模型,你应该是说这个词向量吧XD我其实有思考用nlp,只是我是觉得一般nlp的规则都不可行,毕竟那都是在我们相当了解文字,用这些规则去计算可能意义的分布或分群。这对未知的文字理论上有问题的机会是非常高。

Links booklink

Contact Us: admin [ a t ] ucptt.com