[资料] 试用隐马克夫炼做台罗转换汉字的程式

楼主: yoxem (Yoxem)   2024-03-20 20:29:32
官话版摘要在下面
小弟算讲是闽南语维基ê顾站工,最近hām有志讨论讲闽南语维基(主要用POJ/TL)
写ê议题,我着想讲敢有会当kā罗马字转做汉字ê方法?
因为tse hām输入法拣字原理相siâng,我最近tshiau著输入法自动拣字ê方法,
其中一个是Hidden Markov Model。
因为大学Markov炼仔无学予好,所以著开始重头学,提教育部ê辞典资料,转做(TL-
汉字)ê平行语料,然后算出来文字转移ê频率,写做一个Script:pakkau(tuì北沟
号ê),用Python,会当将教育部台罗拼音转做汉字。
毋过有无准ê所在:
INPUT: Iâ-soo kóng, Siōng-tè thiànn-thàng sè-kan-lâng
OUTPUT: 耶稣讲,上帝疼痛世间人
作者: MilchFlasche (实践才能发光)   2024-03-21 08:45:00
感动咱用技术斗处理语文代志Lohankha作者有创这:https://tinyurl.com/2c34yymt共鹤佬话Wikipedia全白话字做一个mirror site,全转汉字。毋阁伊个site这马袂当用
作者: RungTai (RungTai)   2024-03-21 22:53:00
有神紧拜~

Links booklink

Contact Us: admin [ a t ] ucptt.com