官话版摘要在下面
小弟算讲是闽南语维基ê顾站工,最近hām有志讨论讲闽南语维基(主要用POJ/TL)
写ê议题,我着想讲敢有会当kā罗马字转做汉字ê方法?
因为tse hām输入法拣字原理相siâng,我最近tshiau著输入法自动拣字ê方法,
其中一个是Hidden Markov Model。
因为大学Markov炼仔无学予好,所以著开始重头学,提教育部ê辞典资料,转做(TL-
汉字)ê平行语料,然后算出来文字转移ê频率,写做一个Script:pakkau(tuì北沟
号ê),用Python,会当将教育部台罗拼音转做汉字。
毋过有无准ê所在:
INPUT: Iâ-soo kóng, Siōng-tè thiànn-thàng sè-kan-lâng
OUTPUT: 耶稣讲,上帝疼痛世间人