[分享] OpenCC中文转换python3

楼主: yichen (苍穹之下任我行)   2016-01-15 16:25:44
在做中文转换, OpenCC强悍好用, 但是现阶段的版本并没有直接支援python,
pip中的opencc则是需要先安装OpenCC, 用ctype加载, 在包装跨平台上似乎较不便
于是用OpenCC本身的字典档, 写了纯用python3的opencc, 不需要额外的套件
使用方式就是把opencc这个资料夹放到专案中, 然后import就可以了.
效能上没有跟原本OpenCC比较过, 不过在字数不多的转换上都还可以接受.
source code: https://github.com/yichen0831/opencc-python
使用范例:
from opencc import OpenCC
openCC = OpenCC('t2s') # 正体中文转简体中文
to_convert = '我要转成简体中文'
converted = openCC.convert(to_convert)
原本OpenCC所有的转换都可以使用,如hk2s, s2twp等等.
目前有的问题是如果转换字词时, 有两种以上的可能时, 程式只会取第一个来用
如果有问题或改进的建议, 欢迎交流指教!
作者: uranusjr (←這人是超級笨蛋)   2016-01-15 17:48:00
可以考虑把它变成一个 package, 方便 pip install只要加 setup.py 与一个 MANIFEST.in (用来标示哪些档案需要被安装) 即可, 散布起来会方便很多另外你 redistribute OpenCC 设定档应该附上他们的授权
楼主: yichen (苍穹之下任我行)   2016-01-15 19:52:00
谢谢提醒,我来研究一下如何弄成package以及授权的问题

Links booklink

Contact Us: admin [ a t ] ucptt.com