楼主:
yichen (苍穹之下任我行)
2016-01-15 16:25:44在做中文转换, OpenCC强悍好用, 但是现阶段的版本并没有直接支援python,
pip中的opencc则是需要先安装OpenCC, 用ctype加载, 在包装跨平台上似乎较不便
于是用OpenCC本身的字典档, 写了纯用python3的opencc, 不需要额外的套件
使用方式就是把opencc这个资料夹放到专案中, 然后import就可以了.
效能上没有跟原本OpenCC比较过, 不过在字数不多的转换上都还可以接受.
source code: https://github.com/yichen0831/opencc-python
使用范例:
from opencc import OpenCC
openCC = OpenCC('t2s') # 正体中文转简体中文
to_convert = '我要转成简体中文'
converted = openCC.convert(to_convert)
原本OpenCC所有的转换都可以使用,如hk2s, s2twp等等.
目前有的问题是如果转换字词时, 有两种以上的可能时, 程式只会取第一个来用
如果有问题或改进的建议, 欢迎交流指教!
作者:
uranusjr (â†é€™äººæ˜¯è¶…級笨蛋)
2016-01-15 17:48:00可以考虑把它变成一个 package, 方便 pip install只要加 setup.py 与一个 MANIFEST.in (用来标示哪些档案需要被安装) 即可, 散布起来会方便很多另外你 redistribute OpenCC 设定档应该附上他们的授权