Re: [闲聊] Project Coffee Jazz 词汇用语正简转换

楼主: danny0838 (道可道非常道)   2018-04-26 03:22:07
既然有人要入坑,就拿个很久前的旧作充数XD
https://github.com/danny0838/sts-lib
此专案的主要目标是提供能有效整理各种简繁转换对照表的框架,
供不同情境使用,以及几个层次的转换脚本。
主要程式语言是 Python + Shell Script (CMD)。
大部分转换表资料来自OpenCC和维基百科,但后来做了不少整理。
因为是很古老的专案,充斥着很多不适合公开的版本记录,
所以暂时先丢最新版本。之后有空整理再补上旧的版本历程。
个人是建议如果可以的话,转换表格式尽量用纯文字档,
日后用各种程式比对及整合会比较方便。
※ 引述《t7yang (t7: 攻城蝨)》之铭言:
: 不知道大家对这个 2016 年 11 月的一篇幻想文还有印象吗?
: 现在他不只是幻想了,而且他还正要实现了。
: 当时我还只是一个刚上手写 JS 而已,根本只是个许愿文而已。
: 后来辗转实力提升了不少,加上对新同文堂很不满意
: 但是无奈现有的程式码缺乏有效的管理,后来就选择了自干了
: 原本没有没有想要继承新同文堂的,但是被 ett 拉了回来
: 所以就把这个代号改了一下,作为新同文堂 2.0 的开发代号
: Project Jazz Cafe NEED YOU (新同文堂 2.0 需要你)
: * 一组新的图示(包含亮色系跟暗色系),可能还有其他的图示
: (你可以设计你的版本,最后我们再来投票)
: * 重组字典档专案(因应新的算法和新增转换用语默认字典档)
: 对上述议题有兴趣的人请联络我,我需要你的协助,或引介人才给我
作者: t7yang (t7: 我认为这是一种背叛)   2018-04-26 09:13:00
看起来不错喔。当初也有想去opencc那里借资源的,只是那个一对多的部分不好处理。如果你已经有处理好的东西可以用最好。储存格式的话,最终还是要转到JSON,浏览器那里才能比较好处理多人共编处理的问题很重要,所以我其实是想直接用G社的试算表来维护,开发者再透过 CSV 去后制成 JSON 方到套件线上试算表的好处就是简单、容易用、支援多人共同编辑还有版本控制。剩下的事情就是交给开发者去处理。补个推,一直没推到
作者: oversky0 (oversky0)   2018-04-26 21:41:00
萌典有两岸辞典。不过不知有没有版权问题。两岸词典由中华文化总会提供,采用 CC BY-NC-ND 3.0 台湾授权。https://www.moedict.tw/about.html
作者: karst10607 (谁可以协助我开板?)   2018-05-08 08:49:00
推,这部分我回来了,我会帮忙

Links booklink

Contact Us: admin [ a t ] ucptt.com