[问题] 使用python 做类别归档

楼主: moodoa3583 (金牌台灣啤酒)   2020-04-01 00:57:10
嗨大家晚安
感谢上次大家帮我解决球员伤病关键字提取的问题,今天又有新的问题要来麻烦各位了。
问题是这样的,我有约莫一万个与篮球有关的词汇,而我想将它们一一分类,像是:
NBA>组织
FREAK 1>球鞋
Karl Malone >球员
走步>规则
像是以上这样子,我创了10个类别包括组织、球鞋、球员、伤病、品牌、服饰、奖项、个人数据、规则、其他
想问有什么方法可以将这一万个词汇分类到属于它们的类别呢?
我上网查了一阵只查到doccono这个方便标记的接口,好像比较少看到如何去训练这种取向的模型
再麻烦各位如果知道的话还请和我说该查什么关键字了,感谢
作者: MacBook5566 (尊爵不凡 麦书56)   2020-04-01 01:11:00
entity typing/linking
作者: ddavid (谎言接线生)   2020-04-01 10:46:00
关键在你毕竟还是需要不少已经分类好的词做training,而且直觉来看这个分类器可能正确率不会太高词分类的线索不多,这些类别又不少容易混淆看到Nike到底是组织、品牌或服饰呢?其中有一些引入前后文或人类知识会有帮助,比如里面有动词那高机率属于规则类、NBA球员列表数据库直接比对等等
作者: TuCH (谬客)   2020-04-01 11:25:00
可以收集很多文章 做 word2vec

Links booklink

Contact Us: admin [ a t ] ucptt.com