[问题] 有关语意分析的方向

楼主: RayShigeno (RayShigeno)   2015-11-11 19:16:07
不好意思我目前想学习有关语意分析这块
那我做了些功课后发现,使用python是最简单的
我想问各位,我对语意分析的用法是不是有错
我想实用在抓取关键字
例如去某个网站,利用Python先断词,再把出现的次数最高的依序抓出来,这样就能知道
哪个关键字最热门,进一步做推论
请问我这样的想法有错吗?python可以做到这样吗?感谢各位
作者: ccwang002 (亮)   2015-11-11 19:18:00
Python 可以做到。想法也正确。不过实际上复杂很多例如你觉得 Python 这个版断完词之后哪些词最热门?不意外会有 Python,但我想“问题”“错误”也会很热门更 general 一点,中文高词频有你、大家,商品有漂亮
作者: bibo9901 (function(){})()   2015-11-11 19:20:00
想法很OK 但是细节很多
作者: ccwang002 (亮)   2015-11-11 19:21:00
这些词次数高,但会是关键字吗?就要进一步要思考
作者: flarehunter (Range)   2015-11-11 21:39:00
楼上说的是TF-IDF吧
作者: ccwang002 (亮)   2015-11-11 21:48:00
恩恩,还有 LDA HDP 甚至用 word2vec 做 clustering
作者: sa0124 ((恩恩))   2015-11-12 09:40:00
推荐你可以用jieba断词 语意分析好多东西可以玩耶 从你的叙述可以先做TF-Idf
作者: aa000017 (Ophidian_Wang)   2015-11-20 17:27:00
sk-learn和gensim这两个套件可以拿来用,之前用来做过topic modeling和clusteringscikit-learn,刚才打到简称=x=
作者: new122851 (未若柳絮因风起)   2015-12-05 01:58:00
这牵涉到超多..我现在在搞text SVM classification

Links booklink

Contact Us: admin [ a t ] ucptt.com