PTT
Submit
Submit
选择语言
正體中文
简体中文
PTT
Python
[问题] 有关语意分析的方向
楼主:
RayShigeno
(RayShigeno)
2015-11-11 19:16:07
不好意思我目前想学习有关语意分析这块
那我做了些功课后发现,使用python是最简单的
我想问各位,我对语意分析的用法是不是有错
我想实用在抓取关键字
例如去某个网站,利用Python先断词,再把出现的次数最高的依序抓出来,这样就能知道
哪个关键字最热门,进一步做推论
请问我这样的想法有错吗?python可以做到这样吗?感谢各位
作者:
ccwang002
(亮)
2015-11-11 19:18:00
Python 可以做到。想法也正确。不过实际上复杂很多例如你觉得 Python 这个版断完词之后哪些词最热门?不意外会有 Python,但我想“问题”“错误”也会很热门更 general 一点,中文高词频有你、大家,商品有漂亮
作者:
bibo9901
(function(){})()
2015-11-11 19:20:00
想法很OK 但是细节很多
作者:
ccwang002
(亮)
2015-11-11 19:21:00
这些词次数高,但会是关键字吗?就要进一步要思考
作者:
flarehunter
(Range)
2015-11-11 21:39:00
楼上说的是TF-IDF吧
作者:
ccwang002
(亮)
2015-11-11 21:48:00
恩恩,还有 LDA HDP 甚至用 word2vec 做 clustering
作者:
sa0124
((恩恩))
2015-11-12 09:40:00
推荐你可以用jieba断词 语意分析好多东西可以玩耶 从你的叙述可以先做TF-Idf
作者: aa000017 (Ophidian_Wang)
2015-11-20 17:27:00
sk-learn和gensim这两个套件可以拿来用,之前用来做过topic modeling和clusteringscikit-learn,刚才打到简称=x=
作者:
new122851
(未若柳絮因风起)
2015-12-05 01:58:00
这牵涉到超多..我现在在搞text SVM classification
继续阅读
[问题] touchscreen设定路径
p147525963
[问题] vpython 3D画图
tsungjen
[问题] 画excel的pivot chart
cmlung
[问题] 有没有类似jgroups的channel framework?
Killercat
[问题] 如何将配对过后的值删除
gagalala
Re: [问题] 删除大量数据的速度问题
uranusjr
[问题] 删除大量数据的速度问题
stba5328
Re: [问题] pygame error
p147525963
[问题] 关于 python 架构
herbacin
Re: [问题] pygame error
Neisseria
Links
booklink
Contact Us: admin [ a t ] ucptt.com