[问题] 计算多字词的关联并视觉化

楼主: mikejhou (Mike)   2015-08-17 01:24:47
[问题类型]:
程式咨询(我想用R 做某件事情,但是我不知道要怎么用R 写出来)
[软件熟悉度]:
入门(写过其他程式,只是对语法不熟悉)
[问题叙述]:
现在收集完需要分析的字词
要建构出字词与字词间的关联性,会以节点与连线的方式呈现。
假设关键字中Apple
Apple是节点
连线出去连结到的节点就是与之相关的关键字
像是iOS、iPhone、iPad等等
1.想了解有那些Package能够做到文字关联性分析的效果
2.那些Package可以把计算完的结果视觉化成节点与连线的样式
[程式范例]:
自己还没开始写
但找到Normalized Google distance法
Normalized Google distance是用google的搜寻当基础
资料量计算强度后会证明两字关联性
若两者越接近0表示两字关联越强的方式计算
但不太知道还有没有更精确的方法可以做做看
[环境叙述]:
目前抓取的字词约800多笔
以CSV档案的形式存取
由于小弟的目标是论文的关键字
所以同一篇论文使用的关键字会存在同一行
[关键字]:
字词 计算文字关联 视觉化(节点与连线)
作者: Wush978 (拒看低质媒体)   2015-08-17 20:57:00
也许用word2vec 加上一些高维度资料的视觉化工具

Links booklink

Contact Us: admin [ a t ] ucptt.com