各位好,想请教关于文章相似度计算的问题.
目前知道计算文章相似度有一些算法,例如下列这四种:
1.LSI
2.LDA
3.Doc2vec
4.TF-IDF
因为想运用这四种算法做文章相似度的计算,但由于之前无相关背景,
也请教过一些资讯系的教授,但目前问到的教授,皆未从事相关领域的研究.
能否请教各位有经验的大大是否能提供一些关于这些算法的说明介绍
或是哪些网站可以找寻到相关的资讯,以便了解如何实作出这几个系统,谢谢.
或是有哪些特定的软件,可以模拟这几种算法,并能够求解,谢谢.
所要解决的题目网站:http://kdd.ics.uci.edu/databases/reuters21578/reuters21578.html