最近在探讨一个生成机率模型(LDA)
透过LDA可以产生一个topics-documents矩阵
里面的entry用条件机率来表示的话为Prob(topic|document)
也就是一个document会有多个topic分布,每个分布都有一个机率
想请问的是
如果我想计算topic之间的相似度的话
假设column是表示topic
那可以将每个column分别取出来做内积之后做cos similarity吗?
请问cos similarity需要在什么条件下才会成立(才允许做)?
谢谢各位版友的指教