题目:
Alex Rodriguez 与 Alessandro Laio 在 2014年的六月
于 Science 上面发表了一个聚类的算法:
Clustering by fast search and find of density peaks
里面利用群聚的一些特性还形成一种新的聚类模型
在聚类这种发展多年的领域里还可以发表 Science 论文真的很不容易
请问该验算法是如何做到聚类的?
==============================================================================
解答在下一页喔!!!小心不要雷到!!!
★☆★☆★☆★☆本篇解答含18禁、血腥、暴力、猎奇、令人不适之内容,
可能不适合18岁以下板友观赏,请自行斟酌,不喜者请左转★☆★☆★☆
((若本题是采撷其他作品内容者,请于解答前注明))
((若解答无上述内容者,请出题者自行Ctrl+y删除★☆部份,保留剩余防雷页))
==============================================================================
解答:
不同于过去的算法注重于"群"的概念
这篇的算法把model的重心放在"群的中心点" 或是 "clustering center"
先把一个群的中心点该有的特性找出来
再去看看其他点会被归类到哪个中心点底下
他们列出了两个重点:
1. 群的中心点有高密度
2. 群的中心点距离比他密度高的点应该有一定的距离
(否则他就应该只是附属于另一个群的点 而不是中心点)
计算了所有点的密度 还有距离密度高于他的点的距离之后
我们可以找出群聚中心(clustering center) 单独点(outlier)
还有群聚的点里面属于核心的点跟边缘的点
相较于现在主流的聚类算法 DB-SCAN K-Mean
他不需要做iteration
只需要一次linear的运算
在内存时间跟空间的运用上都大大的提升
而且在参数有调整好的情况下有极佳的辨识率
出处、作者:
science
备注:
想不到被秒杀
我以为会玩一阵子 (都没人)
===================注意解答的标题要跟题库一样喔!===============================