Re: [问题] 有关k-means的问题!!??

楼主: beagle (红茶犬)   2005-12-21 19:10:33
※ 引述《ff7788 (七七八八)》之铭言:
: 我在读资料探勘这门课~看到了这一段叙述
: k-means的缺点
: 1.无法处理类别性资料维度:由于k-means以群集中的质量中心当作群集中心,
: 对于类别性资料维度所描述之资料集合而言,并无法求得群集的质量中心。
: 这是为什么呀~?可以举个例子吗~?
类别性资料维度是相对于连续性资料维度来说的...
前者譬如性别, 就读学校, 后者则是身高体重年龄等...
所以对于性别这个维度, 求其质量中心(平均点)是没有意义的...
对一个班级求出一个性别为 0.3 的典型, 其实并不存在这样不男不女的样本点...
套用到就读学校也是, 没办法把各大学编个数字去平均... 平均出来也没意义...

Links booklink

Contact Us: admin [ a t ] ucptt.com