[SQL ] 有趣性

楼主: swedrf0112 (M)   2014-09-07 23:36:27
想请问版友有人算过有趣性(Interestingness)的吗?
http://msdn.microsoft.com/zh-tw/library/ms175382.aspx
根据里面的说明,可以找到有趣性的公式为:
Interestingness(Attribute) = - (m - Entropy(Attribute)) *
(m - Entropy(Attribute))
m代表整个功能集的entropy (我不太懂这句的意思)
假设有两个变量 x=2,2,3,4,5,6
y=3,4,4,4,6,8
根据Shannon entropy H(x)= - sum_i p(x_i) * log_2( p(x_i) )
p(x_i)为X的pmf
X的entropy H(x)=2.251629
Y的entropy H(y)=1.792481
那请问m及x,y的interestingness是多少呢?
那么Interestingness是越高越好? 还是越低越好?
因为感觉起来会为负数,跟我原本以为是正数不大一样
先谢谢各位了!!
作者: GoalBased (Artificail Intelligence)   2014-09-08 13:16:00
你发错地方了

Links booklink

Contact Us: admin [ a t ] ucptt.com