[问题] 回归分析-模型选择:Mallow's Cp

楼主: maja314 (马甲)   2015-07-01 20:59:08
用Mallow's Cp做 model selection,
老师教先挑每种model subset中最接近母数个数(p)的Cp,然后挑最小的。
那为什么不是直接挑最小的就好?
还是我对这个准则的理解有哪边误解了?
作者: funky1987 (Blacky)   2015-07-01 23:56:00
我记得好像是直接挑最小的馁 通常他也跟P最接近不过Mallow's Cp的题目我没看过很多 仅供参考@@100地特那题 是直接挑最小的 因为他们3个Cp都离P很远而98高考那题 挑出的Cp是2.7 p是2 而不是p=3之下的Cp=3统计版也有人问过 该先考虑min呢 还是接近p呢不过都没有人回XDD 希望有高人能回答啦~~
作者: yhliu (老怪物)   2015-07-02 04:25:00
理论上最接近 p 的 Cp 是最符合假设的, 而最小 Cp 有可能是机会因素造成的 Cp 值偏低. 这就类似卡方适合度检定或独立性检定的卡方值, 做检定时通常只看卡方值是否偏高, 而偏低的卡方值在造类检定中则被无视. 然而, 偏低的卡方值也可能指出一些问题, 例如孟德尔遗传实验资料就因卡方值偏低而被怀疑是造假 ---- 离题了. 不过, 若坚持 "Cp 最接近 p", 是否会导致选出偏复杂 (p偏高) 的模型? 我当初读硕士班修回归分析时曾有此疑问, 不过我并未去钻研, 不知学界有过什么样的讨论, 是否有定论.
楼主: maja314 (马甲)   2015-07-02 08:03:00
感谢yhliu大的回答 获益良多^^
作者: folksuite (Z)   2015-07-02 13:28:00
Cp = ( SSE_p / MSE_F ) - ( n -2p )当模型愈适当, SSE_p 会愈接近 (n-p) * MSE_F,也就是 Cp 会愈接近 ( n - p ) - ( n - 2p ) = p所以除了小外,还要接近 p ... 我猜应该是这样吧...

Links booklink

Contact Us: admin [ a t ] ucptt.com