[问题] 分层抽样是否适用于正负样本差距过大时?

楼主: ciphero (奶油焗蛋饺...:))   2015-07-09 01:22:27
[问题类型]:
意见调查(我对R 有个很棒的想法,想问问大家的意见)
[软件熟悉度]:
入门(写过其他程式,只是对语法不熟悉)
[问题叙述]:
这里我想问的问题,比较偏重在处理资料时使用的抽样方式是否适合?
问题如下:
假设我有一份资料集,样子如下:
项次 col_1 col_2 col_3 ...... col_50 result
作者: Edster (Edster)   2015-07-09 02:35:00
这是错误的抽样方法,样本并不能代表母体的分配我不懂什么叫跑不出来。这几个字有很多想像,但通常跟样本无关,除非结果不符预期。这时你该抽样的对象应该是变量栏,而非样本。
作者: celestialgod (天)   2015-07-09 13:35:00
我测试了一下随机资料 rpart确实给出错误不过没有给错误讯息 就完全没有切割NODEsummary给出error: 1tree这个套件也不行我找到了 加control = rpart.control(cp = -1)可以强迫分

Links booklink

Contact Us: admin [ a t ] ucptt.com