PTT
Submit
Submit
选择语言
正體中文
简体中文
PTT
R_Language
[问题] 分层抽样是否适用于正负样本差距过大时?
楼主:
ciphero
(奶油焗蛋饺...:))
2015-07-09 01:22:27
[问题类型]:
意见调查(我对R 有个很棒的想法,想问问大家的意见)
[软件熟悉度]:
入门(写过其他程式,只是对语法不熟悉)
[问题叙述]:
这里我想问的问题,比较偏重在处理资料时使用的抽样方式是否适合?
问题如下:
假设我有一份资料集,样子如下:
项次 col_1 col_2 col_3 ...... col_50 result
作者:
Edster
(Edster)
2015-07-09 02:35:00
这是错误的抽样方法,样本并不能代表母体的分配我不懂什么叫跑不出来。这几个字有很多想像,但通常跟样本无关,除非结果不符预期。这时你该抽样的对象应该是变量栏,而非样本。
作者:
celestialgod
(天)
2015-07-09 13:35:00
我测试了一下随机资料 rpart确实给出错误不过没有给错误讯息 就完全没有切割NODEsummary给出error: 1tree这个套件也不行我找到了 加control = rpart.control(cp = -1)可以强迫分
继续阅读
[问题] 随机森林分群后的问题
gbd37
[问题] 资料搬移
psinqoo
Re: [问题] 读入"鸻" "鸊鷉" 等怪字
leo0650
Re: [问题] 读入"鸻" "鸊鷉" 等怪字
helixc
[讨论] ggplot2不能叠图或画双Y轴图?
helixc
Re: [问题] 读入"鸻" "鸊鷉" 等怪字
Neisseria
Re: [问题] 读入"鸻" "鸊鷉" 等怪字
helixc
[问题] openair安装问题(dplyr)
dreler1
Re: [问题] 读入"鸻" "鸊鷉" 等怪字
celestialgod
[问题] 读入"鸻" "鸊鷉" 等怪字
helixc
Links
booklink
Contact Us: admin [ a t ] ucptt.com