[问题] 等深分箱法

楼主: a83912a (Richie)   2017-12-03 12:15:49
最近老师上课有提到分箱法
有等宽、等深分箱法
他是要取 CSV 档的字段去算
等宽分箱法已经知道怎么使用
就是先让数值排序 接着算出最大最小值
然后在分成要的等分 就可以用 cut 分群出来
但是等深却一直用不出来
等深是用资料的数量
但是用 cut , split 都没有办法
最后还是用循环去写
但是感觉这就不是真正的方法
想请问有高手能教教刚入门的菜鸟吗
谢谢各位
作者: sw52099 (sw52099)   2017-12-03 13:09:00
查查看 cross validation ,有看到类似的东西
作者: x88776544pc (龙飞五丈原)   2017-12-03 22:28:00
假设分 K 箱breaks = unique(quartile(x,probs=seq(0,1,length=K+1)))new_x=cut(x,breaks,include.lowest=T,right=F)

Links booklink

Contact Us: admin [ a t ] ucptt.com