[问题类型]:
程式咨询
[软件熟悉度]:
使用者(已经有用R 做过不少作品)
[问题叙述]:
该如何等比例切割资料?
假设目前资料目前有5个变量,样本数为1000个
每个变量内的资料都想切成5等份,每份为200个
目前用cut函数切出来的只是等距,但每段内的样本数不为200个
目前想到的做法为,先将资料做排序,看每100笔资料的interval在哪边
再透过cut去做切割,但样本数大的时候这个做法似乎不有效
不知道有没有人知道其他做法?
[程式范例]:
将资料第i个变量切成5等份(等距但不等比例):
cut(data[,i],breaks=5, order_result=T,include.lowest=T)