※ 引述 《sustainer123 (温水佳树的兄长大人)》 之铭言:
: 推 cities516: k-fold不如直接全部丢进去train 12/10 17:14
: → cities516: 除非你很肯定某部分资料是dirty data 对训练有害 12/10 17:15
: → cities516: 才用k-fold去验证 12/10 17:15
仔细想了一下
k-fold跟holdout最大差别就是能不能充分用到所有数据
但k-fold需要的时间是holdout的k倍
假设资料集超小 holdout随便抽有可能抽到超偏颇样本
所以k-fold这时候就很有用
假设资料集超大 k-fold就要花太多时间
而且样本集够大 正常划分应该不太会分得太偏颇
这样?