[问题类型]:
Variable Importance
[软件熟悉度]:
入门(写过其他程式,只是对语法不熟悉)
[问题叙述]:
RandomForest的fit出来的model有一个importance
里面的MeanDecreasingGini是用来判断变量的重要性的指标
这个指标是一个平均值的结果
我想问的是
对于第i棵树
要怎么算出DecreasingGini值
在网络上参考了一篇文章 连结如下
https://goo.gl/6WSuoi
但这篇主要说明是Mean Decrease in Accuracy
不过概念上是很像
第一个step说: 随机挑一些data与variable => 产生一棵树
第二个step说: 将树的模型用来预测没有被挑到的data => 产生一个OOB-accuracy
第三个我就看不懂了
什么是permute variable i
有使用RandomForest的使用者能够指导一下吗?
不想似懂非懂认为这是重要指标
但不晓得如何而来
谢谢大家
[环境叙述]:
R version 3.4.3 (2017-11-30)
Platform: x86_64-w64-mingw32/x64 (64-bit)
Running under: Windows >= 8 x64 (build 9200)
[关键字]:
Measures of variable importance in random forests
谢谢大家指导