[问题] 关于randomforest

楼主: hatemath1991 (hatemath)   2017-09-27 23:09:00
[问题类型]:
意见调查(我对R 有个很棒的想法,想问问大家的意见)
程式咨询(我想用R 做某件事情,但是我不知道要怎么用R 写出来)
[软件熟悉度]:
请把以下不需要的部份删除
使用者(已经有用R 做过不少作品)
[问题叙述]:
抱歉有一些关于randomforest使用上的问题想要问一下
目前我使用randomForest这个套件去训练我的树
然后想要使用https://github.com/araastat/reprtree/tree/master/R
上面那个套件的retree画出我的树
但是遇到了一些问题
训练组跟测试组所画的树不一样
以及如果我现在是想要做随机森林的特征选取
那我该如何下手因为用不同的资料所会出的树不一样
[程式范例]:
请把以下不需要的部份删除
library(reprtree)
rforest <- randomForest(type~., data=train_data)
reptree <- ReprTree(rforest, train_data, metric='d2')
plot(reptree, index=1)
reptree <- ReprTree(rforest, test_data, metric='d2')
plot(reptree, index=1)
[环境叙述]:
R version 3.4.1 (2017-06-30)
Platform: x86_64-pc-linux-gnu (64-bit)
Running under: Ubuntu 16.04.3 LTS
Matrix products: default
BLAS: /usr/lib/libblas/libblas.so.3.6.0
LAPACK: /usr/lib/lapack/liblapack.so.3.6.0
locale:
[1] LC_CTYPE=zh_TW.UTF-8 LC_NUMERIC=C
LC_TIME=zh_TW.UTF-8
[4] LC_COLLATE=zh_TW.UTF-8 LC_MONETARY=zh_TW.UTF-8
LC_MESSAGES=zh_TW.UTF-8
[7] LC_PAPER=zh_TW.UTF-8 LC_NAME=C
LC_ADDRESS=C
[10] LC_TELEPHONE=C LC_MEASUREMENT=zh_TW.UTF-8
LC_IDENTIFICATION=C
attached base packages:
[1] stats graphics grDevices utils datasets methods base
loaded via a namespace (and not attached):
[1] compiler_3.4.1 tools_3.4.1
[关键字]:
随机森林、特征选取、绘图
作者: f496328mm (为什么会流泪)   2017-09-27 23:35:00
为什么要建两次 model ?
楼主: hatemath1991 (hatemath)   2017-09-27 23:37:00
抱歉我不是只用randomForest创一次model嘛?
作者: f496328mm (为什么会流泪)   2017-09-27 23:51:00
应该是说 为什么要分别对对 train and test 画树建 model 时, 是利用 train data 去建立树model所以整个结构是看 train data
楼主: hatemath1991 (hatemath)   2017-09-28 00:00:00
应该说这个是因为有一天打错所以才发现的我原本想说是不是我算法理解错误,但是回去重看林轩田老师的影片确定应该不会因为资料不同产生不同树才对所以才会惨生疑问*产所以现在才会疑惑,为什么两颗树的结构有差异
作者: KKbiger (UUUU)   2017-09-28 10:03:00
为什么会觉得train data和test data建出来的数结构会完全一样 除非你的train data建出来的model会百分之百可以预测test data 才有可能两个一样吧
作者: owem0410 (闲学生)   2017-09-28 11:56:00
抱歉我model才建一次不是?同model解构不就要一样?
作者: KKbiger (UUUU)   2017-09-28 14:37:00
用train data抽了一棵树 又用test data 抽出另一棵树所以抽出两颗不一样的树
作者: APM99 (血统纯正台北人)   2017-09-28 16:45:00
你这样做就没有 训练集跟测试集的意义了只是单纯的画了两棵树
作者: clansoda (小笨)   2017-09-28 16:58:00
这边也看的到APM99??

Links booklink

Contact Us: admin [ a t ] ucptt.com