[问题] xgboost regression

楼主: clansoda (小笨)   2016-07-13 14:48:36
首先我先贴出资料
train
https://drive.google.com/file/d/0B3xY9FMzjybzZ1pCTDE1cE1yVmM/view?usp=sharing
test
https://drive.google.com/file/d/0B3xY9FMzjybzWUpzdmNmWlhwUmc/view?usp=sharing
这是一个hackthon上面的资料,我只是想用实际一点的资料来做我正在研究的package
train跟test都是数字资料是因为xgboost本身只吃数字资料,因此类别变量我全部都
转成dummy variable,我用train data训练一个random forest得到的RMSE在1179
但是我用相同的train data去训练xgbooster然后predict,得到的RMSE居然2800多
已经是最后一名的边都摸不到的那种,我觉得应该是我的code哪里写错了,但是我看
vignette,我一开始是写成classification的样子,后来改成regression后却跑出
负数的值,比用classification去跑更离谱,因此发文请教
xgboost(data = trainmatrix,label = train$Item_Outlet_Sales,max_depth=2
,eta=1,nthread=2,nrounds = 2,objective="reg:linear",booster="gblinear")->s
上面是我用来训练xgbooster的语法跟参数,我一开始跟着vignette写如果booster不写
=gblinear好像会试classfication,多写以后跑出来是负数。

Links booklink

Contact Us: admin [ a t ] ucptt.com