[关键字]:mlr、machine learning
[出处]:https://mlr-org.github.io/mlr-tutorial/release/html/
[重点摘要]:e1071、randomForest、caret这些知名的package来回调用
重要的machine learning function吗? 相信一定会有觉得很烦,每个
function怎么要求的都不同,有的input要matrix有的要全都是数字,都
没有一个整合的平台可以使用吗? 我这不就来了吗。
mlr package是一个整合R上泛用常见的machine learning package的平台
可以让你在一行之内的改变就可以access to大部分的机器学习算法
[分享内容]:
## 首先你要先告诉mlr你现在的training data是谁,还有你想predict的
## column name,这篇文章我会以iris来作范例,假如是regression用regr代替
## classification则用classif,在iris是classification所以是classif
tsk <- makeClassifTask(data = iris , target = "Species")
## 这边有一个argument叫ID,再后来是有其他用途的,但这边我不设的话
## 他默认就是你的dataframe的名称,Species是我们要预测的colname
## 接着我们可以开始训练我们要的model了
mod <- train("classif.randomForest",task = iris)
## 这边是最简易的做法,使用train function给予他你learner的名称与
## 上面我们赋予的task就能开始训练,mlr接受直接使用""包含你的learning
## method,像是最简单的线性回归就叫做regr.lm,但是这种写法你是使用
## default的参数,你才可以这样做,若是你想要改变参数的话
lrn <- makelearner(...)
## makelearner function后面还有许多参数可以调整,可以自行参酌manual
## 最后到了predict的阶段
output <- predict(mod,newdata = iris)
final <- output$data
## 这样就可以得到最后的训练结果了,在makelearner那部分可以修改predict type
## 将他设成prob就能得到机率结果囉,这边是最最简单的使用方法,基本上machine
## learning里面不论是feature selection、missing value imputation、还有
## parameter tuning等等等功能全部都包含在这一个package里面,希望能帮助到
## 想要使用R作为机器学习平台的使用者。需要更详细的tutorial请参照来源,
## 写的跟rstudio里面的文章一样的仔细,一步一步带你做。