大家好,想请教一个回归问题
一般在写回归的语法是
lm(y~x1+x2+x3...),直接将变量名称写上。
但因为实作牵涉变量选择的问题
我的写法是用矩阵的方式
lm(data[,7]~data[,variable])
data是1000*7的矩阵,第7个是反映变量
variable是数字向量,作为变量选择的指标
例如variable=c(1,2,4)是选取x1,x2,x4作为解释变量
这样的写法虽然一样可以建模型但没办法顺利预测测试集
我的测试集是200*7的资料集
用predict预测会给警告讯息说新资料笔数只有200和原始资料笔数不同
并且回传的预测结果是建模型那1000笔资料的fitted.value
这样的状况只有在使用矩阵写lm时会产生,一般写法就没问题
目前只想到提取模型系数自己算的解决方案,请问是否有方法可以解决这样的问题呢?