[问题] 回归的预测问题 totolink PTT批踢踢实业坊

[问题] 回归的预测问题

楼主: totolink (吐吐林克) 2020-08-17 12:13:45

大家好，想请教一个回归问题
一般在写回归的语法是
lm(y~x1+x2+x3...)，直接将变量名称写上。
但因为实作牵涉变量选择的问题
我的写法是用矩阵的方式
lm(data[,7]~data[,variable])
data是1000*7的矩阵，第7个是反映变量
variable是数字向量，作为变量选择的指标
例如variable=c(1,2,4)是选取x1,x2,x4作为解释变量
这样的写法虽然一样可以建模型但没办法顺利预测测试集
我的测试集是200*7的资料集
用predict预测会给警告讯息说新资料笔数只有200和原始资料笔数不同
并且回传的预测结果是建模型那1000笔资料的fitted.value
这样的状况只有在使用矩阵写lm时会产生，一般写法就没问题
目前只想到提取模型系数自己算的解决方案，请问是否有方法可以解决这样的问题呢？

作者: andrew43 (讨厌有好心推文后删文者) 2020-08-17 12:45:00

我会直接提出系数和新资料用矩阵乘法，自变量再多也不算麻烦。

继续阅读

Re: [问题] 使用windows batch用Rscript产excelkhaos [问题] 使用windows batch用Rscript产excelkhaos [问题] 撷取中文特定字串love11098787 [问题] 上传Package到CRANChenEye Re: [问题] 关于平行运算totolink [问题] 汇出excel问题totolink [问题] 想请问此流程控制是否出错 asdfrtg [问题] ggplot画不出同类型的dataYangPeiHung [问题]资料处理之超级大表empireisme [问题] %>%的应用eco100