小妹现在正在做data mining相关的project
但是遇到一个问题
我的data里面有categorical 和numeric variable
如果是在回归里
我知道要把分类变量转换成factor
然后回归会帮我跑出dummy variables来解释结果
但是如果是用lasso在variable selection这个步骤的时候
分类变量要怎么去解读呢?
(因为可能变量选择完后,部分dummy variable有系数部分没有)
另外如果是要分析这样的数据集,
是不是只有特定的variable selection方法才能做?
谢谢!