[问题] 特征选取问题

楼主: iambakr (123)   2025-07-01 00:21:32
经验咨询(我想用R作特征选取,请问大家的经验)
[软件熟悉度]:
入门(写过其他程式,只是对语法不熟悉)
[问题叙述]:
请简略描述你所要做的事情,或是这个程式的目的
我打算使用 TF-IDF 作文字探勘,碰到以下几个问题:
Q1:我打算用 mutual information 与 mRMR作特征选取
我应该先做 TF-IDF 然后再做特征选取?
还是反过来?
Q2: 承上,我将降维后的词汇作机器学习分类 (ex: svm, rf, etc)
我需要将这些文字特征以及其他数值型特征作标准化吗?
如下面 code 最后一行
以及倒数第二行有注解的 step_nzv() 这个实务上也是需要的吗?
rec <- recipe(Label ~ ., data = train_data) |>
step_zv(all_predictors()) |>
#step_nzv(all_predictors()) |>
step_normalize(all_numeric_predictors())
谢谢各位

Links booklink

Contact Us: admin [ a t ] ucptt.com