[关键字]: FeatureHashing, hashing trick, R
[出处]:
https://www.youtube.com/watch?v=CdMzHLrmpi8
这是我在社群介绍CRAN的套件:FeatureHashing时的录影
在以预测为主的分析,处理大量资料时,
如果有大量Categorical Variables,
用这个套件可以让写code简单很多(但是准确度会掉一点点)
也可以当作一种randomized dimension reduction使用。
欢迎有兴趣的版友试用,有问题也欢迎找我交流。