[分享] FeatureHashing

楼主: Wush978 (拒看低质媒体)   2015-01-21 23:40:58
[关键字]: FeatureHashing, hashing trick, R
[出处]:
https://www.youtube.com/watch?v=CdMzHLrmpi8
这是我在社群介绍CRAN的套件:FeatureHashing时的录影
在以预测为主的分析,处理大量资料时,
如果有大量Categorical Variables,
用这个套件可以让写code简单很多(但是准确度会掉一点点)
也可以当作一种randomized dimension reduction使用。
欢迎有兴趣的版友试用,有问题也欢迎找我交流。
作者: braveht (冲吧冲吧)   2015-01-21 23:46:00
为什么有dimension reduction效果?
楼主: Wush978 (拒看低质媒体)   2015-01-22 00:09:00
你可以设定hash过后空间的大小有Paper计算这种方式降维后,向量内积的误差范围
作者: gsuper (Logit(odds))   2015-01-22 23:33:00
正需要这种 我现在都不处理 numeric 了, 直接都转artifically category variable
作者: kenshin528 (成立奥凶帝国!!)   2015-01-23 23:32:00
推推感谢分享

Links booklink

Contact Us: admin [ a t ] ucptt.com