[问题] 请问SVM的问题

楼主: KatherineM (忆 本象)   2013-01-31 11:27:56
大家好,我有一个关于 SVM 的小问题想请教。
就是 SVM 中 feature 的值能不能混用 binary,例如: <0,1>来表示有出现跟没出现
跟连续值,例如: <0.7, 0.9> 这种经过权重后的数值。
因为我是做 text mining,我想要同时有 binary 跟 权重的特征,
但不晓得这样混用会不会有影响,或是有要考量的地方,请大大们指教。
p.s. 因为我第一次找到这个版,若是有其他更适合讨论 Machine Learning 相关的
地方,烦请告诉我,谢谢!!
作者: bob123   2013-02-01 04:39:00
fuzzy SVM ?
楼主: KatherineM (忆 本象)   2013-02-01 10:33:00
所以代表SVM原本是不建议这样设定特征值囉? ~"~
作者: cansas (cansas)   2013-02-04 19:47:00
我研所作文件自动分类 有使用Weighting的效果会比Binary的表示方式好得多 就是会分的比较准 如果你要混用 我觉得可以试试啦 不会怎样 效果不一定 有时候也要看那个Feature是否本身有鉴别力
作者: h3615840 (屁屁猪)   2013-02-15 19:05:00
刚好我目前也在做类似的研究!目前感觉起来还是feature的鉴别度影响比较大,目前我也有用到混用的部分,在可以拆成多个binary的情况下,使用binary的效果感觉上比起用单一个实数表示稍微好些,不知道是不是因为采用更多维度做判断有利提升准确性的关系

Links booklink

Contact Us: admin [ a t ] ucptt.com