[问卦] 严重资料不平衡的小资料,推荐用什么模型

楼主: WeiU (微,U文)   2020-11-24 13:45:40
欸欸肥宅
小妹我女友问我的
叫我上来问资工肥宅你们啦
她有一份资料
只有大概400组data可以用
每个data大概有20000个特征
然后是二分法
但1的大概只有30个
剩下0的有大概300多个
非常不平衡呢
小妹我女友用了随机森林KNN SVM
效果都很差啦
Precision 跟 recall还有F1都超低
怎办啊
再不解决小妹我女友就要哭哭了
有卦吗
作者: greensaru   2019-11-24 13:45:00
作者: deepdish (Keep The Faith)   2020-11-24 13:46:00
先醒醒 你没有女友
作者: TaiwanFight   2020-11-24 13:46:00
啥模型都没用 484套套党连这都问阿
作者: peter210731 (ptt)   2020-11-24 13:46:00
建议 用钢弹模型
作者: TaiwanFight   2020-11-24 13:47:00
套出来一样是垃圾
作者: Nigger5566 (尼哥56)   2020-11-24 13:47:00
knn
作者: dangercat5 (耶楼蹦噜)   2020-11-24 13:47:00
作业自己做
作者: hogarth1985 (扣一八一)   2020-11-24 13:48:00
钢弹模型
作者: ZhouGongJin (ZhouYu)   2020-11-24 13:49:00
借学长训练好的阿法狗分类
作者: nekoares   2020-11-24 13:49:00
问功课不可取,假装有女友则可耻
作者: eterbless (守护之翼)   2020-11-24 13:50:00
资料探勘作业自己做啦
作者: praiseZun (praiseZun)   2020-11-24 13:50:00
听起来就是什么屁都不懂以为套套模型就算会机器学习
作者: minggood   2020-11-24 13:50:00
把资料分组训练啦干
作者: praiseZun (praiseZun)   2020-11-24 13:51:00
认真回random forest先套下去看feature importance
作者: robrob99 (梁龙)   2020-11-24 13:51:00
knn一定能分开啦 除非真的一坨全部同样的

Links booklink

Contact Us: admin [ a t ] ucptt.com