[问题] train 不平衡资料的方法

楼主: qwertad (qwertad)   2018-03-28 04:04:12
是这样的最近想自己做一些练习
于是网络上找了一个dataset,
它的lebal 是1跟0 但是资料不平衡
1:0约2:8
一开始用决策树,随机森林跑acc都大概8成跟我都猜0差不多,precision 爆烂
大概知道有两种做法
1.从资料下手
我试了down _sampled ,smote
2.从算法下手
我试了xg boost 还有用keras 盖神经网络
怎么train 在测试集上的表现大概就是
acc :0.83 ,
precision (预测1正确):0.7
recall (1被预测出来的机率):0.3
的水准,precision 有上升到0.7
想请问有什么方法是可以将准确率,precision ,recall再提高的,特征工程有做
资料集是用kaggle 上的信用卡违约
作者: sean50301 ( (づ′・ω・)づ)   2018-03-28 11:42:00
probability calibration?
作者: aszx4510 (wind)   2018-03-29 01:20:00
可以参考隔壁版 DataScience 最近才讨论过这个问题

Links booklink

Contact Us: admin [ a t ] ucptt.com