Re: 资料不平衡

楼主: kerycheng (kk)   2024-05-20 17:41:09
※ 引述《sustainer123 (caster)》之铭言:
: 没下雨的资料>>>>>暴雨的资料
: 差距可能差了几十倍
: 这种应该算不平衡
: 假如换成没下雨跟小雨
: 差距可能就3.X倍
: 这算不平衡吗?
: 还有我无法理解随机复制样本或删除样本的逻辑
: 假如强行把暴雨跟不下雨变1:1
: 这不就完全不符合现实世界
姆咪研究所在研究人脸辨识
把切好的人脸图丢给model转换成array数值
同一张人脸投射在维度里会相对分布比较集中
但可能会有几张人脸年代比较久远或怎样的,会被离稍微远一点
后来教授就弄了一个公式让我下去套
把每一张人脸先平均后再根据平均值去导出各自的加权数
让相对接近的人脸它的加权变大,不接近的人脸加权变小
其实姆咪我不是很确定,我那时候写的code到底对不对
反正跑起来很像一回事就拿来用了,搞不好最后得出的结果都是错的捏
哭了
作者: sustainer123 (caster)   2024-05-20 17:48:00
调整加权来平衡资料 我有看到这解法CNN能改这个
楼主: kerycheng (kk)   2024-05-20 17:50:00
但是我的研究比较偏向利用model得出的数值去做后续计算model基本上是不动的,顶多就是使用不同版本的model去统计结果得出哪个model比较适合哪种计算方法
作者: sustainer123 (caster)   2024-05-20 17:55:00
还能等结果出来再处理喔 学到了我看到的方法要不预处理时就做好 要不就模型搞加权

Links booklink

Contact Us: admin [ a t ] ucptt.com