[请益] 为什么现在新的深度学习模型都很少割出te ruthertw PTT批踢踢实业坊

[请益] 为什么现在新的深度学习模型都很少割出te

楼主: ruthertw (小叶老大) 2021-08-14 16:12:05

"为什么现在新的深度学习模型都很少割出test dataset?"
在进行实验的时候,
发现近三年来的研究工作,
很多都没有切割test dataset,
论文里也没有列出test dataset的实验结果.
反而都直接以validation dataset包含test dataset.
比例也从以往常用 train:val:test = 8:1:1 (7:2:1)
变成 train:val = 8:2
很多学校里的指导教授还是要求要使用8:1:1这个铁比例.
为什么现在新的深度学习模型都很少割出test dataset?
这些新模型其实只是举手之劳就可以做这到件事,
而且按照指导教授的要求,
论文里要是没有test dataset的实验结果,
应该是不能被刊登.
不得其解...
大大们可以详细说明解释这个原因吗?
还有,
想知道指导教授的坚持是对的吗?
先谢谢各位深度学习的高手~

作者: yiche (你若安好，便是晴天) 2021-08-14 16:26:00

请问可以条列出几篇有这种情况的ICCV CVPR论文吗？

作者: lukelove (午睡) 2021-08-14 16:39:00

一般的benchmark应该是光data就有分train/test吧哪有必要再把train的一部分拿去切test

作者: Raymond0710 (雷门) 2021-08-14 17:19:00

有DataScience板

作者: sooge (老衲) 2021-08-14 17:32:00

你要相信投上的paper 还是相信你教授的话

作者: KindWei (一切都是梦) 2021-08-14 18:34:00

本质上并没有 test ，都看到的ground truth，大家一起调分数就好啦，除非像 kaggle，有一个公正方把 test 藏起来不给看，大家不要 overfit valid 才有意义

作者: andy5656 (andyandy) 2021-08-14 20:51:00

除非不晓得test set的label 不然有没有切是一样的

作者: itis0423 (co) 2021-08-14 23:06:00

哪些 paper 没有切 test set 啊好奇

作者: jamfly (jamfly) 2021-08-14 23:37:00

你可以举例你看的文章吗？因为通常都会有公定的benchmark来比较分数，不太有可能会有你说的只report validation set的成绩

作者: sooge (老衲) 2021-08-15 00:08:00

有小型dataset 一载下来就切 train 和test 而已说到底validation 和test 都是不被训练过的资料本质根本一样用谁去测哪有什么差并不是paper 不切而是dataset 本身就没切三份https://github.com/huangkuns/wireframe我这篇CVPR paper的室内资料集就是切train和test而已

作者: DarkIllusion (′・ω・‵) 2021-08-15 01:10:00

validation的评估指标参与模型选择跟test是有差的

作者: followwar (嫌疑犯X的献身) 2021-08-15 21:28:00

sooge是国人? 该篇作者都是大陆人耶

作者: agario (Agar.io) 2021-08-19 20:33:00

sooge 那篇是没切 val 但原po说的是没切test吧

继续阅读

[讨论] 软件工作真的有需要刷题吗?dickjas [讨论] 走前端的学历够吗？cute18943 [心得] 面试分享 Google/MS/Amazon/Rokuchiel [请益] 关于转职问题yaner Re: [讨论] 算法不强，还有办法在资工混下去吗？unknown Re: [讨论] 算法不强，还有办法在资工混下去吗？elements Re: [讨论] 算法不强，还有办法在资工混下去吗？wawi2 [请益] 字段或是变量改名cloudgoogle [讨论] 大家知道popcat吗vi000246 [讨论] 在 .NET 使用 Pythonnet 的应用情境fundamental