[家教] PyTorch Seq2seq 协助检查模型(已征到)

楼主: b90022790 (柚子拉拉)   2022-05-07 00:48:56
1.对象: 大三资工系男生
2.地点: 线上
3.科目:协助检查 PyTorch 基础 ImageCaptioning Seq2Seq 模型是否有出错
4.上课时间:周五六日一二三晚上皆可,预估需要2~3小时,视状况而定
5.时薪:800,可再议
6.条件:熟悉 PyTorch,有 Seq2Seq 训练经验尤佳
7.联络方式:站内信
8.附注:
基本上出问题的是Image Captioning实验里最基础的 baseline model 无法收敛
是很简单、不超过10层的 model,但是因为刚接触 PyTorch,所以不确定哪里可能出状况
希望您能够协助我检查模型建立、训练过程
不过不用担心没接触过Image Captioning,因为就只是基本的Seq2seq模型而已
有意者请站内信简述曾实做过的 PyTorch model,谢谢!
作者: yiche (你若安好,便是晴天)   2022-05-07 10:41:00
是cross entropy loss 没有minimize吗
作者: jamfly (jamfly)   2022-05-07 12:12:00
有时候是data 没处理好 可以依序检查 1. data 是不是你想要的样子 2. gradient 3. 其他参数的调整 e.g., learningrate / batch size 4. 检查你的每层 model 的 output 5.optimizer
作者: LeFilsDuVent (Le Fils Du Vent)   2022-05-07 12:44:00
SGD换ADAM常常就可以逃出局部低洼区
作者: snow10725 (今天天气不错)   2022-05-07 14:14:00
推文让人趁机笔记

Links booklink

Contact Us: admin [ a t ] ucptt.com