[问题] tensorflow 训练中不明暂停

楼主: ches728ter (Chester)   2018-07-17 15:44:24
环境
NVIDIA GeForce GTX TITAN X
win10 + tensorflow 1.4 + CUDA 8.0 + cuDNN 6.0
目前要测试多个参数组合(kernel数等)哪个正确率高
遂写了一个内含循环的batch档,
会依序开新的cmd跑设定好的py code
batch如以下
start /wait python model_001.py
start /wait python model_002.py
...
问题来了
丢下去跑常常遇到跑了几个model后
训练到某个step就不动了(model数跟step数都不一定)
开'工作管理员'看GPU整个就是在休息状态(?)
要手动在cmd按任意键他才会回神继续跑下面的step
但没几个model又睡着了要再敲醒它
确认过
1. 电脑没休眠
2. GPU内存没满(看工作管理员)
3. 训练完py结束前有下sess.close()
感觉很像GPU偷懒打瞌睡要叫醒一样
不知道有没有人遇过并知道怎么解决的??
感激不尽
作者: sma1033 (死马)   2018-07-17 16:27:00
win10特有的cmd怪问题我跑其他程式时有时也会忽然停住换成ubuntu从此就没发生过Ler
楼主: ches728ter (Chester)   2018-07-18 02:36:00
原来是win10的问题吗感谢 我再查查看有没有解

Links booklink

Contact Us: admin [ a t ] ucptt.com