[问题] JOB会停在server上不动也没任何错误讯息

楼主: peter308 (pete)   2016-04-27 21:27:49
各位好
我用Mpif90 编译产生一个执行档a.out
然后这个a.out再跑一段时间之后就停顿在那边
也没有错误讯息,就只是闲置那边
我目前因为无法从任何讯息文件得知job是在哪个地方出问题
我自己猜测是I/O 不同步 或其他原因
有人知道要怎么去检测这个job闲置的原因为何?
我有想过
1. 在mpif90 那边加一些除错的选项 -debug 之类
2. 用stat 之类的指令去侦测a.out正在等待哪个子程序的回应或档案的读取,..等
能否请版友给我一些方向让我可以顺利解决此问题?
万分感谢~~~~
作者: pillbox1989 (如履薄冰)   2016-04-28 02:35:00
在程式里面加些print看看是不是卡在某一段吧
作者: Bencrie   2016-04-28 12:11:00
gdb attach 后中断它然后 bt
作者: sasoric (sasori.c)   2016-04-29 14:07:00
直觉是你的程式被blocking message passing函式卡住如同楼上所提 用debugger或加printf去查

Links booklink

Contact Us: admin [ a t ] ucptt.com