[问题] CentOS fortran平行计算问题

楼主: ryan0903 (ryan)   2022-03-23 22:27:19
https://www.slothparadise.com/running-mpi-common-mpi-troubleshooting-problems/
https://i.imgur.com/pKWdhds.jpg
也遇到这个网站贴一个问题
已经照他的建议操作
但是还是有一样的error
我怀疑是library没办法在各个nodes 共用
想请问有人有类似经验 很需要帮忙 谢谢
可以再私讯详述问题 麻烦了
楼主: ryan0903 (ryan)   2022-03-23 22:31:00
总共有6个nodes 但是只能利用其中一个 也就是指令只能是#PBS -l nodes=1:ppn=40 最多
作者: relaughter (好好笑)   2022-03-23 23:02:00
每个节点彼此都要能免密码登入,这点确定了吗?
楼主: ryan0903 (ryan)   2022-03-24 00:13:00
有的 感谢提醒 还有什么要注意的吗
作者: giraffe4527 (鹿)   2022-03-24 00:22:00
每个节点防火墙、selinux都关掉,可以输出PBS的log可以试试看在每个节点跑mpirun确认是不是submit问题再来把.ssh/known_hosts节点清掉排除hosts key问题
作者: CardLin (卡林)   2022-03-25 01:28:00
没有 InfiniBand 多节点也只是无用的技术。跨节点建议 /home 及 /opt 用 NFS 分享,ssh key放/home另外建议用 PIC 编译所有的程式码。
作者: pillbox1989 (如履薄冰)   2022-03-25 18:59:00
一般建立mpi时,会用nis在每个节点建立相同的使用者代号。若要用ssh方式,要使用ssh_keygen做出金钥对放到各节点
作者: giraffe4527 (鹿)   2022-03-26 10:46:00
其实nis+nfs共享home就不用每个节点丢key了放到head node自己的auth key就每个节点通用不然很多台每个使用者每台都要做一次真的累但就是平行时比较吃网络

Links booklink

Contact Us: admin [ a t ] ucptt.com