GPU跟CPU的同步现在都是使用cudaDeviceSynchronizeThreadSynchronize似乎是比较旧的版本
![]()
" target="_blank" rel="nofollow">
![]()
然后kernelB和C会顺序执行 除非你是用stream 但CPU依然跑下一个functionstream部分可以参考官方PDF
![]()
" target="_blank" rel="nofollow">
![]()
然后你说的除非3 cudaMemcpy我的理解应该是 你不是用Async的话,应该都是算是cpu的指令最近我也在用CUDA写程式,不足的地方还请版友补充