[运算] 多层for循环简化与 GPU加速 Absolitude PTT批踢踢实业坊

[运算] 多层for循环简化与 GPU加速

楼主: Absolitude (别再睡了起床了爱丽) 2017-12-19 02:09:38

最近遇到一个问题目前只想到用多层for来处理，想请问有没有办法简化
问题大概是这样，有两个m*n*k的三维矩阵atot和atotcc，atotcc是atot的共轭复数

其中每一个k方向的红框atot(1,1,:) atotcc(2,3,:)这些视为一个个向量，目标是把所
有atot中的m*n个向量和atotcc中的m*n个向量分别做内积得到(m*n)^2个值，再取总合
目前的程式大概是这样
m=15;
n=19;
k=10000;
ar=randn(n,m,k);
ai=randn(n,m,k);
atot=ar+i*ai;
atotcc=conj(atot);
acsd=zeros(n,m,n,m)+i*zeros(n,m,n,m);
tic;
for ix=1:m
for iy=1:n
for ixc=1:m
for iyc=1:n
acsd(iy,ix,ixc,iyc)=sum(bsxfun(@times,atot(iy,ix,:),atotcc(iyc,ixc,:)));
end
end
end
end
toc
tic;
acsdsum=sum(sum(sum(sum(acsd))));
toc
说是内积但是不用dot是因为有复数用起来有些问题，一维的话我知道可以取转置，但是
写成(iy,ix,:)这种形式不太知道怎么做所以先用sum配上bsxfun或.*
感觉写这么多层循环不是很有效率，而且也不适合用gpu加速(目前只会变慢)，但这应该是
很适合平行化的计算(上面的程式在执行时会自动在cpu上平行化)，因为所有的内积以及
内积中的运算分别都是独立的
在这先谢谢板上先进的不吝指教感恩

作者: sunev (Veritas) 2017-12-19 05:27:00

atot=randn(m*n,k)+1i*randn(m*n,k);acsdsum=sum(sum(atot*atot'));

楼主: Absolitude (别再睡了起床了爱丽) 2017-12-19 15:40:00

之前用的时候都没用到复数，没想到转置后还会变共轭

作者: sunev (Veritas) 2017-12-19 20:50:00

你画的图很精美，证明你完全知道自己想算什么，也用到了一些vectorize的技巧，像是2维变1维以及bsxfun你只是不知道两件事，1.矩阵相乘可以看成向量内积的推广。2.复数向量怎么做内积。有兴趣可以去翻一下线性代数的书，里面有提到这些事

继续阅读

[讨论] 画图请益Tere15 [请益] LQR/ARE solver FLOP?cholauda [讨论] noverlap是要做什么的？amenamen [请益] XColorcholauda [问题] 修改多个相同字的功能Magicbears [讨论] 有办法读写erd档吗wavek [讨论] 抓取特征的识别框边界问题xxx741789 [讨论] 循环问题cleveland32 Re: [讨论] 电势模拟问题profyang [讨论]取最大平均的问题chinsun

[运算] 多层for循环简化 与 GPU加速

[运算] 多层for循环简化与 GPU加速