[运算] 多层for循环简化 与 GPU加速

楼主: Absolitude (别再睡了起床了爱丽)   2017-12-19 02:09:38
最近遇到一个问题目前只想到用多层for来处理,想请问有没有办法简化
问题大概是这样,有两个m*n*k的三维矩阵atot和atotcc,atotcc是atot的共轭复数

其中每一个k方向的红框atot(1,1,:) atotcc(2,3,:)这些视为一个个向量,目标是把所
有atot中的m*n个向量和atotcc中的m*n个向量分别做内积得到(m*n)^2个值,再取总合
目前的程式大概是这样
m=15;
n=19;
k=10000;
ar=randn(n,m,k);
ai=randn(n,m,k);
atot=ar+i*ai;
atotcc=conj(atot);
acsd=zeros(n,m,n,m)+i*zeros(n,m,n,m);
tic;
for ix=1:m
for iy=1:n
for ixc=1:m
for iyc=1:n
acsd(iy,ix,ixc,iyc)=sum(bsxfun(@times,atot(iy,ix,:),atotcc(iyc,ixc,:)));
end
end
end
end
toc
tic;
acsdsum=sum(sum(sum(sum(acsd))));
toc
说是内积但是不用dot是因为有复数用起来有些问题,一维的话我知道可以取转置,但是
写成(iy,ix,:)这种形式不太知道怎么做所以先用sum配上bsxfun或.*
感觉写这么多层循环不是很有效率,而且也不适合用gpu加速(目前只会变慢),但这应该是
很适合平行化的计算(上面的程式在执行时会自动在cpu上平行化),因为所有的内积以及
内积中的运算分别都是独立的
在这先谢谢板上先进的不吝指教 感恩
作者: sunev (Veritas)   2017-12-19 05:27:00
atot=randn(m*n,k)+1i*randn(m*n,k);acsdsum=sum(sum(atot*atot'));
楼主: Absolitude (别再睡了起床了爱丽)   2017-12-19 15:40:00
之前用的时候都没用到复数,没想到转置后还会变共轭
作者: sunev (Veritas)   2017-12-19 20:50:00
你画的图很精美,证明你完全知道自己想算什么,也用到了一些vectorize的技巧,像是2维变1维以及bsxfun你只是不知道两件事,1.矩阵相乘可以看成向量内积的推广。2.复数向量怎么做内积。有兴趣可以去翻一下线性代数的书,里面有提到这些事

Links booklink

Contact Us: admin [ a t ] ucptt.com