开发平台(Platform): (Ex: Win10, Linux, ...)
Win7
编译器(Ex: GCC, clang, VC++...)+目标环境(跟开发平台不同的话需列出)
VC++
额外使用到的函数库(Library Used): (Ex: OpenGL, ...)
OpenMP
问题(Question):
各位版大大家好
小弟最近需要加速一个function,因为function里面只是两层for循环,所以选用
OpenMP来加速。在自己写的测试程式当中是正常可以使用的,也能确认OpenMP有发挥强
大的效果,但当我将测试程式写回需要使用的专案中之后OpenMP的加速效果就消失了,
已确认编译器参数有调整(/openmp),也有include omp.h,编译无报错,程式正常执行,
小弟经过以下两点判断OpenMP没有发挥加速效果:
1.时间测试
2.使用omp_get_thread_num(),得到的值全为0
目前个人推估可能是编译器直接略过#pragma,或是执行绪都被占用??(有测试指定thread
num给parallel for,但还是没有效果)
但目前对于如何解决还没有方向,希望版大们赐教!
喂入的资料(Input):
预期的正确结果(Expected Output):
错误结果(Wrong Output):
程式码(Code):(请善用置底文网页, 记得排版)
void CMFC_TestSpeedUpDlg::TFunction1D(float srcMx[], float dstMx1[], float
dstMx2[], int Width, int Height, float **cLUT, float **sLUT)
{
#pragma omp parallel for
for (int u = 0; u < Width; u++)
{
float sigma = 0.0f;
float sigma2 = 0.0f;
for (int x = 0; x < Width; x++)
{
sigma += srcMx[x] * cLUT[u][x];
sigma2 += srcMx[x] * sLUT[u][x];
}
dstMx1[u] = sigma;
dstMx2[u] = sigma2;
sigma = sigma2 = 0;
}
}
补充说明(Supplement):
开发平台(Platform): (Ex: Win10, Linux, ...)
编译器(Ex: GCC, clang, VC++...)+目标环境(跟开发平台不同的话需列出)
额外使用到的函数库(Library Used): (Ex: OpenGL, ...)
问题(Question):
喂入的资料(Input):
预期的正确结果(Expected Output):
错误结果(Wrong Output):
程式码(Code):(请善用置底文网页, 记得排版)
补充说明(Supplement):