[讨论] 浮点数运算的效能与误差

楼主: a34021501 (CARD)   2017-10-08 04:12:53
各位好
各种不同 GPGPU 与 CPU 之间的浮点数运算
拥有很多不同的方式可以计算出不同精确度
例如 PhenomII 时代的 GPU 就已经是 GPGPU
可以透过 OpenCL 将大量 MIMD 交给 GPGPU
因此有些浮点数运算会 offload 到 GPGPU
一直以来不同 Device 有不同的浮点数误差
但近期发现同 Device 多次运算却不同结果
其实我只是想要写个 GPGPU Benchmark 程式
http://cargon.net/GMEMD/GMEMD_GPU_Color_Real16bit_Benchmark.7z
但我发现每次交给 OpenCL 运算后有时出错
也有可能是总线传输时发生错误导致误差
因此我在比较的时候还重复比较反复确认之
token=0;
for(int j=0;j<t_height;++j){
for(int i=0;i<t_width;++i){
if( !( cvGetReal2D(fimg2_ch[0],j,i) == cvGetReal2D(fimg2_ch[1],j,i) &&
cvGetReal2D(fimg2_ch[2],j,i) == cvGetReal2D(fimg2_ch[0],j,i) &&
cvGetReal2D(fimg2_ch[1],j,i) == cvGetReal2D(fimg2_ch[2],j,i) )
) token=1;
if( !( cvGetReal2D(fimg2_ch[2],j,i) == cvGetReal2D(fimg2_ch[1],j,i) &&
cvGetReal2D(fimg2_ch[0],j,i) == cvGetReal2D(fimg2_ch[2],j,i) &&
cvGetReal2D(fimg2_ch[1],j,i) == cvGetReal2D(fimg2_ch[0],j,i) )
) token=1;
if( !( cvGetReal2D(fimg2_ch[1],j,i) == cvGetReal2D(fimg2_ch[2],j,i) &&
cvGetReal2D(fimg2_ch[2],j,i) == cvGetReal2D(fimg2_ch[0],j,i) &&
cvGetReal2D(fimg2_ch[0],j,i) == cvGetReal2D(fimg2_ch[1],j,i) )
) token=1;
}
}
printf("token=%d ",token);
因为输入的影像是 Grayscale 所以在重复执行 OpenCL Kernel 三次的数值应该完全相同
但有时候 token 还是会被写入 1,即代表 3 次相同浮点数运算有不同结果于内存存取
不知道大家看法如何?
这问题困扰了我很久!
作者: Ommm5566 (56天團)   2017-10-08 04:29:00
semaphore mutex atomic 自己选一个
作者: longlongint (华哥尔)   2017-10-08 10:34:00
同一行为什么要跑三次
作者: Killercat (杀人猫™)   2017-10-08 15:38:00
你先确认一下token写入时的值
作者: LPH66 (-6.2598534e+18f)   2017-10-08 18:04:00
OpenCL 的同步是使用 barrier() 去研读那部份的东西简单的观念是不经过 barrier() 不该去捞别人负责的格子
作者: Killercat (杀人猫™)   2017-10-09 04:27:00
barrier主要是挡CPU乱序,GPU....也能用吗o_oa?
作者: LPH66 (-6.2598534e+18f)   2017-10-09 09:32:00
呃嗯, 我其实不太确定这边是在问 kernel 运算本身还是 host/device 的传递资料, 毕竟结果出错的原因这两者其中之一出错都有可能我提的 barrier() 是 kernel code 里的东西主要是同一 Workgroup 内的各 Workitem 之间同步这只单纯是在讲 device 端的 kernel 运算
作者: Bencrie   2017-10-09 13:26:00
a34 发文其实不用太认真看就是 XD
作者: liflguy (xxxwino)   2017-10-09 18:19:00
看到GPU OPENCL猜ID
楼主: a34021501 (CARD)   2017-10-09 22:38:00
其实 barrier 只在 GPGPU 中的某个 module 中等待同步!所以软件的 Workgroup 如何分配到 module 会有效能差异其实这支程式在测试的时候发生不同步才会分两阶段Event即等待 kernel function 结束才 read 或 next function
作者: Hazukashiine (私は幸せです)   2017-10-10 15:38:00
哇呜呜新发现耶 快发paper!!!!IEEE Trans on Electromagnetic Compatibility 等你
楼主: a34021501 (CARD)   2017-10-10 15:39:00
但是萤幕只有 16bit 色深的话其实根本看不出来错在哪里
作者: Hazukashiine (私は幸せです)   2017-10-10 15:42:00
你有纸笔对吧 算一下能量够不够啊 实验做一下我有认识这领域的 IEEE Editor 要不要帮你呢~嘻嘻
楼主: a34021501 (CARD)   2017-10-10 15:44:00
最近钟摆都会被重力电磁场推动而产生非常不稳态的计时!
作者: Hazukashiine (私は幸せです)   2017-10-10 15:44:00
而且贵先生应该对这个领域很有研究 还发了很多篇呢不止在我们版上发 还发到被水桶十年真是功绩斐然钟摆哈哈钟摆 你知道现在都用原子钟吗哈哈哈哈哈哈原子钟用能阶释放的微波讯号计时 会不会也有影响呢
楼主: a34021501 (CARD)   2017-10-10 15:50:00
不同计时器要确保每次同步累加避免对时错误而传输异常!但也有可能是卫星或其他装置使用超过IEEE的电磁规范...
作者: MOONRAKER (㊣牛鹤鳗毛人)   2017-10-16 19:21:00
难怪有不太舒服的熟悉感 :|
作者: CoNsTaR ((const *))   2017-10-16 23:45:00
竟然闹到这里来了 = =
作者: kingofsdtw (不能閒下來!!)   2017-10-17 19:53:00
压力大概很大?
作者: CP64 (( ̄▽ ̄#)﹏﹏)   2017-10-17 21:31:00
已经不只是压力大的程度了吧.....
作者: narcissusli   2017-10-17 21:49:00
我好像迷路了,这里是Gundam版吗...???
作者: ssdoz2sk (眷恋着提拉米苏的风采~)   2017-10-17 23:28:00
他到底要被多少个版水桶才不会发奇怪的文章阿

Links booklink

Contact Us: admin [ a t ] ucptt.com