Re: [问题] 两层for循环的效果 littleshan PTT批踢踢实业坊

Re: [问题] 两层for循环的效果

楼主: littleshan (我要加入剑道社!) 2017-05-27 00:53:01

实验最快
#include <stdio.h>
#include <stdint.h>
inline uint64_t rdtsc(void)
{
uint32_t hi, lo;
asm volatile ("rdtsc" : "=a"(lo), "=d"(hi));
return ((uint64_t)lo) | (((uint64_t)hi)<<32);
}
uint64_t calc(uint64_t outer, uint64_t inner)
{
uint64_t s = 0;
for(uint64_t i = 1; i <= outer; ++i){
for(uint64_t j = 1; j <= inner; ++j){
s += i*j;
}
}
return s;
}
int main()
{
uint64_t t0 = rdtsc();
uint64_t sum1 = calc(100ul, 1000000ul);
uint64_t t1 = rdtsc();
uint64_t sum2 = calc(1000000ul, 100ul);
uint64_t t2 = rdtsc();
printf("sum1 = %lu, used %lu cycles\n", sum1, t1-t0);
printf("sum2 = %lu, used %lu cycles\n", sum2, t2-t1);
return 0;
}
使用 gcc 6.3 用 -O2 编译
执行环境 Linux 4.9.18 with Intel Core i5-7260U
结果：
sum1 = 2525002525000000, used 356 cycles
sum2 = 2525002525000000, used 2633286 cycles
造成这样差异的原因，是 gcc 把 calc() 函式直接 inline
然后展开内层循环的运算结果
第一个 function call 转为 asm 后长这样：
movabsq $500000499999, %rdx
movq %rdx, %rdi
.p2align 4,,10
.p2align 3
.L15:
leaq (%rdx,%rax), %rcx
addq $1, %rax
addq %rdi, %rdx
addq %rcx, %rsi
cmpq $101, %rax
jne .L15
看起来有点复杂，翻回 C 就是这样：
rax = 1;
rdx = 500000499999;
do{
rcx = rdx + rax;
rdx += 500000499999;
sum += rcx;
rax++;
}while(rax != 101);
我不知道为什么不直接加 500000500000 就好，不过这不是重点
重点是这样循环只跑了 100 次
相较于第二个 function call，同样的展开方式循环会跑 1000000 次
当然是第一种方式比较快，而且也很刚好差了一万倍左右
不过这一切都取决于 compiler 最佳化
未来会不会不管怎么呼叫都直接在 compile time 算出答案给你，其实很有可能
到时候两种作法就一样快了

作者: Hazukashiine (私は幸せです) 2017-05-27 01:18:00

推实验精神

作者: mh2ant (环球科大扛坝子) 2017-05-27 11:49:00

好猛

作者: cuteSquirrel (松鼠) 2017-05-27 19:34:00

推动手做!

作者: shadow0326 (非议) 2017-05-28 13:16:00

推

作者: xxxx9659 (嘎嘎嘎嘎嘎) 2017-06-04 14:49:00

好猛!!

继续阅读

[问题] thread 使用请益DRLai [问题] VC++ SetTimer函数如何呼叫其他函数rul3nk41 check alloc alignmentHILL33LOVE [问题] qt qthread问题checkIO [问题] 两层for循环的效果mh2ant Re: [问题] C 语言下有类似 Template 的功能吗？loveflames [问题] C 语言下有类似 Template 的功能吗？henry8168 Re: [问题] array out of bound的问题loveflames [分享] 气泡排序法递回写法不使用forAyuang [讨论] function pointer比switch和if有效率？Zoxge