[问题] vector emplace_back() 花费时间问题

楼主: laughingman (笑面男)   2022-01-11 23:06:32
开发平台(Platform): (Ex: Win10, Linux, ...)
Linux
编译器(Ex: GCC, clang, VC++...)+目标环境(跟开发平台不同的话需列出)
GCC
问题(Question):
我用以下的程式码来测量vector emplace_back(int)所需要的时间,
为了避免vector重新分配内存多花的时间,
我先用reserve()将vector的容量调到我需要的大小:
#include <iostream>
#include <vector>
uint64_t get_tscp()
{
uint64_t a, d;
__asm__ volatile("rdtscp" : "=a"(a), "=d"(d));
return (d << 32) | a;
}
int main()
{
std::vector<int> v;
int size = 4096;
v.reserve(size);
for (int i = 0; i < size; ++i)
{
auto t1 = get_tscp();
v.emplace_back(i);
auto t2 = get_tscp();
std::cout << (t2 - t1) / 2.6 << std::endl;
}
return 0;
}
结果我发现emplace_back(int)所花费的时间大多在15ns上下,
但在第1021、2045、3069次loop,花费的时间突然暴增到2us左右,
请问各位大神有没有什么想法可以指点一下小弟,怎么解释这种情形?
感恩。
作者: stucode   2022-01-11 23:18:00
直觉猜是 cache miss。
作者: sarafciel (Cattuz)   2022-01-11 23:22:00
应该是page miss , linux一个page大小默认是4KB
作者: g0010726 (Kevin)   2022-01-12 02:41:00
先说个问题 建议不要在循环里做I/O,尤其是又用了endl去flush buffer。目前这样很有可能测得时间大部分是i/o的时间XD毕竟有时候真的不知道os的io顺序是怎样
楼主: laughingman (笑面男)   2022-01-12 03:09:00
回g大,我以为get_tscp()内的rdtscp就避免掉cpu乱序执行的问题,还是我有考虑不周的地方?再麻烦告知。回前两楼,有什么可以证明是cache miss或是pagefault的方法吗?可以稍微指点一下吗?感恩<(_ _)>
作者: mmmmei (mmm煤)   2022-01-12 07:45:00
int换double看看?
楼主: laughingman (笑面男)   2022-01-12 10:47:00
我用getconf PAGESIZE得到page大小为4096byte,然后我的int大小为4byte,double为8byte,我换成double后变成在512倍数次loop时间就会变大,所以应该是page fault造成的,感谢上面各位高手<(_ _)>

Links booklink

Contact Us: admin [ a t ] ucptt.com