开发平台(Platform): (Ex: Win10, Linux, ...)
在 AMD / intel消费级笔电处理器 比较销率
编译器(Ex: GCC, clang, VC++...)+目标环境(跟开发平台不同的话需列出)
sycl vs gcc -mavx2
额外使用到的函数库(Library Used): (Ex: OpenGL, ...)
问题(Question):
有矩阵向量的程式码已经用avx2 intrinsic实作
在intel/AMD这类消费级处理器可以加速跑了
有看到sycl cpp范例 在intel one-api看到例子说可以做异质计算
想问这类sycl搭载intel 13代或下一代消费处理器+内显级别的 计算时阵向量时间
跟它纯用cpu 的 multi-thread + avx2去跑 还会更快吗?
或者有无类似的比较
感谢
喂入的资料(Input):
预期的正确结果(Expected Output):
错误结果(Wrong Output):
程式码(Code):(请善用置底文网页, 记得排版,禁止使用图档)
补充说明(Supplement):