CUDA 护城河现阶段很深很广
原文转自 UNIKO's Hardware
网页好读版:https://reurl.cc/RWb8eg
https://i.imgur.com/usggQmS.jpg
AI 这个名词绝对是今年与未来最火热的议题之一,目前出现各类生成式 AI 应用,例如 Ch
atGPT 和 Stable Diffusion,为产业带来全新的发展路线。
为了让生成式 AI 应用有更高效的产出,AMD、Intel 与 NVIDIA 等芯片厂商皆不断研发新
的软硬件,以期在这块市场上取得更多收益。这次笔者就利用目前持有的三张入门显示卡 (
ARC A380、GTX 1650 和 RX 6400),来让读者了解三家芯片厂商的入门产品能提供多少运算
效能。
GUNNIR ARC A380 Photon 6G OC 外观
笔者这张 ARC A380 品牌是 GUNNIR,是一张需要外接电源的版本,目前台湾电商平台有销
售的 SPARKLE ARC A380 ELF 则无需外接电源。两者主要差别是 GPU 加速频率。
据 TechPowerUp 数据库显示,ARC A380 Photon 6G OC 加速频率是 2450 MHz,ARC A380
ELF 加速频率是 2050 MHz,差了 400 MHz。
ARC A380 Photon 6G OC 外盒正面印有产品外观彩图,散热器跟外接电源的设计,让它看起
来不像入门级显示卡。右上角标示该卡为 Intel ARC 3 系列成员,支援 XeSS 超采样技
术和 DirectX 12 Ultimate API。
背面标示该卡需要的环境配备,例如 350W 以上并且有 8 Pin PCIe 电源接头的电源供应器
、建议 8GB 以上系统内存、AMD Ryzen 3000 系列及更新的处理器并能开启 Resizable
BAR 功能的平台,以及 Windows 10 或 Windows 11 64 位元系统。
https://i.imgur.com/mxcUogL.jpg
https://i.imgur.com/XPjzpaP.jpg
正面可以看到整体采黑色双风扇散热器,背面也有一块黑色的金属强化背板,已经是接近中
阶显示卡才有的待遇,整体尺寸不含挡板为 222 x 114 x 42 mm。
https://i.imgur.com/IBg77zj.jpg
https://i.imgur.com/ftMSDXH.jpg
内部可以看到有一块不小的铝挤散热片,还有一根导热管。
上方印有 Intel ARC 字样,8 Pin 电源插座旁还有一块 GUNNIR Logo 的发光区域,正常
开机时会发蓝光。
https://i.imgur.com/3bHdodZ.jpg
https://i.imgur.com/G2AvEDq.jpg
在影像输出方面,具备 1 个 HDMI 2.0 跟 3 个 DisplayPort 2.0 输出接头,是新台币 40
00 左右显示卡中输出接头最多的。
https://i.imgur.com/pmjdbng.jpg
硬件规格
处理器:AMD Ryzen 5 5600X (关闭 PBO)
主机板:ASUS PRIME B550M-K/CSM
内存:XPG SPECTRIX D60G DDR4 RGB 3000 8GB x2 (OC 3200)
显示卡:
1.ASUS Dual Radeon RX 6400
2.GUNNIR ARC A380 Photon 6G OC
3.ZOTAC GAMING GeForce GTX 1650 Low Profile储存:ADATA Legend 710
萤幕TUF Gaming VG27AQL1A ZAKU II EDITION
驱动版本:
ASUS Dual Radeon RX 6400 - AMD Software : Adrenalin Edition 23.11.1
GUNNIR ARC A380 Photon 6G OC - Intel Arc & Iris Xe Graphics 31.0.101.4972
ZOTAC GAMING GeForce GTX 1650 Low Profile - GeForce Game Ready 546.17
作业系统:Windows 11 23H2 (关闭防毒)
电源设定:平衡模式
性能与游戏测试
3DMark
不免俗的还是要跑一下 Benchmark,首先是 3DMark,Time Spy 中 ARC A380 分数最高,Fi
re Strike Extreme 中则是 RX 6400 表现最佳。
https://i.imgur.com/QGgqja4.png
https://i.imgur.com/AzV85eD.png
Geekbench
再来是 Geekbench,OpenCL 性能 GTX 1650 具备优势,Vulkan 则是 RX 6400 领先,而 AR
C A380 在这两项测试中性能皆居次。
https://i.imgur.com/Pli4iaj.png
https://i.imgur.com/Wa5EqHB.png
GravityMark Vulkan
GravityMark Vulkan 的显示卡性能排名与 Geekbench Vulkan 相同,表示 RX 6400 在 Vul
kan API 的效能表现是三者中最强的,只是大家性能差距也不大。
https://i.imgur.com/UKJVTYP.png
Counter-Strike 2
简单试个游戏,首先是 Counter-Strike 2,由于是入门显示卡,所以笔者统一使用 1080P
120Hz 低特效全萤幕设定,地图选 Dust 2 进行 AI 对战,结果 RX 6400 出现画面异常不
能玩,只有在未设定全萤幕前的视窗化状态下正常,因此 RX 6400 在这项没有成绩。GTX 1
650 在 CS2 游戏测试中 AVG FPS 最高。
https://i.imgur.com/i9dhqCL.png
Overwatch 2
接着测 Overwatch 2,一样是 1080P 120Hz 低特效全萤幕,关闭动态渲染比率,游戏解析
度设定 100%,最大帧率 300,地图 66 号公路,AVG FPS 由 RX 6400 胜出。
https://i.imgur.com/yEqZ53l.png
AI 相关应用测试
Stable Diffusion WebUI
现在进入重头戏,先来试个最常用的本地 AI 应用 Stable Diffusion WebUI,模型使用 St
able Diffusion V1.5,GTX 1650 用的是AUTOMATIC1111 的 Stable Diffusion web UI,
版本 1.6.0;ARC A380 用的是 openvinotoolkit 的 Stable Diffusion web UI,版本 1.
6.0;RX 6400 使用 Nod.AI 专为 AMD RDNA 显示卡最佳化的 Shark (Vulkan API),版本
20231009.984。测试使用的设定和 Prompt 跟“Stable Diffusion AI 生图加速新利器!
透过 LCM LoRA 大幅提升生图速度”这篇*注1 相同,测试结果显示 Intel 的 OpenVINO
加速相当出色,速度让对手看不到车尾灯。
注1:https://reurl.cc/E4ZWYK
https://i.imgur.com/ea2bs1W.png
本地 LLM 大型语言模型运作效能测试
笔者使用 KoboldCpp V1.5 加载 Taiwan-LLM-7B-v2.1-chat-Q4_K_S.gguf 模型进行测
试,设定只更改 Presets,GTX 1650 选择 cuBLAS,ARC A380 和 RX 6400 选择 CLBlast,
询问的问题是“什么是LLM”,连续三次。图片排序左至右依序是 GTX 1650、ARC A380、RX
6400,测试结果显示 GTX 1650 效率最高,RX 6400 次之。
https://i.imgur.com/kkTADmY.jpg
https://i.imgur.com/9UBUEYp.jpg
https://i.imgur.com/Y38feG5.jpg
AI 影片放大补帧效能测试
测试工具使用 Waifu2x-Extension-GUI 版本 3.108.01, 放大工具选择 Real-CUGAN ncn
n Vulkan,放大倍率为默认的 2X,补帧工具选择 RIFE ncnn Vulkan,针对各显示卡开启硬
体加速选项,图片储存格式用 WebP,图片品质设 80,测试的影片来源 (360P) 可按此下载
*注2。
此项测试由 GTX 1650 拿下冠军,RX 6400 获得亚军。
注2:https://reurl.cc/mrv77A
https://i.imgur.com/My89rrL.png
结论
以一般娱乐用途而言,在新台币 4000 这个价位上,三款显示卡的效能其实差不多,要是真
的想跑 AI 应用,那么 NVIDIA 的显示卡绝对是目前最稳的选择,AI 相关应用软件基本上
都支援 CUDA,可以让你获得下载即可用的体验。
在本次测试结果中,AMD 显示卡虽然性能表现不如 NVIDIA (这边仅考虑 Windows 平台) ,
透过 OpenCL 或 Vulkan API 还是可以获得一定程度的效果。另外,AMD 的 ROCm 虽然说已
登陆 Windows 平台,但笔者使用 KoboldCpp 的 ROCm 版本只能正常开启程式,加载模型
后就自己关闭了,而 Shark 从 Vulkan 改为 ROCm 会显示错误出不了图,因笔者手上没 AM
D 更高阶的显示卡 (本身偏好用无须外接电源的显示卡),不晓得是不是 VRAM 不够所以跑
不了,或是有其他原因,也希望能在 Windows 系统上看到更多最佳化解决方案出现。
至于 Intel ARC 显示卡在 AI 的发展,只要 Intel 持续积极对社群 / 开发者进行资源投
入,以本次 Stable Diffusion WebUI 测出来的效率来看,在 Windows 系统的未来令人期
待。
笔者并非 AI 相关产业人员,对这方面并不熟悉,若是大家有更准确且方便比较性能的测试
方法 / 工具欢迎提出,希望是以简单安装、容易使用且免费或开放原始码,能够在 Window
s 系统正常运作为主。关于 AI 应用测试结果仅供参考,测试期间为 11 月底至 12 月初,
有机会且刚好有硬件的话会继续测试一些东西给大家看。
喜欢我们的文章欢迎分享原文
也可以UNIKO's Hardware 粉丝专页并设为最爱,或是到 UNIKO's Hardware 官方网页逛逛
,观看各种开箱及测试!