UL Procyon 加入 AI Image Generation Benchmark,10 款 AMD、Intel 与 NVIDIA 显示卡实测让你一探虚实

未来又多了一个可以测试显卡的项目。

UL 推出的 Procyon Benchmark 在近期更新,这次更新主要是加入 AI Image Generation Benchmark。

UL Procyon 加入 AI Image Generation Benchmark,10 款 AMD、Intel 与 NVIDIA 显示卡实测让你一探虚实

新推出的UL Procyon AIMage Generation Benchmark是为了更好地衡量中阶、中高阶与高阶独立显示卡的效能而推出,它包含2个测试项目,分别是Stable Diffusion XL(FP16)与StableDiffusion 1.5(FP16)。

Stable Diffusion XL(FP16)与 Stable Diffusion 1.5(FP16)测试项目提供 3 中 AI Inference Engine 进行测试,这包含 TensorRT、Intel OpenVINO 与 ONNX Runtime。

UL Procyon 加入 AI Image Generation Benchmark,10 款 AMD、Intel 与 NVIDIA 显示卡实测让你一探虚实

在 Stable Diffusion XL(FP16)中,TensorRT 最低需要 10GB VRAM,OpenVINO 需要 16GB VRAM,至于 ONNX Runtime 最低则是 16GB VRAM;至于针对中高阶显卡的 Stable Diffusion 1.5(FP16)最低则需要 8GB VRAM。

我们选择了以下显卡进行测试:

AMD
– Radeon RX 7900 XTX 24GB MBA
– Radeon RX 7900 XT 20GB MBA
– Sapphire Radeon RX 7900 GRE 20GB Nitro+
– Radeon RX 7800 XT 16GB MBA
– Radeon RX 7700 XT 12GB Pulse

UL Procyon 加入 AI Image Generation Benchmark,10 款 AMD、Intel 与 NVIDIA 显示卡实测让你一探虚实

Intel
– Intel Arc A770 16GB Limited Edition

UL Procyon 加入 AI Image Generation Benchmark,10 款 AMD、Intel 与 NVIDIA 显示卡实测让你一探虚实

NVIDIA
– GeForce RTX 4090 24GB Founders Edition
– GeForce RTX 4080 16GB Founders Edition
– TUF Gaming GeForce RTX 4070 Ti 16GB
– GeForce RTX 4070 12GB Founders Edition

UL Procyon 加入 AI Image Generation Benchmark,10 款 AMD、Intel 与 NVIDIA 显示卡实测让你一探虚实

测试部分先看看TensorRT这个AI Inference Engine的数据,这部分就只有NVIDIA GeForce显卡能够执行。

Overall Time
(sec)
Image Generation Speeds
(Image / sec)
Score
Stable Diffusion XL(FP16)
GeForce RTX 4090126.4177.9014746
GeForce RTX 4080193.20212.0753105
GeForce RTX 4070 Ti234.96914.6862553
GeForce RTX 4070346.40821.6511732
Stable Diffusion 1.5(FP16)
GeForce RTX 409018.4131.1515430
GeForce RTX 408028.4571.7793514
GeForce RTX 4070 Ti37.8592.3652641
GeForce RTX 407050.5073.1571979

跟着就是Intel OpenVINO部分,但因为 Stable Diffusion XL(FP16)最低要求为 16GB,因此我们没有将 8GB 的 Intel Arc A750 与 Intel Arc A580 加入测试。

Overall Time
(sec)
Image Generation Speeds
(Image / sec)
Score
Stable Diffusion XL(FP16)
Intel Arc A770817.79451.112733
Stable Diffusion 1.5(FP16)
Intel Arc A770144.9089.057690

最后是ONNX Runtim AI Inference Engine的测试数据。

Overall Time
(sec)
Image Generation Speeds
(Image / sec)
Score
Stable Diffusion XL(FP16)
GeForce RTX 4090172.30910.7693482
GeForce RTX 4080264.61916.5392267
GeForce RTX 4070 Ti330.06420.6291817
Radeon RX 7900 XTX382.36123.8981569
GeForce RTX 4070431.60126.9751390
Radeon RX 7900 XT439.65127.4781364
Radeon RX 7900 GRE479.45329.9661251
Radeon RX 7800 XT628.80939.301954
Radeon RX 7700 XT665.66641.604901
Intel Arc A7702755.363172.21217
Stable Diffusion 1.5(FP16)
GeForce RTX 409027.351.7093656
GeForce RTX 408040.592.5372463
GeForce RTX 4070 Ti50.4763.1551981
Radeon RX 7900 XTX51.7153.2321933
Radeon RX 7900 XT59.9133.7451669
GeForce RTX 4070 Ti65.8794.1171517
Radeon RX 7900 GRE67.3194.2071485
Radeon RX 7800 XT82.5085.1571211
Radeon RX 7700 XT90.8295.6771100
Intel Arc A770351.15921.947284

Intel Arc 在 UL Procyon AI Benchmark 的表现实在不怎样,如果用「不入流」来形容它,应该不太好,但 Intel Arc A770 在测试所需要的时间最久,若想要使用 Intel Arc A770 执行 Stable Diffusion 可能要好好思考一下。

至于Intel会不会在未来的驱动程序强化,就让我们继续观望吧。

整体来说,Ada Lovelace GPU架构的 GeForce RTX 40 系列表现依旧优异,在 TensorRT AI Inference Engine 方面,更能轻易看到其优势。

(0)
游侠网游侠网

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注