
Stability AI 最近发布的一篇博客文章中,展示了Intel Gaudi 2与NVIDIA H100和A100 GPU加速器之间的AI基准测试对决。 测试结果显示,对于正在寻找快速且现成解决方案的用户来说,Intel 的解决方案提供了极佳的性价比。
Intel Gaudi 2 与 NVIDIA 加速器的性能对决
Gaudi 2 对抗 H100 和 A100:性能与性价比兼备
Stability AI 一直在开发能够有效处理多样化任务的开放模型。 为了测试这一点,Stability AI 使用了包括 Stable Diffusion 3 在内的两个模型,并在 NVIDIA 和 Intel 最受欢迎的 AI 加速器之间进行了基准测试,以比较它们的性能。
在 Stable Diffusion 3 中,Intel 的 Gaudi 2 AI 加速器取得了出色的结果。 该模型范围从8亿到80亿组参数,并使用了20亿组参数版本进行测试。 比较结果显示,Intel Gaudi 2比H100 80GB GPU快56%,比A100 80 GB GPU快2.43倍,而Gaudi 2具备的96GBHBM内存也让Intel产品取得些许优势。

若将配置规模扩大到32个节点(256个加速器),Intel解决方案的性能提升了3.16倍,每台设备每秒可输出49.4张图像,而A100仅为每秒15.6张。

尽管在训练性能方面 Gaudi 2 AI 加速器表现出色,但由于 NVIDIA 在其 TensorRT 最佳化的进步,其在推理性能方面仍然占据主导地位。 在使用基本 PyTorch 的 Stable Diffusion 3 80 亿组模型推理测试中,Gaudi 2 提供了与 Nvidia A100 相似的推理速度。 但是,在使用 TensorRT 优化后,A100 生成图像的速度比 Gaudi 2 快 40%。
这些测试结果显示AI领域的竞争日趋激烈,并且最重要的不是硬件本身,而是每个特定加速器的软件和相关优化。 尽管硬件至关重要,但如果没有坚实的基础来驱动这些核心、内存和各种 AI 专用加速器,在这个领域将会遇到困难。