最近非常热门的DeepSeek模型,很多人一定都会想在本地部署,而有在考虑升级/购买显卡的人,一定会想知道NVIDIA和AMD的AI效能差距真的很大吗? 近日NVIDIA官方就分享RTX 5090、RTX 4090和RX 7900XTX的DeepSeek R1性能测试数据,即便RX 7900XTX是AMD上一代最强的显卡,结果显示大输RTX 4090,RTX 5090更不用说,差超大一节。

DeepSeek AI性能测试显示,RTX 5090 和 RTX 4090 碾压 RX 7900 XTX
几天前 NVIDIA 分享一篇关于 DeepSeek 在 RTX 50 系列显卡 AI PC 上运行的文章,当中就有分享 RTX 5090、RTX 4090 的测试数据。
NVIDIA 表示,在这种新型推理模型中,推理速度(Inference Speed) 是关键,而 NVIDIA GeForce RTX 50 系列 GPU 采用第五代的 Tensor 核心,这是基于与数据中心 AI 解决方案相同的 Blackwell GPU 架构,因此可以确保 DeepSeek 在 PC 上获得最大推理效能。
下方是 NVIDIA 的测试数据:
- DeepSeek R1 Distill Qwen 7b:跟 Radeon 7900 XTX 相比,RTX 4090 领先 46%,RTX 5090 领先 103%
- DeepSeek R1 Distill Llama 8b:跟 Radeon 7900 XTX 相比,RTX 4090 领先 47%,RTX 5090 领先 106%
- DeepSeek R1 Distill Qwen 32b:跟 Radeon 7900 XTX 相比,RTX 4090 领先 47%,RTX 5090 领先 124%

整体来说,运行DeepSeek-R1模型时,RTX 4090至少赢过7900 XTX达46%,RTX 5090更有103%以上的领先幅度,NVIDIA明显比AMD快很多,因此不用怀疑,首选一定是NVIDIA显示卡。

about:blank
NVIDIA 也提到, RTX AI 平台提供最广泛的 AI 工具、SDK 和模型,可充分利用 DeepSeek-R1 模型的能力,用户可在 Llama.cpp、Ollama、LM Studio、AnythingLLM、Jan.AI、GPT4All、以及 OpenWebUI 轻松体验。
DeepSeek R1是一款全新的 AI 模型,一推出可说就轰动整个 AI 市场,因为它的效能可以跟目前最强 AI 模型相当,但计算需求却低 11 倍。 对于有兴趣本地部署,但不知道怎么开始的人,可以阅读我们的 DeepSeek R1 教程。