
AMD 发布了一篇关于 Stable Diffusion 的文章,藉由将 AI 的学习库从 Python 默认的 PyTorch 替换为 Microsoft Olive 和 Microsoft ML,RX 7900 XTX 的每秒迭代速度(Iteration/sec,简称 it/s)将可以从 1.87 飙升到 18.59,逼近 NVIDIA GeForce RTX 4080 的 19.41 it/s。

Stable Diffusion 是一款开源的 AI 算图软件,玩家只要安装之后,便可以用自己的主机进行「咏唱」,并生成自己想要的照片。 也因为软件依赖的性能来源是自己的显卡,显卡对于 AI 运算的性能高低便会直接影响照片的生成速度。
由于 Stable Diffusion 是开源软件,任何人都可以取得原始码并发行修改后的版本,在网络上流传的版本众多,AMD 本次使用是目前最广为人知的「Automatic1111」,虽然通用性最好,但此版本无法原生对应 AMD 驱动,玩家必须使用迂回的方式加载驱动,也造成效能表现相当不理想。
根据知名工作站软件测试网站Puget Systems的数据,目前对AMD显卡最友善的StableDiffusion版本为SHARK,RX 7900 XTX的效率可以达20.76 it/s,远超卡皇NVIDIA GeForce RTX 4090的15.24 it/s。
反观在Automatic1111上,RX 7900 XTX的官方数据仅1.87 it/s,在Puget System上也只有4.67 it/s,甚至比得分为8.62 it/s的RTX 3060 Ti还不如。

这次AMD发布的内容大幅改善这效能方面的遗憾,即便导入Microsoft Olive和 Microsoft ML 在执行步骤上还是比不上让 Python 自动安装驱动工具来得方便就是了,可至少能够发挥旗舰卡该有的水准。