
NVIDIA 发布全新 H200 Hopper,这是专为 AI 运算而设计的高效能显示芯片,它采用 Micron HBM3e 内存,提供惊人的内存容量和带宽。 除了新的 AI 平台外,NVIDIA 还宣布一项超级计算机合作案,其 Grace Hopper Superchips 将为 Jupiter 超级计算机提供 Exaflop 级别运算能力。
H200 Hopper:AI 运算新一代旗舰
NVIDIA 的 H100 是目前业界最受欢迎的 AI 芯片之一,但 NVIDIA 并不满足于此,它希望为客户提供更高性能的芯片,因此推出最新的 HPC 和运算平台 HGX H200,采用 H200 Tensor Core GPU,这些 GPU 在软硬件上都采用最新的 Hopper 最佳化技术,并且搭载目前全球最快的内存方案。

H200 搭载 Micron HBM3e 内存容量高达 141 GB,带宽高达 4.8 TB/s,这比自家 A100 的内存容量和带宽分别高出一倍和 2.4 倍。 该内存方案让 NVIDIA 能在例如 Llama 2 (70 亿参数的大型语言模型) 这种 AI 推论应用中性能几乎提高一倍。
在解决方案方面,H200 将提供多种 HGX H200 服务器,包括 4 路和 8 路 GPU 配置。 一个8路H200配置HGX系统,将提供高达32 PetaFLOPs FP8运算性能和1.1TB内存容量。
这些 GPU 还将与现有 HGX H100 系统兼容,让客户更容易升级。 NVIDIA 的合作伙伴,如ASUS、ASRock Rack、Dell、Eviden、GIGABYTE、Hewlett Packard Enterprise、Ingrasys、Lenovo、QCT、Wiwynn、Supermicro 和Wistron,将在2024 年第二季度提供更新的解决方案。

Grace Hopper Superchips:为 Jupiter 超级计算机提供 Exaflop 级别运算能力
除了 H200 的发布,NVIDIA 还宣布一项重大的超级计算机合作案,采用其 Grace Hopper Superchips(GH200)。 这台超级计算机被称为Jupiter,将位于德国的Forschungszentrum Jülich研究中心,作为EuroHPC联合计划的一部分,由Eviden和ParTec承包。 该超级计算机将用于材料科学、气候研究、药物发现等领域,这也是英伟达在11月份时曾宣布的第二台超级计算机,前一台是Isambard-AI,提供高达21Exaflops AI运算能力。

在配置方面,Jupiter 超级计算机采用 Eviden 的 BullSequana XH3000,采全液冷架构。 拥有 24,000 颗 NVIDIA GH200 Grace Hopper Superchips,使用 NVIDIA Quantum-2 Infiniband 进行互连。

考虑到每颗Grace CPU都有288个Neoverse核心,可以看到Jupiter超级计算机在CPU方面就拥有近700万个ARM核心(准确数字为6,912,000)。 性能方面,Jupiter 超级计算机将提供 90 Exaflops 的 AI 训练和 1 Exaflop 的高性能运算。 这台超级计算机预计将在 2024 年安装。