NVIDIA公布MLPerf v3.1推论测试成绩，GH200首次亮相校能最高较H100提升17%

榜哥 • 2024年12月14日 15:15 • 达人投稿

NVIDIA公布了H100于MLPerf v3.1推论测试的成绩，并说明GH200 Grace Hopper Superchip的效能最高能较H100提升17%。

MLPerf v3.1依然全勤

NVIDIA公布MLPerf最新版本v3.1推论测试的成绩，新版测试主要的变动为更新推荐系统测试，以及新增GPT-J 6B测试，H100依然提交了所有项目的成绩。

▲ NVIDIA在说明会中强调了MLPerf v3.1推论测试的变动，以及GH200、L4、Jetson Orin等设备的测试成绩。

▲ MLPerf v3.1主要是更新推荐系统测试使用的DLEM-DCNv2，以及新增GPT-J 6B测试。

▲ DLEM-DCNv2具有新的算法，能提供更高的推荐参数量（Recommendations Parameter Count），GPT-J 6B则是具有60亿组参数的「较小型」大型语言模型（GPT-3具有1,750亿组参数）。

▲ NVIDIA表示能提交所有测试成绩相当重要，代表自家产品有能力胜任多样的AI运算需求。举例来说，通过语音询问AI摄影机拍到的花是什么品种，并让结果同样以语音输出，就需要用到语音识别、自然语言处理、影像识别、推荐系统、语音合成等AI管线。

▲ H100在MLPerf v3.1的成绩领先Google、Qualcomm、Intel等对手。其中打叉的项目为没有提交成绩。

▲ GH200具有更大容量的内存，也支持处理器与GPU之间的动态电力调配，效能最高能较H100提升17%。

▲ 根据NVIDIA提供的数据，GH200在多项测试项目领先H100的幅度介于2%~17%之间。

▲ L4是单槽、半高的PCIe接口AI运算卡，且不需额外插电，适合安装在任何现有服务器。它也一样完成所有MLPerf测试项目，且能提供6倍于x86处理器的推论效能，若是处理影像相关运算，更是能受益于内置的专属媒体引擎，将效能增益拉到120倍之谱。

▲ Jetson Orin系列运算平台则是通过软体优化，带来61%至84%的效能提升。

GH200将Grace处理器与Hopper GPU整合为单一超级芯片，具有容量更大的内存，带宽也更大，并且能在处理器和GPU之间自动调节电力，提高整体效能表现。