去年11月宣布推出代号「Genoa」的第四代EPYC服务器处理器,并且针对云原生应用服务运算需求打造、代号「Bergamo」,以及针对科学运算需求推出代号「Geona-X」的衍生版本,目前都已经进入市场应用,而针对智慧边缘运算与电信服务需求打造、代号「Siena」的服务器处理器也准备在今年下半年进入市场, AMD表示将藉此补齐云计算市场需求,并且能结合装置端发挥更大运算效益。

藉由第四代EPYC服务器处理器推动更大规模运算效能
AMD强调,代号Bergamo的第四代EPYC 97X4系列服务器处理器,将配置最高128组Zen 4c架构核心,将能在云原生运算环境以最高虚拟CPU核心密度对应2.6倍运算效能,同时也能对应2.7倍电力使用效益,并且可在单一服务器上运作3倍以上的容器化应用程序数量。


另外,通过整合3D V-Cache快取内存设计,更让第四代EPYC服务器处理器能以最高96组Zen 4架构核心,搭配1GB以上的L3快取内存加快一倍以上的运算工作效率,并且降低原本工作所需花费时间与电力损耗量。

而在此次发布内容中,AMD更宣布与AWS合作,将使其从即日起开放预览的Amazon EC2 M7a服务器系统能比前一代产品提升高达50%效能表现。
另外,甲骨文旗下Oracle Cloud Infrastructure也将导入以「Geona」设计为主的Amazon E5 Instances服务器系统,预计在今年7月正式上线运作。
至于Meta也宣布将导入以「Bergamo」为设计的服务器系统,藉此加速旗下包含Facebook、Instagram及WhatsApp服务运作效率。
微软则将在其Azure云计算平台导入以「Geona-X」设计的服务器系统,藉此推动其以云端架构为设计的超算效能。


藉由Instinct MI300系列加速器推动自动生成式人工智能运算需求
至于在当前盛行的自动生成式人工智能运算需求,AMD也强调通过Instinct MI300系列加速器,将能满足更多运算需求。
其中包含以CDNA 3加速架构打造、配置高达192GB HBM3内存设计的Instinct MI300X,将能对应诸如超过400亿组参数设计的Falcon-40B大型自然语言模型运算。 AMD同时也宣布借由Infinity架构平台,将总计8组Instinct MI300X用于工业标准设计,藉此对应自动生成式人工智能运算训练及推论需求。

AMD预计在今年第三季向特定业者提供Instinct MI300X样品进行测试,而今年初于CES 2023期间预览,结合Zen 4架构CPU与CDNA 3架构GPU的Instinct MI300A,则是针对超算及人工智能运算需求打造的APU加速器,目前已经开始向合作伙伴提供样品测试。



在软件应用部分,AMD也将持续以ROCm软件生态体系建构完整的人工智能运算加速应用模式,同时也会持续与PyTorch等市场主要开源人工智能软件生态紧密衔接。

建构更完整的云端到端点运算环境
通过过去收购赛灵思旗下Pensando Systems技术资源,AMD宣布推出针对虚拟化、安全性等运算需求设计的智能网卡(SmartNIC),并且与VMware vSphere等云端解决方案整合,让公有云运算能变得更加可靠,同时也能满足更多元类型运算需求。 而藉由P4 DPU设计,并且与HPE旗下Aruba合作打造的智能网络交换器,则将进一步提升企业导入混合云服务应用效益。


而藉由扩展EPYC服务器处理器、藉由Instinct与Alveo推动加速运算,另外配合Alveo及Versal以FPGA架构提供弹性调度运算特性,以及通过智能网卡与DPU组件确保数据传输安全,并且提高整体运算效率,AMD预期将能对应现代化数据中心到端点运算流程优化建置需求。

此次AMD也宣布将推出下一款代号 Giglio (编按:名称应该来自意大利吉廖岛)的新款DPU设计,预计在今年底之前推出应用产品,借此满足更多零信任运算架构建置需求。
另一方面,AMD也宣布推出Pensando Software-in-Silicon处理器级软件开发套件 (SSDK),让客户能快速开发或迁移各项服务,并且轻易部署于Pensando P4 DPU设计上,同时能与既有Pensando平台功能并存运作,其中包含客制虚拟化及安全应用服务。
