运算模块用Intel 4节点制程、绘图模块效能大提升
运算模块与前代产品相比,最大的改变就是将制程推进至Intel 4节点,通过全面使用EUV微影技术提升晶体管密度,并改善整体电力效率,至于不同产品型号之间的P-Core、E-Core配置搭配,还有待Intel公布。
考量到这代产品导入全新Low Power Island E-Core,Intel也为了这种特异的处理器架构更新了Thread Director硬件组件,同时也需要搭配Windows 11等对应操作系统的排程器(Scheduler),以硬件、软件协作的方式共同安排工作调度,确保最佳效能输出与省电效果。
在绘图模块部分,Meteor Lake采用Xe LPG绘图核心,具有2倍于前代产品的效能与电力效率表现,同时也加入AV1硬件加速编码等多新功能。 根据目前透露的信息,其性能可以接近于Arc A380独立显卡,表现让人期待。

▲ Intel执行长Pat Gelsinger先前表示要在4年内推进5个制程节点,现在如期走到Intel 4制程节点。

▲ Intel 4制程节点虽由Intel 7nm制程节点改名而来,但其晶体管密度与其他半导体制造商将同命名的制程节点相近。

▲ Intel 4制程节点全面使用EUV微影技术,具有2倍于Intel 7制程节点的晶体管密度,电力效率也提升20%。

▲ Meteor Lake总共具有3种不同的处理器核心,分别为位于SoC模块内的Low Power Island E-Core,以及位于运算模块内的P-Core与E-Core。

▲ 3种核心的效能、电力消耗特性都不同,Low Power Island E-Core的效能最低,但相对最为省电。

▲ Intel也为了这样的新架构,更新了Thread Director的设计,能够夹在操作系统的调度器与处理器核心之间进行资源分配优化。

▲ 过去的运作概念为先调用P-Core完成高优先度工作负载,并将低优先度负载传到E-Core,然后定期确认是否需要P-Core介入安置于E-Core的负载。 Meteor Lake则是先尝试以Low Power Island E-Core处理负载,若效能不够才会传送至运算模块,并先由E-Core接手,需要更大的运算效能则会启动P-Core。

▲ 从示意图可以看到,在低负载的环境下,最省电的Low Power Island E-Core可以完成大部分的工作,而P-Core只需介入很短的时间,可以发挥省电的效果。

▲ Meteor Lake世代的内置显示功能采用Xe LPG绘图核心,效能较前代Xe LP提升为2倍。

▲ Meteor Lake世代的内置显示功能结合Iris Xe的省电特性,也加入Arc独立显示芯片的众多新功能。
NPU提供持续AI应用的可能性
随着越来越多AI功能与相关应用程式的出现,电脑不只需要具有足够的AI运算效能,也要衡量长时间使用AI功能所花费的电量。
Meteor Lake在SoC模块加入了能够加速AI运算的NPU,系统也能依负载性质、运算需求,通过处理器或绘图处理器完成AI运算,以取得最佳效能与省电的平衡。
Intel也以Stable Diffusion AI算图为范例,测量使用不同运算单元所花费的时间以及消耗的功率,可以发现绘图处理器具有较高AI运算效能,但同时花费的电力也比较多,NPU的AI运算效能略低一些,但有着更加省电的特性,而2者并用则可取得平衡的效能与电力消耗。

▲ 现在电脑上已经有许多视频会议(音频强化、降噪、背景模糊)、流媒体视频强化等等AI功能应用,未来还有包含Windows Copilot在内等更多AI功能会日益普及,因此计算机的AI运算效能也越来越重要。

▲ 不同类型的运算单元有着各自的特性,适合处理不同的AI运算负载。

▲ NPU能够满足普通个人应用的AI允算需求,且较省点的特性也更适合长时间使用(如持续在视频会议中使用AI降噪与背景模糊)。

▲ 以Stable Diffusion AI算图为例,其流程需要经过Text Encoder、Unet+、Unet-、VAE等4个模块。

▲ 在Unet阶段迭代的次数越多,可以得到的图像质量就越好。 若迭代次数太少,画面将会充满噪声。

▲ 根据Intel提出的数据图表,在20次迭代的AI算图过程中,仅使用处理器需费时43.3秒。 若全部使用绘图处理器,则可缩短至14.5秒,此时功耗为37W。 若将Unet交由NPU运算,则需20.7秒,功耗可以压低至10W。 在优化的情况下,可以将Unet+交给绘图处理器、Unet-交给NPU,这样花费时间仅为11.3秒,消号功率为30W。
Meteor Lake处理器将于2023年12月14日会随新一代笔记本电脑推出,我们也预计会推出相关的测试专题,请读者持续关注我们的报道。