
由于老黄刀法过于精准,RTX 40中高阶型号吸引力有限,加上市面上还是有一些RTX 30系列,价格与性能差距不够大,迫使NVIDIA推出RTX 40 SUPER救市。 该系列首张登场的是GeForce RTX 4070 SUPER显卡,升级至AD104-350绘图核心,CUDA Core增加至7,168个,并具备56个RT Core及224个TensorCore,规格提升但售价却不变,建议售价维持在US$ 599。 此次找来RTX 4070和4070 Ti一同进行对比测试,帮助大家了解性能差异。
首波主打RTX 4070 SUPER
NVIDIA 1/16正式发布全新中端显卡GeForce RTX 4070 SUPER,这是RTX 40 SUPER系列的第一炮,其CUDA Core数目相较RTX 4070提升20%但加量不加价,建议售价保持在US$ 599,紧接下来还会有RTX 4070 TiSUPER与RTX 4080SUPER型号登场。 此系列还首次出现TiSUPER命名,很多人以为SUPER是型号定位在Ti之下,原来NVIDIA官方将SUPER定义作半代更新,RTX 40 SUPER是一个系列不是型号。

有人说老黄的刀法越来越离谱,或许是 AMD 与 Intel 都太弱了令 NVIDIA 无所顾忌,但资料却是骗不了人,对比 RTX 20、RTX 30 与 RTX 40 世代的芯片规格,中高阶型号的芯片规格与 Full Chip 的差异越来越大,举例 RTX 2070 是 TU102 Full Chip 规模的 50%,RTX 3070 是 GA102 Full Chip 规模的 54.76% ,没想到RTX 4070竟然只有AD102 Full Chip规模的31.94%,芯片规模甚至低于旧代RTX 2060(41.67%)及RTX 3060(33.33%)、相当可怜。

过去 NVIDIA 中端新卡可以完全吊打旧代性能级甚至高阶型号,但 RTX 4070 却完全没有这个能力,性能的提升更多来自 DLSS 3 技术的加持,主要原因是上代库存太多,RTX 40 规格也留手让 AIC 有机会清货 。 根据 NVIDIA 官方数据表示,当启用 DLSS 3 的 Frame Gen 后,GeForce RTX 4070 在 2K 分辨率下平均较 GeForce RTX 3080 快 40%,没有 DLSS 3 就只能和 GeForce RTX 3080 打成平手,因此 GeForce RTX 4070 在游戏市场要取得销售成功,很大程度视乎 NVIDIA DLSS 3 技术的普及程度,
矿难后大量二手卡涌现、旧代RTX 30库存减价,加上全球经济低迷,市场明显对RTX 40中高阶型号兴趣缺缺,以往是RTX 20/30的中高阶型号性价比吸引,旗舰级型号不求性价比目标是追求极致性能的金主们,但RTX 40却是中高阶型号性价比不足,显得RTX 4090性价比更为出色,就算售价是US$1,599甚至还被炒高也是大卖, 玩家们并非没钱只是找不到升级的理由。
拨乱反正的 RTX 40 SUPER

对于NVIDIA来说RTX 40 SUPER是一个大升级,但笔者认为用「拨乱反正」来形容会更贴切,NVIDIA将会推出三款全新RTX 40 SUPER型号,包括GeForce RTX 4070 SUPER、GeForce RTX 4070 TISUPER及GeForce RTX 4080 SUPER,其中RTX 4070 TiSUPER与RTX 4080 SUPER 将用来取代旧型号,RTX 4070 Ti 及 RTX 4080 会完全停产,RTX 4080 SUPER 的建议售价会降至 US$ 999,当年 RTX 4080 只有 9,728 个 CUDA + 256-bit 16GB 敢卖 US$ 1,199,真是静茹给的勇气!

GeForce RTX 4070 SUPER 是三张SUPER之中进步最大的一张,CUDA Core相较RTX 4070增加了20%,回到AD102 Full Chip规格的38.89%,建议售价US$ 599会取代RTX 4070原有定位,但GeForce RTX 4070并不会停产,而是向下降至US$ 499,整个布局令NVIDIA RTX 40 产品线回复吸引力,令人期待。
NVIDIA AD104-350 绘图核心
与 RTX 4070 / RTX 4070 Ti 一样,GeForce RTX 4070 SUPER 同样采用 AD104 绘图核心,基于 NVIDIA Ada Lovelace GPU 微架构,性能提升主要来自 FP32 运算单元数目及时脉倍增,更大的 L2 Cache 容量及全新着色器执行排序技,术,升级第 3 代 RT Cores、升级第 4 代 Tensor Cores,与上代比较 Ampere GPU微架构比较,传统光栅图形运算提高了2倍,同时在光线追踪性能上提升近4倍。
采用 TSMC 4N NVIDIA Custom 制程,拥有 358 亿个电晶体、 DieSize 294.5 mm² 与上代 GeForce RTX 3060 的 GA106-300 Die Size 276 mm²相差不大,完整的AD104芯片内置5个GPC单元、30个TPC纹理处理群集及60个SM串流处理器,具备7,680个CUDA Core、60个RT Core及 240 个 Tensor Core。

GeForce RTX 4070 SUPER采用AD104-350绘图核心,规模相较RTX 4070大幅增加,回复至5个GPC单元、增至28个TPC纹理处理群集及56个SM串流处理器,具备7,168个CUDA Core、56个RT Core、224个TensorCore、224个TextureUnit及80个POP。
核心时脉方面,NVIDIA GeForce RTX 4070 SUPER FE预设时脉1,980MHz、Boost时脉为2,475MHz,最高TDP 220W相较RTX 4070高了20W。

内存方面,NVIDIA GeForce RTX 4070与RTX 4070 SUPER一样维持192-bit内存接口,搭配21Gbps GDDR6X内存颗粒,最高内存带宽为504GB/s,但RTX 4070 SUPER的L2 Cache容量由36MB提至48MB,有助提升游戏Workload资料命中率,降低读取延迟并减少GDDR6X 内存带宽使用,内存子系统性能相较RTX 4070有明显改善。

GeForce RTX 4070 SUPER Founder Edition
收到由 NVIDIA 送测的 GeForce RTX 4070 SUPER Founder Edition 显示卡,由于 NVIDIA 把 RTX 40 SUPER 定义为半代更新,因此外观设计上与 RTX 40 有明显差异,和早前坊间流出、已胎死腹中 RTX 3090 Ti 原型一样,整张卡都被「黑化」了,采用阳极化雾黑色金属框架,X 框架亦变成电镀亮黑面, 在光源下会呈现亮面反射效果,坦白说质感更上一层楼。

卡的正面都是雾黑色的散热鳍片,设计RTX 4070完全一样沿用轴向式散热设计,背面RTX 4070字样只有坑纹没有填色、SUPER则是Highlight效果立体凸出,正反两面各有一个10cm轴向式散热风扇,能够将部份废热排向CPU区域及直接排出机壳,令机壳内部温度变得更平均。


NVIDIA GeForce RTX 4070 SUPER Founder Edition 尺寸和RTX 4070 FE一样,Dual Slot设计、244 x 112 x 40 mm、重量为1,014g,大部份A4小型机壳都可以放得下,官方数据指出在闲置下功耗大约11W,播放视频约16W,游戏平均功耗(AGP)约200W,最高TGP为220W,建议使用 650W 或以上电源供应器。


考虑到大部份人安装显卡后,从机壳外看进去只会看到卡背,NVIDIA将设计反转了把背板变成正面,朝上显示「RTX 4070 SUPER」字样,整张卡所有螺丝孔都用磁吸隐藏了,NVIDIA 真的是从使用者的角度、在细节中作出了考量,难怪那么多玩家想买 Founder Edition。

NVIDIA PG141 公板设计
拆开散热器,可以看到 GeForce RTX 4070 SUPER Founder Edition 采用 PG141 公板设计,NVIDIA 刻意将电路板尽量缩小,卡身的蠐空可让轴向式风扇将带气流带到 CPU 区域,采用低阻抗 8 Layers PCB 设计,提供讯号及电力传输最佳化,同时保留了不俗的超频性能。

供电设计方面,GeForce RTX 4070 SUPER Founder Editon增至7相为GPU供电、2相为GDDR6X供电,全面采用OnSemi NCP302150 DrMOS,在单一封装内加入上下桥MOSFET及集成驱动器,单相能提供50A持续电流输出。

NVIDIA AD104-350 绘图核心
GeForce RTX 4070 使用 AD104-350 绘图核心,采用 TSMC 4N 制程、拥有 358 亿个电晶体、Die Size 约为 295 mm²,相较 RTX 4070 的 AD104-250 绘图核心,运算单元数目增加约20%,由4个GPC单元减至5个、共28个TPC纹理处理群集及56个SM串流处理器,具备7,168个CUDA Core、 56 个 RT Core、 224 个 Tensor Core、224 个 Texture Unit 及 80 个 ROP。

时脉方面,NVIDIA GeForce RTX 4070 SUPER Founder Edition 预设基础时脉为1,980MHz、加速时脉2,475MHz,支持GPU Boost 4.0技术,可因应负载自动超频至更高时脉,Power Limit预设为220W。
192-bit 12GB GDDR6X 内存容量
内存方面,GeForce RTX 4070 SUPER与RTX 4070一样支持192bit内存控制器、12GBGDDR6X内存容量,但L2 Cache容量由36MB增至48MB,因此RTX 4070 SUPER的存储器子系统性能会比RTX 4070更高、与RTX 4070 Ti看齐。 虽然RTX 4070 SUPER相较旧代RTX 3070拥有256bit为低,但换上更高速的21GbpsGDDR6X存储器颗粒,速度较RTX 3070的14Gbps GDDR6高出不少,因此整体内存带宽较上代448GB/s更高,RTX 4070 SUPER达至504GB/s。

NVIDIA GeForce RTX 4070 SUPER Founder Edition 采用了 6 颗 Micron D8BZC GDDR6X 颗粒编号,为 MT61K512M32KPA-21:U,每颗单颗容量为 16Gbit (2GB),总容量 12GB 绘图内存容量。
Dual Slot 轴向式散热器设计
NVIDIA GeForce RTX 4070 SUPER Founder Eidtion 沿用轴向式散热设计,散热器RTX 4070 FE完全共享,Dual Slot、双10 cm风扇,由于RTX 4070 Founder仅轻微提升至220W TGP,因此没有佖必要修改设计,沿用铜底部搭配4支Heatpipe导热管便足够。



采用 12VHPWR / 12V2x6 供电接头
其实早在RTX 4070 FoundedrEdition开始,NVIDIA就已经使用了经过改进的12VHPWR/12V-2×6接头,相较旧有12VHPWR感应接脚仅向内偏移量0.45 mm,GeForce RTX 4070 SUPER Founders Edition使用具有向内偏移1.7 mm的感应接脚,更短的感应接脚可以检测连接器是否完全插入。 如果没有完全插入,GPU就会被限制最大功率负载,理论上应该可解决过去发生的接头烧毁问题,然而效果仍有待观察,产品随附一条PCIe 8-Pin x 2转12VHPWR /12V2x6转接线(300W)。

提供了3组Display Port 1.4a +DSC及2组HDMI 2.1影像输出埠口,两种输出接口皆可提供最高4K@240Hz或8K@60Hz 12bit HDR分辨率输出,支持VESA DSC 1.2无损压缩显示功能,单卡能提供最高2个8K@60Hz HDR显示输出,或是组合2组DisplayPort端口口提供单一8K@120Hz HDR输出。

性能测试
此次测试除了有NVIDIA送测GeForce RTX 4070 TiFE显示卡,同时亦找来RTX 3070/RTX 3070 Ti/RTX 3080 /RTX 4070/RTX 4070 Ti作对比测试,以了解这张NVIDIA GeForce RTX 4070 SUPER的效能水平。
时脉方面,NVIDIA GeForce RTX 4070 SUPER FE默认核心基础时脉为1,980MHz、加速时钟2,475MHz,支持GPU Boost 4.0技术最高可达2,860MHz,最高Power Limit默认为220W,可在-55%至+9%作出调整,最高可调至240W。


散热方面,NVIDIA GeForce RTX 4070 SUPER FE在约24°C的室温环境下闲置约30分钟,GPU温度维持在36°C。 接着采用 Furmark 进行3D负载测试,将 GPU 完全负载 30 分钟后,温度会提升至 68°C,相较,GPU 时脉保持在 1,605MHz,TGP 为 220W。

测试平台
- Intel Core i9-12900K CPU
- ASUS ROG Z790 Maximus APEX
- ANACOMDA DDR5-6400 CL36-38-38-68 32GB x 2 @1.35V
- Windows 11 Professional 23H2
- NVIDIA GeForce Driver 546.52 WHQL
3DMark
Fire Strike / Time Spy
3DMark Fire Strike 与 Time Spy 作为最广泛的 DX11 / 12 性能基准测试,性能对比结果当然不可缺少,根据测试显示 GeForce RTX 4070 SUPER 游戏性能相较 RTX 4070 有明显提升,追赶过了对手 RX 7800 XT,甚至有贴近 RTX 4070 Ti 水平。





Port Royal / Speed Way
3DMark Port Royal与Speed Way是针对实时光线追踪所设计的测试工具,支持Microsoft DirectX Raytracing技术,让玩家测试不同显卡对于光线追踪的效能,RTX 4070性能略输RTX 3080,RTX 4070 SUPER则快RTX 3080接近20%,成绩也十分贴近RTX 4070 Ti。


DLSS Feature Test
3DMark NVIDIA DLSS feature test 测试通过利用Tensor Core以深度学习方式对较低的渲染分辨率的画面进行运算,重新输出更高分辨率的画面,令游戏流畅度有所提升,新增全新DLSS 3版本,并支持全新Frame Generation功能,此次测试会采用3840 x 2160分辨率,测试DLSS OFF、DLSS 2及DLSS 3 的性能差异。
GeForce RTX 4070 SUPER在DLSS Feature Test表现与RTX 3090接近,但如果游戏支持DLSS 3的话,它的性能较RTX 3090 Ti高出约30%。

RT Feature Test
采用 3DMark DirectX Raytracing feature test 跑分测试,由于运行于 Microsoft DXR API 的光线追踪模式,结果显示 NVIDIA GeForce RTX 4070 SUPER FE 取得 61.20 FPS。

测试分数对比表格
GPU | FireStrike | FireStrike Extreme | FireStrike Ultra | Time Spy | Time Spy Extreme | Port Royal | Speed Way | RT |
GeForce RTX 3070 | 33214 | 16681 | 8535 | 13687 | 6859 | 8219 | 3501 | 32.18 |
GeForce RTX 3070 Ti | 35012 | 17824 | 9163 | 14342 | 7241 | 8726 | 3680 | 33.28 |
GeForce RTX 3080 | 41872 | 20716 | 10717 | 17159 | 8671 | 11188 | 4589 | 44.16 |
Radeon RX 7700 XT | 42511 | 21006 | 10624 | 17014 | 7843 | 9033 | 3166 | 30.04 |
GeForce RTX 4070 | 45014 | 21844 | 10149 | 17896 | 8591 | 11195 | 4475 | 51.71 |
Radeon RX 7800 XT | 51249 | 24857 | 12884 | 19996 | 9416 | 10736 | 3941 | 33.38 |
GeForce RTX 4070 SUPER | 52890 | 25620 | 12422 | 21352 | 10130 | 13162 | 5254 | 61.2 |
GeForce RTX 4070 Ti | 55214 | 27842 | 13581 | 22829 | 10946 | 14188 | 5435 | 66.69 |
GPU | DLSS Off | DLSS2 | DLSS3 |
GeForce RTX 3070 | 15.61 | 42.62 | |
GeForce RTX 3070 Ti | 16.66 | 44.74 | |
GeForce RTX 3080 | 22.01 | 55.64 | |
GeForce RTX 3080 Ti | 26.37 | 65.51 | |
GeForce RTX 3090 | 28.45 | 69.85 | |
GeForce RTX 3090 Ti | 32.88 | 81.16 | |
GeForce RTX 4070 | 23.09 | 58.57 | 95.09 |
GeForce RTX 4070 SUPER | 27.84 | 74.57 | 123.36 |
GeForce RTX 4070 Ti | 29.75 | 79.14 | 134.88 |
游戏性能测试
以下的游戏测试除非另外标注,全部皆以 2560 x 1440 分辨率全屏幕执行,画质皆设置为最高,若游戏支持光线追踪技术,则同时将光追画质全开。 而DLSS方面则统一使用Performance设置,当中GeForce RTX 40系列会启用DLSS 3中新增的Frame Generation技术。
A Plague Tale : Requiem 瘟疫传说:安魂曲 (RT + DLSS 3)
GPU | 2K DLSS Off | 2K DLSS On |
GeForce RTX 3070 | 41 | 59 |
GeForce RTX 3070 Ti | 43 | 63 |
GeForce RTX 3080 | 53 | 85 |
GeForce RTX 4070 | 54 | 112 |
GeForce RTX 4070 SUPER | 71 | 139 |
GeForce RTX 4070 Ti | 76 | 149 |
Control (RT + DLSS2)
GPU | 2K DLSS Off | 2K DLSS On |
GeForce RTX 3070 | 56 | 100 |
GeForce RTX 3070 Ti | 61 | 109 |
GeForce RTX 3080 | 80 | 137 |
GeForce RTX 4070 | 75 | 131 |
GeForce RTX 4070 SUPER | 83 | 149 |
GeForce RTX 4070 Ti | 89 | 158 |
CyberPunk 2077 RT Ultra (RT+ DLSS 3)
GPU | 2K DLSS Off | 2K DLSS On |
GeForce RTX 3070 | 29 | 54 |
GeForce RTX 3070 Ti | 33 | 59 |
GeForce RTX 3080 | 41 | 70 |
GeForce RTX 4070 | 43 | 104 |
GeForce RTX 4070 SUPER | 58 | 131 |
GeForce RTX 4070 Ti | 61 | 136 |
F1 22 (RT + DLSS 3)
GPU | 2K DLSS Off | 2K DLSS On |
GeForce RTX 3070 | 63 | 96 |
GeForce RTX 3070 Ti | 67 | 104 |
GeForce RTX 3080 | 89 | 120 |
GeForce RTX 4070 | 86 | 161 |
GeForce RTX 4070 SUPER | 95 | 184 |
GeForce RTX 4070 Ti | 101 | 196 |
Forza Horizon 5 (DLSS 3)
GPU | 2K DLSS Off | 2K DLSS On |
GeForce RTX 3070 | 78 | 101 |
GeForce RTX 3070 Ti | 82 | 105 |
GeForce RTX 3080 | 117 | 151 |
GeForce RTX 4070 | 119 | 173 |
GeForce RTX 4070 SUPER | 141 | 189 |
GeForce RTX 4070 Ti | 148 | 201 |
Tom Clancy’s Rainbow Six Siege 虹彩六号:围攻行动
GPU | 10:02 | 2K | 4K |
GeForce RTX 3070 | 420 | 327 | 188 |
GeForce RTX 3070 Ti | 431 | 342 | 196 |
GeForce RTX 3080 | 473 | 390 | 242 |
GeForce RTX 4070 | 493 | 387 | 228 |
GeForce RTX 4070 SUPER | 571 | 482 | 279 |
GeForce RTX 4070 Ti | 585 | 513 | 312 |
Microsoft Flight Simulator 微软模拟飞行 (DLSS 3)
GPU | 2K DLSS Off | 2K DLSS On |
GeForce RTX 3070 | 46 | 66 |
GeForce RTX 3070 Ti | 48 | 71 |
GeForce RTX 3080 | 63 | 97 |
GeForce RTX 4070 | 68 | 139 |
GeForce RTX 4070 SUPER | 72 | 151 |
GeForce RTX 4070 Ti | 76 | 163 |
Watch Dogs Legion (RT + DLSS)
GPU | 2K DLSS Off | 2K DLSS On |
GeForce RTX 3070 | 64 | 96 |
GeForce RTX 3070 Ti | 68 | 101 |
GeForce RTX 3080 | 76 | 127 |
GeForce RTX 4070 | 73 | 121 |
GeForce RTX 4070 SUPER | 93 | 132 |
GeForce RTX 4070 Ti | 101 | 139 |
总结
如果说RTX 4070 SUPER是大升级,倒不如说这才是RTX 4070应该有的样貌,核心运算单元增加了约20%,性能获得了非常明显的提升,终于回到昔日70新卡能以下犯上吊打80旧卡的局面,甚至有能力追贴RTX 3090,表现令人满意。
从价钱来说,RTX 4070 SUPER 就是拿 RTX 4070 价钱 (US$ 599) 买到接近 RTX 4070 Ti 的性能 (US$ 799),先前买了 RTX 4070 / RTX 4070 Ti 应该会牙痒痒很想骂脏话吧,只能说早买早享受、晚买享折扣啰!