SUPER超能力 NVIDIA GeForce RTX 4070 SUPER显卡首发评测

宝塔服务器面板，一键全能部署及管理，送你10850元礼包，点我领取

在NVIDIA的定义中，GeForce RTX SUPER系列的定位相当于版本进阶。与Ti系列作为不同数字型号之间产品线完善不同，SUPER就是冲着提升对应型号性能与性价比去的。在CES 2024上首次展出的GeForce RTX 4070 SUPER就是其中一个很好的例子，不仅带来更高的性价比，生成式AI创作上也得到进一步创新，战斗力十足。

SUPER超能力 NVIDIA GeForce RTX 4070 SUPER显卡首发评测-编程部落

更确切的说，GeForce RTX 4070 SUPER是当下最有机会进入教科书的产品之一，同样是基于AD104打造，但核心数量已然向GeForce RTX 4070 Ti靠拢，包括7168个CUDA Core，224个第四代Tensor Core和56个第三代RT Core，重点是L2缓存一步拉满至与GeForce RTX 4070 Ti相同的48MB，诚意已然拉满。

SUPER超能力 NVIDIA GeForce RTX 4070 SUPER显卡首发评测-编程部落

重点是GeForce RTX 4070 SUPER的发布定价与GeForce RTX 4070发布之初相同的599美元，这意味着GeForce RTX 4070 SUPER在相同的价格策略下拥有无限接近于GeForce RTX 4070 Ti的表现，特别是当下热门的AI加速，DLSS 3.5游戏，以及生成式AI和NVIDIA Studio特性，在GeForce RTX 4070 SUPER上都应该会着高性价比且强势的表现。

那么事实真的如此？按照惯例，在性能解禁的当下，让我们奉上NVIDIA GeForce RTX 4070 SUPER Founders Edition的首发评测。

SUPER超能力 NVIDIA GeForce RTX 4070 SUPER显卡首发评测-编程部落

AD104-350新范式

AD104拥有广泛且成熟的产品线阵营，GeForce RTX 4070，GeForce RTX 4070 Ti，移动端的GeForce RTX 4080，以及专业领域的RTX 4000 Ada Generation，RTX 4500 Ada Generation都是基于AD104打造的。

SUPER超能力 NVIDIA GeForce RTX 4070 SUPER显卡首发评测-编程部落

GeForce RTX 4070 SUPER所采用的AD104-350-A1已经非常接近于完全体的AD104，同时继承了所有AD102、AD103上的功能特性，包括对DirectX 12 Ultimate很好的支持，芯片面积达到294mm2，晶体管数量358亿个，采用台积电4N NVIDIA定制工艺，并围绕第三代RT Core，第四代Tensor Core以及大量核心所构建起来的芯片。

SUPER超能力 NVIDIA GeForce RTX 4070 SUPER显卡首发评测-编程部落

我们知道Ada Lovelace架构GPU中包含了若干个GPC（Graphics Processing Clusters，图形处理集群），GPC下包含若干个TPC（Texture Processing Clusters，纹理处理簇），再往下就是SM、CUDA、RT Core、Tensor Core等等。每个GPC之间包含的TPC数量相等，当GPU进行定位区分的时候再进行GPC、TPC的物理屏蔽实现。

完整的AD104包含5个GPC，每个GPC包含6组TPC，每组TPC包含2个流式多处理器（Streaming Multiprocessors，SM）。其中每个SM包含4个处理块，每个处理块包含1个64KB寄存器堆，1个L0指令缓存，1个Warp调度器，1个调度单元，4个加载/存储单元，1个特殊功能单元（Special Function Unit，SFU）用于执行超越函数指令（比如正弦、余弦、倒数、平方根等）和图形差值算法指令。

SUPER超能力 NVIDIA GeForce RTX 4070 SUPER显卡首发评测-编程部落

每个SM下的128个CUDA Core随处理块分成4组，每组CUDA由16个专门用于FP32的CUDA Core，16个可以在FP32和INT32之间切换的CUDA Core组成。同时每个SM还包含4个第四代Tensor Core，1个第三代RT Core，成为后续游戏实时光线追踪和DLSS 3.5性能提升的重要前提。

GeForce RTX 4070 SUPER的厉害之处在于，它与GeForce RTX 4070 Ti相当接近，仅在GeForce RTX 4070 Ti的基础上减少2个TPC，即4个SM，最终拥有56组SM，7168个CUDA Core，224个第四代Tensor Core，56个第三代RT Core，224个纹理单元，80个ROP，并搭配192-bit 12GB GDDR6X。

SUPER超能力 NVIDIA GeForce RTX 4070 SUPER显卡首发评测-编程部落

在缓存方面GeForce RTX 4070 SUPER也毫不吝啬，配合56组SM，每组SM搭配128KB L1缓存，因此L1缓存容量达到了7,168KB，L2缓存则没有任何减少，达到49,152KB，也就是48MB。

这相对于GeForce RTX 30系列的GPU而言是给非常庞大的数字，就算是上一代旗舰GeForce RTX 3090的L2缓存也不过48MB，GeForce RTX 3070仅有4MB。这意味着GeForce RTX 4070 SUPER的L2缓存是GeForce RTX 3070的12倍，这将为后续的光线追踪性能发挥、AI加速奠定了很好的基础。

具体对比表格参考如下：

SUPER超能力 NVIDIA GeForce RTX 4070 SUPER显卡首发评测-编程部落

黑化版的FE

与GeForce RTX 4070 Founders Edition一样，GeForce RTX 4070 SUPER Founders Edition也只占2个槽位，长度也与RTX 4070 FE相同，可以轻松放进ATX机箱或者更小的机型中。

SUPER超能力 NVIDIA GeForce RTX 4070 SUPER显卡首发评测-编程部落

在整体的设计元素上，GeForce RTX 4070 SUPER Founders Edition偏向于深黑色，包括固定中框的处理使用了深黑色外观，上手来看实现的更高级了。散热设计则与RTX 4070 FE相似，在GPU贴合底座使用了铜基座设计，并通过4根热管将热量快速扩展到铝制散热片中，同时双轴风扇也提供了更好的气体流动性，能够提供比GeForce RTX 3070 Ti FE更强的20%气体流动提升。

SUPER超能力 NVIDIA GeForce RTX 4070 SUPER显卡首发评测-编程部落