时间:2022-12-04 14:05:01
RTX 3090 Ti改进

序言
在RTX 3090上市526天后,NVIDIA正式发布了消费级顶级旗舰产品—— NVIDIA geforce RTX 3090 ti 24gb。 黄先生的这个操作其实很多人不理解。 就算家里的RTX 3090坐上旗舰产品的头把交椅,苏母RX 6950也很难来。 你在赶什么? 完整的GA102核心让他在业界炙手可热。 钱不是能赚更多吗?
而且,在这一代RTX 30系列的显卡中,中高端显卡的SKU数量真的很多,虽然放弃了RTX 20系列的Super后缀,但拾取了Ti的后缀,同时也出现了以图形存储容量为后缀的显卡算上RTX 3090 Ti,基于GA102核心的产品达到5个以上,在风中确实很混乱。
而且,从RTX 30系列的整个生命周期来看,此时的重点应该是中端和入门级显卡,以增加GA106/107 (或GA117 )。 核心生产能力正确。 尽管如此,NVIDIA GEFORCE RTX 3090 Ti 24GB确实来了,这是既定的事实。
真的是GA102核心产能太多了吗? 赶紧涨价弄干净吗? 还是其他不能解释的理由? 这件事与我们无关,让我们介意一下吧。 RTX 3090 Ti的发布经常会满足游戏用户还是内容创作者?
有什么样的提高?
1 )完整的GA102核心
作为顶级旗舰产品,此次RTX 3090 Ti终于使用了全规格的GA102内核,极大地满足了众多强迫症高端玩家。 到目前为止,GA102核心一直用于行业RTX A6000显卡。
点击原图放大
从规格表来看,完整的GA102核RTX 3090 Ti具有更高的规格,与RTX 3090相比,补充了两组SM单元,10752个CUDA流处理器,84个RT Cores,336个Tensors Cores 从理论上看,RTX 3090 Ti发挥了更好的性能,但核心的微小差距确实很难与RTX 3090拉开明显的差距。 让我们看看这次的RTX 3090 Ti有哪些方向性增强。
2 )提高核心频率,提高功耗
点击原图放大
RTX 3090 Ti核心的基频达到1560MHz,提升频率达到1860MHz(Fe公共版)。 不过,由于RTX 3090 Ti FE的公开版没有几张是真的,所以NVIDIA直接向AIC们开放并着手构建,大部分RTX 3090 Ti非公开显卡Boost的频率达到了1890MHz,实际游戏时的核心频率当然更高。
核心频率更高的缺点是功耗更高,RTX 3090的默认TDP为350W,建议电源需求为750W。 另一方面,RTX 3090 Ti的默认TDP达到450W,大多数非公开版MAX TDP达到480W,电源需求呈指数级增长。 NVIDIA官方提出采用850W的电源,笔者建议采用1000W或1250W的电源。 这还将提高与未来RTX 40系列显卡的兼容性。
3 )高密度和频率的显在粒子
此次,RTX 3090 Ti在内存方面也进行了升级,首次采用了512Mb*32Bit、21Gbps规格的GDDR6X粒子(带ECC ),粒子FBGA编号为D8BZC。 虽然Micron没有官方公布这一详细标准,但感兴趣的用户可以参考以下编号为D8BGX的GDDR6X粒子标准,同样为21Gbps,但粒子密度为256 MB * 32 bit【m t61 k 256 m 32 je-21】。
我知道显著性频率的提高为什么会有好处,但是512Mb*32Bit这个名词,很多网友都不明白意思。 这里简单地说,目前RTX3090采用的是256Mb*32Bit、19Gbps标准的GDDR6X粒子,编号为D8BWW; 换言之,实际上,一个显存的容量为1GB,为了构成RTX 3090的24GB,需要在正反PCB的两面排列24个显存的粒子,所以大多数购买RTX 3090显卡的用户
另一方面,512Mb*32Bit规格的GDDR6X粒子D8BZC,换算成1个2GB的图形存储器容量,可以在正面用共计12个图形存储器实现。 这样,PCB的设计变得简单,图形模块的发热量控制也很出色。 实测表明,显存监测点的温度确实相当低。
4 )视频存储器带有ECC功能
RTX 3090 Ti是消费类市场上唯一配备纠错码( ECC )的显卡,可解决显卡在长时间高负载APP应用中出现的显示错误问题,并提高生产APP应用的可靠性。
默认情况下,RTX 3090 Ti未打开ECC功能。 需要在NVIDIA控制面板中找到相应的ECC打开选项。 同时打开ECC功能会导致显卡性能相应下降。 ECC功能一般只存在于行业图形卡中。 例如,同样是GA102核的RTX A6000。
5:12提起vhp wr辅助电源连接器
12VHPWR辅助电源接口是网络上最热门的话题之一。 这将是未来PCIe 5.0显卡的电源连接器。 根据目前已知的资料,这款12VHPWR连接器最多可提供600W的电源。 RTX 3090 Ti非可移植显卡率先配置了这款12VHPWR辅助电源接口,是否意味着玩家们从此可以更换新电源?
图形接口侧采用了12VHPWR,但是必须连接12VHPWR电缆才能使用吧? 虽然在前面的12VHPWR中还没有设定小4Pin的定义,但是我们可以直接使用Micro-Fit 12Pin接口提供辅助电力。
30系列FE显卡配置均为双*8Pin辅助电源转换电缆,而RTX 3090 Ti为确保辅助电源达到450W,AIC制造商配备了Micro-Fit 12Pin To 3*8Pin转换电缆这样,您就不必担心转换电缆问题,只需检查电源是否有三个8Pin电源接头,以及电源是否足够耗电。
赠送的这条线的规格很好呢。 一般的电源线材采用18AWG标准,但该线条除了NVIDIA信仰标志外,还采用16AWG标准的线材。 线材更粗,电流导通值更大。
感兴趣的用户可以考虑一下Micro-Fit 12Pin To 3*8Pin转换线的线定义。
维护升级NVIDIA NVLink
与行业卡RTX A6000和消费型RTX 3090类似,RTX 3090 Ti具有NVIDIA NVLink 3.0高速GPU互连接口。 这不像以前知道的SLI接口那么简单。 该NVLink一般仅用于行业显卡,该技术通过连接两块NVIDIA显卡实现了显存和性能的扩展。
笔者参考一下NVIDIA提供的NVIDIA NVLink技术的动态图。 基于GA102核心的特性,RTX 3090 Ti采用第三代NVIDIA NVLink,两块RTX 3090 Ti采用NVLINK桥,最高传输速度可达112 GB/s,扩展后内存最高可达48GB
不过,由于这次RTX 3090 Ti的大多数非公开版显卡基本上都采用了3插槽设计,所以要用2块RTX 3090 Ti配置NVLink,必须确认自己的主板是否有足够的位置和散热空间。 上面的两张RTX 3090 Ti背靠背,散热空间明显不够。 4槽空间是你最好的选择。
总结:从规格上看,RTX 3090 Ti类似于高频、GDDR6X显存和高功率的RTX A6000显卡。 但是,RTX 3090 Ti是面向消费者的产品,取消了许多行业功能。
尽管如此,RTX 3090 Ti仍然是目前消费市场上最强大的存在,其标准为完整的GA102内核,主频、显存标准、性能绝对强悍,当然功耗也是令人恐惧的450W。
RTX 3090 Ti的未来
在业界,Ampere架构已经不是什么新鲜事了,距离发布已经过了相对较长的时间。 特别是NVIDIA在最近的GTC 2022上推出了Hopper体系结构。 那个很有魅力。 但是,不可否认的是,Ampere体系结构是当今消费者市场上最好的体系结构。 全新的SM多单元流处理器、高性能的单精度浮点( FP32 )运算速度和出色的性能功耗比,彰显提高图形和模拟工作流的性能。
此外,第二代RT Core和第三代Tensor Core的加入,可大幅提升图形卡的光线追踪、描影或降噪功能,大幅提升工作负载处理速度。 同时,AI运算能力也更强,可以在不修改源代码的情况下实现更高速的AI运算和数据科学模型的训练。
实际上,RTX 3090 Ti的发布是在最近的GTC 2022上,NVIDIA不仅发布了一系列高规格硬件,还发布了NVIDIA OMNIVERSE、NVIDIA DRIVE Map、NVIDIA Maxine、NVIDIA max 行业用户和开发商们引领方向的技术也不少大多数技术一般消费者并不太了解,但这些技术和应用最终也会反馈给我们的用户。 RTX 3090 Ti作为功能最强大的消费显卡,使用24GB大显卡,可用于未来的软件和游戏。
例如DLSS技术,现在有150多个游戏支持NVIDIA DLSS,包括最近发表的一系列游戏大作、幽灵线、东京、消失的光2人与仁之战、影武者3等在内,数量有所增加。 当然,还有很多RTX 30系列的图形特征技术,例如NVIDIA DLAA、NVIDIA Reflex和RTXGI。 如果没有强大的RTX 30系列显卡,这些真的玩不完。 影驰RTX 3090 Ti星曜OC外观分解
影驰RTX 3090 Ti星期OC
回到我们的主题,这次我们没有拿到RTX 3090 Ti FE的公开版。 收到的是影驰GeForce RTX 3090 Ti星OC【以下简称:“RTX 3090 Ti星OC”】。
家族式设计,所有的星期天显卡都有同样的外包装设计,相同的系列外观设计。 当然,不同的显卡等级有不同的工作材料。 特别是这部电影凯RTX 3090 Ti星OC的材料是星系列中最激烈的,一个也没有。
族设计如何识别取决于外包装的产品型号。 NVIDIA统一的产品型号标识: NVIDIA GEFORCE RTX 3090 Ti。
背部说明了该显卡的功能特征,包括星卓 Plus散热器、幻惑星灯效果、PCB设计、魔盘软件、3年保修(个人保修支持)等。
两个实用附件:图形支撑条和micro-fit 12针to3* 8针转换电缆。
外观上下,RTX 3090 Ti星曜OC采用影驰RTX 30系列中经典的星曜透明水晶外壳元素设计,搭配白色导风罩和透明水晶外壳,取下水晶外壳即可定制图案。 这个方块RTX 3090 Ti星期天OC真的很大,满是2个10cm和1个9cm粉丝的武力值,又强又重,很可怕。
比较RTX 3080 Ti FE显卡,它在圆圈里很大。 其他显卡在RTX 3090 Ti星期天OC显卡面前是弟弟。
当然,不仅大,而且真的很重。 RTX 3090 Ti星期天OC裸卡的重量达到了2.1公斤。 RTX 3080 Ti FE也是1.37KG公斤。 要说谁不喜欢,就可以做高级的瓷砖。
显卡背板为白色星期天背板,采用高强度铝合金材质,整个显卡除了与PCB散热不为白色外,还能真正安装在白色机身上。 白色后板为各位玩家提供更好的DIY空间。 还有很多涂鸦等贴纸,很有个性。
显卡尾部采用多孔散热设计,降低散热器风压回弹效应,增强散热性能。
NVLink接口
12VHPWR辅助电源连接器
可使用附带的Micro-Fit 12Pin To 3*8Pin转换电缆供电
输出接口由3个DP 1.4a和1个HDMI2.1,都支持1个接口实现8k视频输出,同时也可以利用4个接口构成4连屏使用。
影驰RTX 3090 Ti星星OC分解
凯RTX 3090 Ti星期天OC显卡PCB采用非公开的设计,基于公开版PCB方案进行了修改。 该PCB计划与一般的GA102核心计划不同,它供电更强大,而且工作完善,给人一种行业显卡PCB计划的感觉。
肩部式PCB的设计,让显卡看起来更巨大,铺满零件的PCB真的让人瞠目结舌; 同时,PCB背面没有明显的内存位置,尾部进行了冲裁加工,唯一的不足是供电位置和SP-CAP空焊位置较多。 预计该PCB方案中将出现更高频率的RTX 3090 Ti,届时这些空焊位置都将得到补充。
RTX 3090 Ti核心号: GA102-350-A1,生产周期为21年46周,周围为12个GDDR6X显著颗粒。
供电模块采用前后两个供电模块的设计,共提供20 4相超级数字电源,整个PCB采用SMD材料,焊接工艺成熟,电气性能更强,稳定性也更好。
许多SP-CAP在供电前后端用作过滤,在整个卡上找不到固态容量,而不是普通的固态容量。
每相配备高效低温的DrMos,型号为MP86957,由MPS美国芯源系统生产,最大持续输出电流为70A。 20 4相*70A的设计,你觉得这个显卡的电源模块有多猛?
主控PWM控制芯片同样来自MPS美国芯源系统,型号为最新的MP2891,由单个控制20相存储器供电,相信规格比常见的MP2888A强大得多。 另一方面,PCB前后共计2个us5650Q是4相图形存储器功率控制器。
12VHPWR接口,接口做工明显优于普通6Pin/8Pin接口,稳定; 显卡末尾是显卡的电压监测点,玩家和工程师们可以快速对显卡进行电压监测,方便超频和维护。
散热器是星卓 Plus散热模块,相当大且重。 整个显卡的大部分重量来自散热器。 星 Plus散热采用6~2根热管两段式散热片式大型3风扇散热器。
GPU底座是镀镍的铜底座,可快速吸收和传递GPU的热量。 此外,GPU、显存和电源模块等许多不同部分都采用集成式机箱盖散热设计,并配备高导热和高粘性散热垫来辅助供电。
从这个角度,可以清晰地看到以星卓 Plus散热为主体的2根8mm 4根、6mm粗的热管贯穿2个不同的散热片,剩下的2根为u形设计。
散热器主体的做工还不错。 在散热片上固定Fin的两根固定条,增强散热器整体的刚性。
另外,热管采用回流方式与散热片固定,散热性能得到良好的保证。
虽然我们已经将其分解,但值得注意的是显卡标配了3个插槽挡板。 如果挡板位置受机箱插槽限制,或者使用水冷配置双插槽显卡的用户可以自行更换赠送的双插槽挡板。 测试平台介绍
测试平台介绍
测试平台选择目前消费类市场最好的一批硬件配置测试仪,对影驰GeForce RTX 3090 Ti星曜OC显卡进行了测试。 I9-12900K与rog maximus z690至尊主板奇奇Trident Z5 RGB幻锋DDR5龙神II 360集成水冷散热器相结合,在满足游戏玩家需求的同时,主板具有丰富的可扩展性,适合内容创作者和迷你机型
显示屏方面,由于手头没有8K显示屏和电视,此次测试中游戏部分利用DSR技术对8K分辨率进行缩放测试,同时通过8K视频的解码、渲染、导出来测试显卡
电源方面,使用的是鑫谷最近推出的80PLUS金牌产品GM1250W的全模块电源。 850W电源产品可以满足RTX 3090 Ti非公共显卡的供电需求,但在测试中不会出现意见事故,因此选择1250W大功率电源更安全; GM1250W具有micro-fit 12针的本机模块线,但为了顺利进行测试,我们优先使用了官方提供的micro-fit 12针to3* 8针的转换线。 理论博弈性能
3DMARK理论性能比较
从3DMARK理论的性能来看,NVIDIA真是刀法如神,一个GA102核心,分为五个产品,同时每个产品之前有5~7%的性能差距。 与RTX 3090显卡相比,RTX 3090 Ti通过添加两对SM和更高的频率设置提供了更好的性能。 与RTX 3080显卡相比,性能提高24%的前提是不考虑价格和功耗。
值得注意的是,在刚才的比较表中不能称为NVIDIA DLSS功能测试。 在DLSS2 Performance 8K项目中,12GB内存容量的RTX 3080 Ti直接存储在此测试项目中,性能自然不具代表性。 另一方面,为了在8K分辨率下打开DLSS进行游戏,没有RTX 3090 Ti或RTX 3090级别的显卡也被证明是不行的。
游戏性能比较:
游戏测试
测试前,其实笔者对RTX 3090 Ti的性能表现其实并不看好。 毕竟,同一个GA102核的RTX 3090显卡的性能变得相当好,即使在全规格的GA102中添加了高频性能的提高也是有限的。 不过,让笔者没有想到的是,450W TDP显卡还是不容小觑的。 简单的2K游戏性能已经领先RTX 3080 Ti约10%; 随着分辨率达到4K,引脚宽度上升到约15%的性能,这样的性能差真的很令人满意。
当然,如果我们观察一下游戏性能的综合比例,就会发现这五种显卡的性能差异与理论性能差异基本一致。 我怀疑黄先生是拿着尺子剪了岩心,还是能定位这么准确。
光线跟踪游戏测试
同样,还进行了2K和4K分辨率的4款游戏的光电跟踪性能测试,测试时默认开启了DLSS平衡模式。 事实上,5块显卡在追光游戏上的表现与普通游戏上的表现一致,RTX 3090 Ti作为老大哥依然处于领先地位。
详细情况在《古墓丽影:暗影》和《看门狗军团》这两种游戏中打开光线跟踪和DLSS,游戏的帧数也相当平滑,请以4K分辨率直接打开光线跟踪享受游戏。
通过进一步的8K游戏测试,RTX 3090 Ti可以说可以玩8K游戏,但是如果游戏画质太高,帧数可能会太低,所以建议大家在玩8K游戏时注意画质设置。 可以适当地牺牲画质,实现更高的游戏流畅度。
PS )全境2、超高画质、DSR 8K分辨率游戏时的爆炸内存生产力测试
创作者的能力比较
在创作者的性能测试中,RTX 3090 Ti和RTX 3090显卡的性能差距约为1%,虽然在某些APP应用中确实略有领先,但这几秒之差在时间成本允许的情况下,实际上能提供更好的性能功耗比视频
需要注意的是,RTX 3090 Ti是目前唯一具有ECC技术的消费显卡,在渲染大型工程文件时,建议打开ECC技术以获得更稳定的渲染表示
PS :打开ECC功能会导致显卡性能下降
由于RTX 3090 Ti在综合创作者的性能表现上不可同日而语,笔者试着直接引出pugetbenchdavincibenchmarkextended测试的各个项目进行比较。 在扩展测试中,与默认测试相比,添加了8K视频测试,可以更清楚地看到性能差异。
如果是主力视频制作的p主的话,我相信RTX 3090 Ti会给你带来更快的渲染速度。 如果预算有限,建议实际购买RTX 3080显卡。 它可以满足大多数视频和创作APP的需要。 电力和温度测试
电力消耗温度的比较
功耗测试真正让RTX 3090 Ti揭示了450W TDP的本质,单纯的CPD功耗达到了326.4W,比RTX 3080 FE卡整体的功耗还高。 详细来看,Micro-Fit 12Pin接口供电还是很强大的,直接提供409.7W供电,根据PCIe也是36.7W的影驰这款RTX 3090 Ti星曜OC显卡的最大480W TDP值来看,频率提升的空间还很大
另外,不得不说RTX 3090 Ti星期天OC显卡的散热性能真的很好。 室内常温为25度,法马克全芯温度也为70.6度,此时显卡频率可维持在1440MHz,风扇转速为52%,噪音不明显。
当然,最厉害的是内存温度,512Mb*32Bit规格的GDDR6X内存粒子比较好。 1面12个即可满足24GB的内存容量,无需担心过热。 对于RTX 3090 Ti星OC显卡Furmark,显示屏的显示温度为80度,而双面显示器的RTX 3090显卡的显示温度达到90度,降低了10度。 24GB显存如何使用光?
24GB的显存怎么用?
在测试RTX 3090 Ti显卡时,笔者利用HWINFO软件记录了测试时显著的内存占有量。 可以看到,在大多数APP游戏和游戏中,只有少量游戏的容量超过10GB,只有部分游戏(如《全境封锁2》和《PugetBench DaVinci Test》 )的容量超过10GB。 当然,8K游戏显存占比几乎翻了一番,游戏中显存占比均超过10GB,其中在《全境封锁2》中更是火爆。
当然,除了游戏之外,实际的专业应用场景才是RTX 3090 Ti这24GB显存容量的用处。 接下来,我们用视频、计算和建模三个小例子来“挤压”这个RTX 3090 Ti的24GB显存。
《DaVinci Resolve》 8K实时渲染
通常,DaVinci很少调用视频存储器,无论是播放时还是转码时,RTX 3090 Ti在测试时占用10GB左右。
您可以使用NVIDIA提供的8K原始视频测试项目文件设置一系列运动效果,并将其调用到24GB的显存中。
同样的8K原始视频播放,显存使用量高达24GB,这太夸张了。 当然,如果此时更换其他较低容量版本的显卡,则会直接报告错误,并停止正在进行的操作。 这样设置后,RTX 3090 Ti有优势吗? 直接将此项目文件用于视频导出,并比较导出时间。
可见相同的运动效果设置,在效果差的一般情况下,RTX 3090 Ti、RTX 3090和RTX 3080具有相同的导出速度,相同的显存占有量均为10GB; 但在强化运动效果设置后,RTX 3080 Ti明显无法加载运动效果,只有RTX 3090 Ti和RTX 3090分别取得了1:34、1:39的导出成绩。 侧面说明: 24GB的大容量在某些大型、非常复杂的视频渲染工程中起着重要作用。
机器学习运算
在机器学习的实际应用中,采用开源的CNN图像数据分类模型进行了基准测试。 它使用了市场上广泛使用的机器学习库——TensorFlow,构建CUDA组件环境后,TensorFlow可以利用GPU进行加速运算,大容量存储器可以为图形卡支持更多的计算资源在这里,将显存的空馀容量设定为“全部”,以2组batches、32个样本为单位奔跑识别10万组图像数据时,24GB的显存在运算中直接填满,最终1秒钟接近3万张
BLENDER场景渲染
另外一方面,在受欢迎3D建模软件blender中,为了在内置的Cycles渲染器进行交互渲染的过程中利用实时RTX光线计算和OpitX AI去噪技术的实时加载,对图形存储器的要求对于重要用户来说,即使图形内存容量为12GB,多工作流也可能会出现图形内存不足,导致渲染错误或无法渲染。 另一方面,使用RTX 3090 Ti的大容量显存,可以实时查看多个复杂的工作流,还可以进行最后一帧的场景渲染。 在这种情况下,显存消耗也至少为21GB。 总结:迟来的新皇
总结:迟来的新皇
性能真好啊
RTX 3090 Ti采用450W TDP设计,性能强大,这一切都可以通过一系列测试得到验证。 基本上,它以绝对优势领先于同一个GA102核心的其他四个显卡。 完整的GA102核心很好地满足了骨灰级玩家的需求,满是血才是真爱!
当然,450W TDP给我们带来了供电的烦恼。 能买到RTX 3090 Ti显卡的人当然少不了高输出电源。 但是,12VHPWR辅助电源连接器必须使用转换电缆或定制兼容的micro-fit 12针模块电缆。 这是相当大的投资。
幸运的是,非公共版显卡的供电和散热具有相当大的力量。 例如,用于测试的视频RTX 3090 Ti星OC具有20 4相强大的供电设计和高效的多热管三风扇散热器,可确保RTX 3090 Ti长时间高频率运行。
谁来买?
我不是说了NVIDIA GEFORCE RTX 3090 Ti不值得买吗? 这不好说。 爱个不停。 这个RTX 3090 Ti是相当大的值。 完整的GA102、高核心频率、24GB大容量高规格显卡、更强大的电源供应,以及如此强大性能的显卡,让您随心所欲。 如果不行的话,再买一个用NVLink连接就可以了。 RTX A6000可以以不到一半的价格买到。 强迫症玩家不死才怪。
恨当然是恨。 RTX 3090 Ti肯定有绝对的性能力,但性价比不高。 虽然比RTX 3090/3080 Ti高很多,但性能提高是有限的。 特别是性能功耗比也稍差,电源不给力还得更换电源。 这投入成本太多了。
因此,购买RTX 3090 Ti真的很给力。 确定自己的需求是否需要使用这种最高级别的显卡是有道理的。
怎么购买?
想购买的用户,可以放松心情。 我们知道NVIDIA为AIC提供了大量的RTX 3090 Ti全规格GA102内核和GDDR6X显存粒子。 只要确保钱包够厚,就可以购买RTX 3090 Ti显卡。