时间:2023-02-04 23:37:52
在NVIDIA GeForce RTX 4090系列GPU首次发布之际,技嘉也发布了高端产品技嘉RTX 4090 GAMING OC魔鹰24G。 以独特的RGB车轮和强化的散热模块为中心。
我们也提前收到了技嘉RTX 4090 GAMING OC魔鹰24G。 在这次测试中,我们将使用顶级的无瓶颈配置来确定这款非官方RTX 4090可以将核心挤压到什么程度。 具体结构如下。
外观设计技嘉RTX 4090 GAMING OC魔鹰24G 24G显卡包装盒较大,正面印有RTX 4090产品型号、4年保修支持等信息。
除了显卡机身外,包装中还包含8针电缆、16针电缆、备用螺丝螺母套件和定制显卡支架。 由于RTX 4090通常比较偏重,因此包装内附带图形支架,横向安装图形板时请注意避免侧板弯曲。
技嘉RTX 4090 GAMING OC魔鹰24G 24G显卡正面为3风扇设计,扇叶四周采用消光亚光铝外框包裹,外框四周经过CNC倒角处理,表面还有装饰纹理。 风扇主体为黑色磨砂材质,每个风扇由9个叶片组成,风扇直径110mm,中央印有技嘉英文标识。
该风扇最大的特色是内置了三组RGB光带,风扇旋转时会产生RGB光轮,外观非常酷炫。 另外,这个RGB等待也可以用技嘉的软件进行定制。
技嘉RTX 4090 GAMING OC魔鹰24G 24G显卡背板为深灰色金属,左侧印有装饰图案和技嘉徽标,右侧有镂空散热孔。
通过散热口,由散热片覆盖的一组散热模块,包含10根复合型热管。
后面板底部的右侧是双BIOS交换机,允许用户在静音模式和OC性能模式之间切换。 为了更好地发挥性能,笔者在以下OC模式下进行了测试。
正侧面为开放式设计,底部包裹着显卡的金属外框和技嘉标识灯,上半部分露出巨大的散热格栅和导热铜管。
I/O金属挡板为深灰色,配备3*DP1.4接口和1*HDMI2.1接口,最高支持8K输出。
技术解析技嘉RTX 4090 GAMING OC魔鹰24G基于目前顶级的AD102核心打造,但核心还没有完全解锁,后续应该还有真正的旗舰RTX 4090Ti,解锁剩下的两个GPC单元。 现在的RTX 4090有16384个CUDA核、512个Tensor核、128个灯光跟踪核、512个纹理单元、176个ROP单元,比上一代的RTX 3090核的规模要大一半以上。
技嘉RTX 4090 GAMING OC魔鹰24G的中心频率为2230-2520MHz,但启用一键频后,频率进一步上升,比上一代上升了一半以上。 显卡内存仍然为384位24gb gddr 6x,但带宽高达1TB/s秒。 TDP默认为450W,与非公开版RTX 3090 Ti大致相同。
技嘉RTX 4090 GAMING OC魔鹰24G的结构也发生了不小的变化,升级到了最新的NVIDIA Ada Lovelace结构。 它基于TSMC NVIDIA定制4N流程构建,性能功耗比最高可达两倍。
反映在具体功能上,新架构带来了很多新功能。 引入双NVENC编码器,增加了对AV1编码的支持,可将视频导出时间最多缩短一半。 通过引入Ada光流加速器,DLSS 3可以预测场景中帧与帧之间的运动变化,实现AI插值帧,在保持图像质量的同时提高帧频。 总之游戏的生产很合适。
DLSS 3详细发布会上最重要的技术升级之一是DLSS 3技术。 DLSS 3是AI驱动的性能倍增器,由全新第四代Tensor Core和GeForce RTX 40系列GPU的全新光流加速器驱动,是NVIDIA备受好评的深度学习超级样本具有独创的光学多帧生成功能,开启了NVIDIA RTX神经网络渲染游戏和APP应用的新时代。
基于NVIDIA Ada Lovelace架构的新型光流加速器不使用传统游戏引擎的运动矢量,而是分析连续两帧的游戏图像,并计算帧之间物体和元素的运动矢量数据。 这将大大减少渲染粒子、反射、阴影和照明等元素时AI的视觉异常。
简而言之,过去的DLSS 2通过渲染低分辨率的图像并在AI中放大为高分辨率,实现了画质和帧数的并存。 新的DLSS 3除了与DLSS 2的兼容性外,还添加了在两个实际帧之间插入AI估计的虚拟帧以实现帧数倍增的插件功能。 与DLSS 2的超分辨率功能相结合,AI最多可以重建八分之七的显示像素,与没有DLSS的情况相比,游戏性能最多提高了4倍。
说是没有根据,我们直接进入测试环节。 最新版的3DMark符合DLSS 3的BenchMark。 将技嘉RTX 4090 GAMING OC魔鹰24G的测试结果和DLSS 2与控制变量进行比较,可以直观地看出差异。 实测DLSS 2模式下,平均帧数为136帧,与不安装DLSS 2的58.62帧相比上升了2倍以上。
但是,打开最新的DLSS 3技术后,技嘉RTX 4090 GAMING OC魔鹰24G显卡的帧数直接平均达到了168帧,比不打开DLSS上升了3倍以上。 关于具体游戏帧数的提高,稍后将统一测试。
像压力测试理论驰骋的非公旗舰,在公版显卡的基础上会进步多少呢? 接下来进行理论测试。 首先要单烤甜甜圈。 烤面包机10分钟后,核心温度稳定在63.9左右,耗电量稳定在446W左右,与公版的表现基本一致。 如果您有i7/i9等等级的处理器,请诚实地使用1000W以上的电源。 至少需要850W的非虚拟电源。
接下来进行3DMark压力测试。 该测试可以检测连续行驶时显卡的性能是否下降。 一般来说,97%以上是合格的显卡。 实测技嘉RTX 4090 GAMING OC魔鹰24G得分为99.5%,几乎没有频率下降,完美通过了测试。
在3DMark TimeSpy DX12测试中,技嘉RTX 4090 GAMING OC魔鹰24G显卡的分数达到35111分,相比之下,GeForce RTX 4090公共版的分数为34725分,RTX 3090为18981分。
在3DMark Fire Strike DX11测试中,技嘉RTX 4090 GAMING OC魔鹰24G显卡的分数达到76434分,相比之下,GeForce RTX 4090公共版的分数为75013分,GeForce RTX 3090为46045分这个分数意味着4K分辨率可以流畅地运行所有游戏,即使只是追赶游戏和VR游戏也能满足高刷新率的需要。
在3DMark Portal Royal光追测试中,技嘉RTX 4090 GAMING OC魔鹰24G获得25518分,高于公版RTX 4090的25080分。 过去,GeForce RTX 3090是一款光线跟踪游戏,可以在2K分辨率下流畅体验,而RTX 4090已经可以在4K分辨率下流畅玩了。
游戏的实测反映在实际游戏中,DLSS 3能带来多大的提高呢? 目前,DLSS 3得到了许多世界领先游戏开发商的支持,超过35个游戏和APP软件宣布将支持该技术。 由于如果符合DLSS 3,则向后兼容DLSS 2,因此开发难度非常低,今后将有越来越多的开发人员加入DLSS阵营。 例如《超级人类》(superpeople ) :抢先体验版将于10月12日13:00发布,与dlss3《生死轮回》 ) loopmancer )对应的更新版将于10月12日发布支持DLSS 3 《逆水寒》拂云庭( justice‘fuyun court’) )新的图形展示将于10月13日发表。 DLS S3《微软模拟飞行》 ( microsoftflightsimulator ):10月17日向Xbox Insider计划成员发布测试版。 dlss3《瘟疫传说:安魂曲》 ) aplaguetale:requiem为了测试支持DLSS 3的技嘉RTX 4090 GAMING OC魔鹰24G,《赛博朋克 2077》,《逆水寒》 此外,还将测试Unity引擎的Demo 《虚幻引擎 5:天琴座》。
首先,我们来测试一下国产武侠游《Enemies》。 还有RTX光线跟踪和DLSS 3选项。 打开4K的最高画质,尝试帧数的表现。 从以下数据可以看出,如果不打开DLSS,几乎无法玩,但如果打开DLSS 3,帧频将提高近5倍。 与相同范围的DLSS 2相比上升了近65%。 另外,大部分项目比公版RTX 4090高出两个课时左右。
在画质方面,选择了BenchMark中的细节,可以看出DLSS关闭和DLSS平衡的画面差很小。 多亏了抗锯齿,打开DLSS后,可以更加养眼。 这就是AI技术的魅力。
左DLSS关闭,右DLSS 3平衡为《逆水寒》的图形杀手,可以在4K的最高画质超光追踪模式下运行附带的BenchMark,得到了以下数据。 技嘉RTX 4090 GAMING OC魔鹰24G可以以原生4K分辨率运行超光交换的《赛博朋克 2077》。 在到达DLSS超性能乐队的前提下,可以实现4K144Hz的舒适游戏,超级任天堂也可以实现8K60帧的舒适游戏。
接下来是使用梦幻5引擎制作的游戏Demo 《赛博朋克 2077》。 由于梦幻5引擎完全支持RTX光线跟踪、DLSS 3和NVIDIA Reflex,随后将有大量基于梦幻5引擎的3A大作上线。 ( 《Lyra》等。
DLSS 3在《黑神话:悟空》上的性能也与预期相符。 打开DLSS 3后,帧速率提高了近1.7倍。 与相同范围的DLSS 2相比上升了近20%。
除了幻想引擎外,Unity引擎还完全支持RTX光线跟踪、DLSS 3和NVIDIA Reflex。 测试最后图像质量爆炸的Demo 《天琴座》。 这个Demo没有那么多量程。 只能调整开关。 打开DLSS 3后,帧数接近3倍,4K渲染变得平滑。
DLSS 3技术完美吗? 当然不是。 DLSS 3的本质是插入帧,插入帧必然具有提高延迟的副作用。 毕竟我们的鼠标是对我们看到的帧的反馈,AI会添加额外的帧。 这种延迟的提高对竞技游戏有很大的影响。 因此,如果打开DLSS 3的帧插入功能,NVIDIA Reflex将强制打开,以尽可能补偿插入帧时的渲染延迟。 从测试数据中可以看出,打开DLSS 3后的延迟比什么都不打开稍低。 如果您想追求绝对的低延迟,可以关闭DLSS,单独打开NVIDIA Reflex,享受极限电竞体验。
我们还测试了一些传统的光栅游戏和DLSS2游戏。 在《Unity:Enemies》中,实测为4K分辨率,最高画质的最高光追着BenchMark执行的话,可以跑到133帧,不打开DLSS就很顺利了。
打开质量文件DLSS后,帧数进一步飙升到174帧,几乎可以满足所有场景的4K144Hz需求。
最后,测试了光追3A大作《古墓丽影:暗影》。 4K最高画质的最高画质只有追不上DLSS才能流畅地玩76帧,而技嘉RTX 4090 GAMING OC魔鹰24G在打开DLSS后帧数几乎翻了一倍。 这个4K游戏体验非常出色。
在优化的《控制》中,即使打开4K的极端画质,平均也能达到131帧。 凭借RTX 4090的狂暴性能,这个赛车游戏似乎8K60帧也能玩。
创意生产成为RTX 4090的水平,不仅仅是游戏,创意生产和深度学习无疑是主要的参与者。 技嘉RTX 4090 GAMING OC魔鹰24G也是NVIDIA Studio支持的GPU。 目前,超过75个创意APP应用程序可以调用AI计算能力,大幅提高工作效率。
在建模渲染类软件中,技嘉RTX 4090 GAMING OC魔鹰24G均可利用CUDA为工作提供硬件加速,目前大多数建模软件已针对NVIDIA的GPU进行了优化例如,作为典型的渲染工具,V-Ray可以利用RTX加速的光线跟踪来实现高性能的最终帧渲染。 具有AI的降噪功能使GPU能够进一步加速交互式渲染。
V-Ray Benchmark开启CUDA加速后,分数达到4445分,高于公共版4200分以上,是笔者测量过的这么多非公共版显卡中最高的。
由于光追性能的提升,技嘉RTX 4090 GAMING OC魔鹰24G在V-Ray GPU RTX上的分数也上升到了6062分,略高于公版卡,创下了我们数据库的历史记录。
视频后期,RTX 40系列GPU增加了对AV1编码的支持。 AV1是新一代的视频编码技术,在占用相同空间的同时提供更快的视频编码和更高质量的流媒体性能。 NVIDIA与许多行业合作伙伴紧密合作,目前主流的多媒体APP应用支持AV1。 目前,国内剪辑专业版支持AV1的视频加速。 OBS直播软件也支持AV1编码的录制。 我想尽快适应AV1编码的直播,大幅节约直播的带宽。
常用的视频彩色剪辑软件Davinci也提供了对AV1编码的支持,作为免费的开源编码,今后将有越来越多的主流软件加入。
最后测试了PugetBench For Davinci。 基于NVIDIA CUDA技术的GPU加速功能可加速视频编辑和帧渲染,使用NVIDIA编码的输出速度最高可达5倍。 技嘉RTX 4090 GAMING OC魔鹰24G的最终分数可达2513分,可流畅切割8K视频,不作弊。
总结技嘉RTX 4090 GAMING OC魔鹰24G作为高端非官方显卡,确实超额了。 不仅性能释放稳定性进一步提升,独有的RGB滚轮和一键OC切换按钮也具有全新的意义。 如果您想体验4K144Hz的游戏迷,显卡的性能优于公共版RTX 4090,是获得非公共卡的理想选择。
技嘉的RTX 4090系列将于10月12日上市,建议零售价为GV-N4090AORUSX W-24GD:16998元GV-N4090AORUS M-24GD:15998元gv-n 4090 gaming oc-24gd