10 月 15 日消息,今天,七彩虹宣布最新推出的 RTX 4090 Vulcan 显卡拿下四项世界超频跑分纪录第一。
如上图所示,RTX 4090 Vulcan 在液氮散热环境下,创造了 3DMark Time Spy Extreme 显卡分、3DMark Time Spy 显卡分、3DMark Time Spy Extreme 总分以及 Port Royal 总分的世界纪录。
IT之家了解到,RTX 4090 Vulcan 现已上市,售价 14999 元。
据介绍,全新 GeForce RTX 40 系列的 iGame Vulcan 拥有更为凌厉的造型,独特的锖铁色金属外骨骼更显凶悍,为其强劲的性能做出警告。作为后赛博时代的高端硬件,系列经典的锐利三角元素也将完美传承。
全新的 LCD 屏幕在 RTX 40 系列中出现了崭新的形态,蜕变为“智屏”,相比起上代的可翻转式的固定设计,屏幕采用可拆卸式磁吸设计。智屏支持横装与竖装两种安插方式。
七彩虹战斧RTX 4090显卡首测:开启4K光追的新时代!
自Turing图灵架构伊始(即GeForce RTX20系列),NVIDIA 显卡正式进入RTX实时光线追踪及DLSS深度学习超级采样技术时代。回顾当初,质疑声音不少,光追效果一般,DLSS折损画质,支持的游戏屈指可数。在接下来的日子里,NVIDIA潜心修炼内功,Ampere安培架构(GeForce RTX 30系列)的强悍表现让许多的质疑者成为了支持者。
今年以世界上第一位女程序员Ada Lovelace为名的新架构正式亮相,属于GeForce RTX 40系列显卡的时代正式到来。先进的TSMC 4N NVIDIA定制工艺,全新的全景光线追踪以及新一代的DLSS 3技术……在游戏画质与流畅度再一次拥有质的飞跃。
GeForce RTX 40系列显卡首发三个型号:GeForce RTX 4090/GeForce RTX 4080 (16GB版本)/GeForce RTX 4080(12GB版本)。今天,我们拿到七彩虹战斧GeForce RTX 4090豪华版显卡,借助它来带您详细了解新一代显卡的具体性能表现。
NVIDIA Ada Lovelace架构分析:
1、内部的架构:GPC规模猛增
七彩虹战斧GeForce RTX 4090豪华版显卡采用的是AD102-300核心,这并不是完整版。完整形态的AD102核心包含12个图形处理集群(GPC),从Ampere的7个猛增至12个,光凭这一点,就能带来很强的性能提升。此外,还包含72个纹理处理簇(TPC),144个流式多处理器(SM),搭配12个32bit的显存接口(共计384bit)。
上图为SM单元,AD102中每个SM单元包含4个处理块,每个处理块包含1个64KB寄存器堆,1个L0指令缓存,1个调度单元,4个加载/存储单元,1个特殊功能单元(Special Function Unit,SFU)。还包含16个专门用于FP32的CUDA Core,16个可以在FP32和INT32之间切换的CUDA Core,因此共计32个CUDA。当然少不了1个第三代RT Core,4个第四代Tensor Core,4个纹理单元(Texture Units),256KB寄存器堆,以及可根据需求进行配置的128KB L1共享缓存。
2、第三代RT Core:带来全景光线追踪
七彩虹战斧GeForce RTX 4090豪华版显卡从第二代RT Core升级到第三代,从两代架构对比来看,第三代RT Core架构增加了微映射透明度(Opacity Micro-Map,OMM)引擎和微网格置换(Displaced Micro-Mesh,DMM)引擎。除此之外,还对L2缓存上进行了升级,配置98304KB的L2缓存,比Ampere 提高16倍。这些都让光线追踪性能获得巨大收益。
3、着色器执行重排序:提高光追效率
在接近真实场景的实时光线追踪中,多样化的环境变化意味着本应重要的原始处理工作量会越来越少,反而像反色、间接照明、半透明效果的二次折射等计算会占据大量的着色器资源,让着色器忙碌在无意义的二次反射、漫反射等场景中,导致效率降低。如果不加以解决,GPU以有序性常规执行方式会非常低效。
为此,七彩虹战斧GeForce RTX 4090豪华版显卡引入了【着色器执行重排序(Shader Execution Reordering,SER)】功能,能够让着色器更智能的安排每一项工作的重要程度,从而能大大提高渲染的效率。SER可以为光线追踪带来最高可达3倍的性能提升,整体游戏性能提升可高达25%。
4、第四代Tensor Core:AI计算效能倍增
七彩虹战斧GeForce RTX 4090豪华版显卡从第三代Tensor Core升级到第四代,新一代Tensor Core的FP16、BF16、TF32、INT8、INT4性能相对前一代提升两倍以上,实现AI计算性能大幅度提升。
5、全新DLSS 3 : 真正的帧率收割机
DLSS 3绝对是七彩虹战斧GeForce RTX 4090豪华版显卡最亮眼的技术。DLSS 3包括了全新的帧生成技术、DLSS 2超分辨率技术和NVIDIA Reflex技术。
DLSS本质通过深度学习算法将单帧的低分辨率提升成高分辨率,让游戏帧率获得大幅度提升。但这还不够,在DLSS 3上,利用光流加速器与DLSS相结合的办法,构建一个更为立体的分析方式:之前的帧与当下帧,由光流加速器生成光流场、游戏运动矢量和深度等数据,DLSS将新渲染的帧与之前的帧进行比较,并考虑运动矢量与光流场信息,了解场景变化,从而生成一个全新高质量帧。简单的理解,AI生成帧不需要占用太多GPU资源,是由AI计算出来的。
DLSS 3在光流加速器的搭配下实现了脱离GPU渲染重建高分辨率方法,让GPU渲染的部分大幅减少,以两帧为例,DLSS 3会承担起第一帧的3/4的工作和第二帧的所有工作,实际上GPU只需要完成其中的1/8的渲染即可,从而节省了大量的计算资源。
DLSS 3也并非传统意义上的单一技术,事实上它是一个软件与硬件协同的集合。在软件层面,DLSS 3使用AI超分辨率生成,AI生成帧,加入对NVIDIA Reflex支持。在硬件层面,DLSS 3需要在第四代Tensor Core上运行,并利用改进的光流加速器帮助DLSS 3像素级的测量场景,最后云端的NVIDIA超级计算机则夜以继日的寻找提升高质量图像的途径。上述六种软硬件结合,才最终实现了DLSS 3的高质量表现。
目前已经超过35款游戏和应用支持DLSS 3,包括寒霜引擎、Unity 、虚幻引擎4 &5 等游戏开发引擎,《赛博朋克2077》、《逆水寒》、《微软模拟飞行》、《瘟疫传说:安魂曲》等热门游戏大作,未来支持DLSS 3的游戏会越来越多。
RTX 4090显卡的规格:
GeForce RTX4090显卡用上TSMC 4N NVIDIA定制工艺,由台积电5N改进而来。AD102核心面积没有增加的前提下,晶体管数目爆涨,从283亿个提升至763亿个。流处理器方面,GeForce RTX 4090达到16384个,相比GeForce RTX 3090 Ti提升34%。同时第四代Tensor Core和第三代RT Core的数量,相比GeForce RTX 3090 Ti都有大幅度增涨。
GeForce RTX4090显卡核心Boost频率达到2520MHz,比GeForce RTX 3090 Ti的1860MHz高得多,后续如果经AIC厂商调教,轻松超过2.52G。显存来自美光定制GDDR6X,24GB满配,显存带宽超1TB/s峰值。
功耗方面,GeForce RTX4090与GeForce RTX 3090 Ti保持一致,都是450W,这出乎很多人的意料,这也从侧面证明Ada Lovelace架构GPU能耗比的巨大飞跃。
至于价格上,GeForce RTX 4090官方建议零售价12999元,比GeForce RTX 3090 Ti便宜2000。当然12999只是公版指导价,非公版显卡价格要贵一些。
战斧GeForce RTX 4090豪华版的规格:
▲七彩虹战斧GeForce RTX 4090豪华版的GPU-Z信息
七彩虹战斧GeForce RTX 4090豪华版设定的Boost频率为2565MHz,比公版的2520MHz,高了45MHz。功耗设定450W,峰值功耗则在480W,功耗也保持一致,理论上性能跟公版一致。如果搭配旗舰型号的CPU,推荐1000W或以上电源比较稳妥。
七彩虹战斧GeForce RTX 4090豪华版显卡介绍:
产品的外包装,印有一把战斧,右下角标识着产品型号GEFORCE RTX 4090。
整体采用黑与红的撞色设计,金属外观,经磨砂工艺处理,非常有质感。钻石状三角元素,起到点缀作用,也彰显了力量感。
区别于旧款战斧,战斧豪华版全新的造型,方正硬朗,肌肉感十足。很酷,也很强!
由于性能增强,供电与散热也要强化,GeForce RTX 4090的体积又增加了。七彩虹战斧GeForce RTX 4090豪华版尺寸为长817.5000000000001px,宽度377.5px,厚度为167.75px,跟以前20系列显卡相比,几乎大了一圈。
妥妥要占据三个PCIe插槽,对机箱兼容性要求可不低。
全金属背板设计,尾部同样做了镂空处理,方便空气的对流,利于通风散热。
七彩虹战斧GeForce RTX 4090豪华版显卡采用了利斧散热器,正面设计三个98mm的大风扇,实现更强的风压以及更大的进风量。
战斧散热器内置2根6mm和4根8mm的镀镍热管,大面积液冷均热板和散热鳍片,保证高负载场景下,快速驱散热量,保证显卡性能稳定发挥。
供电接口为新型的16Pin(12+4Pin)PCIe5.0供电接口,12pin为供电口,另外4Pin负责信号传输,单口可以承载600W功耗。
使用ATX3.0标准的电源,只需一根供电线即可,看着比过去3个8Pin口简洁多了。
如果您使用的不是新款ATX3.0电源,没有16Pin供电口,随显卡附赠一条转接线,3个8Pin转16Pin,可与旧款电源兼容。
侧边的隐藏式LOGO RGB信仰灯,通过新款iGame Center软件,可以进行灯光设置。
不同的灯光效果,让机箱内部更多彩。
接口上,提供一个HDMI2.1和三个DP1.4a。其中HDMI2.1接口可支持8K@60Hz视频输出。
顺便提一款有意思的“玩物”,随七彩虹战斧GeForce RTX 4090豪华版显卡一起送测的,还有这款拼奇积木联名的iGame奇趣主机。
这款奇趣主机是由主机、主板、内存、显卡几大部分积木组装而成,喜欢DIY硬件的小伙伴们,用它也能体验一回装机乐趣,或者新手朋友,先自己尝试尝试DIY电脑过程。如果大家对这款积木感兴趣,可以微信小程序搜索“COLORFUL官方旗舰店”购买编辑同款。
新款iGame Center软件:
七彩虹显卡专用的集成控制软件iGame Center同步更新到了最新版本,整个软件进行深度优化,不仅界面更清晰明了,功能也更加丰富。
搭载七彩虹RGB硬件,在这里可以对全局灯光进行控制。有不同灯效模式,也可以对灯光的速度,亮度,方向等进行调节。
除了灯效同步,还能单独对显卡的灯光模式进行调节,可玩性还是挺高的。
灯光控制的另外一栏则是超频控制,在这里可以调整显卡的核心频率,显存频率,电压,温度及功耗等。
在监控日志里,可以控制LCD屏幕的各种显示功能,不过战斧系列并没有配备LCD屏幕。
新款iGame Center软件加入玩家俱乐部,以增加玩家的粘性。
测试平台介绍:
测试平台如上,CPU使用i9-12900K,搭配一块Z690 D5主板,内存则是DDR5-6000高频,16GBx2双通道。
测试GeForce RTX 4090这样的性能猛兽,怎么能少得了一款旗舰级的4K电竞显示器呢?我们测试所使用的是:爱攻PD32M保时捷联名电竞显示器,堪称“旗舰中的旗舰”。
它搭载一块31.5英寸Mini LED背光技术面板,内置3456颗Mini LED背光灯珠,多达1152个独立控光分区;高达1600尼特的峰值亮度,通过DisplayHDR 1400专业认证;97%DCI-P3、99% AdobeRGB、100% sRGB的广色域覆盖,10.7亿色显示,搭配DeltaE<2的专业色准,色彩表现在电竞显示器中属于“天花板”级别,能够更好展出游戏中的光影效果。电竞属性方面,PD32M支持144Hz高刷新率和1ms疾速灰阶响应时间,可提供畅快淋漓的游戏体验。4K超高清分辨率,特效全开,才能不负显卡。
七彩虹战斧GeForce RTX 4090豪华版显卡的峰值功耗在480W,而i9-12900K的满载功耗接近260W,光显卡+CPU这两项功耗值740W,考虑到40%的冗余功耗,以此保证一些高负载情况下正常运行,我们使用了航嘉新款MVP P1200 ATX3.0电源,额定功率1200W,一步到位保证平台的稳定供电。
基准性能测试:
以3DMark作为显卡基准测试软件,测试项目有Fire Strike、Fire Strike Extreme、Fire Strike Ultra(对应DX11,1080P、2K及4K分辨率)。Time Spy 和Time Spy Extreme(对应DX12 2K和4K分辨率)。还有Port Royal光线追踪性能。
▲七彩虹战斧GeForce RTX 4090豪华版显卡 Time Spy得分36384分。
▲七彩虹战斧GeForce RTX 4090豪华版显卡 Time Spy Extreme得分19292分。
▲七彩虹战斧GeForce RTX 4090豪华版显卡Fire Strike得分77359分。
▲七彩虹战斧GeForce RTX 4090豪华版显卡Fire Strike Extreme得分45734分。
▲七彩虹战斧GeForce RTX 4090豪华版显卡Fire Strike Ultra得分24866分。
▲七彩虹战斧GeForce RTX 4090豪华版显卡 Port Royal光追得分25669分。
基准测试方面,战斧GeForce RTX 4090 豪华版对比RTX 3090 Ti,这性能提升幅度可以用“夸张”来形容。Time Spy性能提升68%;Time Spy Extreme性能提升73%;Fire Strike性能提升55%;Fire Strike Extreme性能提升76%;Fire Strike Ultra性能提升82%;而光追性能提升更是达到78%。怎么样?这新卡的性能提升幅度,各位看客老爷们还满意不?
4K光栅化游戏性能测试:
传统光栅化游戏测试分辨率为3840x2160,考虑显卡的定位,不测试2K及1080P分辨率。画质设定均为最高,关闭垂直同步功能,支持DLSS均处于关闭状态,全部测试的游戏由自带Benchmark输出结果。
我们一共测试6款热门的3A大作,在4K分辨率,最高画质设定,不牺牲画质特效的前提下,也不需要DLSS辅助,战斧 GeForce RTX 4090 豪华版显卡均可以非常流畅运行。
像渣优化的《赛博朋克2077》跑出76帧,而显卡杀手《荒野大镖客2》跑出121帧,《古墓丽影 暗影》更是跑出夸张的184帧,要知道这可是4K分辨率啊。毫无夸张地说,4K最高画质在战斧 GeForce RTX 4090 豪华版面前只能算是“入门”的挑战。
对比GeForce RTX 3090 Ti,《赛博朋克2077》、《荒野大镖客2》、《极限竞速:地平线5》、《刺客信条 奥德赛》、《古墓丽影 暗影》、《孤岛惊魂5》分别提升46%、46%、73%、54%、73%、30%,提升幅度还是相当惊人的。
DLSS 3 游戏实测:
我们先来看看战斧 GeForce RTX 4090 豪华版在DLSS 3开启与关闭状态下,游戏画质变化如何?
《瘟疫传说:安魂曲》DLSS 3 OFF VS DLSS 3 NO
《逆水寒》DLSS 3 OFF VS DLSS 3 NO
《Unity引擎》DLSS 3 OFF VS DLSS 3 NO
我们截取部分支持DLSS 3游戏的实景画面,像《瘟疫传说:安魂曲》、《逆水寒》的游戏画面通过对比可以看到,在开启DLSS 3之后,画质并没有折损,反而是得到强化,尤其是光影效果更加真实。
开启DLSS 3之后,游戏帧数的提升相当惊人,瘟疫传说:安魂曲》、《赛博朋克2077》的帧率分别翻了2.35倍、3.27倍。就算特别吃CPU资源的《微软模拟飞行》也翻了2.15倍。
在画质没有损失反而加强的前提下,带来如此巨大的游戏性能提升,对于游戏玩家来说,无疑是幸福的存在。未来有DLSS 3加持下,4K+光追+最高特效,将会顺畅无比。
DLSS 3游戏近期更新:
●《超级人类》(SUPER PEOPLE):抢先体验版将于10月12日13:00发布,支持DLSS 3
●《生死轮回》(Loopmancer)将于10月12日发布更新版,支持DLSS 3
●《逆水寒》“拂云庭“(Justice ‘Fuyun Court’): 全新图形展示将于10月13日发布,支持DLSS 3
●《微软模拟飞行》(Microsoft Flight Simulator):将于10月17日为Xbox Insider计划成员推出测试版,支持DLSS 3
●《瘟疫传说:安魂曲》(A Plague Tale: Requiem):将于10月18日发布,支持DLSS 3
实时光线追踪游戏测试:
RTX光线追踪测试,同为4K分辨率,画质设定均为最高,光追效果设定均为最高档位,不开启DLSS选项,接受最为苛刻的硬件考验。
光追游戏测试部分,就算不开DLSS的情况下,除了《赛博朋克2077》,其他四款游戏,战斧 GeForce RTX 4090 豪华版已经可以超过60帧流畅运行。
像光追效果十分明显的《Control》可以在140帧的超高帧率下,畅玩4K光追。《光明记忆:无限》、《古墓丽影 暗影》均突破100帧。战斧 GeForce RTX 4090 豪华版显卡真正带我们走进4K光追的时代。而对比GeForce RTX 3090 Ti,光追游戏性能提升幅度在70%左右。
创作应用测试:
由于测试时间关系,还有考虑到GeForce RTX 4090刚推出,专业创作应用软件需要去做优化,我们就只测了Blender这款热门的专业三维渲染软件,使用固定的Benchmark进行测试,测试了monster/junkshop/classroom三个场景。
战斧 GeForce RTX 4090 豪华版在monster/junkshop/classroom场景得分为6331、2806、2911分,平均4050分。对比之下,领先GeForce RTX 3090 Ti 幅度达到80%以上,可见在创作领域,战斧 GeForceRTX 4090 豪华版也比GeForce RTX 3090Ti强出一截,帮助创作者节省大量的渲染时间。
功耗与温度测试:
在温度与功耗测试中,使用Furmark软件,对显卡进行10分钟的满载测试,用GPU-Z软件来监控显卡的温度与功耗表现。
在满载10分钟之后,这时GPU的核心温度仅70℃,要知道这可是一张旗舰级显卡,性能怪兽。有这样的温度表现,绝对处于优秀的水平。
功耗的话,平均接近450W,基本跟GeForce RTX 3090 Ti是持平的。不过,峰值功耗更猛一些。如果搭配新款旗舰CPU,比如i9-12900K、i9-13900K,建议至少1000W电源起步吧,850W压力还是挺大的。
总结:
经历了GeForce RTX 30系列显卡性能大跃进,很多人都担心GeForce RTX 40系列显卡无法超越前辈。当测完战斧 GeForce RTX 4090 豪华版后,我们担心显然是多余的。基于Ada Lovelace GPU架构设计AD102-300核心的RTX 4090再次实现性能飞跃,真正将游戏带入4K光追时代。曾几何时,4K游戏遥不可及,到如今的4K+光追最高特效流畅玩耍。或许摆在2-3年前,很多人想都不敢想吧。
这次NVIDIA还带来DLSS 3,这是一项真正的黑技术。在开启DLSS 3之后,宛如打开性能释放的密钥,开启与关闭,性能提升非常非常显著,真正意义上实现从性能的堆砌到质的改变。未来会有越来越多的游戏加入DLSS 3,N卡玩家最幸福的存在。
战斧 GeForce RTX 4090 豪华版的450W功耗,虽说整体功耗不低,但发热控制得不错。并且这个功耗也是频率大幅度提升的结果,由此带来强大的性能提升,我认为是值得的。
最后给大家送上产品的发售信息,七彩虹战斧GeForce RTX 4090豪华版、iGame GeForce RTX 4090 Vulcan OC、iGame GeForce RTX 4090 Neptune OC三款显卡将于10月12日晚9点整在京东、天猫、抖音、快手等电商平台及全国经销零售渠道开售,售价在12999-14999元之间,感兴趣的小伙伴可以关注。
平趟4K剑指8K游戏 七彩虹iGame GeForce RTX 4080 Vulcan首发评测
目前硬件市场首发已经不再“藏一手”,各家都把“90”系列旗舰级产品直接首发推出,不久前全新的NVIDIA RTX 4090系列显卡一经发布就坐稳了高性能PC独立显卡市场头把交椅的位置。
对于广大的用户来讲,从性价比的角度来看的话,80系列显卡作为旗舰的水准,不论是性能、价格、功耗表现等,显然都更适合绝大部分的发烧游戏玩家。
本次我们拿到了七彩虹的iGame GeForce RTX 4080 16GB Vulcan OC显卡,作为国内显卡的一哥,近两年七彩虹的产品力表现提升明显,并且也是目前为数不多支持个人送修的厂商,目前七彩虹的产品已经遍布整机、配件、笔记本电脑等全产品线,为玩家提供全方位的产品和技术支持。
再回到显卡方面,七彩虹的iGame GeForce RTX 4080 16GB Vulcan OC被玩家亲切滴称为“火神”!是定位非公版旗舰型游戏显卡,在做工、用料、创新科技方面,这款显卡是显而易见的旗舰代表。下面我们就来为大家详细介绍一下这款显卡。
外观:后·赛博时代风格 金属外骨骼机甲风 酷炫十足
外观方面,七彩虹的iGame GeForce RTX 4080 16GB Vulcan OC采用了全新的后赛博风格设计,整个正面看上去机甲风明显,全新的设计的风扇搭配上金属外骨骼,给人视觉上强烈“后赛博风”效果,一眼看上去就非常的硬核、科技风拉满。
配件方面,作为旗舰代表,iGame GeForce RTX 4080 16GB Vulcan OC提供了显卡支杆,防止压弯主板,毕竟这一代的显卡散热器重量较大,另外还有一块LCD的磁吸智能显示屏,并且可以自定义显示效果,并且还有可更换的磁吸式RBG灯光组建,让玩家打造独一份的酷炫桌面或者主机,可玩性非常高。
这款屏幕支持三种自定义布局方式,在显卡的顶部预留了磁吸接口,只需要将LCD显示屏轻轻靠近就能自动吸附,安装非常简便,当然在将显示屏摆放在桌面上的时候,如果觉得显卡顶部触点有点突兀,还可以安装上RGB灯光组件。
显示效果方面,这块屏幕的分辨率从上代的480*128升级到了800*216,分辨率提升了近1倍,成像效果更加清晰,视觉冲击力更强,并且搭配磁吸式底座,让这块屏幕可以摆放在桌面上,打造更加酷炫的桌面风格。
另外搭配全新的iGame Center驱动软件,让用户能够在软件内时刻监控整套平台的运行状态,并且还能够控制灯光效果,让整套平台都能都进行灯光联动,让玩家打造个性化整机RGB灯光效果,同时在软件内我们还能够自定义设置LCD屏幕的内容展示效果,在iGame Center内置了几种动画模式,用户可以选择轮播,或者自己设置动画效果,可玩性非常高,同时还能调整屏幕亮度和轮播速度等操作。
显卡背部我们可以看到,PCB板和iGame RTX 4090火神保持一致,V型的设计,并没有铺满整个散热器,显卡尾部有大面的镂空,这样的好处就是散热效果很好,热交换效率更高,同时这一代的GPU芯片也开始采用了裸露设计。
接口方面,iGame GeForce RTX 4080 16GB Vulcan OC提供了3个DP1.4a接口和1个HDMI 2.1接口,并且后部还有七彩虹iGame标志性的一键超频按键,在默认频率下,这款显卡的频率为2205MHz-2505MHz,开启一键超频的情况下,显卡的频率可以提升到2640MHz,提升幅度为5.7%,理论性能方面大概也会提升6%左右。所以这也就是为什么大家在选择显卡的时候都会尽量选择非公版旗舰,因为用料更好、性能更强。
散热方面,七彩虹向来都是不惜工本的,iGame GeForce RTX 4080 16GB Vulcan OC使用了9根8mm热管,并且采用了回流焊工艺设计,让整块显卡的散热效果拔群,经过我们实际测试,基本上满载的时候,GPU的温度基本上没有超过60摄氏度,非常给力。
供电方面,依旧是我们熟悉的16pin供电接口,旁边是RGB光效控制接口,官方理论TGP为350W左右,以上为显卡部分的介绍,下面就来和大家看看全新的RTX 4080在技术方面的升级吧。
升级Ada LoveLace架构 4nm领先工艺制程
近几年NVIDIA显卡架构命名上,都会选择知名科学家的名字来进行命名,本次的Ada LoveLace是何方神圣?Ada LoveLace热爱数学,是19世纪的数学家,被科学界尊称为世界上首位女程序员,建立了循环和子程序的概念。
再回到显卡核心上,RTX 4080的核心代号为AD103-300-A1,配置了76个SM流式处理器,共计9728个CUDA单元,使用了16GB的GDDR6X内存,显存位宽为256Bit,显存速度为22.4Gbps,显存带宽达到716.8GB/S,相对RTX 4090的16384个CUDA核心数量以及24GB的显存,差距还是非常明显,所以不出意外的话,后续大概率将会推出的RTX 4080 Ti显卡。
接下来我们看GPC架构图,这一代的GPC每组依然由6组TPC、一个独立光栅引擎和两个ROP分组组成,其中每组TPC里面又包含2组SM单元,这样的架构和上代Ampere保持一致。
在更进一步的SM单元架构图上,我们可以看到,每个SM单元内有4个主要计算模块,一个RT光追核心、以及128KB的一级缓存。
而每个计算模块内包含一个Warp调度器、一个分配单元、16个FP32浮点CUDA和16个FP32/INT32单精度浮点和证书混合CUDA核心,一个Tensor Core核心和RT Core,其中Tensor Core升级到目前第四代,带来更强悍的数据吞吐量,让显卡的AI性能大幅提升,并且也为广大的玩家带来了全新的DLSS 3.0技术。
第四代Tensor Core核心&DLSS 3.0技术
全新的RTX 40系列显卡升级了第四代Tensor Core核心,并且加入了Hopper FP8 Transformer Engine引擎,张量处理性能相对上代提升5倍之多,并且随着全新的光流加速器,让我们能够享受全新的DLSS 3.0技术。
其中光流加速器所具备的光学多帧生成技术也是Ada架构的RTX 40系显卡所独有的,通过AI强力计算,让游戏画面变得更加流畅丝滑。
DLSS 3.0技术相对于DLSS 2.0提升明显,如果DLSS 2.0是通过计算出当前画面的部分像素进行,那么DLSS 3.0则是通过强大的算力同时将下一帧的画面也同时计算出来,这样的性能提升放在实际的游戏当中是非常明显的,根据官方给出的说法,全新的DLSS 3.0能够带来2-4倍的游戏性能提升,让我们在4K游戏上获得更为丝滑的游戏体验,另外这项技术让8K光追游戏不再成为奢望,逐步变为现实。
当然,很多玩家所关心的延迟的问题,在DLSS 3.0上也是基本不需要担心的,毕竟强大的AI算法和硬件支持,让我们在实际游戏当中基本感受不到明显的延迟。
后续的DLSS 3.0性能测试当中,我们也会为大家详细讲解这项技术在实际的游戏性能和测试当中带来的革命性变化以及优秀的实际体验。
第三代RT光追核心 彻底改变游戏体验
自NVIDIA光线追踪技术问世以来,起初人们觉得这项技术觉得非常鸡肋,毕竟当时没有几款游戏支持这项技术,并且游戏过程中体验并不明显,但是经过3代RT核心的技术迭代,全新的第三代RT核心带来的光追游戏体验已经发生了质变。
全新的第三代RT核心在性能方面相对于上代提升2.8倍,达到191TFLOPS,其内部包括了用于加速边界体积层次(BVH)数据结构遍历的加速单元,去执行射线三角形和光线边界框相交测试计算,这也是目前公认的最!高效的光线追踪计算方式,另外本次还加入了还引入了称为“微映射透明度引擎”(OMM)和“微网格置换引擎”(DMM),可以优化光线追踪渲染效率,使得不规则的图形和半透明的对象都能更快更好地被渲染出来。
支持AV1编码和Broadcast AI直播
AV1编码作为面向未来的编码方式,能够有效节省网络带宽,相对于传统的编码效率方面提升非常多,对于内容创作和流媒体时代,有着非常大的帮助,全新的RTX 40系列显卡同样支持AV1解码器,对于内容创作者和直播用户来讲,能够大大提升效率。
另外对于直播用户来讲,RT 40系列显卡还提供了全新的AI直播技术,能够实现AI智能抠图,提升直播效果,同时更好的解码性能,在相同的码率下视频质量更高,既能保证更加清晰直播效果,同时还能够实现更加流畅的游戏效果。
2倍的视频转码性能提升 提升内容创作效率
对于视频内容创作者来讲,全新的RTX 40系列显卡内置了第八代双编码器,所以在视频导出方面的性能提升也提升巨大,就拿我们常见的DaVinci后期软件来讲,RTX 4080的视频导出速度要比RTX 3080 Ti提升超过接近2倍,并且对于内容创作者来讲,效率即生产力,更强悍的性能带来更加高效率的后期性能表现。
另外,对于有4K、8K视频剪辑、渲染,以及3D建模、游戏开发等应用方面有需求的用户来讲,NVIDIA全新的RTX 40系列显卡都能提供极为优秀的性能支持。
通过第三代RT光追核心、DLSS 3.0技术以及NVIDIA Omniverse,能够轻松在4K/FPS下流畅进行创作,所以对于内容创作者来讲,全新的RTX 40系列显卡能够加速创意,带来数倍的性能提升,对于玩家来讲的话,RTX 40系列显卡能够提供更加出色的光追效果、流畅的4K/8K游戏画面,带给游戏玩家更为优秀游戏体验,让游戏、内容创作、AI加速进入一个全新的时代。
即将上线:RTX Remix
对于游戏开发者和Mod制作者来讲,全新的RTX Remix是NVIDIA专门为这部分用户开发的智能创作应用,通过这款应用能够让数十年前的老游戏也能实现现代化的视觉效果,并且还能够在这些游戏中增加光线追踪功能,让老游戏重换新生,并且配合上NVIDIA Studio驱动和NVIDIA Omniverse的免费MOD平台,还能够创作自己专属的MOD游戏,带给创作者全新的游戏体验。
RTX Remix这项技术预计在今年内正式上市,内容创作小伙伴和MOD爱好者千万不要错过哦!
实际性能测试:测试平台介绍
下面我们进行实际的性能测试,在正式测试之前我们来看看本次测试平台,处理器方面,我们选择了Intel酷睿13代i9-13900K处理器,主板为七彩虹CVN Z790 FROZEN D5主板,内存则为Kingston FURY 野兽Beast RGB DDR5 5600MT/s 16g*2,显示器为ThinkVision 4K显示器,系统为Windows 11 22H2。
3DMARK基准性能测试:
3DMARK作为测试显卡性能的专用软件,并且在新版的3DMARK更新中,已经支持了全新的DLSS 3.0的测试,本次测试我们将iGame GeForce RTX 4080 16GB Vulcan OC开启一键超频,显卡的频率将会提升至2640MHz,并且我们将会选取几款定位接近的显卡进行对比,在这项测试中,我们记录的均为显卡的单独分数,以下为最终测试结果。
FireStrike作为测试DX11游戏性能的项目,在这个项目中我们可以看到最终的测试结果,在2K分辨率下,战地V这款游戏能够实现200+的游戏帧数,性能表现强悍。
经过我们的实际测试可以看到,在FireStrike测试项目中,iGame GeForce RTX 4080 16GB Vulcan OC领先RTX 3090 Ti约26.6%,领先3080 Ti约58.2%,性能提升非常明显。与此同时,在Firestrike Extreme测试项目中,iGame GeForce RTX 4080 16GB Vulcan OC领先RTX 3090 Ti约16.5%,领先RTX 3080 Ti约21.7%,性能同样表现出色,而在FireStrike Ultra测试项目中,我们可以看到,iGame GeForce RTX 4080 16GB Vulcan OC领先RX 6950XT约20.8%,明显落后于RTX 3080 Ti、RTX 3090 Ti和RTX 4090。
在DX 12测试项目中我们可以看到,iGame GeForce RTX 4080 16GB Vulcan OC的TimeSpy性能领先RTX 3090 Ti约32.4%,领先RTX 3080 Ti约62%,而在TimeSpy Extreme测试项目中,iGame GeForce RTX 4080 16GB Vulcan OC领先RTX 3090 Ti约26%,领先RTX 3080 Ti约60.3%,性能提升非常大。
Royal Port光线追踪基准性能测试环节中,我们可以看到,iGame GeForce RTX 4080 16GB Vulcan OC的得分为18075,领先RTX 3080 Ti约36.9%,领先RX 6950XT约68.4%,能够轻松应对市面上绝大部分光追游戏,带给玩家媲美电影级别的光影效果。
DLSS 3.0专项性能测试:
目前,3DMARK已经更新了全新的DLSS 3.0测试,在这项测试中,在4K分辨率下不开启DLSS 3.0的情况下,帧数为39.38fps,在开启DLSS 3.0之后,帧数暴涨到了134.08fps,游戏帧数提升了2.4倍,表现抢眼。
实际游戏性能测试:
由于显卡的性能定位旗舰级,所以基本上能够平趟所有的1080P游戏,在这里我们就不进行1080P分辨率的游戏性能测试了,直接从2K分辨率起跳,游戏画质全部选取到顶的游戏画质,有Benchmark的选择Benchmark进行测试,没有的话,则选择记录帧数的软件进行帧数记录,最终的得到以下成绩。
在2K游戏性能测试方面,我们可以看到目前市面上绝大部分的主流游戏都能轻松胜任,并且除了赛博朋克2077这款游戏之外,基本上其他几款游戏都能突破100帧,在2K游戏性能领先方面领先RTX 3090 Ti,大幅领先RTX 3080 Ti。
4K游戏方面,在关闭DLSS并且开启光追的时候之后,iGame GeForce RTX 4080 16GB Vulcan OC基本上都能够平趟各种4K游戏大作,并且在绝地求生这款游戏中,FPS能够达到172帧,配合上144Hz的刷新率以及G-Sync技术,能够实现丝滑流畅的游戏体验,将4K游戏带入到一个新的高度。
DLSS 3.0游戏评测:
目前已经有超过35款游戏和应用支持全新的DLSS 3.0技术,在DLSS 3.0技术的加持下,游戏能够有2-4倍的性能提升,让我们享受更加丝滑流畅的4K游戏,在本项目的测试中,我们选择4K分辨率进行测试,挑选目前市面上几款支持DLSS 3.0技术的游戏进行测试。
赛博朋克2077游戏中,不开启DLSS的情况下,游戏的帧数平均为40左右,在开启DLSS 3.0之后,游戏的帧数攀升到130-145之间,性能提升了3倍还多,整个游戏画面更加丝滑流畅,并且游戏画面的质量没有缩水,游戏体验非常棒。
毁灭全人类2:重新探索是首批支持DLSS 3.0的游戏之一,在这款游戏中我们扮演邪恶的外星人在地球上“为所欲为”的类FPS游戏,游戏风格集恶搞、幽默等元素,是一款可玩性比较高的游戏,上架Steam之后好评如潮。
在这款游戏中,经过我们的实际测试,在开启DLSS 3.0之后,游戏的平均帧数从91提升到了203fps,性能提升了2.23倍,提升非常明显。
幻塔是一款角色扮演类游戏,也是目前市面上首批支持DLSS 3.0技术的游戏,这款游戏采用了超唯美的画风设计,精美的战斗风格和多样化的角色,让玩家沉浸其中,在这款游戏中,在开启DLSS 3.0之后,游戏帧数从65提升到了120帧左右,性能提升约2倍,提升非常明显。
光明记忆:无线是一款国产第!一人称射击类游戏,支持光线追踪和全新的DLSS 3.0技术,测试过程中我们打开光线追踪,分别打开和关闭DLSS,并记录帧数,最终在4K分辨率下,开启DLSS 3.0之后,游戏帧数从68提升到了154,提升了2.26倍,性能提升明显。
并且在这类FPS游戏中,高帧数带来的丝滑顺畅感受非常明显,配合上144Hz高刷新率屏幕,能够实现非常出色的游戏体验,对于喜爱FPS类游戏的玩家来讲,提升非常大,所以这类玩家应该尽可能选择支持DLSS 3.0技术的RTX 40系列显卡。
暗影火炬城是一款国产暗黑类的横版格斗闯关游戏,游戏贴图非常精美,画风复古,非常适合那些喜欢横版游戏的玩家,并且这款游戏同样支持全新的DLSS 3.0技术,在4K分辨率下,不开启DLSS 3.0的情况下,游戏帧数为68,在开启DLSS 3.0之后,游戏帧数提升到了141,提升非常明显,达到2倍以上。
在游戏中,游戏的音效出色,打击感优秀,同时每一关的风格明显,可玩性十足,尤其是开启DLSS 3.0之后,游戏的流畅度更进一步得到了提升,整体游戏体验更加丝滑流畅。
生死轮回同样是一款横版的闯关类游戏,同时支持DLSS 3.0技术,经过我们的实际测试,在开启DLSS 3.0之后,游戏的帧数提升了2.1倍,性能提升幅度巨大。
iGame GeForce RTX 4080 16GB Vulcan OC定位旗舰游戏显卡,能够在4K分辨率下轻松畅玩各种类型的游戏,加上DLSS 3.0技术的加持,能够实现2倍游戏性能的提升,使得我们的游戏体验有了夸时代的改变。
截止到2022年11月15日,已有超10款DLSS 3游戏发布,除了我们上面测试的几款外,还有:《瘟疫传说:安魂曲》(A Plague Tale: Requiem)《F1 ® 22》《逆水寒》(Justice)《漫威蜘蛛侠:重制版》《微软模拟飞行》和《超级人类》,另外《WRC Generations》《Need for Speed Unbound》和《战锤40K:暗潮》将在RTX 4080推出后不久就会陆续发布,在圣诞节前玩家就可畅玩这些DLSS 3.0游戏,充分享受AI科技带来的畅爽游戏体验。
内容创作性能测试:
对于内容创作者来讲,后期渲染是常规性的操作,全新的iGame GeForce RTX 4080 16GB Vulcan OC显卡支持全新的AV1编码,在后期渲染方面性能提升非常明显,我们使用达芬奇进行4K、8K视频素材的渲染,视频文件的大小为8GB和13GB,最终渲染所需的时间分别为27秒和41秒,渲染速度惊人,是上代RTX 3080 Ti的2倍,大大减少了不必要的渲染等待时间,大幅提升了后期内容创作者的效率。
功耗&温度测试:
我们使用“甜甜圈”对这款iGame GeForce RTX 408016GB Vulcan OC显卡进行烤机,在满载的情况下,GPU的温度仅为53.4℃,散热表现极为出色,此时的显卡芯片功耗为173.8W,板载功耗为232.2W,显存模块总功耗为47.8W,显卡整体功耗处在一个不断变换的状态,远远没有官方所说的350W TGP,750W的电源完全能够带得动这块显卡。
另外NVIDIA表示,显卡的TGP功耗是一个不断变化的过程,在不同的应用场景中负载是不一样的,在不同分辨率下,显卡的负载水平是不一样的,所以需要测试平均功耗表现,就拿赛博朋克2077这款游戏来讲,使用FrameView记录GPU的功耗,在4K分辨率下RTX 4080的功耗水平要明显低于1080P分辨率下游戏的功耗,并且远远低于TGP额定350W的功耗,实际的能效比表现更好。
写在最后:iGame GeForce RTX 4080 16GB Vulcan OC外观酷炫,后·赛博时代金属风格设计,配合上智能LCD显示屏,让这款显卡非常酷炫,可玩性十足,科技感拉满。性能方面,这款显卡支持一键OC超频,可以将频率提升至2640MHz,性能提升约6%,是目前市面上旗舰级的非公版RTX 4080显卡,基本上可以轻松胜任4K分辨率下各种游戏大作,配合上DLSS 3.0和光线追踪技术,能够让玩家享受4K高清画面和100+FPS的高帧数,整体游戏体验更加丝滑流畅。
对于游戏玩家来讲,如果你想要无门槛、全特效的4K游戏体验,或者偶尔玩玩8K游戏,又接受不了RTX 4090那12999元起的价格,那么RTX 4080显卡作为目前4K游戏性能仅次于RTX 4090的高性能游戏显卡,并且在游戏方面的表现基本上全面领先上代RTX 30系显卡和AMD全系显卡,是高端发烧友追求4K高性能游戏体验的不二之选。
对于内容创作者来讲,iGame GeForce RTX 4080 16GB Vulcan OC拥有16GB GDDR6X大显存,配合上全新升级的Ada LoveLace架构和4nm领先工艺,至高提升2倍的内容创作效能,大大提升内容创作者的后期效率。
上市消息:
11月16日晚10点,七彩虹将在京东、天猫、抖音、快手等电商平台及线下授权零售经销渠道正式以现货发售或预售的形式同时上架多款iGame、战斧 GeForce RTX 4080显卡,包含 iGame GeForce RTX 4080 16GB Vulcan OC、 iGame GeForce RTX 4080 16GB Neptune OC、 iGame GeForce RTX 4080 16GB Advanced OC、iGame GeForce RTX 4080 16GB Ultra OC及战斧GeForce RTX 4080 16GB 豪华版,感兴趣的话可以去了解一下。