過去兩年的顯示卡市場(chǎng),可以說是歷經(jīng)波折,疫情造成全球供應(yīng)鏈吃緊,貨本來就不多,NVIDIA首發(fā)RTX 30系列顯卡沒多久就缺貨,再來隨即經(jīng)歷礦潮,不但缺而且價(jià)格搞的跟房地產(chǎn)一樣飛漲,直到今年價(jià)格終于回落了,供貨也日漸充足,但此時(shí)RTX 40系列顯示卡也要來了,我們就在這樣的風(fēng)風(fēng)雨雨中,迎接新一代的顯卡。
 
RTX4090性能測(cè)試 RTX4090比3090提升多少?
 
這次NVIDIA的RTX 40系列顯示卡采用了全新的Ada Lovelace架構(gòu),簡(jiǎn)稱為Ada架構(gòu),這次的命名來自于英國(guó)的一位數(shù)學(xué)家Ada Lovelace,他也普遍被認(rèn)為是世界上第一位電腦程序的設(shè)計(jì)師。
 
之前的發(fā)布會(huì)上公布了RTX 4080以及4090顯卡,官方宣稱比前代快上2-4倍,今天我們就來測(cè)試NVIDIA所推出的GeForce RTX 4090,看看這張性能怪獸到底表現(xiàn)如何。
 
這里我先整理出RTX40系列的三大重點(diǎn):
 
1、采用臺(tái)積電4nm制程,晶體管密度以及能耗比上都有著大幅的提升
 
2、采用第三代的Ray Tracing Core光線追蹤核心,并加入了兩種全新的處理單元,
分別是OMM(Opacity Micromap)以及DMM(Displaced Micro-Mesh),讓光線追蹤的運(yùn)算效率相較前代翻倍,搭配SER(Shader Execution Reordering)調(diào)度系統(tǒng),讓SM單元以及RT Core能更有效率的協(xié)調(diào)工作。
 
3、采用第四代的Tensor Core,支持全新的DLSS 3.0,通過在GPU中加入了全新的光流加速器,讓DLSS 3.0的性能相較2.0提升了兩倍。
 
綜合以上3點(diǎn),讓這次的RTX 40系列顯示卡有著大幅的性能提升,可以達(dá)到前代的翻倍,整體來說在硬件及技術(shù)上都有亮點(diǎn)。
 
RTX4090性能測(cè)試 RTX4090比3090提升多少?
 
下面我們來詳細(xì)了解下這次的RTX40顯卡。首先是制程的部分,NVIDIA總算又回歸臺(tái)積電的懷抱,RTX 40系列顯卡用上目前最先進(jìn)的4nm制程,雖然它跟5nm是屬于同一個(gè)節(jié)點(diǎn),但性能還是要比5nm再?gòu)?qiáng)上13%左右。
 
RTX4090性能測(cè)試 RTX4090比3090提升多少?
 
光追方面,NVIDIA這幾年一直極力的發(fā)展光線追蹤,不單是游戲上可以獲得更精良的真實(shí)畫面,光追更重要的意義還在于生產(chǎn)力上,你能通過特定的RT Core加速單元去提升光追渲染的效率,更快速的去模擬出接近真實(shí)的光線路徑。
 
第一款支持光追的游戲是戰(zhàn)地風(fēng)云5,那時(shí)候每個(gè)像素會(huì)動(dòng)用到39次的光追計(jì)算,而到了近年推出的賽博朋克2077,每個(gè)像素動(dòng)用到的光追計(jì)算已經(jīng)突破600次了,面對(duì)如此大量的計(jì)算需求,NVIDIA一直在想方設(shè)法的提升硬體對(duì)于光追的運(yùn)算性能。
 
這次Ada架構(gòu)配備了第三代的RT Core,擁有兩倍的光線三角交叉(Ray-Triangle intersection)傳輸量,以及兩個(gè)全新的光追硬件單位,Opacity Micromap Engine(OMM)不透明微圖引擎可以直接對(duì)物體進(jìn)行Alpha幾何測(cè)試,并且顯著的分擔(dān)基于著色器的工作量,所以開發(fā)人員可以借助這項(xiàng)硬件技術(shù)對(duì)像是葉子邊緣或是火焰等等這些有半透明樣貌的物體進(jìn)行詳細(xì)分析,通過RT-Core對(duì)他們進(jìn)行直接、并且更有效率的光線追蹤。
 
而Displaced Micro-Mesh Engine(DMM)置換微網(wǎng)引擎,在建構(gòu)3D圖像的過程中,以前會(huì)需要去記錄下每個(gè)三角形的座標(biāo),所以當(dāng)物體細(xì)節(jié)越多的時(shí)候,往往會(huì)產(chǎn)生很大的數(shù)據(jù)量,并且對(duì)硬件的運(yùn)算效能也相當(dāng)嚴(yán)苛,而通過DMM,它不是記錄每個(gè)座標(biāo),而是透過記錄一個(gè)三角形,搭配向量的方式,可以大幅的減少數(shù)據(jù)量,有點(diǎn)類似資料壓縮的概念,但是他卻又能大幅節(jié)省運(yùn)算能耗以及VRAM空間,所以透過DMM引擎,能將建構(gòu)BVH(Bounding volume hierarchy)的速度提升10倍。
 
RTX4090性能測(cè)試 RTX4090比3090提升多少?
 
除此之外AdaDA也加入了SER,著色器執(zhí)行重新排序技術(shù)。光追一直是出了名的難平行處理,一道光打在不同角度的物品平面上上,會(huì)產(chǎn)生各個(gè)方向的反彈,對(duì)于這些繁雜的負(fù)載導(dǎo)致GPU必須動(dòng)用不同的線程來處理不同的著色器,而造成運(yùn)算效率低下。而通過SER技術(shù),他可以即時(shí)重新安排著色工作負(fù)載。光是這項(xiàng)技術(shù)的加入,官方宣稱說光追的運(yùn)算效率就可以提升2-3倍,并且?guī)碚w25%的游戲性能提升。
 
接下來是DLSS的部分。這項(xiàng)技術(shù)的出現(xiàn)讓我們得以在游戲中用更少的運(yùn)算資源來獲得更多的幀率提升,這其中是歸功于Tensor Core的AI運(yùn)算,透過深度學(xué)習(xí)讓硬件預(yù)先去模擬游戲畫面,再通過超采樣將低解析度畫面放大成高解析度。
 
RTX4090性能測(cè)試 RTX4090比3090提升多少?
 
這次的AdaDA架構(gòu),配備第四代的Tensor Core,而其中最重要的是加入了光流加速器(Optical Flow Accelerator),搭配動(dòng)態(tài)向量引擎,AI能去預(yù)判游戲中每個(gè)像素的運(yùn)動(dòng)軌跡,并且不需要額外的渲染就能產(chǎn)生一個(gè)完整的畫面,更好理解的說法就是「補(bǔ)幀」,但這個(gè)補(bǔ)幀不是通過接合前后幀做生成,而是通過現(xiàn)有的畫面,搭配運(yùn)動(dòng)軌跡來預(yù)知下一幀的畫面,搭配原先就有的超解析度技術(shù),這次的DLSS 3.0將會(huì)帶來4倍的游戲性能提升。
 
RTX4090性能測(cè)試 RTX4090比3090提升多少?
 
此外這次的RTX 40系列顯卡在編解碼規(guī)格上也有了更新,支持了AV1編碼功能,并且它搭載了雙編碼器,NVIDIA通過這個(gè)雙編碼器可以在影像輸出的過程中協(xié)同運(yùn)作,一個(gè)畫面可以分成上下兩個(gè)部分,分別由雙編碼器去做渲染,并且再將上下畫面做合成,這樣一來就可以使圖形處理速度翻倍,對(duì)于很多視頻創(chuàng)作者來說,這項(xiàng)功能將會(huì)帶來更高的生產(chǎn)效率。
 
接著我們來看下這次RTX 4090的規(guī)格,剛看到規(guī)格參數(shù)的時(shí)候真的很令人傻眼,作為RTX 3090的下一代,你漲價(jià)貴100美金就算了,但這功耗是怎么回事?RTX 4090比RTX 3090整整上升了100W,直接跟RTX 3090Ti齊平,不過先別急著開噴,看完評(píng)測(cè)再說。
 
RTX4090性能測(cè)試 RTX4090比3090提升多少?
 
RTX 4090核心是AD102,后綴型號(hào)是300-A1,配備128組SM單元,16384個(gè)CUDA,是完整AD102的88.88888%。完整的AD102會(huì)留給更高階的RTX 4090Ti以及RTX 6000 Ada。
 
單從CUDA數(shù)來看,這代的RTX 4090就極其恐怖,受惠于先進(jìn)制程的淫威之下,其晶體管密度真的是大躍進(jìn),直接增長(zhǎng)了64%。核心頻率部分,RTX 4090也是上到2.5GHz,RTX 3090也才不過1.7GHz,搭配72MB的L2大緩存,其實(shí)這次Ada架構(gòu)在硬體規(guī)格上提升是非常巨大的。
 
而現(xiàn)在的問題就是這些強(qiáng)大的規(guī)格提升,對(duì)比高出100W的功耗以及貴100美元的價(jià)格,平衡下來到底哪邊勝出?下面就是大家最關(guān)心的實(shí)測(cè)環(huán)節(jié)了。
 
先來做個(gè)烤機(jī)機(jī)測(cè)試。
 
RTX4090性能測(cè)試 RTX4090比3090提升多少?
 
RTX 4090在Furmark的壓力測(cè)試下,功耗吃滿可達(dá)450W,整機(jī)平臺(tái)功耗更是接近600W大關(guān),單看功耗的話,它就是一張RTX 3090 Ti,電源建議為850W,不過考慮到90級(jí)別卡通常都會(huì)搭高端的CPU,所以我個(gè)人會(huì)建議還是直上1000W比較保險(xiǎn)。

RTX4090性能測(cè)試 RTX4090比3090提升多少?
 
溫度方面,滿載狀態(tài)下溫度保持在73度,相對(duì)于它的功耗來說這個(gè)溫度完全在可接受范圍。
 
RTX4090性能測(cè)試 RTX4090比3090提升多少?
 
首先是我們最熟悉的3D Mark,在DX 11環(huán)境的FSU中,RTX 4090對(duì)比RTX 3090領(lǐng)先了96%,比RTX 3090 Ti強(qiáng)上74%。
 
RTX4090性能測(cè)試 RTX4090比3090提升多少?
 
DX12環(huán)境的TSE中,RTX 4090也領(lǐng)先RTX 3090 85%,比RTX 3090 Ti高67%。
 
這樣對(duì)比下來,RTX 4090性能基本達(dá)到RTX 3090的翻倍,這要比RTX 2080對(duì)上RTX 3080時(shí)的幅度更大,功耗跟當(dāng)時(shí)RTX 3080類似,對(duì)比前代同樣上升了100W左右,所以這樣看起來,倒是有種之前30系列顯卡卡的影子,性能提升雖然巨大,但是同時(shí)也用了更多的功耗來換,不過實(shí)際的能耗表現(xiàn)如何,我們先別急著下定論,接著我們來看NVIDIA主打的光追和DLSS性能。
 
RTX4090性能測(cè)試 RTX4090比3090提升多少?
 
在Port Royal的光追測(cè)試中,RTX 4090有著86.5%的成長(zhǎng)。
 
RTX4090性能測(cè)試 RTX4090比3090提升多少?
 
而針對(duì)光追硬件的DXR測(cè)試?yán)?,RTX 4090更是比RTX 3090跑出多達(dá)2.3倍的FPS,可以說從RTX 20系列到RTX 30系列光追性能翻倍,接著從RTX 30 系列到RTX 40系列又再次的翻倍,呈現(xiàn)指數(shù)成長(zhǎng)的曲線。
 
RTX4090性能測(cè)試 RTX4090比3090提升多少?
 
在DLSS 2.0的測(cè)試中,RTX 4090的幀率表現(xiàn)明顯高出一截,效果部分則是跟RTX 30系列顯卡差不多,在開啟DLSS之后FPS能夠有翻倍的成長(zhǎng)。
 
RTX4090性能測(cè)試 RTX4090比3090提升多少?
 
不過換作是DLSS 3.0的測(cè)試?yán)?,結(jié)果就有所不同了。這里RTX 30系列卡因?yàn)椴恢С諨LSS 3.0,所以無法跑測(cè)試。而RTX 4090大家可以觀察它的FPS增長(zhǎng),從原始的57幀,開啟DLSS 3.0之后竟然是暴增到恐怖的169幀,直接是成長(zhǎng)了整整3倍。而這不單單是在理論測(cè)試,就連后面的游戲?qū)崪y(cè)中也能發(fā)現(xiàn)不錯(cuò)的效果。
 
2077光追+DLSS 3.0全開,4K幀率可以達(dá)到140FPS,就問你怕不怕?值得留意的是功耗部分,RTX 4090在跑CUDA測(cè)試的時(shí)候,實(shí)際公耗其實(shí)是不到300W,但RTX 3090卻需要跑到350W,這意味著RTX 4090他只用RTX 3090不到9成的功耗,就跑出了比他翻倍的成績(jī),而且在游戲表現(xiàn)上也是如此。
 
RTX4090性能測(cè)試 RTX4090比3090提升多少?
 
首先是GPU的傳統(tǒng)性能,也就是不開光追,也不蹭AI運(yùn)算,我們單看這代Ada架構(gòu)在物理運(yùn)算上到底成長(zhǎng)多少。在我測(cè)試的5款游戲中,分辨率統(tǒng)一設(shè)定在4K,特效全開。只能說RTX 4090是強(qiáng)到?jīng)]朋友,對(duì)比RTX 3090基本都是50%的增長(zhǎng)起步,尤其是地平線5更是跑出高達(dá)66%的表現(xiàn),即便在4K特效全開的高壓環(huán)境下,都沒能讓RTX 4090吃滿功耗,甚至最變態(tài)的是其中四款游戲,功耗竟然還比RTX 3090低,這未免也太不科學(xué)了吧。這就是我前面所說的,先別對(duì)RTX 4090的能耗下定論指的就是這個(gè)。當(dāng)我們實(shí)際拿它來打游戲時(shí),它不但比RTX 30系列卡強(qiáng)之外,竟然還更省電,新架構(gòu)搭配臺(tái)積電真的是太猛了。
 
RTX4090性能測(cè)試 RTX4090比3090提升多少?
 
這里我用2077 4K光追全開來進(jìn)行測(cè)試,RTX 4090和RTX 3090在開啟光追后,性能同樣都減損了30%左右,這里兩者倒是沒有明顯的差距,不過RTX 4090的幀率還是比較高,能耗表現(xiàn)也更好一些。
 
接下來是DLSS測(cè)試,目前第一批支持DLSS 3.0的游戲有賽博朋克2077、逆水寒、微軟模擬飛行等。
 
RTX4090性能測(cè)試 RTX4090比3090提升多少?
 
賽博朋克在開啟DLSS平衡模式下,RTX 4090出現(xiàn)了2.6倍的幀率提升,比起RTX 3090的2倍要多出0.6倍,平均150幀的2077都足以喂飽4K 144的電競(jìng)屏了,如果是性能檔位下,更是會(huì)有多達(dá)3倍的幀率提升。
 
總結(jié):RTX4090性能測(cè)試 RTX4090比3090提升多少?
 
總結(jié)一個(gè)字就是“強(qiáng)“,雖然功耗確實(shí)上升了,也貴了100刀,但是它所提供的性能以及能耗都完全掩蓋不了它目前在市場(chǎng)上的強(qiáng)勢(shì)性,NVIDIA確實(shí)是充分利用制程優(yōu)勢(shì),加上大量的導(dǎo)入新技術(shù),實(shí)現(xiàn)比RTX 3090多兩倍以上的性能提升,同時(shí)卻有更優(yōu)異的能耗,即便老黃說摩爾定律在GPU上已經(jīng)難以實(shí)現(xiàn),但依靠著NVIDIA的軟實(shí)力,同樣是讓我們看到不亞于摩爾定律的表現(xiàn)。
 
不過希望gpu廠家不要再繼續(xù)上調(diào)硬件功耗了,以前的硬件出廠功耗比較保守,可以留給玩家們超頻探索的空間,但現(xiàn)在的硬件是原廠先幫你超到冒煙后再拿出來給你,性能強(qiáng)是沒錯(cuò),但留給玩家的探索空間越來越少了,并且功耗也提升了。這次Ada架構(gòu),確實(shí)擁有更優(yōu)異的能耗,并且在高功耗的區(qū)間上,還有更寬廣的性能延伸空間,這也是為什么NVIDIA這次會(huì)上調(diào)RTX 4090的功耗,畢竟到450W,也還不足以達(dá)到明顯的邊際效應(yīng),所以調(diào)高一些功耗來換取性能,是很常見的作法。但是當(dāng)硬件繼續(xù)往這個(gè)方向發(fā)展,之后的60、70級(jí)別卡要突破200、300W的功耗也不是不可能,即便你的能耗再優(yōu)異,但周邊的花費(fèi)成本無疑是會(huì)提高的,以前5000塊就能配到一臺(tái)性能不錯(cuò)的電腦,現(xiàn)在同樣價(jià)錢買個(gè)顯卡都差不多了。
裝機(jī)