經(jīng)過(guò)兩年的漫長(zhǎng)等待,代號(hào)為Blackwell的RTX 50系GPU終于在今年的CES上與廣大玩家們正式見(jiàn)面。繼承了RTX 40系及之前GPU強(qiáng)大的全場(chǎng)景游戲性能,與Blackwell數(shù)據(jù)中心GPU在各路AI超算中的廣泛應(yīng)用,本次RTX 50系GPU究竟會(huì)對(duì)當(dāng)下混搭游戲與生成式AI的全場(chǎng)景AIPC帶來(lái)怎樣的提升著實(shí)令人好奇。好在,一切的等待都是值得的,盡管并無(wú)像RTX 40系那樣鋪天蓋地的新技術(shù)爆料,但RTX 50系所引入的改動(dòng)可以說(shuō)真真切切地再一次定義了電子游戲的底層邏輯。我們這次也拿到了一張NVIDIA GeForce RTX 5080 FE公版GPU,不妨一起來(lái)上機(jī)測(cè)測(cè)看。
圖形架構(gòu)的超級(jí)革命
本次RTX 50系游戲GPU搭載了NVIDIA最新銳的Blackwell架構(gòu),而基于NVIDIA以歷史上有名的各位大神為GPU微架構(gòu)起名的傳統(tǒng),本次Blackwell也是向著名數(shù)學(xué)家、統(tǒng)計(jì)學(xué)家 ,拉奧-布萊克韋爾定理的提出人戴維·哈羅德·布萊克韋爾的致敬。
由于半導(dǎo)體制造工藝以及商業(yè)可行的芯片尺寸逐漸逼近物理學(xué)極限,摩爾定律的終結(jié)已然是擺在臺(tái)面上的不可忽視的問(wèn)題。在RTX 50系Blackwell GPU上,NVIDIA引入了一個(gè)全新的概念-Neural Shaders神經(jīng)網(wǎng)絡(luò)著色器。
從名字上也可以看出來(lái),本次Blackwell GPU的著色單元高度依賴(lài)AI算力,每一組Blackwell SM單元均是針對(duì)神經(jīng)網(wǎng)絡(luò)著色器架構(gòu)進(jìn)行特化的產(chǎn)物,與上一代Ada GPU SM單元僅有一半核心擁有INT32能力不同,在Blackwell上,每一組SM單元的著色器核心都能夠執(zhí)行FP32/INT32指令,搭配第五代Tensor Core與改進(jìn)的亂序執(zhí)行架構(gòu),能夠顯著提升顯卡在運(yùn)行包括DLSS在內(nèi)的各種圖形/AI負(fù)載時(shí)的效率。
在實(shí)際應(yīng)用中,基于Blackwell GPU的Neural Shaders,開(kāi)發(fā)者可以在游戲中部署基于神經(jīng)網(wǎng)絡(luò)的模型、貼圖、材質(zhì)與體積云等效果。開(kāi)發(fā)者可以通過(guò)訓(xùn)練一個(gè)基礎(chǔ)模型,在用戶端進(jìn)行實(shí)時(shí)推理的方式實(shí)現(xiàn)高質(zhì)量、高效率且小體積的畫(huà)面效果。與在本地完整烘焙光照、打包分發(fā)相比,采用基于Neural Shaders實(shí)現(xiàn)的AI著色同樣也能顯著提升游戲開(kāi)發(fā)者側(cè)的效率,可以說(shuō)是讓所有人都幸福的解決方案了。
在面向包括DLSS在內(nèi)的各路AI應(yīng)用的Tensor Core上,本次Blackwell引入的第五代Tensor Core支持了更低精度的FP4規(guī)格數(shù)據(jù),這能夠進(jìn)一步壓縮負(fù)載時(shí)的內(nèi)存壓力,在顯存池受限的消費(fèi)級(jí)游戲GPU上更是能顯著提升如DLSS等技術(shù)的效果表現(xiàn)。同時(shí),對(duì)于近年來(lái)逐漸成為業(yè)界焦點(diǎn)的Transformer模型而言,第五代Tensor Core的效果也是相當(dāng)出彩,這一點(diǎn)在后面講DLSS 4的時(shí)候也會(huì)提及。
說(shuō)到顯存,本次RTX 50系GPU全系引入革命性的GDDR7顯存。由于采用了PAM-3信號(hào)調(diào)制技術(shù),GDDR7顯存能夠在實(shí)現(xiàn)更高頻率的同時(shí)顯著降低功耗,且提升幅度十分可觀:根據(jù)NVIDIA的說(shuō)法,RTX 50系首發(fā)搭載的GDDR7顆粒能夠在帶來(lái)兩倍于GDDR6顯存的性能同時(shí)僅消耗一半的能量,提升幅度相當(dāng)顯著。
大規(guī)模GPU的能耗問(wèn)題在如今愈發(fā)顯著,而B(niǎo)lackwell架構(gòu)通過(guò)更精細(xì)的電壓控制與頻率切換可以說(shuō)是大幅優(yōu)化了這一點(diǎn)。
對(duì)于消費(fèi)級(jí)GPU而言,圖形輸出規(guī)格與視頻編解碼能力也是一個(gè)相當(dāng)重要的參數(shù),在這方面Blackwell自然也是不遑多讓。本次RTX 50系GPU全面支持包括DP2.1 80Gbps在內(nèi)的先進(jìn)視頻輸出規(guī)格,在消費(fèi)級(jí)GPU中鶴立雞群。同時(shí),NVENC與NVDEC分別升級(jí)到第九代與第六代,支持了AV1 UHQ、MV-HEVC與422規(guī)格視頻的編解碼,而同時(shí)基礎(chǔ)的H.264解碼效率也同樣令人嘖嘖稱(chēng)奇。無(wú)論是多屏用戶還是多媒體創(chuàng)作者,都能夠得益于Blackwell架構(gòu)帶來(lái)的顯著提升。
更多光線,更快上線
自從RTX 20系Turing架構(gòu)首次向全世界展示實(shí)時(shí)光線追蹤技術(shù)對(duì)電子游戲的表現(xiàn)力帶來(lái)的革命以來(lái),基于光線追蹤技術(shù)構(gòu)建游戲幾乎成為了3D游戲的缺省選項(xiàng)。隨著RTX 50系列的上市,第四代的RT Core也一并上線,與GPU架構(gòu)的其他部分協(xié)作帶來(lái)了更出彩的光追體驗(yàn)。
第四代RT Core在第三代Ada 光追單元的基礎(chǔ)上將三角形引擎拆分成求交與解壓引擎,并引入了線性掃描球體引擎,能夠大幅提升光追單元的計(jì)算效率,配合前文提到的在GPU微架構(gòu)與顯存技術(shù)上的提升,提升幅度不可小覷。
在先進(jìn)的光追單元加持下,本次RTX 50系Blackwell GPU引入了全新的RTX Mega Geometry與硬件加速曲線基元,結(jié)合前面架構(gòu)分析時(shí)提到的神經(jīng)網(wǎng)絡(luò)著色器能夠?yàn)殚_(kāi)發(fā)者提供更多樣的可能性,帶來(lái)革命性的畫(huà)面表現(xiàn)能力與游戲體驗(yàn)。
DLSS 4:一生二,再生三,再生萬(wàn)物
憑借著高性能的光流加速器與游戲開(kāi)發(fā)商的深度合作,RTX 40系A(chǔ)da GPU搭載的DLSS 3功能可以說(shuō)是廣受好評(píng),去年推出的DLSS 3.5光線重建技術(shù)更是讓玩家們?cè)谌纭顿惒┡罂耍?077》與《心靈殺手2》這樣的游戲中享受了數(shù)百小時(shí)的視覺(jué)盛宴,筆者自己就專(zhuān)程為了體驗(yàn)《心靈殺手2》這部Remedy Entertainment十年磨一劍的神作專(zhuān)程組裝了一臺(tái)搭載GeForce RTX 4080 SUPER GPU的旗艦臺(tái)式主機(jī)。而隨著本次RTX 50系游戲GPU一并發(fā)布的全新技術(shù) – DLSS 4更是在現(xiàn)有的幀生成管線上進(jìn)一步拓寬了上限。
本次DLSS 4的一大亮點(diǎn)就是引入了Transformer模型替換了以往的C N N模型架構(gòu)。傳統(tǒng)的C N N模型架構(gòu)在多年的更新中已經(jīng)觸及了性能極限,而全新的Transformer架構(gòu)的性能不僅已經(jīng)在Stable Diffusion等AI圖片生成應(yīng)用、ChatGPT等大語(yǔ)言模型中已經(jīng)得到一次次的證實(shí),而且它有能力根據(jù)畫(huà)面的上下文進(jìn)行推理,能夠帶來(lái)更穩(wěn)定且符合邏輯的畫(huà)面,減少鬼影、閃爍等現(xiàn)象隨著DLSS 4的上線,包括超分辨率、幀生成在內(nèi)的全套功能都將由更先進(jìn)的Transformer模型驅(qū)動(dòng),帶來(lái)顯著提升的畫(huà)面表現(xiàn)。
在這套截取自《心靈殺手2》亮瀑鎮(zhèn)警局后院的對(duì)比圖中,我們可以看到引入Transformer模型后,DLSS光線重建功能的畫(huà)面表現(xiàn)得到了顯著的提升。由于Transformer模型有能力通過(guò)“上下文”實(shí)現(xiàn)對(duì)畫(huà)面的整體理解,在柵欄上我們能夠明顯看到鐵絲的質(zhì)感更為真實(shí),而基于C N N模型的DLSS光線重建實(shí)現(xiàn)則由于C N N模型依賴(lài)卷積核的特性在這類(lèi)場(chǎng)景中表現(xiàn)并不出色。
即使在像《地平線:西之絕境》這樣不支持DLSS光線重建,僅支持DLSS超分辨率的游戲中,我們也能看到類(lèi)似的改善。埃洛伊背包上的皮革線條在Transformer模型加持的DLSS超分辨率后仍然保持了相當(dāng)明顯的立體感,玩家可以顯著的看到這個(gè)背包的縫制線條,對(duì)于游戲整體畫(huà)面表現(xiàn)提升十分顯著。
除了底層架構(gòu)的革新之外,DLSS 4的另一大亮點(diǎn)就是它引入了多幀生成功能,允許游戲在DLSS 3幀生成技術(shù)的基礎(chǔ)上生成更多幀數(shù)。同時(shí),由于需要高效生成游戲畫(huà)面,本次DLSS 4也引入了全新的AI光流算法以替代硬件光流加速器來(lái)加速光流場(chǎng)計(jì)算。綜合而言,這套全新的DLSS 4管線能夠帶來(lái)40%的速度提升,同時(shí)還能降低30%的顯存占用,可以說(shuō)是相當(dāng)強(qiáng)悍了。
在《戰(zhàn)錘40K:暗潮》中,DLSS 4多幀生成能夠?qū)崿F(xiàn)最高畫(huà)質(zhì)下4K 137幀的游戲體驗(yàn),提升高達(dá)10%,同時(shí)顯存占用也比DLSS 3降低了0.4GB,為游戲開(kāi)發(fā)者提供了更多空間用于引入高質(zhì)量的畫(huà)面技術(shù)。
而當(dāng)我們將DLSS 4多幀生成技術(shù)與之前所有DLSS技術(shù)放在一起考慮時(shí),我們會(huì)發(fā)現(xiàn),目前DLSS技術(shù)已經(jīng)能夠做到讓每十六個(gè)像素點(diǎn)中有15個(gè)由AI生成。在傳統(tǒng)圖形渲染架構(gòu)革新與制程進(jìn)化速度不斷放緩的今天,依靠AI加速的DLSS而非暴力堆徹硬件規(guī)模(盡管NVIDIA在這方面也同樣是武林高手)反而能夠帶來(lái)更顯著的游戲體驗(yàn)上的提升。 而對(duì)于之前已經(jīng)購(gòu)買(mǎi)過(guò)NVIDIA GeForce RTX GPU的玩家而言,本次DLSS 4在底層架構(gòu)上的提升也同樣能夠讓諸位受益,正如我們?cè)?jīng)在DLSS 3.5光線重建上見(jiàn)到的一樣。
Reflex 2:更低延遲的電競(jìng)體驗(yàn)
自從初代NVIDIA Reflex低延遲技術(shù)于2020年正式上線以來(lái),這項(xiàng)通過(guò)優(yōu)化游戲圖形渲染管線以降低系統(tǒng)延遲的技術(shù)就在整個(gè)業(yè)界廣受好評(píng)。無(wú)論是游戲開(kāi)發(fā)商、外設(shè)廠商還是玩家都樂(lè)見(jiàn)并廣泛接納了這項(xiàng)極富盛名的技術(shù),日前已有超過(guò)百款熱門(mén)游戲進(jìn)行支持,其中不乏如《反恐精英2》、《無(wú)畏契約》等熱門(mén)電競(jìng)大作,它也是DLSS 3幀生成功能實(shí)現(xiàn)高可用性的重要基石。
而隨著圖形技術(shù)復(fù)雜度越來(lái)越高,NVIDIA Reflex 2也應(yīng)運(yùn)而生。它在初版Reflex的基礎(chǔ)上引入了全新的Frame Warp技術(shù),能夠基于鼠標(biāo)輸入預(yù)判下一幀的畫(huà)面,進(jìn)一步降低系統(tǒng)延遲。
針對(duì)Reflex 2實(shí)現(xiàn)首發(fā)支持的兩款游戲分別將會(huì)是The Finals與無(wú)畏契約,而這項(xiàng)技術(shù)盡管首發(fā)支持RTX 50系GPU,將會(huì)在未來(lái)擴(kuò)展到全部RTX GPU陣容,讓所有現(xiàn)代NVIDIA GeForce GPU的游戲用戶體驗(yàn)到次世代的電競(jìng)體驗(yàn)。
RTX 5080:完整的GB203
本次我們?cè)u(píng)測(cè)的GPU是RTX 50系GPU矩陣中的次旗艦產(chǎn)品-RTX 5080。
這顆GPU基于完整的GB203核心打造,擁有7組GPC單元,42組TPC單元,84組SM單元,共計(jì)10752組CUDA核心。盡管仍然基于TSMC的4nm 4N定制工藝打造,但RTX 5080 GPU在前文提到的Tensor Core、RT Core、NVENC/DEC編解碼器上都有顯著提升,輔以全新的30Gbps GDDR7顯存顆粒,在顯存位寬保持256bit的前提下將顯存帶寬從上一代RTX 4080的716.8GB/s提升到960GB/s,在高帶寬要求的現(xiàn)代游戲、圖形專(zhuān)業(yè)應(yīng)用與AI負(fù)載下能夠帶來(lái)十分可觀的提升。全面的提升帶來(lái)了整卡的功耗的小幅上漲,從320W TGP上漲到360W,但考慮到增幅只有40W,現(xiàn)有RTX 4080/4080 SUPER的用戶應(yīng)當(dāng)可以在不更換任何配件的情況下直接升級(jí)。
公版怎么看
本次RTX 50系的FE顯卡均采用了全新的雙流散熱架構(gòu),實(shí)現(xiàn)了極為驚艷的尺寸控制,但在工業(yè)設(shè)計(jì)上仍然能與上兩代的GPU找到諸多相似之處。盡管從散熱結(jié)構(gòu)上來(lái)說(shuō),這一散熱架構(gòu)與近年來(lái)高端GPU產(chǎn)品的“標(biāo)準(zhǔn)答案”并無(wú)多少差別:核心、顯存和VRM等核心元器件的熱量通過(guò)均熱板導(dǎo)出,經(jīng)由多根熱管傳導(dǎo)到鰭片上,再由風(fēng)扇構(gòu)建風(fēng)道進(jìn)行實(shí)際的降溫,但在RTX 50系FE版GPU上,NVIDIA的熱流工程師采用了一種十分驚艷的設(shè)計(jì),通過(guò)顯著優(yōu)化PCB密集度允許風(fēng)扇徹底吹穿鰭片,帶來(lái)更高的風(fēng)量,顯著提升了散熱的水平。
根據(jù)NVIDIA自己給出的數(shù)據(jù),采用這種雙流散熱架構(gòu)的GPU僅需一個(gè)標(biāo)準(zhǔn)的雙槽尺寸散熱器就能夠輕松應(yīng)對(duì)最高600W的功耗,那無(wú)論是小尺寸PC發(fā)燒友還是塞滿了各種拓展卡的全尺寸機(jī)箱用戶都能夠明顯受益于如此精巧的設(shè)計(jì)了。事實(shí)上,不僅是本次評(píng)測(cè)的這張RTX 5080,即使是RTX Blackwell家族的旗艦,RTX 5090這顆核彈GPU的FE版也采用了標(biāo)準(zhǔn)雙槽尺寸的散熱器,如此激進(jìn)的散熱設(shè)計(jì)帶來(lái)的產(chǎn)品形態(tài)上的進(jìn)化可謂立竿見(jiàn)影,也是對(duì)NVIDIA在去年年底推出的SFF Ready規(guī)范的良好實(shí)現(xiàn)。
我們的散熱壓力測(cè)試也證明了這一點(diǎn)。在30分鐘室溫25度環(huán)境下的FurMark 4K 2xMSAA壓力測(cè)試中,我們可以看到這張RTX 5080 FE采用的雙流散熱架構(gòu)在性能上同樣相當(dāng)穩(wěn)定,GPU頻率幾乎是一條直線,且溫度表現(xiàn)也相當(dāng)出色。
而在3DMark的高壓力Speed Way Extreme壓力測(cè)試中我們也能看到同樣的結(jié)果,RTX 5080 Founder’s Edition GPU的散熱系統(tǒng)實(shí)現(xiàn)了相當(dāng)穩(wěn)定的性能釋放。如此優(yōu)秀的成績(jī)輔以良好的尺寸控制,可以說(shuō)是讓所有發(fā)燒友都垂涎三尺了。
盡管在散熱架構(gòu)上帶來(lái)了革命性的改動(dòng),NVIDIA GeForce RTX 5080 Founder‘s Edition在工業(yè)設(shè)計(jì)上仍然延續(xù)了從RTX 30系A(chǔ)mpere GPU開(kāi)始引入的那套設(shè)計(jì)語(yǔ)言。整體設(shè)計(jì)以X型框架為核心,左右兩個(gè)風(fēng)扇在視覺(jué)上相當(dāng)震撼,像左右護(hù)法一樣在GPU的兩側(cè),不僅視覺(jué)沖擊力拉滿,也能夠?yàn)閮蛇叺纳狯捚瑤プ銐虻娘L(fēng)量方便導(dǎo)出熱量。
RTX 50系FE卡在配色上相當(dāng)有趣:框架采用亮色,而IO擋板、散熱鰭片、風(fēng)扇等部分則采用暗色,但兩者之間的色調(diào)差異在實(shí)際拿到手上反而并不明顯。就筆者個(gè)人而言,我還是相當(dāng)欣賞這種配色風(fēng)格的。話扯遠(yuǎn)了,右側(cè)的“GEFORCE RTX”字樣也繼承了之前的傳統(tǒng),在點(diǎn)亮后有單色白光LED映照,盡管并不如AIC卡一樣有全套ARGB解決方案,但整體質(zhì)感上仍然不丟分。同時(shí),為了方便機(jī)箱空間受限的用戶理線,本次RTX 5080 Founder’s Edition GPU的12VHPWR電源接口也像當(dāng)年的RTX 3090Ti Founder’s Edition一樣采用了斜45度設(shè)計(jì),可以說(shuō)是充滿巧思了。
整卡在做工上還是延續(xù)了NVIDIA Founder’s Edition GPU一如既往的精致,尤其是在本代引入雙流散熱架構(gòu),全面縮小尺寸后精致感更是進(jìn)一步凸顯。
顯卡背部則是密集的金屬鰭片,金屬制的框架不僅讓顯卡的整體視覺(jué)語(yǔ)言協(xié)調(diào)一致,還為用戶提供了一個(gè)方便的握持區(qū)域避免損傷鰭片影響散熱效率。對(duì)于RTX 5080 Founder’s Edition這樣一張?jiān)跇?biāo)準(zhǔn)FHFL尺寸下需要壓制360W TGP的GPU來(lái)說(shuō)尤為重要。
由于本次RTX 50系FE版GPU采用了全新的雙流散熱架構(gòu),為了避免風(fēng)從IO擋板處流出影響散熱能力,NVIDIA將整個(gè)IO擋板封上,只保留了螺絲孔和視頻IO。前面介紹RTX 50系架構(gòu)的時(shí)候我們提到過(guò),本代GPU在視頻輸出規(guī)格上顯著進(jìn)步,支持了80Gbps的DP 2.1接口,不僅應(yīng)對(duì)當(dāng)下的4K高刷顯示器毫無(wú)壓力,即使面對(duì)未來(lái)的8K高刷顯示器,在DSC等技術(shù)的加持下也仍有一戰(zhàn)之力,三DP+HDMI的策略也帶來(lái)了相當(dāng)?shù)目捎眯浴?/p>
上機(jī)測(cè)試
我們使用最新的Intel Core Ultra 9 285K處理器搭配MSI Z890 EDGE TI WIFI主板搭建了我們的測(cè)試平臺(tái),能夠全面發(fā)揮本次測(cè)試的GeForce RTX 5080 Founder’s Edition GPU的性能表現(xiàn)。而作為對(duì)比的則是去年年底剛剛發(fā)布的老將GeForce RTX 4080 SUPER Founder‘s Edition,它同樣搭載了一顆完整規(guī)模的GPU,擁有過(guò)萬(wàn)的CUDA核心,與RTX 5080 FE相比可謂棋逢對(duì)手。詳細(xì)的配置單可以參考這張表格。
一顆GPU最底層的性能還是光柵算力,在3Dmark的經(jīng)典光柵測(cè)試項(xiàng)目中,我們可以看到RTX 5080在三種分辨率、兩種圖形API的項(xiàng)目中帶來(lái)了相當(dāng)顯著的性能提升,這一點(diǎn)也能直接反映在游戲的基礎(chǔ)表現(xiàn)上。
光線追蹤是RTX 50系GPU的一大強(qiáng)項(xiàng)。
當(dāng)然,真正的重頭戲還是DLSS 4。NVIDIA為我們提供了一份能夠測(cè)試DLSS 4的3Dmark副本,我們?cè)谶@個(gè)副本中針對(duì)DLSS 4的性能表現(xiàn)進(jìn)行了一些簡(jiǎn)單的測(cè)試。首先可以看到,即使使用DLSS 3技術(shù)棧,RTX 5080的性能仍然顯著強(qiáng)于RTX 4080 SUPER,不僅在原生渲染下高了8幀,在DLSS 3下還能高出11幀,而引入Transformer模型和全套DLSS 4技術(shù)棧后還能再高出約10幀。從這個(gè)對(duì)比可以看出來(lái),RTX 5080中引入的、用于替換硬件光流加速器的AI確實(shí)是相當(dāng)高效的存在,DLSS 4的性能表現(xiàn)十分值得期待。
來(lái)玩游戲
既然都用上RTX 5080 GPU了,那我們當(dāng)然需要在游戲中品鑒一下DLSS 4帶來(lái)的性能與體驗(yàn)提升了。而考慮到GPU規(guī)模和定位,本次評(píng)測(cè)將只專(zhuān)注于4K性能,并且在游戲提供的最高畫(huà)面預(yù)設(shè)下進(jìn)行游戲。同時(shí),由于C N N與Transformer模型的性能差距并非本次評(píng)測(cè)的重點(diǎn),且評(píng)測(cè)時(shí)間確實(shí)受限,筆者將不會(huì)針對(duì)C N N+DLSS多幀生成或DLSS 3+Transformer的性能進(jìn)行完整測(cè)試與分析,敬請(qǐng)各位諒解。
《心靈殺手2》是首批帶來(lái)DLSS 4支持的游戲中相當(dāng)突出的一款,這主要是因?yàn)樗鞘卓钜隢VIDIA RTX Mega Geometry技術(shù)的游戲,這項(xiàng)技術(shù)能夠智能地集中處理并更新復(fù)雜幾何,實(shí)時(shí)進(jìn)行光線追蹤計(jì)算,不僅可以降低CPU占用率、提高游戲幀率,還能夠降低復(fù)雜光線追蹤場(chǎng)景下的顯存消耗。同時(shí),至少在我們測(cè)試使用的開(kāi)發(fā)者預(yù)覽版中,Remedy開(kāi)放了選擇C N N或Transformer模型的權(quán)限,這使得我們可以更全面的對(duì)比幾個(gè)模式下的性能表現(xiàn)。然而,由于它原生針對(duì)DLSS 3.5開(kāi)發(fā)的特性,這也是唯一一款我們?cè)诟弋?huà)面預(yù)設(shè)+高光線追蹤預(yù)設(shè)下進(jìn)行測(cè)試的游戲。
由于這款游戲原生針對(duì)支持光線追蹤技術(shù)的現(xiàn)代GPU開(kāi)發(fā),不需要像其他幾款游戲一樣考慮老舊的第八世代GPU架構(gòu),加之與NVIDIA的深度合作,Remedy Entertainment能夠在自家的Northlight Storytelling Technology引擎中塞入大量先進(jìn)圖形技術(shù),并在藝術(shù)創(chuàng)作中進(jìn)行全面利用。從數(shù)據(jù)中我們可以看到,無(wú)論是上一代的RTX 4080 SUPER還是RTX 5080,在原生渲染的情況下完全無(wú)法應(yīng)對(duì)全景光線追蹤下的嚴(yán)苛壓力,但在開(kāi)啟全套DLSS技術(shù)棧后,游戲的性能表現(xiàn)實(shí)現(xiàn)了突飛猛進(jìn)的增長(zhǎng),只需要開(kāi)啟DLSS 多幀生成x3就能夠輕松實(shí)現(xiàn)4K 120Hz以上的游戲體驗(yàn),可以說(shuō)是相當(dāng)精彩了。
《賽博朋克2077》作為近幾年NVIDIA展示圖形技術(shù)革新的必備作品,在最新的2.21版本更新中正式引入DLSS 4技術(shù),且同樣允許玩家選擇使用傳統(tǒng)的C N N模型還是Transformer模型進(jìn)行游戲,這也為我們提供了一個(gè)在實(shí)際游戲中探索兩者表現(xiàn)的好辦法。
從數(shù)據(jù)上來(lái)看,我們可以清楚地看到,同樣在2X模式下運(yùn)行時(shí),DLSS 3+RTX 4080 SUPER與DLSS 4+RTX 5080的性能表現(xiàn)相差十分顯著,最新的Transformer模型架構(gòu)與Blackwell架構(gòu)的高效相信都居功甚偉。這樣的差距在更高階的多幀生成3X甚至4X模式下顯得更加顯著。
而在《霍格沃茨之遺》與《星球大戰(zhàn):法外狂徒》這兩款同樣引入DLSS 4技術(shù)的游戲中,我們也能看到類(lèi)似規(guī)模的性能提升。
除了我們上面測(cè)試的四款游戲之外,還有很多游戲暫未引入DLSS 4支持。同時(shí),盡管玩家可以通過(guò)NVIDIA app在部分游戲中實(shí)現(xiàn)強(qiáng)開(kāi)DLSS 4,我們出于數(shù)據(jù)可用性的考慮在這篇評(píng)測(cè)中將只覆蓋那些已經(jīng)支持的游戲,而對(duì)于像《黑神話:悟空》這樣的暫未引入DLSS 4的游戲,我們也只能簡(jiǎn)單看看在DLSS 3的技術(shù)管線上,RTX 50系GPU到底能帶來(lái)怎樣的提升了。
由于《黑神話:悟空》暫未引入DLSS光線重建技術(shù)的支持,它對(duì)性能的要求其實(shí)相當(dāng)可觀,兩張GPU在原生渲染下都帶來(lái)了并不出彩的成績(jī)。但是,在開(kāi)啟DLSS 3后,RTX 5080的表現(xiàn)比RTX 4080 SUPER翻倍,提升十分顯著。
AIPC的絕對(duì)核心
對(duì)于當(dāng)代的AIPC產(chǎn)品來(lái)說(shuō),搭載NVIDIA GPU的機(jī)種由于能夠無(wú)縫接入包括CUDA在內(nèi)的全套NVIDIA技術(shù)棧早就成為了發(fā)燒友們的心頭好,而隨著更多應(yīng)用程序開(kāi)始引入AI加速,搭載RTX 50系GPU的AIPC平臺(tái)也成為了生產(chǎn)力應(yīng)用的好幫手。
對(duì)于工業(yè)級(jí)AI比較了解的讀者一定聽(tīng)說(shuō)過(guò)MLPerf的大名。作為行業(yè)標(biāo)準(zhǔn)級(jí)別的AI測(cè)試套件,我們本次引入了MLPerf Client這一面向端側(cè)應(yīng)用的AI測(cè)試套件。它基于Meta開(kāi)源的LLaMA 2模型,能夠有效測(cè)試系統(tǒng)在常見(jiàn)AI負(fù)載下的理論性能,我們以Token Generation Rate值為基準(zhǔn)進(jìn)行比較??梢钥吹?,在所有四種負(fù)載中,RTX 5080的性能都顯著強(qiáng)于RTX 4080 SUPER。
除了偏理論的MLPerf Client,我們還能夠通過(guò)Procyon套件測(cè)試RTX 5080 GPU在文生圖與LLM應(yīng)用下的實(shí)際性能表現(xiàn),先來(lái)看看文生圖。需要注意的是,由于文生圖項(xiàng)目我們以GPU生成圖片的時(shí)間值制表,這里數(shù)值越低代表性能越好??梢钥吹?,在硬件支持FP4后,即使規(guī)格相近,RTX 5080的性能表現(xiàn)仍然擁有相當(dāng)可觀的增幅。
而在大語(yǔ)言模型測(cè)試環(huán)節(jié),我們也看到了不可小覷的性能進(jìn)步。
當(dāng)然,并非所有生產(chǎn)力應(yīng)用都引入了AI加速,那作為算力基座,這張RTX 5080 GPU表現(xiàn)如何呢?我們使用同樣屬于業(yè)界標(biāo)準(zhǔn)的SPECviewperf 2020 V3.1進(jìn)行了全套的性能測(cè)試。從結(jié)果上可以看到,RTX 5080實(shí)現(xiàn)了相當(dāng)可觀且大幅度的領(lǐng)先,尤其是在Maya與Solidworks兩項(xiàng)個(gè)人用戶相當(dāng)多的測(cè)試中提升十分顯著。
而Vray6渲染器測(cè)試中,我們也看到了相當(dāng)出色的性能表現(xiàn)。
總結(jié)
從上面的測(cè)試我們可以看出,NVIDIA GeForce RTX 5080全面繼承了上一代RTX 40系A(chǔ)da GPU在各類(lèi)應(yīng)用程序中的頂級(jí)性能表現(xiàn)并更上一層樓。從底層核心架構(gòu)到上層DLSS軟件生態(tài)的徹底變革,為用戶與開(kāi)發(fā)者解鎖了更多的可能性。甚至,筆者認(rèn)為RTX 50系GPU的發(fā)布意味著電子游戲業(yè)界像《奪寶奇兵:古老之圈》那樣真正將光線追蹤與AI上采樣納入游戲的底層設(shè)計(jì)的元年已經(jīng)來(lái)到??梢哉f(shuō),無(wú)論是游戲玩家內(nèi)容創(chuàng)作者 AI工作者還是工業(yè)用戶,RTX 50系GPU,尤其是RTX 5080這款GPU,是一個(gè)腳踏實(shí)地面向未來(lái)的GPU平臺(tái)。
而對(duì)于這張F(tuán)E公版RTX 5080而言,光是嶄新的散熱設(shè)計(jì)帶來(lái)的顯著更優(yōu)秀的機(jī)箱兼容性就足以讓像筆者這樣的各類(lèi)迷你主機(jī)顯卡塢等用戶垂涎三尺,更不要說(shuō)它還搭載了高性能的GPU核心。由于RTX 5090D GPU并不提供FE版,這張NVIDIA GeForce RTX 5080 Founders’ Edition也是目前國(guó)內(nèi)有售的雙槽非渦輪GPU中性能最強(qiáng)的產(chǎn)品,在市場(chǎng)上可以說(shuō)是相當(dāng)具有競(jìng)爭(zhēng)力了。
那個(gè)曾經(jīng)的彈幕文化,終究還是回不去了啊。
最關(guān)鍵的,誰(shuí)?能想到看小電影也要發(fā)彈幕???
從元宇宙到AI,每當(dāng)新風(fēng)口出現(xiàn),總有一批"轉(zhuǎn)型勇士"帶著PPT勇闖天涯。