服務(wù)熱線
0755-83647532
發(fā)表日期:2020-09-17 文章編輯: 閱讀次數(shù):
一、前言:RTX 3080的到來 和說好的完全不一樣
3D圖形卡領(lǐng)域的第一次革命是1999年NVIDIA公司GeForce 256,它集成的T&L技術(shù)(硬件光影轉(zhuǎn)換),將光影處理從CPU中接手過來,解放了CPU的同時(shí)也極大的提高了游戲的性能以及畫面的真實(shí)性。
T&L技術(shù)之后3D圖形技術(shù)的另一次飛躍則是2006年的基于統(tǒng)一渲染構(gòu)架的DX10。它將此前的Vertex Shader(頂點(diǎn)著色器)和Pixel Shader(像素著色器)統(tǒng)一為streaming processor(流處理器),自此之后設(shè)計(jì)的GPU都不會(huì)再開辟獨(dú)立的管線,而是所有的流處理器運(yùn)算單元都可以任意處理任何一種Shader運(yùn)算,使得GPU的運(yùn)算效率得到了成倍的提升。
爾后10年,GPU領(lǐng)域沒有突破性的技術(shù)出現(xiàn),DX12屬于雷聲大雨點(diǎn)小,對(duì)性能的提升并沒有想象中的那么美好,Physx則是曲高和寡。
直到2018年8月,實(shí)時(shí)光線追蹤技術(shù)的出現(xiàn),將3D游戲的畫面推向了一個(gè)新的高度,玩家第一次在游戲中見到了如同科幻電影般的科幻電影般的光影世界。
圖靈GPU發(fā)布之后,NVIDIA的市值一路飆升,甚至超越了Intel。財(cái)大氣粗的老黃沒有讓我們等太久,僅僅二年的時(shí)間,NVIDIA再一次革新了GPU構(gòu)架。
2020年9月4日發(fā)布的基于新一代Ampere安培架構(gòu)的GeForce RTX 30系列顯卡統(tǒng)一了INT32與FP32單元,原本只能做整數(shù)運(yùn)算的INT32單元現(xiàn)在既能做整數(shù)運(yùn)算,也能做單精度浮點(diǎn)運(yùn)算。
這一項(xiàng)技術(shù)革新將傳統(tǒng)意義上的流處理器數(shù)量直接翻倍,同時(shí)GPU的浮點(diǎn)運(yùn)算能力也提升了一倍。于是我們就看到了RTX 3080的流處理器數(shù)量直接從RTX 2080的2954個(gè)暴增到了8704個(gè),恍然間仿佛又回到了8800GTX時(shí)代。
完整的GA102共有7組GPC,每組GPC有12組SM單元外加16組ROP單元,總計(jì)是84組SM單元與112個(gè)ROP單元。
RTX 30系列顯卡視乎規(guī)格不同啟用的SM單元總數(shù)不同,RTX 3090是7組TPC、24組SM單元與112個(gè)ROP單元,RTX 3080是6組TPC、68組SM單元與96個(gè)ROP,RTX 3070是6組TPC、46組以及96個(gè)ROP。
這是GA102核心的SM單元構(gòu)架,每個(gè)SM單元有64個(gè)INT32整數(shù)核心、64個(gè)FP32單精度浮點(diǎn)核心、4個(gè)第三代TENSOR COREs以及以及1個(gè)第二代RT CORE。
這里的INT32單元可以根據(jù)需求進(jìn)行單精度整數(shù)或者浮點(diǎn)運(yùn)算,也就是說理論上一個(gè)SM單元可以擁有高達(dá)128個(gè)FP32單元。
融合了一級(jí)緩存與共享緩存,每SM單元中緩存總?cè)萘繛?28KB,可以按需靈活分配給一級(jí)緩存與共享緩存(Shared Memory),可以是64KB+64KB的組合,也可以是32KB+96KB的組合。
此次NVIDID一共發(fā)布了3款GA10X核心的顯卡型號(hào)。
RTX 3090:擁有7組GPC,82組SM單元共計(jì)10496個(gè)流處理器、112個(gè)ROP、328個(gè)紋理單元、328個(gè)第三代Tensor Cores、82個(gè)第二代RT Cores。搭配24GB GDDR6X顯存,顯存頻率19.5GHz、
位寬384Bit,帶寬936GB/s。相比于Titan RTX快了50%,9月24日上市,售價(jià)11999元。
RTX 3080:擁有6組GPC,68組SM單元共計(jì)8704個(gè)流處理器、96個(gè)ROP、272個(gè)紋理單元、272個(gè)第三代Tensor Cores、68個(gè)第二代RT Cores。搭配10GB GDDR6X顯存,顯存頻率19GHz、
位寬320Bit,帶寬760GB/s。綜合性能是RTX 2080的二倍,9月17日上市,售價(jià)5499元。
RTX 3070:GA104核心,擁有6組GPC,46組SM單元共計(jì)5888個(gè)流處理器、96個(gè)ROP、184個(gè)紋理單元、184個(gè)第三代Tensor Cores、46個(gè)第二代RT Cores。搭配8GB GDDR6顯存,顯存頻率14GHz、位寬256Bit,帶寬448GB/s。綜合性能與RTX 2080 Ti但價(jià)格只有一半,10月份上市,售價(jià)3899元。
RTX 3080的詳細(xì)規(guī)格如下:
二、安培構(gòu)架解析:流處理器數(shù)量翻倍是否言過其實(shí)?
在圖靈誕生之前,GPU核心中并沒有單獨(dú)的INT32單元,從Kepler到Maxwell到再到Pascal,每一個(gè)CUDA核心都就是由FP32單元構(gòu)成。
而Turing每一個(gè)CUDA核心除了有一個(gè)FP32的單精度浮點(diǎn)單元之外,還有對(duì)應(yīng)有一個(gè)INT32的單精度整數(shù)單元。
在現(xiàn)代游戲(例如古墓麗影:暗影)中,每100條指令操作中有62條是浮點(diǎn)指令操作,38條是整數(shù)指令操作。以往GPU在只能單獨(dú)、交替的執(zhí)行浮點(diǎn)和整數(shù)運(yùn)算,圖靈構(gòu)架加入了整數(shù)運(yùn)算單元之后,可以與浮點(diǎn)單元一起并發(fā)執(zhí)行,可以將流處理器的執(zhí)行效率提升36%。
不過在游戲中整數(shù)運(yùn)算量遠(yuǎn)遠(yuǎn)低于浮點(diǎn)運(yùn)算量(38:62),因此經(jīng)常會(huì)有大量的INT32單元被閑置。為了解決這個(gè)問題,提升INT32單元的利用率,NVIDIA改進(jìn)了INT32單元,使之不僅可以運(yùn)行整數(shù)運(yùn)算,也能進(jìn)行單精度浮點(diǎn)運(yùn)算。
如上圖所示,在安培構(gòu)架中,每個(gè)SM單元中的64個(gè)FP32單元依舊保留,而INT32單元?jiǎng)t被賦予了更多的使命,它不僅能進(jìn)行整數(shù)運(yùn)算,但是在不需要進(jìn)行整數(shù)運(yùn)算的情況下,它也能和FP32一樣進(jìn)行單精度浮點(diǎn)運(yùn)算。
也就是說,每個(gè)SM單元可以同時(shí)執(zhí)行4x(16FP32+16FP32)=128個(gè)FP32運(yùn)算,或者4x(16FP32+16INT32)=64個(gè)FP32+64個(gè)INT32運(yùn)算。
在理想的情況將下,一個(gè)SM單元中的64個(gè)INT單元全部都做單精度浮點(diǎn)運(yùn)算的話,那么流處理器(FP32單元)數(shù)量將會(huì)直接變成128個(gè)。相對(duì)而言,圖靈構(gòu)架一個(gè)SM單元只有固定的64個(gè)流處理器。
RTX 3080擁有68個(gè)SM單元,理論上能達(dá)到8704個(gè)流處理器的規(guī)模。很多同學(xué)可能懷疑NVIDIA在騙我們,這些流處理器是否能夠同時(shí)工作還是個(gè)問號(hào)。
下面我們使用AIDA64 GPGPU進(jìn)行驗(yàn)證,看看RTX 3080的8704個(gè)流處理器是否言過其實(shí)。
如果依據(jù)1710MHz的頻率和8704個(gè)FP32單元來計(jì)算RTX 3080的理論浮點(diǎn)性能應(yīng)當(dāng)是29767GFLOPS。
實(shí)測(cè)RTX 3080的單精度浮點(diǎn)運(yùn)算性能是29117GFLOPS,略低于理論值。這是因?yàn)?20W TDP的限制,RTX 3080在進(jìn)行GPGPU單精度浮點(diǎn)測(cè)試時(shí),GPU核心的滿載頻率只有1672MHz并沒有達(dá)到默頻的1710MHz。
不過從這里可以看出,RTX 3080的的確確擁有8704個(gè)流處理器(FP32單元),現(xiàn)在已經(jīng)沒有什么好質(zhì)疑的了。
實(shí)測(cè)RTX 2080 Ti的單精度浮點(diǎn)運(yùn)算性能是16626GFLOPS,接近RTX 3080的6成。
實(shí)際上,在進(jìn)行GPGPU測(cè)試時(shí),RTX 2080 Ti的運(yùn)行頻率達(dá)到了1910MHz,所以雖然流處理器數(shù)量只有一半,但是浮點(diǎn)性能卻能達(dá)到6成。
RTX 2080在進(jìn)行GPGPU測(cè)試時(shí),運(yùn)行頻率更是高達(dá)1938MHz,單精度浮點(diǎn)運(yùn)算性能達(dá)到了11416GFLOPS,約為RTX 3080的40%。要知道RTX 2080 2944個(gè)流處理器只相當(dāng)于RTX 3080 8704個(gè)流處理器的1/3。
所以現(xiàn)在大家應(yīng)該知道了RTX 3080 TDP如此之高的原因!即便是320W的TDP,也難以滿足讓8704個(gè)流處理器以較高的頻率運(yùn)行的功耗需求。
三、安培構(gòu)架解析:RTX IO技術(shù)實(shí)現(xiàn)“秒進(jìn)游戲”
多年以前,當(dāng)筆者還在用機(jī)械硬盤的時(shí)候,想象著如果硬盤能像內(nèi)存一樣快,就可以秒進(jìn)游戲,不用再等待漫長(zhǎng)的加載了!
索尼新一代的次世代主機(jī)PS5有一個(gè)賣點(diǎn),憑借著讀取速度高達(dá)5.5GB/s的高性能SSD,可以實(shí)現(xiàn)“秒進(jìn)游戲功能”。
不過事實(shí)上,這里的秒進(jìn)游戲是有限制的,它只是進(jìn)入了游戲的菜單界面,并沒有進(jìn)入能夠控制人物行動(dòng)的游戲畫面。并且實(shí)際上即便PS5的SSD讀取速度再翻倍增長(zhǎng)到10GB/s,也難以實(shí)現(xiàn)秒進(jìn)游戲畫面。
傳統(tǒng)的游戲數(shù)據(jù),首先要從磁盤讀取到內(nèi)存。然而從硬盤復(fù)制過來的游戲數(shù)據(jù)包是無法直接使用的,需要CPU先將將數(shù)據(jù)解包。特別是GPU要使用的時(shí)候,數(shù)據(jù)通過CPU解包之后再經(jīng)由PCIe總線傳遞給顯存。
當(dāng)SSD速度足夠快的時(shí)候,CPU解包速度就會(huì)成為決定了游戲加載時(shí)間的長(zhǎng)短。然而CPU只是一塊通用處理器,進(jìn)行專業(yè)運(yùn)算時(shí)的性能極其有限。市面上常見的MMORPG以及電子競(jìng)技游戲,最強(qiáng)的i9-10900K處理器大概要經(jīng)過10秒的運(yùn)算才能完成全部的解包工作。
也就是說,即便你用超大容量DDR4內(nèi)存做成虛擬硬盤,將整個(gè)游戲放入內(nèi)存盤中,也需要10秒左右的時(shí)間才能完全進(jìn)去游戲。
NVIDIA的RTX IO技術(shù),可以讓游戲在加載時(shí)完全規(guī)避CPU,直接從SSD寫入到GPU的顯存中。GPU的浮點(diǎn)性能數(shù)十倍于CPU,可以瞬間完成數(shù)據(jù)的解包工作。
此時(shí)若你當(dāng)你配備了足夠快速的SSD(比如Intel 905P),就能實(shí)現(xiàn)秒進(jìn)游戲的功能,從此不用再等待漫長(zhǎng)的游戲加載過程。
RTX IO技術(shù)需要DirectStorage API的支持。根據(jù)微軟的計(jì)劃,DirectStorage在2021年會(huì)向游戲開發(fā)商遞交開發(fā)預(yù)覽,正式開始應(yīng)用可能需要等到2022年。
四、安培構(gòu)架解析:新的ROP單元、NVIDIA Reflex 、NVIDIA Broadcast
1、ROP單元的改變
也許很多同學(xué)不知道,以往的NVDIA GPU,ROP單元一直都是被集成在內(nèi)存控制器中!
也就是說同樣一顆GPU,如果位寬不變,只是閹割流處理器的話,它的ROP數(shù)量是不會(huì)變的。例如GTX 1080與GTX 1070同為GP104核心,位寬都是256Bit,所以他們的ROP數(shù)量都是64個(gè)。即便是GTX 1080有2560個(gè)流處理器,GTX 1070被閹割到了1920個(gè)也不會(huì)對(duì)ROP數(shù)量產(chǎn)生影響。
而同一顆GPU核心,如果閹割位寬的話,那么它的ROP數(shù)量相應(yīng)地變少!例如GTX 1080 Ti與TITAN X Pascal同為GP102核心,TITAN X Pascal擁有完整的384Bit位寬,因而它的ROP數(shù)量也是完整的96個(gè)。而GTX 1080 Ti由于顯存位寬被閹割到了352Bit,ROP數(shù)量也就減少到了88個(gè)。
從GA10x GPU開始,ROP單元正式成為了GPC的一部分,用于匹配流處理器,以改善抗鋸齒性能。完整的GA102核心有7個(gè)GPC,每個(gè)GPC內(nèi)置16個(gè)GPC,共112個(gè)ROP。
2、NVIDIA Reflex
游戲玩家,特別是網(wǎng)絡(luò)游戲?qū)ρ舆t很敏感,這個(gè)延遲不僅僅跟網(wǎng)絡(luò)、顯卡性能有關(guān),還跟系統(tǒng)有關(guān),包括鍵鼠的輸入延遲等。
NVIDIA Reflex就是一款可以降低延遲的工具,在支持該技術(shù)的游戲中,如《Apex英雄》、《使命召喚:戰(zhàn)區(qū)》、《堡壘之夜》、《VALORANT》等熱門電競(jìng)游戲,可將延遲降低50%。
此外,NVIDIA Reflex未來還會(huì)有個(gè)Reflex延遲分析器(Reflex Latency Analyzer),它可監(jiān)測(cè)鼠標(biāo)點(diǎn)擊,并測(cè)量屏幕上相應(yīng)像素變化所需的時(shí)間,比如槍焰閃光,效果堪比超過7000美元的專用高速攝像機(jī)和設(shè)備。
3、NVIDIA Broadcast:游戲直播助手
如今游戲跟直播息息相關(guān),NVIDIA Broadcast軟件可以讓游戲主播更加輕松省力,它通過顯卡的AI加速實(shí)現(xiàn)了多種功能,比如噪音消除、虛擬背景、自動(dòng)框顯,從而提升麥克風(fēng)和網(wǎng)絡(luò)攝像頭的效果。
五、圖賞:有史以來做工最好的公版顯卡 很完美的風(fēng)道設(shè)計(jì)
包裝盒的風(fēng)格從圖靈時(shí)代的綠黑配色變成了純黑色。
打開包裝盒除了顯卡之外,還附贈(zèng)一條雙8Pin轉(zhuǎn)12Pin的轉(zhuǎn)接線。
顯卡的正面有一個(gè)風(fēng)扇,吹出的熱風(fēng)是直接從I/O接口處排出,可以極大程度上緩解機(jī)箱的散熱壓力。
背面也有一個(gè)風(fēng)扇,風(fēng)是直接往機(jī)箱下面吹,并不是像部分玩家想象的那樣將熱風(fēng)吹向了CPU。
由于沒有PCB的阻擋,即便是在較低的轉(zhuǎn)速下,風(fēng)扇也能夠更加輕松的吹透散熱鰭片。
頂部視角圖,中間有一個(gè)12Pin供電接口。
12Pin接口特寫。
底部視角圖。
需要注意的是,雖然頂部與頂部看起來有鰭片暴露在外,但實(shí)際上這兩2處并不會(huì)出風(fēng),也就是不會(huì)有熱量排出,可以避免傷害通常位于顯卡下面的NVMe SSD,不至于溫度過高。
背面的風(fēng)扇。
取消了Type-C接口,只有3個(gè)DP 1.4與一個(gè)HDMI 2.1接口。
拆下來的散熱器。
散熱底座周圍都是大面積的均熱板,GDDR6X顯存也有導(dǎo)熱背貼覆蓋,顯存的溫度也能得到很好的控制。
金屬背板。
非常奇特的PCB設(shè)計(jì)。18相供電電路設(shè)計(jì),另外還有2個(gè)空焊位,應(yīng)該會(huì)在RTX 3090補(bǔ)齊,屆時(shí)會(huì)有20相供電。
PCB板的背面,由于空間原因,供電電容被放在了這一面。
NVIDIA非常激進(jìn),每一相供電竟然配備了3個(gè)高成本的鉭電容。
GA102-200-KD-A1核心,8704個(gè)流處理器,核心面積628.4mm2,擁有283億個(gè)晶體管。
供電電路特寫。
美光的GDDR6X顯存,一共有10顆,單顆容量1GB,總?cè)萘?0GB。頻率19GHz,位寬320Bit,顯存帶寬760GB/s。
12Pin供電接口填寫。
輸出接口特寫。
PCB背面的鉭電容。
六、測(cè)試平臺(tái):全核5.2GHz的i9-10900K + 皇家戟4000MHz C15 32GB內(nèi)存
在i9-10900K與銳龍9 3900X之間糾結(jié)了一下,最終還是選擇了i9-10900K處理器。為了降低CPU的瓶頸效應(yīng),我們將i9-10900K的核心頻率超頻到了5.2GHz,Ring頻率超頻到了4.8GHz。
主板用的是ROG MAXIMUS XII EXTREME。這款主板采用16+0供電,16相供電全部給了CPU核心,0相給核顯。MosFET升級(jí)為TDA21490,這是目前最高規(guī)格的一體化MOSFET,導(dǎo)通電流也從55A提高到了90A,可以輕易提供超過1000W的輸出功率。
芝奇皇家戟F4-4000C15D 8GBx4套裝,不僅擁有4000MHz的頻率,15-16-16-36的時(shí)序也是低的嚇人,比絕大部分3000MHz頻率的內(nèi)存都要低,不過默認(rèn)電壓1.5V也算是比較高的了。
長(zhǎng)江存儲(chǔ)致鈦PC005 Active 512GB SSD,順序讀寫速度分別為3500MB/s,2900MB/s。不依賴模擬SLC緩存也能保持550MB/s的穩(wěn)定寫入速度,同時(shí)壽命遠(yuǎn)遠(yuǎn)高于市面上絕大多數(shù)TLC SSD。
酷冷至尊P360 ARGB水冷散熱器,應(yīng)該是市面上顏值最高也最易安裝的水冷散熱器,可以很輕松的壓制5.2GHz的i9-10900K處理器。
華碩玩家國度PG27UQ ROG 27英寸IPS電競(jìng)顯示器。
4K UHD(3840*2160)分辨率、4ms響應(yīng)時(shí)間、144Hz刷新率、G-Sync 技術(shù)、IPS+量子點(diǎn)面板、10bit色彩、DisPlay HDR1000認(rèn)證。依舊是目前市面上頂級(jí)的電競(jìng)顯示器。
七、理論性能測(cè)試:3DMark Fire Strike Extreme首破2萬 默頻可達(dá)2025MHz
1、3DMark Time Spy
在2K分辨率3DMark Time Spy測(cè)試中,RTX 3080圖形分?jǐn)?shù)達(dá)到了17698分,核心溫度最高76℃,核心運(yùn)行最高頻率為1965MHz,最高風(fēng)扇轉(zhuǎn)速1787RPM,最高功耗329W。
在4K分辨率3DMark Time Spy Extreme測(cè)試中,RTX 3080圖形分?jǐn)?shù)達(dá)到了8876分,核心溫度最高76℃,核心運(yùn)行最高頻率為1750MHz,最高風(fēng)扇轉(zhuǎn)速1810RPM,最高功耗335W。
從3DMark Time Spy的成績(jī)來看,RTX 3080在2K分辨率下的分?jǐn)?shù)比RTX 2080高了將近7000分,領(lǐng)先幅度為62%;與RTX 2080 Ti相比,也能多出3630分,領(lǐng)先幅度為26%。
在4K分辨率下,RTX 3080比RTX 2080多了3787分,領(lǐng)先幅度來帶了74%;相比RTX 2080 Ti也有2249分的優(yōu)勢(shì),強(qiáng)了34%左右。
2、3DMark
在2K分辨率3DMark Fire Strike Extreme測(cè)試中,RTX 3080圖形分?jǐn)?shù)達(dá)到了20979分,核心溫度最高68℃,核心運(yùn)行最高頻率為2025MHz,最高風(fēng)扇轉(zhuǎn)速1323RPM,最高功耗333W。
在4K分辨率3DMark Fire Strike Ultra測(cè)試中,RTX 3080圖形分?jǐn)?shù)達(dá)到了10785分,核心溫度最高63℃,核心運(yùn)行最高頻率為1995MHz,最高風(fēng)扇轉(zhuǎn)速1521RPM,最高功耗322W。
RTX 3080是第一張3DMark Fire Strike Extreme圖形分?jǐn)?shù)破2萬的顯卡。在2K分辨率下,它比RTX 2080多了7897分,領(lǐng)先幅度為60%;比RTX 2080 Ti則要強(qiáng)了29%。
到了4K分辨率下,RTX 3080能比RTX 2080多4403分,領(lǐng)先優(yōu)勢(shì)為70%,同時(shí)比RTX 2080 Ti也要快了34%。
八、1080P分辨率測(cè)試:5.2GHz的i9-10900K也無法發(fā)揮它的全部性能
1、APEX英雄
《Apex英雄》沒有提供測(cè)試程序,為了減少測(cè)試時(shí)變量的干擾,我們選取在訓(xùn)練場(chǎng)進(jìn)行幀數(shù)測(cè)試,測(cè)試時(shí)手動(dòng)調(diào)整為最高畫質(zhì)。我們?cè)谟?xùn)練場(chǎng)錄得的幀率與實(shí)戰(zhàn)時(shí)的幀率較為接近,因此有一定的參考價(jià)值。
在《APEX》中,RTX 3080的幀率達(dá)到了284FPS,比RTX 2080 Ti高出51幀,比RTX 2080高了104幀。
2、使命召喚16:戰(zhàn)區(qū)
《使命召喚:戰(zhàn)區(qū)》在1080P分辨率最高畫質(zhì)下,RTX 3080能輕松跑出221FPS,比RTX 2080 Ti高了48幀,比RTX 2080多出64幀。
3、GTA V
以下是我們?cè)凇禛TA V》中的參數(shù)設(shè)置,1080P分辨率下,顯存占用為3442MB。另外,在進(jìn)階影像設(shè)定中,所有設(shè)置項(xiàng)都調(diào)到了最高值。
《GTA V》在1080P分辨率下處理器性能是最大的瓶頸,即便如此,RTX 3080也跑出了139FPS的幀率,比RTX 2080 Ti高5幀,比RTX 2080高了11幀。
4、刺客信條:奧德賽
RTX 3080在《刺客信條:奧德賽》1080P分辨率下跑出了超過百幀的成績(jī),比RTX 2080 Ti高了11幀,比RTX 2080高了22幀。
5、德軍總部:新血脈
RTX 3080在《德軍總部:新血脈》中跑出了驚人的351FPS的幀率,比RTX 2080 Ti多了65幀,比RTX 2080多了113幀。
6、地平線:零之曙光
在1080P分辨率下,RTX 3080的幀率是135FPS,比RTX 2080 Ti多了16幀,比RTX 2080多了37幀。
7、孤島驚魂5
在i9-10900K的強(qiáng)力支援下,RTX 3080的《孤島驚魂5》1080P幀率也有183FPS,不過這個(gè)游戲在1080P分辨率時(shí)過于需求CPU,因此并沒有和RTX 2080 Ti拉開多少差距,只有2幀的優(yōu)勢(shì),不過比RTX 2080則多了29幀。
8、古墓麗影:暗影
即便是超頻到5.2GHz的i9-10900K處理器,在將近一半的場(chǎng)景中渲染耗時(shí)都高于RTX 3080。
《古墓麗影:暗影》同樣也是一個(gè)極度需求CPU性能的游戲,雖然i9-10900K依舊是瓶頸所在,但RTX 3080還是跑出了193FPS的恐怖幀率,比RTX 2080 Ti多了30幀,比RTX 2080多了56幀。
9、絕地求生
突破300幀了。
有了RTX 3080,即便是240Hz的顯示器也能被喂飽。RTX 3080的幀率達(dá)到了316FPS,比RTX 2080 Ti多了47幀,比RTX 2080多了115幀。
10、微軟模擬飛行2020
顯卡殺手級(jí)的游戲!我們選擇的是訓(xùn)練場(chǎng)景。
在《微軟模擬飛行2020》中,RTX 3080的幀率為116FPS,比RTX 2080 Ti多了21幀,超出RTX 2080有37幀。
11、死亡擱淺
在這個(gè)游戲中,RTX 3080跑出了217FPS的幀率,比RTX 2080 Ti多了31幀,比RTX 2080要多60幀。
12、巫師3
原本《巫師3》是一款非常消耗GPU的游戲,然后RTX 3080實(shí)在太強(qiáng),導(dǎo)致i9-10900K第一次在這款游戲中成為了瓶頸,跑出了158FPS,比RTX 2080 Ti高了16幀,比RTX 2080高了41幀。
13、無主之地3
在《無主之地3》中,RTX 3080的幀率為119FPS,比RTX 2080 Ti剛好多了10幀,比RTX 2080多了35幀。
14、戰(zhàn)地5
《戰(zhàn)地5》鎖死了200幀,于是RTX 3080就跑出了200幀,比RTX 2080 Ti高了13幀,比RTX 2080多了47幀。
15、戰(zhàn)爭(zhēng)機(jī)器5
1080P分辨率下,RTX 3080在《戰(zhàn)爭(zhēng)機(jī)器5》中能跑出168FPS,比RTX 2080 Ti高了32幀,比RTX 2080多了47幀。
對(duì)于頂級(jí)新卡而言,1080P分辨率下CPU的性能是系統(tǒng)瓶頸所在,不過在這個(gè)分辨率下RTX 3080依然能比RTX 2080強(qiáng)38,比RTX 2080 Ti快16%。
九、4K分辨率測(cè)試:比RTX 2080 Ti強(qiáng)30%
本來2K分辨率測(cè)試不在計(jì)劃之內(nèi),考慮到現(xiàn)在不少玩家都用上2K分辨率顯示器,臨時(shí)決定將此分辨率加入測(cè)試,在這里只向大家展示測(cè)試數(shù)據(jù)。
接下來是4K分辨率的測(cè)試。
1、APEX英雄
在4K分辨率下,RTX 3080的幀率依然突破了百幀,比RTX 2080 Ti多了32幀,比RTX 2080多了49幀。
2、使命召喚16:戰(zhàn)區(qū)
在《使命召喚:戰(zhàn)區(qū)》中,RTX 3080依然突破百幀,比RTX 2080 Ti多了29幀,領(lǐng)先幅度為40%,比RTX 2080高出43幀,領(lǐng)先幅度超過了70%。
3、GTA V
在4K分辨率下,《GTA V》才能發(fā)揮出顯卡的真正性能,RTX 3080跑出了93幀,比RTX 2080 Ti多了21幀,領(lǐng)先幅度為29%;相比RTX 2080則多出了35幀,領(lǐng)先幅度為60%。
4、刺客信條:奧德賽
《刺客信條:奧德賽》這個(gè)游戲不虧是顯卡殺手,在4K分辨率下,RTX 3080也這是剛好過了60幀,比RTX 2080 Ti多了13幀,領(lǐng)先幅度為25%;相比RTX 2080則能多出22幀,領(lǐng)先幅度為52%。
5、德軍總部:新血脈
RTX 3080在《德軍總部:新血脈》中跑出了150FPS的成績(jī),比RTX 2080 Ti多了30幀,比RTX 2080多了55幀。
6、地平線:零之曙光
在《地平線:零之曙光》這個(gè)游戲中,RTX 3080的幀率為69FPS,比RTX 2080 Ti高了15幀,領(lǐng)先幅度為26%;和RTX 2080相比,能多出26幀,領(lǐng)先幅度為60%。
7、孤島驚魂5
在《孤島驚魂5》中,RTX 3080的幀率為98FPS,比RTX 2080 Ti多了21幀,領(lǐng)先優(yōu)勢(shì)為27%;比RTX 2080則多了38幀,領(lǐng)先優(yōu)勢(shì)為63%。
8、古墓麗影:暗影
在《古墓麗影:暗影》中,RTX 3080的幀率為83FPS,比RTX 2080 Ti多了20幀,領(lǐng)先幅度為32%;相比RTX 2080則多了34幀,領(lǐng)先幅度接近70%。
9、絕地求生
《絕地求生》中,RTX 3080在4K分辨率下依然能跑出134FPS,比RTX 2080 Ti強(qiáng)了34%,比RTX 2080則要強(qiáng)了74%。
10、微軟模擬飛行
《微軟模擬飛行2020》果然是真硬件殺手,RTX 3080在4K分辨率下也沒能超過60FPS,但是比RTX 2080 Ti強(qiáng)了31%,比RTX 2080則要快了64%。
11、死亡擱淺
RTX 3080在《死亡擱淺》能夠很輕松的跑出112FPS,比RTX 2080 Ti的85FPS高了27幀,領(lǐng)先幅度為32%;和RTX 2080相比則多了43幀,強(qiáng)了62%。
12、巫師3
在《巫師3》中,RTX 3080依然能在4K分辨率下測(cè)得92FPS的幀率,比RTX 2080 Ti高了20幀,領(lǐng)先幅度為28;和RTX 2080相比則多出了34幀,領(lǐng)先優(yōu)勢(shì)為59%。
13、無主之地3
《無主之地3》是RTX 3080第二款沒能到60幀的游戲,雖然59FPS也非常接近了,和RTX 2080 Ti相比能夠有26%的優(yōu)勢(shì),與RTX 2080相比優(yōu)勢(shì)幅度接近80%。
14、戰(zhàn)地5
在4K分辨率下,RTX 3080在《戰(zhàn)地5》中依然跑出了123FPS,比RTX 2080 Ti多了34幀,領(lǐng)先幅度達(dá)到了38%;比RTX 2080多了55幀,領(lǐng)先優(yōu)勢(shì)為81%。
15、戰(zhàn)爭(zhēng)機(jī)器5
在《戰(zhàn)爭(zhēng)機(jī)器5》中,RTX 3080的幀率為80FPS,比RTX 2080 Ti多了16幀,領(lǐng)先幅度為25%;與RTX 2080相比則能多出30幀,領(lǐng)先了60%。
4K分辨率才是RTX 3080真正的戰(zhàn)場(chǎng),相比RTX 2080領(lǐng)先優(yōu)勢(shì)達(dá)到了65%,比RTX 2080 Ti也強(qiáng)了30%,同時(shí)幾乎達(dá)到了AMD RX 5700XT二倍的性能。
十、超頻測(cè)試:放棄
RTX 3080的超頻真是一言難盡!
想一想當(dāng)初從Maxwell的28nm到Pascal的16nm所帶來的頻率提升幅度,原本我們是對(duì)采用8nm制程工藝的GA102芯片抱有很大的期待。畢竟在3DMark中,RTX 3080在默頻下就能自動(dòng)加速到2025MHz,不過結(jié)果卻是令人大跌眼鏡。
經(jīng)過多次嘗試,最終發(fā)現(xiàn)RTX 3080超70MHz之后可以勉強(qiáng)通過3DMark的測(cè)試,并且得分也有些許提升。
不過卻無法通過3DMark Time Spy測(cè)試,即便將超頻幅度降到40MHz也依然如此。超頻40MHz之后在部分游戲中也會(huì)出現(xiàn)崩潰的現(xiàn)象。
既然40MHz都超不了,那就干脆不超核心了,來超顯存看看。
結(jié)果顯存頻率很輕易就從1188MHz(等效于19GHz)超到了1251MHz(等效于20GHz),顯存帶寬也從760GB/s提升到了800GB/s。
不過讓人大跌眼鏡的是,超了顯存之后3DMark的跑分并沒有提升,連一絲都沒有。
看來RTX 3080的超頻幾乎就是雞肋般的存在了,不過考慮到它默頻其實(shí)已經(jīng)很強(qiáng),所以不能超頻也沒有太大遺憾。
十一、溫度與功耗測(cè)試:烤機(jī)20分鐘68度 功耗也并不夸張
RTX 3080的TDP達(dá)到了320W,較RTX 2080的225W高了將近100W,比起RTX 2080 Ti的260W也增加了60W之多。
至于溫度,在我們的RTX 2080/RTX 2080 Ti首發(fā)測(cè)試中,前者的烤機(jī)溫度為75度,而RTX 2080 Ti的烤機(jī)溫度則高達(dá)79度。
下面,讓我們來看看在大幅度增加TDP之后,RTX 3080的溫度與功耗實(shí)際表現(xiàn)如何。
1、溫度測(cè)試
使用Furmark來對(duì)RTX 3080進(jìn)行烤機(jī)測(cè)試,測(cè)試時(shí)室溫為28度。
將Furmark的參數(shù)設(shè)定為1920*1080分辨率、0AA。運(yùn)行20分鐘之后, RTX 3080的溫度穩(wěn)定在70度附近,沒有上升的跡象,顯卡的功耗穩(wěn)定在310~320W附近。
RTX 2080/RTX 2080 Ti的溫度取自于2018年的首發(fā)評(píng)測(cè)
能夠在320W的烤機(jī)功耗下降核心溫度壓制在70度的,即便是以往的頂級(jí)非公RTX 2080 Ti也未必能做到,看來RTX 3080的散熱系統(tǒng)的確是提升巨大。
2、功耗測(cè)試
由于TDP大幅度提升,外界傳言需要RTX 3080需要配備額定1000W的電源,事實(shí)是否真的如此呢?
分別測(cè)試待機(jī)、與Furmark烤機(jī)功耗,另外我們還會(huì)加上游戲功耗測(cè)試,測(cè)試的游戲項(xiàng)目為《巫師3》。
測(cè)試所用的電源為鑫谷昆侖KL-750W鉑金牌電源。
由于我們的測(cè)試平臺(tái)將i9-10900K超頻到了5.2GHz(核心)+4.8GHz(Ring),皇家戟F4-4000C15D 8GBx4的默認(rèn)電壓也高達(dá)1.5V,因此待機(jī)功耗也是水漲船高,幾塊N卡的平臺(tái)待機(jī)功耗都在90W左右。
在運(yùn)行《巫師3》時(shí),NVIDIA RTX 3080平臺(tái)的整機(jī)功耗達(dá)到了450W,比RTX 2080 Ti高了55W的樣子,比RTX 2080更是高了126瓦。
至于烤機(jī)功耗,其實(shí)NVIDIA RTX 3080顯卡的功耗一直在305W~320W之間跳動(dòng),對(duì)應(yīng)的平臺(tái)功耗則是450W~470W之間。這個(gè)功耗數(shù)字比起RTX 2080 Ti來說高了60W左右,比起RTX 2080則高了110W。
十二、DLSS與光線追蹤測(cè)試:《堡壘之夜》、《德軍總部:新血脈》、《古墓麗影:暗影》
2年前,圖靈構(gòu)架正式來到玩家面前。與以往的顯卡相比,圖靈GPU最大的革新就是新增了光線追蹤計(jì)算單元,讓玩家第一次在游戲中感受到了實(shí)時(shí)光線追蹤技術(shù)所帶來的真實(shí)而又震撼畫面。
然而,NVIDIA這條路走的可謂是充滿坎坷,圖靈顯卡上市兩個(gè)月后都還沒有一款游戲支持RTX,因而一直被玩家所質(zhì)疑,認(rèn)為RTX就是下一個(gè)Physx。
不過在NVIDIA、AMD、微軟以及眾多游戲廠商不懈努力之下,已經(jīng)有越來越多的游戲開始支持光線追蹤和DLSS,已經(jīng)有越來越多的游戲開支擁抱RTX技術(shù),比如《戰(zhàn)地5》、《古墓麗影:暗影》、《地鐵:離去》、《控制》、《使命召喚16》、《AMID EVIL》、《德軍總部:新血脈》、《帶你去月球》、《我的世界》、《光明記憶:無限》、《DOOM:永恒》這些已經(jīng)上市的游戲已經(jīng)支持光追和DLSS技術(shù)。
另外像《微軟模擬飛行2020》、《死亡擱淺》這樣的大作雖然不支持光追,但是卻支持DLSS技術(shù),也能極大的提升游戲的流暢度。
下面我們挑選了6款游戲進(jìn)行測(cè)試,讓大家看看最新的RTX 3080的表現(xiàn)是否能夠達(dá)到大家的預(yù)期。
所有RTX與DLSS的測(cè)試均是在4K分辨率下運(yùn)行,并開啟最高畫質(zhì)。
1、堡壘之夜
幾乎在NVIDIA發(fā)布全新的RTX30系顯卡的同時(shí),《堡壘之夜》也推送了最細(xì)的更新,全面支持光線追蹤與DLSS技術(shù)。
這是打開RTX與DLSS之后的畫面,水面波光粼粼,天空和地面一切可以反射與折射的物體都在水中有形成了相應(yīng)的倒影。另外4K分辨率下幀率也不低,有53FPS。
再來對(duì)比關(guān)閉實(shí)施光線追蹤后的畫面,可以明顯地發(fā)現(xiàn),水面死氣沉沉,天空紫色的彩霞在水中沒有得到任何體現(xiàn)。
至于測(cè)試場(chǎng)景,為了盡量避免變量干擾,我們選擇了一個(gè)單人場(chǎng)景。
RTX 3080在默認(rèn)情況下能夠達(dá)到94FPS的幀率,開啟了光線追蹤之后,幀率暴跌到了28FPS,跌幅達(dá)到了70%實(shí)在是令人震驚。不過還好打開DLSS技術(shù)之后,幀率又回升到了65FPS。
2、德軍總部:新血脈
《德軍總部:新血脈》在2019年7月發(fā)售的時(shí)候并不支持光追,但在2019年底加入了光追與DLSS技術(shù)的支持,讓游戲中的任何反射表面現(xiàn)在都能有準(zhǔn)確、高質(zhì)量、高細(xì)節(jié)的逼真反射效果。
《德軍總部:新血脈》在開啟了RTX之后,完全就是2個(gè)游戲了,汽車玻璃里面可以看到非常真實(shí)的倒影。
4K分辨率下開啟DLSS+RTX之后,依然能夠跑出149FPS的幀率。
《德軍總部》的表現(xiàn)還算友好,開啟光追后幀率只是從150FPS掉到了86FPS,跌幅僅有43%。而開啟DLSS技術(shù)之后,幀率又回到了149FPS。
3、古墓麗影:暗影
RTX 3080光追之后,幀率只有50FPS。
開啟RTX DLSS之后,幀率直接從50FPS提升到了100FPS。
在這里,RTX 3080開啟DLSS之后幀率直接翻倍,提升幅度明顯強(qiáng)于其余2張顯卡。RTX 2080與RTX 2080 Ti在開啟DLSS之后,性能只是提升了50%。
十三、DLSS與光線追蹤測(cè)試:《光明記憶:無限》、《控制》、《戰(zhàn)地5》
1、光明記憶:無限
《光明記憶:無限》是一款國產(chǎn)游戲,最初僅由一個(gè)人單獨(dú)開發(fā),但不要因此而輕視了它,因?yàn)樗堑侥壳盀橹?,光線追蹤效果做的最好的一款游戲。
RTX關(guān)閉時(shí),整個(gè)畫面非常暗淡,頭盔上的玻璃面罩顯示的影子并不全,有很多缺失。下圖打開RTX之后,頭盔幾乎可以反射任何物體,天上的白云、遠(yuǎn)處的山峰、當(dāng)然最明顯的就是那個(gè)太陽。
從這張圖,可以非常清楚的看到常規(guī)的光柵化渲染與實(shí)時(shí)光線追蹤技術(shù)之間的區(qū)別。
《光明記憶》開啟光追之后,RTX 3080的幀率直接從111FPS掉到了43FPS,下降了60%以上。開啟DLSS技術(shù)之后,幀率提升到了102FPS,與默認(rèn)幀率僅有9FPS的差距。
2、控制
《控制》采用Northlight引擎打造,并且支持光追特效和NVIDIA DLSS深度學(xué)習(xí)超級(jí)采樣抗鋸齒,這也讓《Control》成為繼《戰(zhàn)地5》《地鐵:離開》《古墓麗影:暗影》之后的第四款支持光線追蹤效果的游戲。
在2020年3月,《控制》推送了支持DLSS 2.0技術(shù)的更新,相比DLSS一代細(xì)節(jié)更清晰,幀率更高。
不開啟RTX與DLSS時(shí),RTX 3080的幀率為67FPS。
開啟RTX之后,地面以及墻壁上產(chǎn)生了非常真實(shí)的光影效果,同時(shí)畫面看上也去更加明亮。不過代價(jià)就是幀率跌到了40FPS。
同時(shí)開啟RTX+DLSS之后,游戲的幀率提升到了73FPS。
不過實(shí)際上DLSS 2.0實(shí)際渲染分辨率是2560*1440,而不是3840*2160,但是看上去畫面幾乎沒有區(qū)別。
《控制》的表現(xiàn)還算是好的,RTX 3080開啟光追后幀率只是從67FPS掉到了40FPS,只是下降了40%。開啟DLSS 2.0技術(shù)之后,幀率提升到了73FPS,已經(jīng)超過了默認(rèn)的67FPS。
3、戰(zhàn)地5
《戰(zhàn)地5》在2018年推出了支持DXR光線追蹤的更新,又在2019年2月份推送了支持DLSS深度學(xué)習(xí)抗鋸齒的更新。
從時(shí)間點(diǎn)上來說,《戰(zhàn)地5》是世界上第一款同時(shí)支持DLSS與RTX技術(shù)的游戲,也第一次讓玩家見到了實(shí)時(shí)光線追蹤到了游戲中會(huì)是什么樣子。
左圖沒有光追,出現(xiàn)了非常明顯的邏輯性錯(cuò)誤。高架橋的倒影沒有出現(xiàn)在車窗中,反而被高架橋所擋住的屋頂竟然出現(xiàn)了。
右圖在打開光線追蹤之后,一切恢復(fù)了正常。
《戰(zhàn)地5》的表現(xiàn)很令人迷惑,開啟光追后,RTX 3080的幀率只是從123FPS掉了74FPS,下降了40%不算太多。不過開開啟DLSS之后,幀率僅僅只提升了14FPS,提升還不到20%
十四、DLSS與光線追蹤測(cè)試數(shù)據(jù)分析:光追幀率砍半 DLSS給追回來
將前面2章的測(cè)試數(shù)據(jù)匯總?cè)缦拢?/p>
1、首先是橫向?qū)Ρ龋?/strong>可以看到3款顯卡在開啟RTX之后,游戲的幀率都爆降了55%左右,相對(duì)來說,RTX 3080降幅稍低一些。但是在開啟DLSS技術(shù)之后,性能可以得到90%以上的提升。
2、對(duì)比3款顯卡的RTX性能:RTX 3080的光追性能比RTX 2080強(qiáng)81%,比RTX 2080 Ti要強(qiáng)了38%。
3、對(duì)比3款顯卡的DLSS性能:開啟DLSS之后,RTX 3080的幀率比RTX 2080高了80%,比RTX 2080 Ti強(qiáng)了40%。
要知道在不開啟RTX與DLSS的情況下,RTX 3080對(duì)比RTX 2080/RTX 2080 Ti的提升幅度分別是66%、30%。因此也說明了新一代安培構(gòu)架擁有更加高效的RTX與Tensor單元。
另外對(duì)于在不啟用RTX的時(shí)候,僅僅開啟DLSS深度抗鋸齒技術(shù)能有多大的提升,我們也稍稍測(cè)試了一下,測(cè)試依舊是在4K分辨率下進(jìn)行,開啟最高畫質(zhì)!
死亡擱淺
在使用TAA抗鋸齒的時(shí)候,RTX 3080能夠跑出114FPS。
開啟DLSS抗鋸齒(均衡模式),游戲的幀率直接提升到了174FPS,提升幅度高達(dá)53%。
控制
在《控制》這款游戲中,4K分辨率下使用默認(rèn)抗鋸齒技術(shù),RTX 3080的幀率是67FPS。
開啟DLSS抗鋸齒技術(shù)之后,RTX 3080的幀率來到了113FPS,提升幅度為69%。
堡壘之夜
使用默認(rèn)的抗鋸齒技術(shù),RTX 3080能夠跑出94FPS的幀率。
打開DLSS技術(shù)之后,游戲的幀率暴增到了169FPS,4K144Hz的顯示器也可以愉快的玩耍了。
剩下的幾款游戲也是類似的情況,我們就不一一展示了。總體而言,在4K分辨率,如果只開啟DLSS技術(shù),游戲的幀率能夠有60%以上的提升,RTX 3080在大多數(shù)游戲都能獲得100FPS+的幀率。
十五、總結(jié):十年來最良心的N卡
NVIDIA這一次的確是“欺騙”了所有人!發(fā)布之前,各方面的消息都顯示:RTX 3080擁有4352個(gè)流處理器,售價(jià)直奔五位數(shù)。
GeForce RTX 30系列顯卡正式發(fā)售之后,我們才知道RTX 3080的流處理器數(shù)量直接從傳言的4352個(gè)翻倍到了8704個(gè),而5499元售價(jià)更是讓人驚掉下巴。簡(jiǎn)單地說,就是流處理器比原來預(yù)計(jì)的多一倍,而價(jià)格降了一半!
下面,我們長(zhǎng)話短說,本次評(píng)測(cè)的內(nèi)容簡(jiǎn)述如下:
1、雙倍流處理器為什么只有30%的性能提升!
首先我們通過AIDA64 GPGPU測(cè)試知道RTX 3080的8704個(gè)流處理器的確是可以同時(shí)工作,不過為什么相比RTX 2080 Ti流處理器數(shù)量翻倍而性能卻只提升了30%呢?
原因有二,其一就是RTX 2080 Ti還有4352個(gè)INT32單元,他們中的大部分雖然會(huì)被閑置,但是依然能為RTX 2080 Ti帶來額外的30%左右的性能提升。
第二點(diǎn)則是因?yàn)镽TX 3080需要足夠高的功耗才能使8704個(gè)流處理器運(yùn)行在較高的頻率上,而默認(rèn)的320W TDP并不能很好的滿足這個(gè)需求。
2、是否真的需要額定1000W電源?
我們也不知道1000W的傳言從何而來!就我們的測(cè)試平臺(tái)而言,超頻到5.2GHz的i9-10900K + 皇家戟4000MHz C15 32GB內(nèi)存,在數(shù)天的測(cè)試過程中,全程使用GPU-Z監(jiān)控顯卡的功耗。
發(fā)現(xiàn)GPU-Z記錄的最高功耗只有357W,即便加上i9-10900K滿載時(shí) 250W功耗,一款額定750W的金牌電源亦足以應(yīng)付最極端的情況了。
事實(shí)上,整個(gè)測(cè)試過程中,我們的KL-750W鉑金牌電源也沒有因?yàn)檫^載觸發(fā)斷電保護(hù)而重啟。
3、超頻
對(duì)于RTX 3080的超頻真的是一言難盡!經(jīng)過我們反復(fù)測(cè)試,這塊顯卡在基礎(chǔ)頻率上增加40MHz都無法通過3DMark Time Spy的測(cè)試。美光的GDDR6X顯存倒是可以從19GHz超頻到20GHz,但是通過測(cè)試發(fā)現(xiàn)只超顯存對(duì)于游戲性能的提升非常有限。對(duì)于超頻,可以放棄了!
有鑒于此,大家在選購RTX 3080時(shí),可以避開昂貴的堆料非公,畢竟再怎么堆料,頻率也難以有較大提升。
散熱性能較好的廉價(jià)非公是相對(duì)合理的選擇。
4、光線追蹤:最好有DLSS輔助
目前支持光追的游戲越來越多了,隨著PS5與Xbox Series X的到來,預(yù)計(jì)未來會(huì)有更多的游戲擁抱光追。在第二代RT單元的加持下,RTX 3080開啟實(shí)時(shí)光追之后,性能可比RTX 2080 Ti強(qiáng)40%,比RTX 2080強(qiáng)80%。
即便如此,在4K分辨率下開啟光追之后,游戲的幀率會(huì)暴跌55%左右,很多大作已經(jīng)無法流暢運(yùn)行。不過好在現(xiàn)在支持光追的游戲同時(shí)也支持DLSS深度學(xué)習(xí)抗鋸齒技術(shù)。在開啟RTX的導(dǎo)致幀率暴跌之后,啟用DLSS技術(shù)可以將游戲的幀率提升90%左右。
另外DLSS 2.0技術(shù)對(duì)于畫質(zhì)的優(yōu)化做的相當(dāng)?shù)轿涣?,幾乎可以媲美TAA鋸齒。在幀率不夠的時(shí)候,可以放心的在游戲里開啟DLSS技術(shù)。
5、RTX 3080是NVIDIA歷年來顏值與做工最好的公版顯卡
公版RTX 3080采用了一體化金屬框架設(shè)計(jì),整個(gè)顯卡可以看作是一塊金屬,因此不會(huì)出現(xiàn)非公版那種由于散熱器太重將顯卡PCB板拉完的情況。
另外在散熱方面,公版RTX 3080的設(shè)計(jì)也相對(duì)完美。約有一半的熱量會(huì)直接從I/O接口處排除機(jī)箱外,可以大大減輕機(jī)箱的散熱壓力。而背面的風(fēng)扇會(huì)這幾將熱氣向下吹,對(duì)CPU散熱影響極小。另外由于有金屬外殼的保護(hù),顯卡下方的NVMe SSD也不會(huì)被顯卡的熱氣直接吹到。
6、ROP單元綁定GPC的好處
以往ROP單元是被集成在顯存控制器中,閹割顯存時(shí),ROP單元也會(huì)相應(yīng)的變少。
新的Ampere構(gòu)架將ROP單元與GPC綁定在了一起,每組GPC有16個(gè)ROP。今后如果縮減顯存位寬、閹割流處理器數(shù)量的時(shí)候,只要GPC數(shù)量保持不變,那么ROP單元也不會(huì)減少。
比如即將上市的RTX 3070,與RTX 3080同為GA102核心,但是流處理器數(shù)量從8704減少到了5888,顯存位寬也從320Bit閹割到了256Bit。不過由于它和RTX 3080一樣,都有6組GPC,因而ROP單元也和RTX 3080一樣是96個(gè)。更多的ROP單元可以提高GPU抗鋸齒運(yùn)算時(shí)的性能表現(xiàn)。
數(shù)天之后,RTX 3090將會(huì)解禁,敬請(qǐng)大家期待我們的首發(fā)評(píng)測(cè),謝謝!