在眾所周知的原因推動下,想要以理想的價格買到GeForce RTX 4090已然不太現實,所幸黃氏刀法著實精準,用GeForce RTX 4090 D實現了合規與性能之間的新平衡點。並且由於沒有Founders Edition版本,國內發售的重任落到了幾家AIC品牌上,作為NVIDIA好基友的索泰自然是其中之一。
手握GeForce RTX 4090 D GPU的索泰自然不會閑著,索泰GeForce RTX 4090 D PGF、索泰GeForce RTX 4090 D AMP AIRO、索泰GeForce RTX 4090 D天啟、索泰GeForce RTX 4090 D TRINITY 月白上齊一套,其中索泰GeForce RTX 4090 D TRINITY 月白不僅上架電商,在眾友商定價中,也是頗具性價比的一款。
那麼GeForce RTX 4090 D的表現究竟如何?評測就此奉上。
AD102的新篇章
與GeForce RTX 4090所使用的AD102-300-A1不同,索泰GeForce RTX 4090 D TRINITY 月白採用的GPU型號為AD102-250-A1。兩款GPU均源自相同的AD102,並以此為基礎向下屏蔽單元,實現不同的性能定位。
從整體上看,完整的AD102包含了12個圖形處理集群(Graphics Processing Clusters,GPC),72個紋理處理簇(Texture Processing Clusters,TPC),144個流式多處理器(Streaming Multiprocessors,SM),以及搭配了12個32-bit控制器的顯存介面,共計384-bit。
同時每個GPC獨立使用1個光柵引擎(Raster Engine,RE),6個TPC,2個光柵處理分區(Raster Operations partitions)。其中每個光柵處理分區包含8個光柵處理單元(Raster Operations,ROP),因此總共16個ROP。
每個TPC下包含2個流式多處理器(Streaming Multiprocessors,SM)。從Maxwell架構開始,SM之下細分出了處理塊(Sub-Core)概念,AD102中每個SM包含4個處理塊,每個處理塊包含1個64KB寄存器堆,1個L0指令緩存,1個Warp調度器,1個調度單元,4個載入/存儲單元,1個特殊功能單元(Special Function Unit,SFU)用於執行超越函數指令(比如正弦、餘弦、倒數、平方根等)和圖形差值演算法指令。包含16個專門用於FP32的CUDA Core,16個可以在FP32和INT32之間切換的CUDA Core,因此共計32個CUDA。
此外每個SM還包含1個第三代RT Core,4個第四代Tensor Core,4個紋理單元(Texture Units),256KB寄存器堆,以及可根據需求進行配置的128KB L1共享緩存。
有意思的是,你會發現無論GeForce RTX 4090還是GeForce RTX 4090 D其實都沒有用到完整的AD102核心,而是通過禁用GPC或者TPC的數量從而實現不同的定位。而GeForce RTX 4090 D相當於在GeForce RTX 4090的基礎上再屏蔽1組GPC實現。
因此索泰GeForce RTX 4090 D TRINITY 月白總共包含57個TPC,114個SM,14592個CUDA Core,456個第四代Tensor Core,114個第三代RT Core。大致對比如下:
可以看到在顯存配置和GPU頻率上,GeForce RTX 4090 D沒有做出刪減,同樣保持了24GB GDDR6X 384-bit顯存,等效21Gbps頻率,1008GB/s的顯存帶寬。另外L2緩存容量也維持在了72MB,GPU頻率2.52GHz。大容量顯存和L2緩存的配置,都仍然能夠給後續的遊戲,特別是AI加速性能提供優秀的基礎。
在72MB超大L2緩存的加持下,第三代RT Core和第四代Tenor Core作為提升遊戲特效性能的主力也有了更多的用武之地。其中,第三代RT Core不僅可以通過L2緩存在路徑追蹤從中獲得巨大收益,本身相對第二代RT Core也提升了射線/三角形求交測試吞吐量,並引入透明度微圖引擎(Opacity Micro-Map,OMM)和位移式微型網面引擎(Displaced Micro-Mesh,DMM)。
第四代Tenor Core則是當下火熱的DLSS 3以及開始普及的DLSS 3.5的重要組成部分。這是一套利用光流加速器實現像素級的測量,並通過雲端的夜以繼日的尋找提升高質量圖像的途徑,這使得GPU擺脫了渲染重建高解析度方法,讓渲染工作大幅度減少,以兩幀為例,DLSS 3會承擔起第一幀的3/4的工作和第二幀的所有工作,實際上GPU只需要完成其中的1/8的渲染即可,從而節省了大量的計算資源。
而接下來的DLSS 3.5則能同時包含DLSS幀生成(FG)與光線重建(RR, Ray Reconstruction)技術搭配,再加上超解析度(Super Resolution)、DLAA、幀生成(Frame Generation)多種技術融合。最終構建出一套高效的運行方式,但所有的前提都依靠第四代Tenor Core和光流加速器配合實現的。
此外,索泰GeForce RTX 4090 D TRINITY 月白還包括第八代NVENC和第五代NVDEC編解碼器對媒體提供支持,從而在諸如AV1編解碼加速上獲得更好的體驗。
全副武裝的TRINITY
讓我們把焦點放回顯卡本身,索泰GeForce RTX 4090 D TRINITY提供了月白和黑色兩種顏色可選,在散熱上主要選擇了IceStorm 3.0散熱系統,優化了空氣散熱效能,並支持SPECTRA 2.0 ARGB燈效。
其中IceStorm 3.0散熱系統提升了散熱效能,提供了3個110mm的盾鱗2.0風扇,在提升扇葉面積的同時,也優化了每一片扇葉的曲率和鱗狀仿生條紋,從而實現提升風扇風量、風壓和風流的效果。
原創文章,作者:簡單一點,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/200421.html