北京時間1月23日晚10點,NVIDIA正式解禁了RTX 40 SUPER系列台式機顯卡的第二款型號——RTX 4070 Ti SUPER,其產品定位介於RTX 4070 Ti和RTX 4080之間。
先說一個好消息,RTX 4070 Ti SUPER的起售價為6499元,這個定價跟RTX 4070 Ti一樣。在核心規格、顯存規格都要高於RTX 4070 Ti的情況下,全新的RTX 4070 Ti SUPER可謂加量不加價!
一周前上市的RTX 4070 SUPER已給人們帶來了不小的驚喜,現在對於全新RTX 4070 Ti SUPER,它的表現又會如何?此次評測筆者便利用映眾RTX 4070 Ti SUPER曜夜這款新顯卡,為大家揭曉答案。
Ada Lovelace架構與全新的RTX 4070 Ti SUPER
RTX 4070 Ti SUPER基於英偉達Ada Lovelace架構設計。為了讓大家更好地了解到這款新顯卡,筆者首先會對Ada Lovelace架構以及所支持的一些重要技術進行介紹。
(一) RTX 40 SUPER系列台式機顯卡第2彈——RTX 4070 Ti SUPER
RTX 4070 Ti SUPER基於AD103-275顯示核心設計,擁有8448個CUDA核心,搭配16GB容量、256bit位寬的GDDR6X顯存。
而之前的RTX 4070 Ti基於AD104-400顯示核心設計,擁有7680個CUDA核心,搭配12GB容量、192bit位寬的GDDR6X顯存。
對比CUDA核心數量,全新的RTX 4070 Ti SUPER相比RTX 4070 Ti有着10%的規格提升。
更高端的RTX 4080基於AD103-300顯示核心設計,擁有9728個CUDA核心,搭配16GB容量、256bit位寬的GDDR6X顯存。
從硬件規格來看,RTX 4070 Ti SUPER明顯要高於RTX 4070 Ti。而跟更高端的RTX4080相比,還是有一定差距的。
(映眾RTX 4070 Ti SUPER曜夜顯卡的GPU-Z信息)
本文選用的映眾RTX 4070 Ti SUPER曜夜顯卡與RTX 4070 Ti SUPER創始人版保持一致,其GPU頻率為2340MHz,Boost頻率為2610MHz,顯存頻率為1313MHz(等效21000MHz)。
(二) Ada Lovelace架構核心
(Ada Lovelace架構核心)
(Ada Lovelace架構核心GPC單元)
Ada Lovelace架構核心配備了全新的第三代RT Core(光線追蹤核心)、第四代Tensor Core(張量核心)以及SM(流式多處理器)。根據NVIDIA官方的介紹,Ada Lovelace架構核心所採用的第3代RT Core不僅將光線與三角形求交性能提高了一倍,還將RT-TFLOP峰值性能提高了一倍之多。第3代RT Core還配備了全新的Opacity Micromap (OMM)引擎和Displaced Micro-Mesh (DMM)引擎,進一步提升了光追計算的性能以及減少計算開銷,帶來了更好的光線追蹤效果表現。Ada Lovelace架構核心配備的第四代Tensor Core引入了來自專業級H100數據中心GPU的FP8 Transformer引擎帶來了更加強悍的AI算力。
(第三代RT Core結構示意圖,相比前代,增加了2個功能)
Ada Lovelace架構核心在SM單元上引入了Shader Execution Reordering(SER着色器執行重排序)技術來更好的對於着色器的工作進行調度排序,在使用上可以根據不同的負載需求來執行渲染,可對負載較為統一的畫面進行渲染,降低工作開銷。根據英偉達官方的介紹,這一個SER功能將作為API開放給開發者使用。英偉達官方宣稱,SER功能的加入至高可帶來兩倍RT Core性能上的改善,對於光追遊戲來說更可帶來體驗的升級。根據NVIDIA官方的數據,全新的SM(流式單元處理器)可帶來至高兩倍的性能以及能效升級,這一項升級不可謂不小。
(Ada Lovelace架構核心SM結構圖)
Ada Lovelace架構核心除了第三代RT Core(光線追蹤核心)、第四代Tensor Core(張量核心)以及SM(流式多處理器)的升級以外,帶來了全新的第八代NVENC硬件編碼器,這一全新的第八代NVENC硬件編碼器整合了對AV1視頻編碼格式的支持,可以在傳統的H.264等格式之外,加入了對AV1這一主流新標準的支持,可以進行對於AV1格式的編碼與解碼,有效提升了生產力方面的表現,對於創作型用戶、遊戲主播等群體來說更是如虎添翼。來自NVIDIA官方的數據顯示,第八代NVENC硬件編碼器在AV1的效率上比H.264編碼器的效率提高了40%,這一提升非常明顯。
而除了核心上的升級以外,Ada Lovelace架構核心還大幅度提升了其L2緩存。其中RTX 4070 Ti SUPER顯卡所採用的AD103-275顯示核心擁有48MB的L2緩存,L2緩存容量相比上一代RTX 3090 Ti顯卡(6MB L2緩存)可謂提升巨大。大容量的L2緩存帶來了數據命中率的有效提升,在現階段顯存帶寬提升有效的情況下,通過升級更大容量的L2緩存,可以進一步提升數據命中表現,帶來性能方面的升級,根據NVIDIA官方的說法,大容量L2緩存的加入為GPU的一系列操作到帶來了更高的收益,尤其是在光線追蹤等場景下,表現更為明顯。
(三) DLSS 3與NVIDIA Reflex
Ada Lovelace架構的一系列升級還帶來了全新的DLSS 3技術的獨佔以及NVIDIA Reflex方面的體驗提升。
DLSS 3包含有DLSS 2(DLSS超分辨率技術),以及全新加入的DLSS幀生成技術,這一項DLSS幀生成技術依託於Ada Lovelace架構的獨立光流處理器以及Tensor Core的AI算力。在一項技術在運行過程中,其通過光流處理器所得到的一系列數據後,以光流加速技術(Optical Flow Acceleration,簡稱為OFA)來生成畫面信息,而AI算力則負責來對畫面進行進一步的優化,從而在遊戲中加入了更多的幀畫面,進行幀數的提升。
DLSS 3可直接生成遊戲第1幀3/4的像素以及整個遊戲第2幀,相當於使用1/8的算力,就完成了整個計算過程,而通過這一個流程的循環,可在提升幀數的同時節省資源開銷,進一步帶來更好遊戲體驗。
原創文章,作者:簡單一點,如若轉載,請註明出處:https://www.506064.com/zh-hk/n/174682.html