自打2022年英特爾正式發佈旗下Arc系列獨立顯卡,在獨顯領域的討論終於從AMD、NVIDIA兩家之爭擴展到了第三家。對於英特爾而言,首次試水的Arc A系列在發佈的2年內像升級打怪一般,攻克了一個又一個需要大量行業經驗積累才能解決的問題,例如對DX9、DX11遊戲的支持程度,再例如光線追蹤單元利用的效率,以及驅動穩定程度等等。
從現在這個時間點來看,Intel Arc A系列雖然說不上一鳴驚人,但成長的速度令人印象深刻,光是過去一段時間接連50多次的驅動更新,以及對120款以上遊戲發佈當日的Day-0支持,都讓Intel Arc的性價比愈發凸顯。
但只有驅動層面更新是遠遠不夠的,特別是在AI視覺運算和光線追蹤效果逐漸具備普適性,A、N兩家新顯卡蓄勢待發,是時候重新定義性價比概念了。因此在距離CES 2025不到一個月的時間點上,英特爾正式發佈並開賣銳炫Arc B580系列,以Battlemage戰鬥法師為名,點燃GPU迭代的第一把火。
如果你是Intel Arc A750用戶,或者計劃在近期構建一套高性價比的台式機PC,眼前的Intel Arc B850顯然是值得期待的,它定位2000元檔的價位段,並帶來全新的Xe2架構和大量的硬件升級,配合軟件和驅動積極更新的節奏,都暗示着Intel Arc B850很有嘗試的必要。
那麼Intel Arc B850的戰鬥力究竟如何?我們的首發評測就此奉上。
戰鬥法師BMG-G21
在月初的媒體溝通會上,英特爾表明Intel Arc B系列先發的兩款型號為Intel Arc B580和Arc B570兩款,其中Intel Arc B580先發,Arc B570則會安排到2025年1月份。
兩款GPU的核心均來自型號為MG-G21的SoC,基於Xe2架構打造,採用台積電N5製程,晶體管數量達到196億個,Die Size為272mm2。因此Intel Arc B580和Arc B570的主要區別在於Xe Core數量和顯存數量的區別。
Xe2架構同樣已經應用到了前段時間已經發佈的Lunar Lake CPU的核顯中,全新的Xe2架構加入了XVE矢量引擎、更高效的XMX引擎等,特別是XMX矩陣單元在底層硬件設計上的升級,為後續的XeSS 2分辨率超採樣技術得以實現,同時XMX矩陣單元帶來的優勢也是早期Xe-LPG利用的DP4a指令集無法達到的效率。
Xe2中的Xe核心包含8個512bit矢量引擎,相比上一代Xe的16個矢量引擎減少了一半,另一半用來放前面提到的2048bit XMX矩陣引擎來實現更好的運算支持。XMX矩陣引擎包含INT2、INT4、INT8以及FP16、BF16在內精度計算,並對FP64提供支持,從而實現對更豐富的推理模型的兼容。
由於XMX引擎支持Int8 4096 OPS/clock和FP16 2048 OPS/clock算力,遠高於XVE矢量引擎,因此在重負荷AI加速中,Xe2可以承擔更多的AI加速工作。
繼續向下延伸就是構成Xe核心部分之一的渲染切片(Render Slice)。新的渲染切片引入了對於Excute Indirect的支持,原來3D任務需要CPU把指令給到GPU,然後由GPU去運算執行,而在Excute Indirect功能支持下,部分命令可以直接在GPU本地執行,不需要CPU一條條告訴GPU做什麼,而是GPU本身就具備Draw、Dispatch的能力,這些命令可以直接在GPU里直接完成。此外,幾何單元改進達成頂點獲取(Vertex Fetch)吞吐提升3倍,mesh shading性能提升3倍。
Xe2緩存部分的壓縮率和吞吐量也有了明顯提升,包括提升了L1 Cache的利用率,Sampling吞吐提升2倍,Pixel Color Cache提升1.33倍。因此儘管在Xe核心數量上Arc B580比Arc A750要少,但實際上由於效率的提升,讓性能顯著增加。
英特爾用《堡壘之夜》舉例,得益於在已經上對間接執行(Execute Indirect)支持,並通過SIMD16減少光照通道執行時間,以及L1緩存無序訪問視圖(Unordered Access Views,UAVs)寫入,同樣場景下Xe2渲染體積霧的時間減少33%。
順帶一提,Xe2在SIMD16的基礎上,增加了對SIMD32的支持,即一次處理32個數據元素。雖然這個設計是基於SIMD16上獲得而不是原生,但可以確保Intel ARC B580運行更大規模的矩陣乘法,或者處理圖形渲染中更複雜的計算效率。
Xe RTU光線追蹤單元也進行了拓寬,提供三條遍歷通道,18 x Box intersections和2 x Triangle intersections計算,能夠更快速地進行盒子和三角形之間的交叉檢測。其中Box intersections是指單元在光線與盒子或者說包圍體積相交時所能處理的數量,Triangle intersection指代光線與三角形相交時所能處理的數量。
在媒體引擎方面,Intel Arc B系列使用了雙MFX引擎設計,看可以提供8K 10bit HDR 120FPS編碼工作負載,並且從硬件提供包括VP9、AV1等硬件支持。同時Xe媒體引擎還提供HEVC 4:2:2 10bit編解碼,是目前Windows平台唯一硬件原生支持此格式的GPU。
由於Intel Arc B580已經是完整的BMG-G21,因此包含了5個渲染切片,20個Xe-Core,160個Xe矢量引擎,160個XMX矩陣引擎,20個光線追蹤單元,20個紋理採樣器,並配備了18MB L2緩存以減少內存訪問延遲和帶寬瓶頸問題。此外,Intel Arc B580的核心最高頻率可以達到2850MHz,配備12GB 192-bit GDDR6顯存,顯存帶寬456GB/s。
原創文章,作者:簡單一點,如若轉載,請註明出處:https://www.506064.com/zh-hk/n/271212.html