第五代AMDEPYC9755測評

在伺服器處理器市場,AMD的市場份額持續刷新歷史紀錄。根據Mercury Research的數據顯示,在2024年第三季度,AMD在伺服器市場的出貨份額多達24.2%,營收份額更是高達33.9%,雙雙創下歷史新高。今年10月10日,AMD推出了搭載“Zen 5”和“Zen 5c”核心架構的EPYC 9005系列新品。這些新品憑藉其創新架構、創紀錄的核心/線程數量以及全面升級的先進特性,鞏固了EPYC系列處理器在伺服器處理器市場的領先地位。那麼,在實際測試和應用中,新一代EPYC 9005系列產品的性能究竟提升了多少呢?我們對基於Zen 5核心的旗艦級EPYC 9755處理器進行了獨家的性能測試。

第五代AMDEPYC9755測評

參測處理器規格解析

我們先來看看本次測試的主角——AMD EPYC 9755處理器的基本情況。它是一款針對通用伺服器的旗艦產品,具有16個CCD,每個CCD有8個核心,總共擁有128核心256線程,基礎頻率為2.7GHz,最高Boost頻率為4.1GHz,每個CCD配備32MB共享L3緩存,L3緩存總量為512MB。值得注意的是,這一次它所支持的AVX-512指令集具有完整的512bit數據路徑。

雖然從產品型號的命名方式來看,有讀者可能會以為EPYC 9755處理器是EPYC 9754的升級,但其實並非如此。因為EPYC 9755處理器採用的是Zen 5核心,而EPYC 9754採用的是Zen 4c核心,兩者在產品規格和市場定位方面有較大差異。嚴格說,上一代產品中的EPYC 9654是採用Zen 4核心的旗艦(96核心192線程),所以EPYC 9755其實是EPYC 9654的升級,在核心、線程數量以及整體規格上有了全面提升。

第五代AMDEPYC9755測評

▲第五代AMD EPYC系列處理器的創新規格綜述

除了核心架構的升級,EPYC 9755處理器支持的內存規格也進一步升級,最高可以支持DDR5 6400 MT/s規格的ECC RDIMM內存,每個Socket最高可支持高達6TB內存。在2P模式下,新一代系統整體擁有最高160條PCIe Gen5通道,還支持CXL 2.0規範和更多安全功能。

第五代AMDEPYC9755測評

▲AMD EPYC處理器的安全功能演進圖

此外,EPYC 9755處理器完全支持新增的Trusted-IO功能。該功能擴展了可信設備的邊界,除了CPU以外,外部的存儲、加速器和智能網卡也納入其中,可以讓整個系統更加安全。

由EPYC 9755處理器組建的雙路系統能為用戶打造256核心、512線程的超多核心計算系統。同時,由於是Zen 5核心架構設計,其每核心可共享的L3緩存容量也很充足,對那些既需要多線程數量,又不想妥協綜合運算性能的用戶來說,這樣的雙路系統是頗具吸引力的。因此本次測試也以此作為測試平台。

為了更直觀地體現第五代EPYC 9755處理器的進步,我們引入曾經測試過的,包括AMD第四代基於Zen 4架構的EPYC 9654處理器、基於Zen 4c架構的9754處理器、基於Zen 4架構帶有3D V-Cache的9684X處理器以及第三代基於Zen 3架構的EPYC 7763處理器的雙路系統的部分相關性能測試數據作為參照,讓大家可以更加直觀地了解EPYC 9755處理器平台的綜合性能提升。

我們如何測試

本次EPYC 9755測試平台採用AMD代號Volcano的雙路主板,SSD為三星NVMe SSD,總共配備24通道內存,總共安裝24根海力士DDR5 6400 64GB內存,總容量為1.5TB。

EPYC 9654、EPYC 9684X以及EPYC 9754的雙路系統同樣支持24個內存通道,所使用的內存為三星DDR5 4800 64GB,內存總數量同為24根,內存總容量同為1.5TB,搭配美光9300系列企業級NVMe SSD。

基於Zen 3架構的EPYC 7763雙路系統則採用AMD DAYTONA_X主板、三星 DDR4 3200 32GB內存,總數量為16根,內存總容量為512GB,搭配三星PM883企業級SSD。

本次的測試平台軟體操作系統同樣基於Ubuntu 22.04系統,通過11個專業的測試項目來考察處理器在浮點與整數性能、內存性能、光線追蹤、渲染等方面的表現。

第五代AMDEPYC9755測評

第五代AMD EPYC處理器雙路系統測試平台一覽

  • 處理器:AMD EPYC 9755×2
  • 內存:海力士DDR5 6400 64GB×24
  • 主板:AMD Volcano
  • 硬碟: 三星NVMe SSD
  • 系統:Ubuntu 22.04
  • 性能測試:SPECrate 2017

SPEC旗下的系列測試軟體是目前業界標準的、權威的基準測試之一。其中,SPEC CPU測試中的SPECrate 2017主要測試單位時間的吞吐量或工作量,這是伺服器採購時的主要性能指標。SPECrate 2017包含SPECrate Integer和SPECrate Floating Point,前者主要測試整數計算性能,後者主要測試浮點計算性能。值得一提的是,該軟體可以調動處理器的所有核心與線程數參與計算。

第五代AMDEPYC9755測評

從測試成績來看,EPYC 9755的表現相當強悍。在雙路系統中,平台整體規格達到256核心512線程,再加上更大的L3緩存,雙路EPYC 9755出色地發揮出了最大實力。對比雙路Zen 3架構的EPYC 7763,其整數性能的領先幅度高達207.6%,浮點運算性能的領先幅度則達到誇張的223%。也就是說對於EPYC老用戶來講,全新Zen 5加持的EPYC 9755在性能上具備相當突出的優勢,完全值得升級換代。

如果和第四代Zen 4架構的EPYC 9654對比,EPYC 9755不僅在參數規格上擁有絕對優勢(128核256線程),在性能上也優勢明顯。其在整數性能上領先EPYC 9654(96核心192線程)雙路系統44.85%,在浮點運算性能上領先EPYC 9654雙路系統多達45.93%。

如果考慮核心數量和線程數量相同情況下的性能對比,EPYC 9755也能輕鬆擊敗上一代基於Zen 4c架構的EPYC 9754。其整數性能的領先幅度為29.19%,浮點運算性能領先38.73%。

對於通用的數據中心而言,EPYC 9755不但可以帶來核心密度的大幅提升,而且綜合性能提升非常明顯,能夠更好地保證企業客戶的業務應用流暢運行。

性能測試:Stream-Triad

Stream是業界廣為流行的綜合性內存帶寬實際性能測量工具之一。與硬體廠商提供的理論最大內存帶寬不同,通過fortran、C兩種高級、高效的語言編寫完成的Stream可以在測試中充分發揮出內存的能力。Stream支持Copy、Scale、Add和Triad這4種操作,其中Triad組合了前面3種操作,所以其測試成績更具參考價值。

第五代AMDEPYC9755測評

在內存規格方面,本次對比的五款EPYC處理器可以劃分為三個類別,即支持DDR4 3200的Zen 3平台(EPYC 7763)、支持DDR5 4800的Zen 4/Zen 4c平台(EPYC 9684X、EPYC 9654、EPYC 9754),以及支持DDR5 6000的EPYC 9755平台。有了這三個類別的劃分,我們的內存測試成績圖表看起來就很有趣—三個類別呈現出三種梯度。其中,最新的EPYC 9755的表現最為出色,它的測試成績達到845160.686MB/s,領先基於Zen 3的EPYC 7763平台大約127%。與支持DDR5 4800的Zen 4/Zen 4c平台(比如EPYC 9654)對比,全新的EPYC 9755由於所支持的內存頻率更高,理論內存帶寬更大,所以它也有大約14%的領先優勢。

在伺服器市場中,隨著處理器處理核心數量的增多,內存帶寬對於提升整個系統性能越發重要,如果某個系統不能迅速地將內存中的數據傳輸到處理器當中,若干處理核心就會處於等待數據的閑置狀態,而其中所產生的閑置時間不僅會降低系統的效率,還會抵消多核心和高主頻所帶來的性能提升因素。從我們的測試結果來看,全新的EPYC 9755處理器新增對DDR5 6000內存的支持,理論內存帶寬也提升到576GB/s,對比DDR5 4800平台來說有顯著的性能提升,這也為整個平台強大的綜合性能打好了基礎。

性能測試:OpenSSL

OpenSSL廣泛用於保護伺服器之間的通信,這是許多伺服器堆棧中的重要協議,是雲計算中為應用程序提供信息安全的保障,不過在不少伺服器中,由於硬體設備性能不濟、用戶數量增多等問題,OpenSSL的運算速度會不斷降低。OpenSSL測試主要包含生成簽名和驗證簽名兩部分,我們在本次測試中主要進行OpenSSL生成簽名測試,最後通過統計每秒處理的數據量來判斷處理器的性能表現。

第五代AMDEPYC9755測評

測試結果顯示,OpenSSL測試比較依賴處理器的多線程運算性能。擁有256核心、512線程的EPYC 9755雙路系統與核心數量、線程數量相同的基於Zen 4c架構的EPYC 9754雙路系統相比,EPYC 9755雙路系統依然有46.46%的領先優勢,這主要得益於全新Zen 5架構帶來的性能狂飆。這意味著數據中心如果升級到EPYC 9755平台,顯然可以更好地提高資源利用率以及整體效率。

基準性能測試:UnixBench Dhrystone 2和Whetstone

UnixBench是一個類Unix系統下的性能測試工具,該工具的主要目的是提供伺服器性能的基本指標。這是一個系統基準測試工具,擁有多個測試子項目,而不僅僅是CPU、內存或磁碟基準測試工具,它的結果不僅取決於硬體,還取決於操作系統、庫甚至編譯器。在本次測試中,我們主要使用能夠體現整數性能的Dhrystone 2 using register variables和能夠測試雙精度浮點操作速度與效率的Double-Precision Whetstone兩個項目。此外,在這兩個測試項目均可選用單線程或多線程進行,我們選用多線程進行測試。

第五代AMDEPYC9755測評

可以看到,在體現處理器整數性能的Dhrystone 2 using register variables測試中,相對隔代產品——基於Zen 3架構的EPYC 7763雙路系統,全新的EPYC 9755雙路系統帶來了出色的表現,領先優勢達到186.51%。與基於Zen 4架構的EPYC 9654雙路平台相比,EPYC 9755雙路平台也有高達56.41%的領先優勢,這樣的迭代性能表現相當不錯。

眾所周知,CPU的整數運算主要用於處理離散數據,比如壓縮演算法、圖像處理、編譯器語法分析、電腦電路輔助設計等,它還可以反映處理器控制程序流的能力。從測試結果可以看到,EPYC 9755處理器具備更強悍的整數性能,意味著它能為企業的業務運行提高系統的執行效率。

第五代AMDEPYC9755測評

在Double-Precision Whetstone測試中,全新的EPYC 9755雙路系統性能表現更加強悍,領先基於Zen 3架構的EPYC 7763雙路系統190.55%。對比EPYC 9654雙路系統,EPYC 9755雙路系統的領先幅度同樣達到誇張的115%,性能幅度比整數性能測試更高。這也意味著在科學計算、工程模擬等依賴處理器浮點運算能力的領域,EPYC 9755的優勢非常明顯。

性能測試:C-ray 1.1

C-ray是一種常用的光線追蹤基準測試,它可以顯示多線程工作負載下處理器的性能差異,時間越短說明系統性能越強。在本次測試中,我們分別使用4K和8K解析度進行測試。

第五代AMDEPYC9755測評

使用處理器來完成光線追蹤任務,對於處理器的計算性能有很高要求,而處理器緩存容量的差異,也會帶來一定的性能影響。EPYC 9755升級到Zen 5架構,IPC更高,核心數量更多,Boost頻率更高,所以從測試結果可以看到,EPYC 9755雙路系統的光線追蹤表現是完全領先的——完成4K解析度的渲染只需要1.225秒,完成8K解析度的渲染只需要4.281秒,而上一代旗艦EPYC 9654相對應的成績為2秒和7秒。新一代EPYC 9755分別節約38.75%和38.84%的運行時間,效率大幅度提升。

性能測試:Sysbench CPU

Sysbench一個開源、模塊化、跨平台的多線程性能測試工具,它可以對CPU進行性能測試,在測試中主要是通過CPU進行多輪次的質數加法運算,質數極限為10000個。

第五代AMDEPYC9755測評

在這個測試中,我們默認設置啟用最大512個線程來進行質數計算。可以看到,由於EPYC 9755雙路系統擁有256核心、512線程,所以它在這項測試中的表現遠遠領先於Zen 4架構的EPYC 9654雙路系統(儘管它也擁有192核心384線程),領先幅度達到大約62%。

採用Zen4c核心的EPYC 9754雙路系統也擁有256核心、512線程,但採用全新的Zen 5核心的EPYC 9755雙路系統的領先幅度仍然高達44.14%。這意味著,在多線程運算的應用環境中,擁有256核心、512線程的EPYC 9755雙路系統能夠為加密和科學計算等領域提供極為明顯的性能提升。

性能測試:HPL

HPL是High Performance Linpack的簡稱,也叫高度並行計算基準測試。它是一款用於測試高性能計算機系統浮點性能的基準測試工具,通過對高性能計算機採用高斯消元法求解一元N次稠密線性代數方程組的測試,考察高性能計算機的浮點計算能力。值得一提的是,該測試支持調用AVX-512指令集。

第五代AMDEPYC9755測評

從測試結果來看,擁有更多計算核心的EPYC 9755雙路系統在該測試中輕鬆戰勝EPYC 9654雙路系統,領先幅度達到誇張的100.17%。對比Zen 3架構的EPYC 7763雙路系統,EPYC 9755雙路系統的領先優勢則高達332%。

EPYC 9755相對上一代旗艦產品EPYC 9654在核心數量和線程數量提升了33%,但測試成績領先的幅度遠超這一水平,看來更高的CPU主頻和Boost頻率,以及完整的AVX-512指令集在本項測試中發揮了巨大的作用!

性能測試:DGEMM

DGEMM是一個基於雙精度矩陣乘法例行程序的快速基準測試,可計算以下乘積:C←αAB+βC。其中A、B和C是包含雙精度浮點值的矩陣,α和β是標量。AMD的開源DGEMM基準使用AOCL 4.0的AMD BLIS組件,其結果最終會反饋出一個Gflops值,該值將接近於可實現的最大系統吞吐量。這個測試可以使用AVX-512指令集運算,能體現處理器在支持AVX-512指令集後的性能優勢。

第五代AMDEPYC9755測評

毫無疑問,256核心、512線程配置的EPYC 9755雙路系統在這個測試中處於絕對的領先地位,它的測試成績突破18329Gflops,對比EPYC 7763雙路系統有多達340.3%的領先優勢,對比EPYC 9654雙路系統,它的領先優勢達到97.46%,這樣的成績相當亮眼。

性能測試:V-RAY 5.02

VRay是業界最受歡迎的渲染引擎,基於V-Ray內核開發的VRay for 3ds max、Maya、Sketchup、Rhino等諸多版本,為不同領域的優秀3D建模軟體提供了高質量的圖片和動畫渲染,方便使用者渲染各種圖片。Chaos公司還推出了免費的V-Ray Benchmark測試工具,用於幫助大家測試CPU、GPU的渲染速度。

第五代AMDEPYC9755測評

渲染應用一般都更依賴處理器的多核心和多線程數量,因此擁有更多核心和線程數量的處理器在這項測試中往往能得到更高的成績。從測試結果可以看到,擁有256核心、512線程配置的EPYC 9755雙路系統取得最好的成績,領先EPYC 9654雙路系統大約32%。對比相同核心數量和線程數量的EPYC 9754平台,EPYC 9755雙路系統依然能夠取得大約27%的領先幅度。

FFmpeg視頻編碼性能測試

FFmpeg是一套可以用來記錄、轉換數字音頻、視頻,並能將其轉化為流的開源計算機程序,它提供了錄製、轉換以及流化音視頻的完整解決方案。我們使用FFmpeg中的編碼工具來測試處理器的視頻編碼性能,編碼器為x264,通過測試處理器在live場景中的編碼速度(也就是幀率)來考察處理器的性能。

第五代AMDEPYC9755測評

最後我們使用FFmpeg中的編碼工具測試雙路系統的視頻編碼性能,編碼器為x264,測試處理器在live場景中的編碼速度(即幀率)。對於這一特定領域而言,我們考察的是Zen 5核心EPYC 9755相對上一代Zen 4核心EPYC 9654以及EPYC 9684X的性能提升。可以看到,核心數量帶來的影響是比較明顯。比如128個Zen 5核心的EPYC 9755雙路系統就比96個Zen 4核心的EPYC 9654雙路系統性能提升31.19%,比EPYC 9684X雙路系統提升28.02%。

評測綜述

在經過一系列測試後,我們發現AMD EPYC 9755處理器在128核心/256線程的性能競賽中,無疑是通用伺服器市場的新一代“性能巨獸”。綜合本次對比測試的結果,EPYC 9755雙路系統在所有測試項目中均顯著超越了前代Zen4核心的旗艦產品EPYC 9654以及Zen4c核心的旗艦EPYC 9754所組成的雙路系統。與EPYC 9654相比,EPYC 9755在測試中的最大性能領先幅度高達115%;與EPYC 9754相比,最大領先幅度達到70%;而與Zen 3時代的EPYC 7763雙路系統相比,EPYC 9755更是展現了驚人的跨代性能提升,最大領先幅度達到340%。

EPYC 9755處理器的性能提升並不僅僅源自核心數量的增加。生產工藝的進步帶來了基準頻率和Boost頻率的顯著提升,核心架構的創新則持續提高IPC(每時鐘周期執行的指令數),加之I/O方面的內存規格提升和緩存容量的不斷增加,這些因素共同促成了令人矚目的跨代性能提升。對於那些不願因核心數量增加而犧牲性能的用戶而言,單節點性能的持續提升仍然至關重要。EPYC 9755處理器顯然能夠輕鬆滿足科學計算、工程模擬以及大數據分析等企業級高性能計算需求。

另一方面,對於那些既關注性能又關注機架密度的數據中心用戶來說,採用新一代核心密度更高的EPYC 9755處理器可以實現更高的機架核心密度,從而減少對機架空間的需求。

當然,對於更注重核心密度的用戶,例如提供虛擬化服務的雲服務商,選擇基於Zen 5c核心的EPYC 9005系列處理器將更有助於實現極致的核心密度和更佳的綜合能耗表現。例如,Zen 5c核心的旗艦EPYC 9965處理器擁有創紀錄的192核心和384線程,在雙路配置下規格可達到384核心和768線程,它所提供的核心密度和能效優勢在企業級伺服器市場中同樣無出其右。

綜上所述,以EPYC 9755為代表的EPYC 9005系列處理器再次證明了AMD在晶元設計領域的深厚技術底蘊。該系列處理器所達到的創紀錄規格,帶來的極致性能和能效表現,使其成為行業發展的新標杆。對於企業用戶和數據中心用戶而言,如果需要兼顧性能、核心密度、能效表現和總體擁有成本,那麼在採購決策時,AMD EPYC 9005系列處理器無疑是首選,以確保獲得最佳的投資回報。

原創文章,作者:簡單一點,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/251616.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
簡單一點的頭像簡單一點
上一篇 2024-12-13 17:28
下一篇 2024-12-13 17:32

相關推薦

發表回復

登錄後才能評論