跟一些行業內朋友聊天,大家經常提到裸金屬機的概念,實際上指的是物理機。與我理解的,如AWS等雲廠商提到的,裸金屬(Bare Metal)機,其實不是一回事。
那什麼是裸金屬機?以及物理機、虛擬機及裸金屬機的優勢劣勢、區別和聯繫到底是什麼?今天這篇文章,我們一起探討。(註:本文提到的物理機、虛擬機和裸金屬機,均指的是公有雲場景下的相應雲伺服器。)
一、裸金屬和物理機的區別
1、概念
裸金屬伺服器是指一種不運行虛擬化層的物理伺服器,直接暴露硬體資源給用戶,但是能夠提供與傳統物理伺服器類似的性能和功能,只是通過雲服務提供商的方式進行部署和管理。
傳統的物理伺服器是指完全獨立運行在數據中心中的硬體設備,通常由企業自行購買和維護,直接安裝操作系統和應用程序,沒有虛擬化的中間層。
2、架構與硬體資源
(1)裸金屬伺服器
- 硬體資源直通:裸金屬伺服器沒有虛擬化的性能開銷,可以直接訪問物理伺服器的所有硬體資源,如CPU、內存、存儲和網路。
- 更接近物理伺服器:與虛擬機相比,裸金屬伺服器更接近傳統物理伺服器的性能表現,適合需要高性能和低延遲的應用場景。
(2)物理機
- 完全獨立性:物理機是完全獨立的伺服器實體,不與其他虛擬機共享硬體資源,可以獲得最大的計算和存儲性能。
- 適合特定需求:對於需要絕對控制和定製化配置的應用程序和工作負載,物理機提供了最大的靈活性和自主性。
3、管理與部署
(1)裸金屬伺服器
- 雲服務提供:通常由雲服務提供商管理和部署,用戶可以通過控制台或API快速創建、配置和管理裸金屬實例。
- 快速部署:通過雲服務商提供的自動化工具和服務,可以快速部署裸金屬伺服器,大大簡化了硬體管理和操作系統安裝的流程。
(2)物理機
- 自主管理:企業通常自行購買、配置和維護物理伺服器,擁有完全的管理控制權。
- 高度定製化:可以根據具體需求選擇硬體配置、操作系統和網路設置,實現高度定製化的部署和管理。
4、適用場景
(1)裸金屬伺服器
- 高性能計算:適合需要強大計算能力和低延遲的應用,如科學計算、金融交易系統等。
- 數據密集型應用:需要大量存儲和高速網路訪問的大數據應用和分析任務。
- 合規性要求:特定安全和合規標準的應用,如金融行業或政府部門的數據處理。
(2)物理機
- 定製化需求:對於需要特定硬體配置或操作系統環境的應用程序和工作負載。
- 傳統企業應用:傳統的資料庫管理系統、企業資源規劃(ERP)系統等業務應用。
- 低延遲應用:對延遲極為敏感的應用,如實時交易系統或遊戲伺服器。
相關問題與解答:
- 1、裸金屬伺服器和物理機的性能比較如何?
答:裸金屬伺服器由於沒有虛擬化層,可以直接運行在物理硬體上,因此性能較高,而物理機通過虛擬化技術劃分出多個虛擬機實例,每個虛擬機都需要運行自己的操作系統和應用程序,這會帶來一定的性能開銷。
- 2、裸金屬伺服器和物理機的管理方式有何不同?
答:裸金屬伺服器通常需要手動配置和管理,用戶可以直接訪問物理硬體進行操作和維護,而物理機可以通過虛擬化管理平台進行集中管理和監控,用戶可以在平台上創建、刪除和調整虛擬機實例,以及監控資源的使用情況。
二、物理機的優勢和劣勢
物理機,顧名思義,是把物理的伺服器完全交付給客戶。
物理機唯一的優勢在於,所有的資源完全交付給客戶。算力服務提供商不佔用此伺服器的硬體計算資源。
物理機的劣勢,主要總結如下:
- 管理運維難。整個伺服器系統的運行情況完全脫離算力服務提供商的管理和監控,機器的運行情況不可知,也無法完成硬體和系統的管理和運維。
- 不支持高可用。如果伺服器出現故障,運行於伺服器的業務需要停止,這對於需要7×24小時保持服務暢通的互聯網業務來說,是不可接受的。
- 不支持資源彈性。系統提供個資源數量由伺服器硬體決定,無法更改。比如,伺服器提供50個CPU核,但客戶場景僅需求1個CPU核,那麼其他49個CPU核的資源則是浪費的,但客戶仍需要為此浪費的資源付費。
- 資源利用率低,成本高。沒有資源共享,沒有資源充分利用,資源浪費嚴重。多租戶場景,需要實現租戶之間的系統隔離;由於整台伺服器都交付給了客戶,因此隔離工作需要在外部交換機或其他主機上實現;額外的資源消耗成本較高,並且安全性較低。
三、虛擬機的優勢和劣勢
虛擬機,是公有雲最常見的產品形態,沒有之一。通過虛擬化技術,實現基於宿主機(Host)的虛擬機器,為客戶提供更靈活更低成本的雲主機服務。
大體上,物理機的劣勢,就是虛擬機的優勢;反過來,物理機的優勢,也即虛擬機的劣勢。
虛擬(雲)機的優勢主要總結如下:
- 主機可控。虛擬機在宿主機側都有完整的管理監控,以及網路、存儲等I/O後台設備模擬和工作任務處理。整個虛擬機的運行情況處於可控狀態,可以實時為客戶虛擬機提供可能的服務,比如硬體出現問題的時候實時熱遷移。
- 支持高可用。如果伺服器出現故障,運行於伺服器的業務會自動熱遷移到其他運行正常的伺服器,業務客戶對伺服器硬體的故障無感。
- 支持資源彈性。客戶雲主機,可以支持從1-N個彈性資源的選擇,並且在主機創建之後仍可以對主機資源進行擴縮容。
- 更低成本。通過虛擬化實現硬體資源的共享,通過自定義不同資源配比實現儘可能最高的資源利用率低,從而極致的均攤硬體成本,降低客戶開銷。此外,租戶隔離不需要額外硬體配套,虛擬網路交換機在伺服器本地,不額外消耗其他的硬體資源。
而虛擬機的劣勢,則主要是性能的問題。虛擬機性能的額外損耗主要來源於兩點:
- 虛擬化的損耗。虛擬化分為完全軟體虛擬化、類虛擬化(也稱之為半虛擬化)和完全硬體虛擬化。軟體虛擬化CPU資源消耗較大,類虛擬化次之,完全硬體虛擬化幾乎不需要額外的CPU消耗。目前,主流的CPU晶元都支持CPU處理器和內存的完全硬體虛擬化,網路和存儲等I/O仍然是CPU軟體虛擬化或類虛擬化。
- 網路和存儲兩個主要I/O的後台工作任務的額外資源消耗。
(註:為了簡化問題,這裡僅涉及CPU,沒有涉及GPU等業務加速處理器,下同。)
四、強強聯合,物理機和虛擬機的優勢合併
既然物理機和虛擬機都不完美,都存在這樣或那樣的問題。那麼,能不能把兩者的優勢結合起來?使得物理機像虛擬機一樣功能強大;同樣的,虛擬機也能像物理機一樣,沒有額外的資源消耗,實現裸機級別的性能。
答案是肯定的。
方案一:物理機實現虛擬機的強大能力,即真正的裸金屬機
虛擬機的優勢,如資源彈性、高可用等,主要是虛擬化系統提供的。要想物理機也實現這樣的能力,則需要物理機也“支持”虛擬化。虛擬化系統主要分為兩層:宿主機(Host)側和客戶機側(Guest VM)。通過DPU,可以實現虛擬化系統宿主機側所有任務的完全卸載。在傳統虛擬機模式下,這部分工作是在CPU中完成,而在裸金屬機的模式下,這部分工作卸載到了DPU中,並把性能敏感的任務進行了加速優化。
方案二:虛擬機實現物理機般極致的性能
前面我們分析過,虛擬機的性能損耗主要來自於非硬體虛擬化的CPU資源消耗,以及網路、存儲兩個主要I/O的後台工作任務(網路主要是VPC處理,存儲主要存儲虛擬化映射)的CPU資源消耗。
通過DPU,可以實現整個宿主機側計算任務的卸載,這樣就可以實現:
- I/O的完全硬體虛擬化(也可以理解為I/O模擬任務的卸載)。虛擬出來多個邏輯的硬體設備,直通到虛擬機中。這樣,VM所在的Guest主機,實現所有計算機資源,即CPU處理器、內存和I/O設備,的完全硬體虛擬化(CPU核內存的硬體虛擬化由CPU晶元支持,I/O設備的硬體虛擬化由CPU和DPU共同支持)。實現完全接近物理裸機的性能。
- 同時,網路和存儲等工作負載實現從CPU到DPU的卸載和加速。在CPU中完全沒有了這些“額外”的資源消耗,CPU完全交付給業務客戶。
需要注意的是,在此種方案下,在CPU側仍存在Hypervisor。這個Hypervisor比較輕量,主要是實現虛擬機的創建、銷毀和遷移等操作。Hypervisor幾乎不干擾虛擬機的穩定運行,也就幾乎不會從Guest Mode切換到Host Mode,也就沒有了額外的CPU資源消耗,從而實現虛擬機“獨佔”CPU。
五、更進一步,虛擬機和裸金屬機的統一
既然可以實現物理機像虛擬機一樣功能強大,虛擬機像物理機一樣性能極致,那麼接下來就會有一個新的問題:站在客戶的視角,為什麼要區分虛擬機和物理機?兩者不可以統一嗎?
答案同樣是肯定的。
系統可以自由的在虛擬機和裸金屬機之間切換:
- 創建後的虛擬機,如果發現資源不夠用,就可以在不改變系統環境的情況下,持續擴容,最終變成裸金屬機。例如,在一台具有50核CPU的機器上,最開始申請了20個核的虛擬機。當發現資源不夠用的時候,可以把此台主機擴容,擴容到30核、40核,知道50核。當達到50核的時候,就獨佔了此主機,也即從虛擬機形態變成了裸金屬形態。但使用主機的客戶,對此無感。
- 同樣的,裸金屬的客戶,在發現此主機業務跑不滿的情況下,可以縮容,變成虛擬機。用同樣的例子,客戶申請了50個核的主機,此時為裸金屬機,客戶縮容到了40核,此刻給客戶呈現的主機形態仍然沒有變化。而技術上的來說,已經從裸金屬機變更成了虛擬機。
統一虛擬機和裸金屬機,可以實現客戶業務使用和技術實現之間的隔離:從技術角度,實現底層實現和上層呈現之間的隔離,便利客戶使用;l對客戶來說,客戶需要的是一個性能強勁、功能強大的雲主機,用戶不需要關心到底是物理機或虛擬機。
總結
物理機和虛擬機是兩套獨立的體系,獨立的運維,物理機實例和虛擬機實例之間無法切換。這和我們一直講的算力資源池化是相悖的。
因此,除了優化性能和優化功能之外,還需要統一平台,統一資源,簡化運維,簡化用戶的使用。這樣,我們可以簡單劃分雲主機發展的三個階段:
- 第一階段,傳統的物理機和虛擬機階段。這個階段,各自獨立,物理機存在高可用等方面的問題,虛擬機存在性能方面的問題。
- 第二階段,增強優化階段。物理機具備了高可用等傳統虛擬機所具備的能力,虛擬機則優化了性能,實現了極致接近硬體實際的性能。
- 第三階段,物理機虛擬機統一形態階段。給客戶提供統一的雲主機資源,在業務層次,不再區分虛擬機和物理機。
五種類型主機的特性總結如下。
裸金屬伺服器通常需要手動配置和管理,用戶可以直接訪問物理硬體進行操作和維護,而物理機可以通過虛擬化管理平台進行集中管理和監控,用戶可以在平台上創建、刪除和調整虛擬機實例,以及監控資源的使用情況。
原創文章,作者:簡單一點,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/158691.html