前幾天,上海浦東某機房新採購一批節點伺服器,這一批運算伺服器系華為品牌,基本配置為:
CPU:Intel Xeon 2680V4 二塊
顯卡:Tesla K40 十塊
內存:512G
整體配置相對高端,運算性能強悍不容置疑。由於疫情的影響,我受公司委託,協此相關IT技術和代理技術工程師,對這批運算伺服器的前期CentOS操作系統的安裝。
一、【部署思維】
根據金牌代理商的建議,我們擬採用網線連接管理埠,通過Huawei IBMC進行CentOS的安裝。前期準備工作如下:
- 1、 設定筆記本電腦的IP地址為: 192.168.2.xxx;
- 2、 連接網線N條;
- 3、 CentOS 7的ISO包;
- 4、 筆記本安裝JAVA環境(JRE 8);
物理把網線正確連接在華為伺服器的BMC網路管理埠,使用瀏覽器打地址:192.168.2.100(初始默認地址,建議修改提升安全管理等級!
華為iBMC登陸界面
華為伺服器的IBMC管理和配置,我會在下一篇給大家詳細介紹一下,IBMC純圖形界面的配置,如果思路明確,操作並不難!
二、【疑難雜症】
在CentOS7的安裝過程中,不過我們用U盤啟動,還是通過IBMC使用CentOS ISO包虛擬光擬安裝,都無法進入到正常的圖像安裝界面……。現在具有豐富經驗的華為代理商IT技術工程師,有點一頭霧水:更換U盤,檢查各種iBMC配置,更換到其他幾台伺服器,操作均類似!
當時我作為一名協助技術工程師,尤其對於華為伺服器也是初次部署,當時的我屬於旁邊學習者的身份:只能看著大家著急。
時間一分一秒,眼看上午就卡在這個步驟。項目負責人突然想起之前也碰到過類似的問題,發給我這樣一張處理圖片,如下:
項目負責人的提示
根據圖片內容提示,第一種方法我們直接放棄:十塊Tesla K40圖像運算卡的拔插操作,風險係數高,尤其對於剛上好機架的伺服器工作量大。
我們一致確認採用第二種方式,為了找到第二種正確的操作方法。我使用電腦連接了其中某台華為伺服器,開始進行了嘗試性操作。
我平時工作在生產環境,安裝部署Linux操作系統並不多見,尤其是一些專業辭彙不理解。例如:grub編輯,kernel所在行等等。只能根據負責人給我的操作方法,反覆嘗試,最好我們終於模索出正確的操作方法,如下圖:
「grub編輯」和「kernel所在行」圖解
這是伺服器配置的Tesla K40運算顯卡對CentOS 7不兼容造成的故障,我們熟悉相關概念和操作後,在安裝開始界面,通過以下操作:
- 1、 游標停留在 「Install CentOS 7」;
- 2、 按鍵盤「Tab」鍵,進行grub編輯模式;
- 3、 最下面的kernel所在行「>vmlinuz initrd=initrd.img inst.stage2=hd:LABEL=CentOSX207x20x86_64 quiet nouveau.modeset=0
- 4、 回車繼續開始,CentOS熟悉的安裝界面終於出來了!
後續的安裝,相對簡單,大家可以用VMware Workstation等虛擬機摸擬安裝學習。
三、【故障小結】
公司成立以來一致專註小微企業的IT運行和維護,基本上沒有接觸過這類中高端的伺服器生產環境,相對這一塊來說:比較陌生,但我們的工程師具有20多年豐富的現場工作經驗!
在伺服器安裝和部署過程中,碰到過很多疑難雜症,遇到問題先不要放棄,我們可以通過網路查詢相關故障提示、報錯信息和關健字,借簽相關網友(大神)的成功處理經驗,慢慢分析故障原因、找到故障點並解決難點,更好的完成工作!
原創文章,作者:投稿專員,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/208702.html
 
 微信掃一掃
微信掃一掃  支付寶掃一掃
支付寶掃一掃 