《運維好數據中心的四大法寶》要點:
本文介紹了運維好數據中心的四大法寶,希望對您有用。如果有疑問,可以聯系我們。
對于數據中心,運維工作的重要性不言而喻,在數據中心生命周期中運維管理是歷時時間最長的一個階段.數據中心運維的工作主要是對數據中心各項管理對象進行系統的計劃、組織、協調與控制,是信息系統服務有關各項管理工作的總稱,具體包括對機房環境基礎設施部分的維護,系統與數據維護,管理工具的使用,人員的管理等方面.投資巨大的數據中心,為了能夠盡快得到收益,就需要在運維的工作上多下工夫,切勿進入“一流設備、二流設計、三流運維”的不良運營之中,高品質數據中心運維的工作至關重要.那么如何才能提升數據中心的運維水平,本文提出了數據中心運維工作制勝的四大法寶,做好這四個方面的工作將使數據中心一直運行于最佳狀態,為數據中心創造最大的受益.
法寶1:工程文檔
文檔對數據中心運維的工作非常重要.包括數據中心的安裝、配置、優化、組網、設備互連等方方面面,通過這些文檔可以對數據中心的運營了如指掌,在出現故障時迅速排查,找到故障點.文檔還有一個重要的作用就是工作的傳承,當有人員離開時,他只要留下工作的文檔,其它人交接工作就很容易.還有就是工作經驗的積累文檔.雖然各種數據中心大同小異,基本是靠服務器、網絡和存儲三大件打天下,但每個數據中心又都有自己的風格,自己的優勢與劣勢.通過對數據中心運維而輸出的各種技術文檔,將為后來人提供方便,并且可以提升數據中心整體的運維能力.數據中心的文檔五華八門,你不知道什么時候其中的哪些文檔就會派上用場.根據以往經驗,數據中心的文檔主要集中于三類:一是數據中心內部架構文檔,比如:組網介紹、設備互連關系、IP分配情況、空調系統、機電系統、布線系統等的基本狀況;二是數據中心管理文檔,比如:機房管理制度、機房值班和交接制度、機房巡檢制度、設備操作規范制度,安全防護制度等等.三是數據中心改造,優化工程文檔.比如:升級指導書、網絡變更計劃書、應急措施指導、軟件回退方案等等.四是數據中心運維的經驗文檔.比如:網絡中斷問題分析、現有機房環境評估、如果進行業務不丟包切換等等.利用這些文檔,即使一個新人來做數據中心維護,也可以迅速上手.其實不僅對于數據中心這個行業,其它任何行業,任何工作都是如此,養成輸出文檔的好習慣,為自己也為別人提供方便,可以大大提升工作效率.
法寶2:業務備份
數據中心的業務要求全年24小時連續運行,然而數據中心一個故障都不出是不可能的,甚至一些數據中心幾乎天天都在上演各種故障.擁有數十萬臺設備的數據中心,每天壞一臺服務器或一個端口都是在正常不過的事情了,這就要求我們對數據業務有備份.小到服務器、網絡到存儲,大到數據中心,都需要有備份,包含軟件的備份和硬件的備份.通過備份,可以在數據中心運行出問題時,及時做業務調整,確保業務無中斷或者短時中斷.如今的數據中心可以做到多數據中心互為備份,就算其中一個數據中心癱掉,業務也可以順利由其它數據中心接管,繼續正常運行,所以只要不是世界末日到來,在不同地方建設多個數據中心,就能保證數據中心業務的長期穩態運行.業務備份是龐大的系統工程,涉及到方方面面,任何一個環節都有一些備份技術,在數據中心里不可能任何地方都部署備份技術,那將使得數據中心成本過高,設計過于復雜,但是沒有備份肯定是不行的,這就需要在兩者之間找到一個平衡點.不管怎樣,業務備份在數據中心里不可缺少.
法寶3:在線監測
數據中心運行是動態的,每時每刻都在變化.我們無法預知未來會發生哪些突發故障,就算是每個環節都有備份,也需要有監測的手段,來保證業務切換到運行正常的設備上來.對于數據中心在線監測必不可少.在線監測包括網管的監測,服務器運行狀態的監測,空調系統的監測,機房環境的監測等等,當發現異常時,即使將告警通知運維人員,或者軟件自動啟用備用系統,確保數據中心繼續穩定運行.在線監測是確保數據中心無故障運行的保證,有效的在線監測可以減少數據中心故障發生時,對業務造成影響.
法寶4:周期巡檢
俗話說“防患于未然”,對于數據中心日常的周期巡檢是不可缺少的.通過周期巡檢,及時發現一些運行隱患,然后排除,可以大大降低數據中心發生嚴重故障的可能性.周期巡檢可以包括對各種設備的檢查,環境的檢查,電源、空調設備的檢查,填寫日常巡檢記錄表,檢修記錄,作業操作表等等.通過以往記錄的數據進行綜合分析,一旦某些數據有波動或者異常,應該及時采取有效措施,避免隱患引發故障.通過周期巡檢也可以對整個數據中心有個全面的了解,一旦要進行系統改造或者擴容等工作,有了前期這些巡檢數據參考,制定的改造或擴容方案才更有針對性.千萬不要以為周期巡檢只是記錄一些設備運行的基本參數,通過這些參數可以看到整個數據中心的運行狀態.對于一個剛從事運維的新手來說,通過周期巡檢可以迅速了解到數據中心的各個環節,獨立展開維護工作.
工程文檔、業務備份、在線監測、周期巡檢是數據中心運維工作的四個重要方面,只有做好這四個方面的工作,才能讓數據中心保持長期穩定運行,并能產生良好的效益,是數據中心運維水平高低的主要體現,擁有這四大法寶,將使數據中心終身受益.
轉載請注明本頁網址:
http://www.snjht.com/jiaocheng/4600.html