《專家觀察 | 肖力:“OpenStack政企專享云運維實踐”》要點:
本文介紹了專家觀察 | 肖力:“OpenStack政企專享云運維實踐”,希望對您有用。如果有疑問,可以聯系我們。
由工業和信息化部指導,中國信息通信研究院主辦,業界知名組織云計算開源產業聯盟(OSCAR)承辦的2017全球云計算開源大會于4月19日-20日在北京國家會議中心順利召開.本文為本屆大會嘉賓分享的大會演講速記內容,敬請瀏覽.
嘉賓介紹:肖力
公司職務:北京中聯潤通信息技術有限公司運維總監
大會演講速記
以前都是我當主持人,別人講,今天換個個,我發現明宇主持水平非常高.我給大家帶來的是OpenStack企業專享云運維實踐.
第一,介紹一下我們對政企專享云建設過程.我們公司成立于2009年,我們自己定位是一個云計算、大數據解決方案公司,目前我們通過ISO20000、20007,國家等保三級認證,可信云認證,SP認證.
我們的客戶有國家發改委、中國海關、中國海監局、中國聯通,中國紅十字會等等.
我們包括云計算、大數據資源管理平臺,分布式數據庫,安全態勢感知和數據交換等服務,還提供一些專業服務,運維外包,SDN托管,還包括一些行業解決方案,宏觀經濟決策,軍民融合,電子稅務,政務公開辦公,制造和醫療.
我們做過很多國家級的大型項目,還有一些上市公司,在這些項目中,一些核心需求是什么,我們自己總結十二個字,六個方面,自主、開放、成本、性能、定制、遷移,怎么滿足這些核心需求呢?我們有兩個字秘訣“開源”,通過使用開源解決方案,我們可以滿足自主、開放、成本方面的需求,通過自主研發能力,運維能力,可以很好地滿足性能、定制、遷移方面的需求.
我們有兩個案例,第一個是國家級大數據中心建設,底層云和上層大數據都是使用我們的解決方案,我們首先會做業務需求分析,確定建設思路,這是以點帶面的思路.包括建設方式,我們是統籌的數據資源,這個項目建設成果可以促進國家經濟發展,大數據中心,有效支撐了國家大數據分析應用,有利于顯著提高國家經濟部門管理性能和決策水平.
這是一個醫藥行業某上市公司的案例,這是非常典型的OpenStack案例.
這個案例目標是制造核心云,從傳統模式自建SDC,遷移到OpenStack私有云,同時支持多層復雜的內部云,包括醫院業務系統醫療和辦公系統等,設計架構采用混合架構,新建以OpenStack為核心的企業私有云,提供用于SDP等特殊配置物理集合,標準配置虛擬機,使用點對點專線連接到用戶現場,辦公現場.
建設成果以用戶需求為導向,以穩定性、安全性、靈活性為設計目標,建設私有云平臺,滿足行業監管機構對業務系統的特殊安全要求,包括醫療檔案數據隔離,數據庫等等.
用戶收益,通過部署私有云實現客戶IP資源標準化,通過服務目錄交互服務,企業不再承擔固定資產投入,以靈活的方式選擇IP投入,這是典型的OpenStack云的建設案例.
云的運維非常重要,我們云的運維如何組織的呢?運維方面我們主要有兩個挑戰.
第一,我們經常有多個OpenStack項目同時實施,而且許多又是國家級大型OpenStack項目,經常一個周期是大半年時間,甚至有的超過一年時間,而且這些項目經常做完以后轉為我們去服務,我們目前有幾十個OpenStack項目提供服務,這是我們運維方面碰到的兩個挑戰.
解決方案:我們有三板斧,第一,我們有一套運維工具,我們有持續不斷的共享和培訓.我們非常重要的是項目導向的團隊建設,先看一下我們運維工具,我們有一套自動化的運維系統,我們建設是用微服務的理念建設出來的,完全自己開發出來的,我們的開發團隊幫助我們做一個平臺,所有運維都為了完善這個平臺.一切的腳本都是原子的,我們可以快速對腳本進行重新組合,比如原來機遇OpenStackM版寫了一個腳本,現在N版出來了很多腳本是公用的,我們也可以很快的把腳本寫出來.
另外我們要為幾十個OpenStack項目服務,我們整個服務用公端驅動的,所有客戶需求都是用公端體現的.我們還有日志系統,我們把云主機、物理機日志收集起來.現在我們還在做一件事情,做一些智能的預警,建立一個智能系統,通過日志分析,在故障沒有發生之前做預測.以及我們還有一個項目管理系統.
這是我們的工單系統,我們日常就是靠工單系統運轉,最早我們使用的一套開源工單系統,這套系統功能比較全一點,但是東西也比較笨重一點,后來我們開發了一套完全滿足我們一套輕量級的工單系統,非常不錯,界面是簡陋一點.
這是我們的運維系統,基本上我們把它叫平臺集成器,我們的研發幫我們做一個平臺,底層有一個集成器.基本上我們目前運維就是高公端系統和自動化運維系統作為兩個支撐點支撐的,在內部也運行比較順暢.
我們有一個計劃,我們使用了很多開源軟件,我們也希望回饋一些東西,我們預計今年下半年或者明年年初,我們的公端系統和運維工具系統準備拿出來開源,和大家共享.因為我們覺得這些系統跟OpenStack結合的時候,我們還是有一些經驗和心得的,希望能夠分享出來.
另外運維我們還有一個非常大的特色,就是引入一些項目管理工具,比如我們拿到OpenStack項目會首先分成幾個任務包,任務包可以再細分到天、人,每個人每天做什么,一些特別重要的項目,我們甚至會分解到小時,我們每天都有一個list,每天大家匯報信息,完成什么樣,每天持續檢查跟蹤,這樣可以保證我們對一個運維項目,對一個OpenStack項目,譜儀保質保量,而且在可控范圍內能夠把它做完.
這是我們運維團隊的演進,最早的時候我們運維團隊分為四組,一個是知識組,知識組分為兩塊,一個是24小時值班,一直看監控屏幕,還有一個是客服接電話的終端處理,還有一個組是現場組,這個組主要做一些物理服務器上架,還有操作系統安裝,還有一個組叫網絡安全組,做一些網絡安全設備上架配置,還有網絡服務的需求.
還有是系統組,系統組主要做操作系統以上,比如OpenStack部署,Ceph部署,客戶系統的需求,可以做一些變更.這個劃分可以滿足我們業務需要,但是有一個問題,如果有項目來的時候,現場組工作量非常忙,但是項目結束以后,有一段時間可能沒項目,這段時間他又相對比較清閑一點,工作量不飽和,而且還有一個問題,現場組這些人永遠接觸的都是硬件,網絡組接觸的都是網絡的一些東西,然后我們做了團隊的變革.
目前我們有三個組,一個是支持組,基本上還是做以前支持組的事情.還有是實施組,我們把現場組、網絡組、系統組部署的活分到一個組里面,這樣對于實施組來說有很好的學習機會,既可以做硬件部署,也可以做系統部署,也可以做OpenStack部署,也可以做終端處理.還有架構組,架構組主要做一些方案設計,方案實施,有時候需要見一些客戶,對他來說也是很好的鍛煉.
項目怎么實施呢?我們目前采用的是虛擬項目的機制,一般是架構組出一個人,實施組根據項目大小,人數不一樣,有時候三到五人有時候更多,這個項目就一直歸架構組處理.整個項目周期由一個人負責,這樣的好處是項目他比較熟悉,客戶一直接觸他,有些問題也比較好處理,以及數據流量他都很清晰,能夠保證項目不管是實施,以及實施后的項目服務,都可以保證.
文章來自微信公眾號:云計算開源產業聯盟
轉載請注明本頁網址:
http://www.snjht.com/jiaocheng/4174.html