《完美世界:百款游戲背后的運維實踐》要點:
本文介紹了完美世界:百款游戲背后的運維實踐,希望對您有用。如果有疑問,可以聯系我們。
以下內容根據阿里云行業圓桌論壇視頻整理而成.
本期嘉賓介紹:
趙鵬,完美世界運維部總監;
翔賀,阿里云資深架構師.
上云趨勢不可避免,越來越多的企業啟動上云之路.在云計算普惠時代,各行各業都在發生著變化.
阿里云行業圓桌會,匯聚APP、網站、游戲、金融、電商、音視頻、健康、教育、能源、政務、運輸、制造等12大行業類別,邀請阿里云經典客戶,一起聊聊他們的上云之路,以及云上技術實踐!
完美公司的主要業務是游戲和影視,游戲像PC當中的《完美世界》國際版、《誅仙》、《笑傲江湖》等,手游也是近兩年完美的發展方向;影視方面像《失戀33天》、新版《射雕英雄傳》等都是完美影視作品.完美是影游聯動,去做文化娛樂產業.
那么,阿里云對游戲行業有什么解決方案?
翔賀介紹說,游戲行業對穩定性、性能表現比其他行業要高,甚至要超過金融行業,游戲行業會有流失行為,當你的服務不穩定,用戶體驗不好,玩家就流失掉了.阿里在游戲方向從第一天就開始在產品上做功課,現在有高效云磁盤、SSD云盤等更好的符合游戲簡單部署的場景,傳統的性能磁盤肯定不能滿足游戲行業的需求;從產品架構設計上來說,數據都是多分容存儲的,也支持熱遷移,突發性的宕機遷移,數據可靠性能夠得到很好保障;從穩定性來講,我們也打造了游戲專享集群,在這個集群里我們會要求客戶本身業務的健康度.我們也會深入行業的業務層,包括卡牌、棋牌等都會有針對性的方案提供給游戲合作伙伴參考,如何在云平臺更好的構建業務.另外,我們的售后服務體系保障的時效性和處理速度也非常專業.
完美上云實踐
游戲上云和其它行業上云有什么不同嗎?完美世界的上云之路都應用了哪些云產品?
游戲是互聯網的一部分,常規互聯網的運維自主性更強,運維人員可以使用更開源、更新的技術,而游戲受限于整個研發團隊,很難去改變它已經定義好的技術上使用的工具、內容,一旦改變就會影響整個游戲的穩定性.
游戲上云時,第一會考慮可定制化,有時我們會對內核做一些調整,對系統做一些修改;第二會考慮性能,游戲是理論上的單點,對性能有一定要求;第三會考慮穩定,我們很難接受服務器宕機,我們的目標是讓宕機率越來越低,趙鵬如是說.
接著他又說,云所提供的服務不僅有云主機,還包含CDN、防護等,完美在上云過程中,將云主機當作虛擬IDC處理,使用云產品時不會破壞整個運維體系和架構,它只是被當作觸角延伸出去.阿里本身技術能力也很強,我們的IDC人員只需和阿里技術人員溝通好.
對于老游戲如何平滑的遷移到云上,新游戲如何快速的部署到云上?
趙鵬解釋說,老游戲就是把現有的架構遷移到云上,阿里云已經支持架構的定制化,我們可以無縫的遷移.新游戲,我們會更多的考慮云主機資源的彈性以應對突增.
完美目前是自建IDC和云服務樣的混合云架構?
趙鵬談及,游戲行業對程序的安全性比較重視,我們所有的運維都有自己的運維網絡,IDC之間的互聯,或是自己拉專線,或是通過VPN方式打通虛擬通道來去做管理,可以把完美現有的架構當成私有和公有混合的云,既有云主機也有實體機,既有自建IDC,也有云IDC.
翔賀也說,混合云在現在還是有存在的必要性的,包括在安全上、性能上、傳統的運維方式以及存量服務器的因素等,在這個時代我們會去適應這樣的場景.混合云包括兩種,一是云平臺+物理機,一是多家云平臺混合使用,我們都有相應的技術支持,我們可以將云上云下通過專業的方式打通,可以通過VPN方式實現子網IP地址統一管理,可以實現私網互通.
緊接著趙鵬又說,云會給我們帶來方便,但不會顛覆我們的運作方式,它是我們資源的擴展,它給業務運維提供的東西還是一個一個符合網絡要求、性能要求、系統版本要求的操作系統,更多的是實現融合.完美的運維團隊有60多人,負責北美、國內和海外約140個項目.
對運維的理解和探索
如何在游戲業務架構上保證高可用性?
游戲架構決定游戲怎么去搭建生態環境,有些游戲是單組的,一組能夠承載的人數取決于本身系統提供的性能和程序本身設定的環境,超過上限玩家可能搶不到掛、任務組隊不容易等,甚至游戲內的金融環境也會產生影響,為了滿足玩家,我們只能不停的開服,這時候云對我們就很重要了,趙鵬認真的解釋道.
對DevOps的理解大家各有見解,而趙鵬理解是,他會把它分成兩部分去看.一部分是做平臺,脫離業務做通道、平臺、流程流控,因為它不知道這款游戲合服怎么合,挪服怎么挪;一部分是做業務,通過自己的腳本能力,Python、Shell等形成標準的操作腳本,腳本的輸入輸出要符合要求,將它嵌進去也算是devOps.
翔賀也做了自己的理解,DevOps核心是解決研發,業務層包括代碼,以及傳統IT之間交付的效率協同,完美的運維平臺就是在解決DevOps的場景,可能與業內DevOps定義不完全一樣,但我們要實現的目標和目的是一樣的.
對于某游戲發生宕機造成回檔,以及gitlab刪庫事件有什么看法?
趙鵬深有感觸,備份失效的事件我們也發生過,我們很早就開始反思備份策略,之前定制的規定是否做到位了呢?我們現在采取三級備份,本組服務器的備份、本機房存儲空間的備份和第三方機房甚至云上的備份,如果機器宕機,我們保證一個小時內回檔數據.除了備份之外,我們也強調備份后的可用性,我們會定期做備份的演練,抽檔的檢查.同時,我們也會通過手機、微信的報警聯動進行監控.
阿里云每一款持久化數據的產品以及緩存類的產品都會做持久化和容災策略,首先我們要保證服務的高可用性,其次要保證數據的高可靠性,主從切換時盡量保證數據的一致性.
最后,趙鵬對想從事運維行業同學給出了自己的建議,首先是線下學習,才能在后續做更大的發展;其次,運維也要保證好身體;另外,我們也要有好心態,能夠承受壓力.運維做到最后是讓人感覺不到明顯的存在,因為我們把事情做到位了,不出事故.
原文出處:https://yq.aliyun.com/articles/71877
轉載請注明本頁網址:
http://www.snjht.com/jiaocheng/4339.html