系統(tǒng)運(yùn)維 | 游戲公司的自動(dòng)化運(yùn)維建設(shè)
2020-05-23 20:41 作者:艾銻無(wú)限 瀏覽量:
一、建設(shè)自動(dòng)化系統(tǒng)運(yùn)維體系的原因
先來看一下我們?yōu)槭裁匆ㄔO(shè)一個(gè)自動(dòng)化
系統(tǒng)運(yùn)維體系。首先來看
系統(tǒng)運(yùn)維遇到的一些挑戰(zhàn)。
第一個(gè)是游戲的需求。它表現(xiàn)為三個(gè)方面:
· 一是游戲數(shù)量多,我司現(xiàn)在運(yùn)營(yíng)的游戲多達(dá)近百款。
· 二是游戲架構(gòu)復(fù)雜。游戲公司和一般的互聯(lián)網(wǎng)公司有一個(gè)很大的區(qū)別,就是游戲的來源可能有很多,比如有國(guó)外的、國(guó)內(nèi)的,有大廠商的、小廠商的;每個(gè)游戲的架構(gòu)可能不一樣,有的是分區(qū)制的,有的是集中制的,各種各樣
的需求。
· 三是操作系統(tǒng)種類多,這與剛才的情況類似,游戲開發(fā)者的背景與編程喜好不一樣,會(huì)有Windows、Linux等。
第二個(gè)是在硬件環(huán)境方面,主要表現(xiàn)為服務(wù)器數(shù)量多、服務(wù)器型號(hào)多。因?yàn)楣緩慕⒌浆F(xiàn)在有十幾年的時(shí)間了,在這個(gè)過程中分批、分期采購(gòu)的服務(wù)器幾乎橫跨各大OEM廠商的各大產(chǎn)品線,型號(hào)多而雜。
最后是人的因素。我們?cè)诮ㄔO(shè)自動(dòng)化
系統(tǒng)運(yùn)維體系過程中,有一個(gè)比較重要的考慮點(diǎn)是人的因素。如果大家的技術(shù)能力都很強(qiáng),很多時(shí)候一個(gè)人可以完成所有工作,可能也就不需要自動(dòng)化
系統(tǒng)運(yùn)維體系了。正是因?yàn)槊總€(gè)
系統(tǒng)運(yùn)維人員的能力不一樣,技術(shù)水平參差不齊,甚至是運(yùn)維習(xí)慣和工具也不一樣,導(dǎo)致我們必須要?jiǎng)?chuàng)建一套規(guī)范的自動(dòng)化
系統(tǒng)運(yùn)維體系,來提升工作效率。
二、建設(shè)自動(dòng)化系統(tǒng)運(yùn)維體系的目標(biāo)
再看一下建設(shè)這套自動(dòng)化
系統(tǒng)運(yùn)維體系的目標(biāo),也就是說我們的原則是什么?筆者將自動(dòng)化
系統(tǒng)運(yùn)維體系的建設(shè)目標(biāo)總結(jié)為四個(gè)詞。
· 第一個(gè)是“完備”,這個(gè)系統(tǒng)要能涵蓋所有的運(yùn)維需求。
· 第二個(gè)是“簡(jiǎn)潔”,簡(jiǎn)單好用。如果系統(tǒng)的操作流程、操作界面、設(shè)計(jì)思想都比較復(fù)雜,運(yùn)維人員的學(xué)習(xí)成本就會(huì)很高,使用的效果是會(huì)打折扣的,系統(tǒng)的能力、發(fā)揮的效率也會(huì)因此打折扣。
· 第三個(gè)是“高效”,特別是在批量處理或者執(zhí)行特定任務(wù)時(shí),我們希望系統(tǒng)能夠及時(shí)給用戶反饋。
· 第四個(gè)是“安全”,如果一個(gè)系統(tǒng)不安全,可能導(dǎo)致很快就被黑客接管了。所以安全也是重要的因素。
三、自動(dòng)化系統(tǒng)運(yùn)維體系的結(jié)構(gòu)和運(yùn)作方式
下面我們來看一下每個(gè)子系統(tǒng)是如何設(shè)計(jì)和工作的。
1、自動(dòng)化安裝系統(tǒng)
2、自動(dòng)化運(yùn)維平臺(tái)
3、自動(dòng)化安檢系統(tǒng)
4、自動(dòng)化客戶端更新系統(tǒng)
5、自動(dòng)化服務(wù)器端更新系統(tǒng)
6、自動(dòng)化數(shù)據(jù)分析系統(tǒng)
7、自動(dòng)化數(shù)據(jù)備份系統(tǒng)
8、自動(dòng)化監(jiān)控報(bào)警系統(tǒng)
總結(jié)
我們一直在做自動(dòng)化
系統(tǒng)運(yùn)維體系,對(duì)過去進(jìn)行總結(jié),我覺得有3個(gè)方面可以供大家參考。
第一是循序漸進(jìn)的原則,特別是中小公司或者初創(chuàng)公司,很多時(shí)候并不需要一個(gè)“高大上”的系統(tǒng)。聚焦當(dāng)前的問題,把當(dāng)前的問題處理好,后面的問題也就迎刃而解。如果一開始設(shè)計(jì)的系統(tǒng)很龐大、功能特別豐富,會(huì)導(dǎo)致一些無(wú)法控制的局面。比如這個(gè)系統(tǒng)可能最后做不下去了,或者因?yàn)轳詈闲蕴珡?qiáng),開發(fā)控制不了了,或者項(xiàng)目因?yàn)榻?jīng)費(fèi)問題擱淺了。但是如果一開始的目標(biāo)是解決一些特定的問題,有針對(duì)性,那么推進(jìn)起來也會(huì)比較簡(jiǎn)單。在我司的自動(dòng)化運(yùn)維體系建設(shè)過程中,我們首先構(gòu)建的是一個(gè)基礎(chǔ)的服務(wù)器批量操作平臺(tái),先把一部分需要重復(fù)執(zhí)行的工作搬到平臺(tái)上來,再依據(jù)運(yùn)維的需求豐富這個(gè)操作平臺(tái)的功能和提升效率,最后把周邊的系統(tǒng)打通,相互對(duì)接,形成完整的自動(dòng)化
系統(tǒng)運(yùn)維體系。
第二是考慮可擴(kuò)展性。設(shè)計(jì)系統(tǒng)的時(shí)候,功能或者設(shè)計(jì)方面可能不用考慮那么多,但是要考慮當(dāng)服務(wù)器數(shù)量發(fā)生比較大的擴(kuò)張時(shí),系統(tǒng)是否還能支撐,比如數(shù)量級(jí)從十到百,或者上千了,這個(gè)系統(tǒng)是否還是可用的。
第三是以實(shí)用為目的。這在我們系統(tǒng)中也是有體現(xiàn)的。很多情況下,市面上可能已經(jīng)有比較成熟的協(xié)議和工具,拿來評(píng)估看看它們?cè)谏a(chǎn)環(huán)境里面是否可用,如果能用就直接用,沒必要自己再去做一套。自己做的這一套工具,
很多方面沒有經(jīng)過驗(yàn)證,可能會(huì)帶來安全問題。基于成熟的協(xié)議和框架去做,可以提升效率,保證穩(wěn)定性和安全性。
以上內(nèi)容由北京艾銻無(wú)限科技發(fā)展有限公司整理