隨著 IT 建設(shè)的不斷深入和完善,計算機硬軟件系統(tǒng)的運行維護已經(jīng)成為了各行各業(yè)各單位領(lǐng)導(dǎo)和信息服務(wù)部門普遍關(guān)注和不堪重負的問題。由于這是一個隨著計算機信息技術(shù)的深入應(yīng)用而產(chǎn)生的新課題,因此如何進行有效的 IT 運維管理,這方面的知識積累和應(yīng)用技術(shù)還剛剛起步。對這一領(lǐng)域的研究和探索,將具有廣闊的發(fā)展前景和巨大的現(xiàn)實意義。
所謂 IT 運維管理,是指單位 IT 部門采用相關(guān)的方法、手段、技術(shù)、制度、流程和文檔 等,對IT 運行環(huán)境(如硬軟件環(huán)境、網(wǎng)絡(luò)環(huán)境等)、IT 業(yè)務(wù)系統(tǒng)和 IT 運維人員進行的綜合管理。IT 運維管理主要包括七個方面的管理內(nèi)容:
● 設(shè)備管理:對網(wǎng)絡(luò)設(shè)備、服務(wù)器設(shè)備、操作系統(tǒng)運行狀況進行監(jiān)控和管理;
● 應(yīng)用/服務(wù)管理:對各種應(yīng)用支持軟件如數(shù)據(jù)庫、中間件、群件以及各種通用或特定服 務(wù)的監(jiān)控管理,如郵件系統(tǒng)、DNS、Web 等的監(jiān)控與管理;
● 數(shù)據(jù)/存儲/容災(zāi)管理:對系統(tǒng)和業(yè)務(wù)數(shù)據(jù)進行統(tǒng)一存儲、備份和恢復(fù);
● 業(yè)務(wù)管理:包含對企業(yè)自身核心業(yè)務(wù)系統(tǒng)運行情況的監(jiān)控與管理,對于業(yè)務(wù)的管理,主要關(guān)注該業(yè)務(wù)系統(tǒng)的 CSF(關(guān)鍵成功因素 Critical Success Factors)和KPI(關(guān)鍵績效指標Key Performance Indicators);
● 目錄/內(nèi)容管理:該部分主要對于企業(yè)需要統(tǒng)一發(fā)布或因人定制的內(nèi)容管理和對公共信息的管理;
● 資源資產(chǎn)管理:管理企業(yè)中各 IT 系統(tǒng)的資源資產(chǎn)情況,這些資源資產(chǎn)可以是物理存在 的,也可以是邏輯存在的,并能夠與企業(yè)的財務(wù)部門進行數(shù)據(jù)交互;
● 信息安全管理:目前信息安全管理主要依據(jù)的國際標準是 ISO17799,該標準涵蓋了信息安全管理的十大控制方面,36 個控制目標和 127 種控制方式,如企業(yè)安全組織方式、資產(chǎn)分類與控制、人員安全、物理與環(huán)境安全、通信與運營安全、訪問控制、業(yè)務(wù)連續(xù)性管理等;
● 日常工作管理:該部分主要用于規(guī)范和明確運維人員的崗位職責和工作安排、提供績 效考核量化依據(jù)、提供解決經(jīng)驗與知識的積累與共享手段。
IT運維軟件隨著IT系統(tǒng)的實施逐漸成為企業(yè)必備的信息化工具,解決好IT運維,實施高效網(wǎng)絡(luò)管理,將顯著提升企業(yè)IT系統(tǒng)運行效率,將轉(zhuǎn)變IT服務(wù)部門的職能作用,從成本中心向價值中心轉(zhuǎn)換,那如何選擇一款好的運維軟件,這也成為企業(yè)用戶最為關(guān)注的事情。
評價IT運維的軟件應(yīng)該結(jié)合功能以及企業(yè)的實際應(yīng)用情況,具體來說應(yīng)該分了兩部分。一部分為軟件的底層監(jiān)控平臺的性能,即對服務(wù)器、數(shù)據(jù)庫、存儲等的監(jiān)控,同時還應(yīng)重視對桌面的安全策略,通常應(yīng)該包括防火墻、入侵顯示、防病毒等方面的信息。對以上設(shè)備和策略的監(jiān)測分析,進而歸并分析的就是底層監(jiān)控平臺,這不僅包含監(jiān)控的完整性,更重要的需要考慮監(jiān)控的顆粒度,監(jiān)控資源、基礎(chǔ)信息,從而得出運行報告,為系統(tǒng)優(yōu)化提供一些可供參考的依據(jù)。這應(yīng)當是一款好的IT運維軟件應(yīng)該具備的功能。
第二部分,也是企業(yè)更為關(guān)注的運維管理層,對于底層類種繁多的監(jiān)控工具,如何將其在統(tǒng)一平臺上展現(xiàn)出來,以供IT 管理員方便查看。企業(yè)IT管理員可以通過統(tǒng)一管理平臺查看當前IT系統(tǒng)的環(huán)境,網(wǎng)絡(luò)的服務(wù)器,業(yè)務(wù)應(yīng)用以及安全設(shè)備等。在此基礎(chǔ)上可以通過流程化的IT運維管理來解決企業(yè)的IT故障,并且能保證高效快速解決。
用戶對集中運行管理平臺的底層監(jiān)控軟件提出了兩方面的要求:一是需要底層監(jiān)控平臺的穩(wěn)定,如果系統(tǒng)底層監(jiān)控平臺不穩(wěn)定,業(yè)務(wù)監(jiān)控時斷時續(xù),系統(tǒng)不能有效實施。同時因為經(jīng)常誤報、錯報,不能解決真正的IT故障。此次,不穩(wěn)定的IT運維平臺所產(chǎn)生的報表也是不可用的,因為數(shù)據(jù)是無效的,所以底層監(jiān)控平臺的穩(wěn)定性是非常重要的權(quán)衡標準;其實,底層監(jiān)控平臺方面還需考慮到監(jiān)控的“顆粒度”,顆粒度深入細致的IT運維軟件能夠?qū)⑿枰P(guān)注的運行參數(shù)展現(xiàn)給IT人員,管理人員可以整體把控系統(tǒng)運行的健康度,從而通過故障的分析了解到系統(tǒng)的瓶頸,通過相應(yīng)的優(yōu)化策略來進行調(diào)整。總之,集中運行管理平臺集平臺穩(wěn)定和監(jiān)控顆粒度細微于一體,完全能滿足國內(nèi)用戶的IT運維需要。
在運維管理平臺方面同樣存在著兩方面的管理需求:第一是需要運行展現(xiàn)的科學(xué)化、人性化。企業(yè)領(lǐng)導(dǎo)希望整個網(wǎng)絡(luò)和系統(tǒng)的穩(wěn)定運行,比如網(wǎng)絡(luò)鏈路、服務(wù)器這些運行在運維管理平臺上呈現(xiàn)為一個小燈,如果為綠色就代表正常,紅色代表故障,如果異常需要管理員去查看,從業(yè)務(wù)應(yīng)用到具體的硬件指標,可以清晰明了地查看到,進而解決問題;第二是運維平臺有良好的運維流程規(guī)范,企業(yè)的運作模式多樣性決定了IT運維軟件流程的不能一層不變,而應(yīng)該具有靈活性,能滿足不同用戶的運維流程,從而實現(xiàn)輕松運維。
好的運維軟件不僅能滿足用戶的監(jiān)控需要,可供技術(shù)人員管理好基礎(chǔ)設(shè)備,同時運維層次也應(yīng)具備科學(xué)化、人性化的特點,面向IT服務(wù)人員實施好IT運維流程。
相關(guān)文章