电竞比分网-中国电竞赛事及体育赛事平台

分享

事件管理決定一個網(wǎng)管軟件的成功與失敗...

 digman 2009-08-04

事件管理決定一個網(wǎng)管軟件的成功與失敗

2009-7-27 15:33:17【作者】 賴永鋒 【進入論壇】
editor@Amteam.org進入賴永鋒談ITIL

賴永鋒

賴 永鋒,1997年畢業(yè)于新加坡國立大學,曾在知名咨詢公司埃森哲公司任電信、金融行業(yè)資深IT顧問,為企業(yè)提供最佳IT實踐模式;還在渣打銀行的業(yè)務經(jīng)營 分析系統(tǒng)建設項目中任技術主管;后進入美國NCR公司研發(fā)中心,擔任技術主管,并為多家公司提供IT支撐系統(tǒng)的架構設計。2003年加入摩卡軟件,現(xiàn)任摩 卡軟件有限公司總經(jīng)理?!?/div>
因此,一旦網(wǎng)絡中某些設備或者某些資源出現(xiàn)了問題,或者說設備的狀態(tài)發(fā)生了變化,就自然而然會產(chǎn)生事件。
本文關鍵字 網(wǎng)管 事件管理
聲明:
1.暢享網(wǎng)專欄專家文章僅代表作者個人觀點,并不代表暢享網(wǎng)贊同其觀點和對其真實性負責,本網(wǎng)不承擔此類稿件侵權行為的連帶責任。
2.在本網(wǎng)的文章頁面上進行跟帖或發(fā)表言論者,均為網(wǎng)友言論,不代表暢享網(wǎng)觀點。

很多人用網(wǎng)管軟件很長時間了,但是還是覺得用起網(wǎng)管軟件來,很不方便。這是什么原因呢?筆者認真分析了種種原因,最終發(fā)現(xiàn),原來是很多人并沒有把網(wǎng)管軟件中的事件管理用好。因此筆者用摩卡軟件公司的Mocha BSM網(wǎng)絡管理軟件為例,來說明一下,為什么要用好事件管理。

什么是事件管理

首 先向大家說明一下,什么是事件管理,首先我們想象一下,網(wǎng)絡中各種IT元素也像人類這個社會一樣,每天都會發(fā)生各種各樣的事情,如某個網(wǎng)絡設備宕機了,某 個服務器重啟了,或者某個網(wǎng)絡端口宕掉了,等等。因此一旦網(wǎng)絡中某些設備或者某些資源出現(xiàn)了問題,或者說設備的狀態(tài)發(fā)生了變化,就自然而然會產(chǎn)生事件,如 端口由UP狀態(tài)變?yōu)镈own狀態(tài);或者反之,由Down狀態(tài)變?yōu)閁p狀態(tài),都會產(chǎn)生事件。

那么,我們再想象一下,如果沒有事件管理,網(wǎng)管將 會怎樣?如果沒有事件管理的話,針對IT資源的管理永遠將會是處于一片混亂,我們根本不知道過去整個網(wǎng)絡中到底發(fā)生了什么,我們只能夠通過網(wǎng)絡拓撲圖僅僅 看到紅燈由綠變紅,而后又由紅變綠。這也就是為什么,很多人使用了網(wǎng)絡管理軟件后,總覺得網(wǎng)管軟件不好用的原因之一,因為他覺得只要看網(wǎng)絡拓撲圖就足夠 了,而真正的驅動整個網(wǎng)絡管理的運維流程和為管理維護人員產(chǎn)生短信通知等,都是事件管理的功勞。因此,說事件管理決定一個網(wǎng)管軟件的成功和失敗是不為過 的。

好的事件管理軟件好在何處

在這里,我們就為大家好好說一說一個好的事件管理軟件是如何做到的:

1.好的事件管理是能夠進行根源性分析的。

一 旦網(wǎng)絡中某個核心路由宕機,導致某個網(wǎng)段內(nèi)的IT設備都不可訪問,如果沒有根源性分析的話,網(wǎng)管人員將會看到成百上千的故障事件,而有了根源性分析的話, 管理人員只會收到一個故障事件的報告,網(wǎng)管人員只要恢復該故障事件即可解決問題。因此,一個好的事件管理能幫助網(wǎng)管人員減輕大量的工作量,而且能起到一劍 封喉的作用,直接解決問題,省卻大量的故障查找時間和故障分析時間。

2.好的事件管理是能夠防止誤報的。

一 個網(wǎng)管系統(tǒng)上線后,網(wǎng)管人員常常會收到大量的故障告警,而通過查找和對比,網(wǎng)管人員往往會發(fā)現(xiàn),其中95%的故障告警是垃圾告警,長此以往,真正的故障告 警發(fā)生的時候,將會是狼來了,卻沒有人理會。這個是為什么呢?因為,市面上,很多網(wǎng)管軟件都沒有做誤報過濾處理,如下圖,很多的時候,一個性能超標事件常 常是因為某個偶然因素,會向上跳至超標線,而后迅速恢復至正常。如果將該種超標視為故障而報警的話,將會導致網(wǎng)管人員疲于奔命的效果,因此摩卡軟件公司的 網(wǎng)管軟件采用了Flapping技術,當某個指標連續(xù)超標N次后,才會告警。這個N是可以根據(jù)用戶的實際需求,而靈活調整的。

3.好的事件管理是能夠提供壓縮事件的。

當一個服務器宕機后,如果在1個小時內(nèi)沒有恢復的話,很多網(wǎng)管軟件會每隔幾分鐘就不間斷的發(fā)出短信告警,但實際上運維人員已經(jīng)在處理故障了,因此摩卡軟件根據(jù)這個特點,實行了故障事件壓縮處理,當故障事件產(chǎn)生后,只會發(fā)出一條告警事件,直到故障恢復。

4.好的事件管理能夠和問題指標自動關聯(lián)的。

很多時候,一個設備出現(xiàn)問題,往往不止是一個原因,因此摩卡軟件的事件管理能夠將性能故障和多個性能指標事件相關聯(lián),方便管理人員進行綜合分析。

5.好的事件管理是能夠產(chǎn)生自定義事件,以方便和運維流程整合。

故障事件產(chǎn)生后,是需要流程去解決的,因此必須為流程的啟動和工單的觸發(fā)預留足夠的接口,而摩卡網(wǎng)管軟件支持用戶自定義事件,為流程的整合提供了靈活的接口,方便網(wǎng)管軟件和IT運維流程管理軟件進行整合。


    本站是提供個人知識管理的網(wǎng)絡存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權內(nèi)容,請點擊一鍵舉報。
    轉藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多