2024年3月6日發(作者:睥睨一切)
淺談省級電信網絡集中監控系統的實現與思考
作者:童杰斌
來源:《中國新通信》 2018年第15期
【摘要】 本文主要對省級電信運營集中監控系統應用背景、設計構想、應用實踐進行探討和思考,旨在呈現集中監控和自動派單的實現路徑,并提出集中監控系統下一步發展方向的思考。
【關鍵詞】 集中監控 自動派單 告警壓縮 監控策略 跨域關聯 數據挖掘
一、前言
隨著移動通信的升級迭代以及移動通信往高頻譜方向發展,無線基站網元數量在成倍增長;在寬帶中國及互聯網消費經濟刺激下,固定寬帶接入網元數量也在高速增長;業務網的擴張也帶動了傳輸、動力環境等基礎網絡網元數量的大量增長。幾何級數的網元數量增長對傳統的網絡監控模式提出嚴峻的挑戰,同時電信運營商面臨互聯網轉型下的人員、效率、效益等方面的壓力,如何利用IT 信息系統實現十萬~百萬級網元實現集中監控、自動派單、全流程管控成為必須面對的課題。
二、集中監控系統結構及設計
基于省級電信網絡大量的網元匯集和海量的告警信息采集,以及網絡運營中資源數據的頻繁更新,在實踐中可將配置數據、告警數據、電子運維等功能采用積木式搭建,系統架構設計采用告警采集及分析模塊(FM)、電子工單派發與反饋模塊(EOMS)、資源數據采集與關聯模塊三部分構成,系統結構設計圖如下:
系統架構設計上,集中監控系統涉及的兩套核心系統為FM 告警采集派單系統和EOMS 電子運維工單系統,一套輔助系統為資源管理系統。FM 告警采集派單系統集成全省N套專業網管的海量告警實時采集功能,實現告警標準化及過濾功能,按照派單策略部署M 條自動派單規則,與資源管理系統對接定期完成資源配置數據同步。同時具備對故障告警的統計報表輸出(Unibi)。EOMS 電子運維工單系統接受FM 告警采集派單系統的派單指令,與資源管理系統接口同步配置信息,將電子工單按照分權分域的要求派發到資源管理系統中網元對應的維護人。資源管理系統通過全省N 套專業網管定期采集網元配置信息,一方面同步至FM 系統形成告警與網元的關聯派單,另一方面同步至EOMS 系統形成網元與電子工單接單人(組)的一致。
三、集中監控派單策略及流程
3.1 派單策略部署
1、過濾壓縮策略
過濾壓縮策略主要指FM 系統對采集到的海量告警,按照事先部署的派單策略過濾出需要派單的告警,再針對這類告警利用一系列關聯、合成、壓縮規則創建成故障工單。例:一個省級電信運營商每天產生的告警量為100 萬+,派單策略過濾出需要派單的告警為1.5 萬+,通過關聯、合成、壓縮最后形成的工單約3000+。(注:以上數據僅說明過濾壓縮策略的數量級)
2、工單分類策略
工單分類策略是根據告警產生工單的重要性及影響范圍,將工單分為業務類、性能類和通知類。業務類主要為網元退服、鏈路中斷等告警形成的工單;性能類主要為網元出現重要告警、隱性告警等形成的工單;通知類主要為停電、溫度等告知類告警形成的工單。
3、分權分域策略
分權分域策略主要指工單派發應考慮到設備所屬區域、設備所屬專業、接單人權屬等特點,在區域方面按照省、市、縣三級區分,最低按照縣域進行派發;在專業方面按照無線網、核心網、數通網、接入網、傳輸網、動環網等專業設置進行派發;在接單人權屬方面,直接派發至末梢一線維護人員,同時具備抄送至地市主管、地市領導、省級主管、省級領導等升級通知功能。
4、分時延時策略
延時策略主要針對故障發生后,由于多告警合成的需要(如無線基站片掉、短時頻繁閃斷),或是瞬時故障等特點,派單延遲1-10 分鐘,目的在于減少無效派單量。
分時策略主要針對夜間非重要網元、不具備搶修條件的網元告警不派發工單,待窗口時間后對仍未恢復的告警啟動派單。同時分時策略也可以對夜間割接網元產生告警進行工單抑制。派單流程實現
根據各類設備產生的告警通過專業網管收斂至FM 系統,FM 從資源管理系統定期同步資源信息對采集到的告警信息進行網元配置信息豐富,并進行標準化歸檔。
FM 系統根據提前布置的派單規則,對“有用”告警進行合成故障工單,包含網元信息、告警類型、工單級別、分權分域等內容并作為唯一的site down flag 傳遞至EOMS 電子運維工單系統。
EOMS 電子運維工單系統根據同步資源管理系統得到的資源配置信息,以及自身配置的資源組、工單組、工單賬號等信息,將相應工單派發至相應的地市維護組。(對資源管理系統中極少量未及時維護資源配置信息造成無主的工單,采取手動派單的方式派發到地市維護組)。地市維護組內相應的接單人員通過APP 或web 頁面,接收工單并納入故障處理流程,故障恢復后按照故障原因歸類及時回復故障原因,EOMS 電子運維工單系統進行歸檔處理。
四、集中監控系統發展及思考
通過全省集中監控系統,可對網絡數據進一步進行數據挖掘:利用動環網采集到的停電數據和無線斷站數據,對基站機房蓄電池續航能力進行監測和整治;利用動環網和設備發出的溫度告警,作為機房配套設備維護整治的依據;利用設備板卡告警故障大數據沉淀,可形成設備穩定性后評估報告,可指導設備選型等工作。根據多專業告警產生規律,結合網元拓撲邏輯關系和物理關系,形成基礎網和業務網跨域關聯,進一步提升網管監控效率及專業協同,通過IT
系統智能判斷出故障直接原因,提高對一線維護人員搶險的支撐能力。
本文發布于:2024-03-06 20:03:42,感謝您對本站的認可!
本文鏈接:http://www.newhan.cn/zhishi/a/88/53395.html
版權聲明:本站內容均來自互聯網,僅供演示用,請勿用于商業和其他非法用途。如果侵犯了您的權益請與我們聯系,我們將在24小時內刪除。
本文word下載地址:淺談省級電信網絡集中監控系統的實現與思考.doc
本文 PDF 下載地址:淺談省級電信網絡集中監控系統的實現與思考.pdf
| 留言與評論(共有 0 條評論) |