在“工業4.0”的大旗之下,制造企業把產品和互聯網技術進行融合,利用信息和通訊技術將生產工藝數字化,提高質量和效率并節約成本。但這條看似寬闊的大路卻不平坦,當前IT基礎設施與生產系統的耦合度緊密,企業的IT運維管理能力亟需與時俱進。
作為中國輛汽車的誕生地,一汽解放汽車有限公司(以下簡稱“一汽解放”)的信息化利刃曾經斬荊披棘,那么,一路風雨走來的IT管理部門,在這個全數字化的奇跡時代能否扛得住呢?
“存儲故障”引發的運維變革
一汽解放成立于2003年,是以原汽車制造廠主體專業廠為基礎,以中國汽車集團公司技術中心為技術依托重新組建的中重型載重車制造企業,是中國汽車集團公司的全資子公司。
在2003年公司成立之初,企業的信息化基本處于空白狀態,之后經歷了管理體系建設、工廠級數字化企業建設、到現在擁有OA、PDM、ERP、TDS、MES、SCM、EOL等多個汽車制造業核心業務系統 ,使公司信息系統管理水平走在了國內商用車行業的前列。
“經過十多年的信息化建設,一汽解放的IT基礎支撐平臺已經比較完善,各種復雜的業務系統支撐著企業高速運轉,因此必須確保各種業務系統實現、持續的運行,否則將對核心業務造成極大的影響,甚至會帶來巨大的經濟損失。因此,我們從未放松,IT運維管理系統也經歷了幾次升級,這次對運維平臺升級換代的原因看似很簡單,是因為存儲系統的故障無法監控,但它的意義遠不止于此。”IT部門的劉工全面介紹了一汽解放網絡運維管理工作,并且重點談到了IT運維平臺升級的經歷。
那么,存儲系統出現故障后,為何能夠引起如此大的波瀾呢?
能者居之,與北塔軟件的“偶遇”
“傳統意義上的存儲管理,更多的是廠商設置管理,往往一個存儲網絡中需要存在多個廠商的管理,之間互不聯系,導致運維效率低下,甚至出現了對于存儲的‘黑盒’管理模式。另外,IT運維是一種整體服務,如果把存儲系統故障的事件單獨拿出來,這就失去了運維本身的意義。”劉工思考這次事件不僅能夠立足現在,更顯示出了熟讀“運維兵法”的功底。
據介紹,當時存儲系統出現了磁盤硬件故障,但由于第三方的網管工具不能針對存儲系統進行監控,所以劉工和同事接到業務部門報修電話后,再一次扮演了“救火隊員”的角色,這是大家都不愿意看到的。
一套完整的業務系統會涉及到方方面面,包括:網絡通信、電力資源、機房環境等能夠直觀看到的硬件資源;以及承載業務服務的服務器、存儲、網絡設備、安全設備、操作系統、數據庫、中間件、應用程序等軟性指標。所以,要確保整體運維服務水平一直保持在“高位”,就要盡可能全面地覆蓋業務系統中的所有監控對象,不留“死角”。而在當時,能夠實現全局監控的IT運維系統很少,能夠對存儲系統監控的更少。從這一角度出發,實際上就把復雜的IT運維平臺升級工作變得簡單化了,答案就是“能者居之”。
通過對主流IT運維管理產品的篩選,北塔BTIM IT綜合管理軟件中具備的存儲管理特性讓一汽解放的IT運維部門眼前一亮,并終成為“聚焦點”。而作為北塔BTIM核心組件之一,存儲管理能夠基礎IT管理的擴展,可以與北塔BTIM系統有機的集成,將IP層網管的先進管理方法,覆蓋到虛擬化、存儲管理中。
據了解,北塔BTIM可以監控不同廠商的存儲設備,實現集中式、可視化的管理,有效提高存儲管理運維的效率,保證業務數據的安全存儲。同時,存儲監控能夠全面覆蓋FC-SAN網絡中的不同設備類型,管理對象包括磁盤陣列、FC-交換機、HBA、線路等。這完全滿足了一汽解放對異構存儲系統監控的需要。
如果說一汽解放和北塔軟件的合作是一次“偶遇”,那么在測試上線后,北塔BTIM只是對存儲系統實現了護航嗎?
落戶之后,北塔BTIM干了什么?
IT系統的復雜性是固然存在的,這也就決定了,“不出任何差錯的系統至今還未問世”的現實。所以,又一次系統故障出現了,但結局卻與上次大不相同。
“當時,一汽解放的EOL汽車現場組裝系統剛剛上線,網絡設備就來‘找麻煩’,但這次我們利用了北塔BTIM系統的告警功能,在時間就處理完了隱患問題,業務部門到現在可能都不知道那次故障。” 劉工回憶起了EOL上線的經歷,雖還心有余悸,但也略顯自豪。
“主動”與“被動”雖然只有一字之差,但蘊含的管理智慧、服務能力卻在千里之外。如今,北塔BTIM為正在負責一汽解放IT運維部門的四大工作,這包括“監、看、析、查”。系統可以7×24小時監視關鍵指標,并保證IT基礎設施出現故障后能時間通知到值班員,同時值班員也能快速查看到所關心的設施的實時健康狀態。而為避免IT故障誤報,北塔BTIM提供了智能巡檢系統,為IT管理提供額外的保險,真正實現了精準預警、全局掌控。