眾所周知,移動通信網絡目前已成為像水、電、氣一樣的社會基礎設施,一旦出現重大故障,就會對人們的日常生活和生產造成巨大影響。當前,全球5G網絡處在快速部署的階段,5G對于各產業數字化升級中的作用更為明顯,在這一背景下,網絡的穩定、可靠性就顯得尤為重要。
網絡中斷事故時有發生,很多是人為原因造成的
KDDI本次斷網從上周六凌晨一直持續到本周一早上,除了影響了數千萬手機用戶外,多個行業的正常經營也受到影響,日本首相對此專門批示。
根據公開報道,本次受到影響的包括面向物流、金融、交通的線路達100多萬條,大量物流貨運狀態系統信息無法更新,多家銀行ATM機無法使用,很多公交卡、車聯網服務無法使用。此外,斷網也影響了氣象服務,日本約1300個氣象觀測點有接近4成癱瘓,在臺風逐漸逼近情況下,氣象數據無法更新,給民眾造成不小恐慌。
KDDI將此次網絡中斷事故歸咎于“設備故障”,稱在設備定期維護的過程中,公司員工們更換核心網的路由器,出現了一個錯誤,導致無法接通電話,為了改善和修復,進行了進一步的操作,導致發生了連鎖多起故障,最終導致有史以來最大的網絡中斷。日本相關法律規定,如果通信服務“完全不可用”的時間達到24小時或更長時間,則將向用戶支付損害賠償金,媒體估計本次賠償金額達到200億日元。
網絡中斷的嚴重事故近年來時有發生。就在去年10月份,日本最大的移動通信運營商NTT DOCOMO突然發生全國性移動網絡中斷的故障,造成其3G/4G/5G網絡不可用,有200萬人受到影響。直接帶來的結果是網課被迫停課、智能手機支付失效等,給日常生活帶來了極大的不便。
而這次本來是一次簡單的升級替換,準備替換存儲20萬臺物聯網終端設備的用戶和位置信息的服務器,在這個過程中出現了問題,操作人員啟動了回退操作,重新倒回到舊設備,不過卻引發了大量物聯網終端向舊服務器重新發起位置注冊信息,形成信令風暴迅速引發網絡擁塞。
去年4月,加拿大第一大移動通信網絡運營商Rogers Wireless也發生了超過24小時的超大規模斷網,近千萬用戶受到影響,有觀點甚至認為此次斷網對加拿大經濟產生了重大負面影響。從該運營商發布的聲明看來,此次斷網的主要原因在于愛立信最近所進行的軟件更新,業界分析Rogers的核心網已經實現了基于NFV的軟硬件解耦,在網絡云化和功能虛擬化后,復雜性從此前的硬件轉移到了軟件,因此核心網軟件的不當更新會導致全網的故障。
國內運營商也出現過部分地區網絡中斷的故障,不過所涉及的地區和用戶規模不大,且在短時間內實現恢復。
諸如地震、洪水等不可抗力容易造成網絡中斷故障,但很多情況下,網絡中斷是因為人為的操作引起的,這種情況下很難讓用戶和監管部門接受,嚴重情況下會背負絕賠償,并導致品牌形象受損。
5G時代,網絡中斷會帶來更為重大的損失
網絡中斷的故障一直伴隨著移動通信的發展,在整個經濟社會對通信基礎設施的依賴程度不斷提升的背景下,此類重大故障對于人們生產生活的負面影響越來越大。
在數十年前,當電話或手機還不是生活中標配的時候,網絡中斷較為常見,人們對斷網的容忍度很高。隨著移動通信的發展,手機成為普及設備,且成為人們每天生活工作中必不可少的設備時,人們對斷網的容忍度越來越低。試想一下,在當前的環境下,有多少人可以忍受24小時處于失聯狀態?
當然,在技術不斷進步的情況下,網絡中斷的重大故障發生概率已經非常微小,在公眾手機用戶應用之外,各行業一些場景也對移動通信產生一定的信任,使各行業對通信網絡的依賴度不斷提升,移動通信網絡成為賦能各行業的重要工具。
這一狀況進一步發展,移動通信網絡成為行業數字化的基礎設施,但同時網絡的故障帶來的負面影響更大。我們看到,日本KDDI和NTT DOCOMO兩次重大事故,除了影響手機用戶外,還對很多行業物聯網連接造成重大影響,甚至造成致命影響。
工信部數據顯示,截至今年5月末,三家基礎電信企業發展蜂窩物聯網終端用戶15.9億戶,比上年末凈增1.96億戶。蜂窩物聯網終端用戶規模占移動網終端連接數的比重已達49%。可見,物聯網連接正在高速增長,很快將成為移動通信網絡連接的主力。而這些物聯網連接大多分布于各行業應用中,因而未來也將成為網絡故障造成負面的主要領域。
另外,5G更大的價值在于賦能千行百業數字化應用的觀點已深入人心,業界認為未來5G網絡的應用場景中80%是行業應用,個人應用僅20%。如果說此前運營商的斷網大部分影響在于手機用戶,那么未來5G規模化商用后,斷網的重大事故則會對各行各業正常生產經營造成中斷,屆時會形成更為惡劣的影響。
眾所周知,國內5G正式商用超過3年時間,過去3年5G應用的主戰場放到了行業應用上,以超乎預期的速度拓展商用場景,大踏步邁入規模化應用關鍵期。目前,5G行業應用案例已累計超過2萬個,覆蓋40個國民經濟大類,尤其是在工業制造、采礦、港口等垂直行業應用場景加速規模落地,已由最初的生產輔助類業務為主向設備控制、質量管控等核心業務拓展,是當前5G應用方案較為成熟的領域。
各行業的高清視頻、智能檢測、移動巡檢、遠程控制、輔助作業、人機互動、精準定位等應用場景背后都有5G的助力,而這些場景是行業生產經營的核心流程,可以說5G將大量物聯網連接深入嵌入到各行業生產經營過程中,因此網絡的可靠性、穩定性對于各行業來說至關重要。
以5G+智慧急救為例,在5G的輔助下,病人在被送上急救車的那一刻,醫護人員就可以利用5G醫療設備完成一系列基礎檢查,并通過5G網絡將醫學影像、病人體征、病情等關鍵信息實時傳輸到醫院,院前院內無縫銜接,及時做好術前準備。此前,傳統急救無法做到“上車即入院”,但在5G加持下這一愿望可以實現,繼而成為急救行業的一個常態化模式,在這種情況下,若網絡突然中斷,讓已普及的“上車即入院”模式無法實現,嚴重情況下可能造成致命的醫療事故。
在5G網絡穩定性、可靠性方面,近年來業界對于5G網絡“云化”形成廣泛討論,尤其是對于核心網云化部署引起的重大故障擔憂。例如,此前多家云計算巨頭發布5G網絡解決方案,其中一個典型的特點就是將核心網部署在公有云上,降低了部署成本和落地門檻,更有一些主流運營商計劃加速網絡功能虛擬化的進程。然而,承擔了通信控制、用戶管理、切片編排、轉發等功能的核心網是5G網絡中的“大腦”,出現故障后導致大面積癱瘓的概率很大。
針對網絡中斷的重大故障,業界從多方面提出建議,例如加強冗余備份、建立完善的管理制度和法規,以確保網絡的可靠性和穩定性。當然,網絡的可靠性與穩定性是一個持續改進優化的過程,也需要平衡投入和成本,逐漸推動網絡重大故障概率進一步降低。