侵權(quán)投訴
訂閱
糾錯
加入自媒體

自治網(wǎng)絡(luò)與服務(wù)2.0

自治網(wǎng)絡(luò)與服務(wù)2.0的目標(biāo),是用架構(gòu)性創(chuàng)新解決電信領(lǐng)域結(jié)構(gòu)化問題,通過數(shù)據(jù)與知識驅(qū)動的智能網(wǎng)絡(luò),達(dá)到自動、自愈、自優(yōu)、自治的網(wǎng)絡(luò)自動駕駛目標(biāo)。

多年以來,電信行業(yè)一直以支持各行業(yè)數(shù)字化為已任,但從行業(yè)內(nèi)部視角來看,我們雖然運(yùn)行著當(dāng)今時代最前沿的網(wǎng)絡(luò),但大量運(yùn)行和維護(hù)手法卻仍然停留在十八世紀(jì)的手工階段,呈現(xiàn)出一系列結(jié)構(gòu)化問題:一是從財務(wù)結(jié)果來看,OPEX普遍是CAPEX投資的三到四倍,通過網(wǎng)絡(luò)建設(shè)的優(yōu)化,很難支撐運(yùn)營商大規(guī)模改善財務(wù)狀況;二是多代網(wǎng)絡(luò)疊加造成的復(fù)雜性,使得運(yùn)維人員單靠人力難以把握和應(yīng)對。大量的站點(diǎn)、管線、機(jī)房問題形成物理斷點(diǎn),阻礙了自動化,核心系統(tǒng)的復(fù)雜性又導(dǎo)致了70%的網(wǎng)絡(luò)級事故由人為操作層面引發(fā);三是互聯(lián)網(wǎng)結(jié)構(gòu)性沖擊,不僅在云業(yè)務(wù)上形成威脅,在網(wǎng)絡(luò)上也從DC間骨干網(wǎng)向云網(wǎng)協(xié)同企業(yè)網(wǎng)絡(luò)滲透,以大規(guī)模、廣覆蓋、高利用、深集成的方式?jīng)_擊云網(wǎng)協(xié)同市場。

從OPEX分布的維度切入,我們不妨分為運(yùn)維(維護(hù)、雇員)、能源(動力、水電、取暖)、資源利用率(電路網(wǎng)元租賃、折舊、網(wǎng)站互聯(lián))、體驗(yàn)(銷售費(fèi)用、產(chǎn)品成本)等四個角度,來進(jìn)一步審視電信行業(yè)目前面臨的具體挑戰(zhàn)。

首先,從運(yùn)維效率來看,第一大特點(diǎn)是日常維護(hù)工作量巨大。以某運(yùn)營商為例,每年局?jǐn)?shù)據(jù)制作超過170億條,網(wǎng)元參數(shù)配置近1000萬個,傳輸隱患整改近百萬處,家寬小區(qū)資源整治數(shù)十萬處。而在這些工作中,大量環(huán)節(jié)與物理設(shè)施有關(guān),我們在一個區(qū)域調(diào)研運(yùn)營商工單分布如下:26%是饋線、光纖等線纜問題,26%是重啟非主設(shè)備軟件、重啟上聯(lián)設(shè)備、簡單數(shù)據(jù)配置等恢復(fù)性操作,24%是市電中斷后自動恢復(fù),11%是告警自行消除,設(shè)備本身的硬件類故障不到10%;第二大特點(diǎn)是每年要應(yīng)對網(wǎng)絡(luò)割接升級超過10萬次,應(yīng)急保障近40萬次,這些升級和重大事件的系統(tǒng)性保障都需要大量人力投入。

第二,從能源效率來看,站點(diǎn)能耗(包含室外站和電信機(jī)房)占到60%~80%,數(shù)據(jù)中心占到20%,云化之后數(shù)據(jù)中心能耗占比會越來越高。從運(yùn)營統(tǒng)計來看,流量在時間和空間的分布是不均衡的:某網(wǎng)絡(luò)最繁忙的前10%的站點(diǎn)產(chǎn)生50%的流量,而最空閑的50%的站點(diǎn)僅產(chǎn)生5%的流量,但基礎(chǔ)能源的消耗又是類似的,即沒有流量或流量較低的站點(diǎn),基礎(chǔ)運(yùn)行仍然消耗著大量能源。

第三,從資源利用率來看,資源利用效率低的根源在于業(yè)務(wù)量在時間和空間分布不均衡,同時,資源受限于物理分散式設(shè)計和運(yùn)維,沒有采用全局式的集中化設(shè)計和隨時間空間動態(tài)調(diào)度有效手段。以骨干網(wǎng)為例,運(yùn)營商的骨干網(wǎng)利用率普遍在30%左右,而過去傳統(tǒng)的流量調(diào)優(yōu),基于專家規(guī)則確定調(diào)優(yōu)策略(如調(diào)優(yōu)觸發(fā)閾值、遷移流量的選取等),不能根據(jù)應(yīng)用及網(wǎng)絡(luò)的流量狀態(tài)做動態(tài)調(diào)整,因而也就不能獲得持續(xù)負(fù)載均衡,這一水平與多家互聯(lián)網(wǎng)90%左右利用率形成巨大差距。

最后,從客戶體驗(yàn)來看,在運(yùn)營活動中仍存在大量傳統(tǒng)的路測、鄰區(qū)參數(shù)優(yōu)化等人工活動。抽樣式測試不能全面客觀反映客戶體驗(yàn),尚未系統(tǒng)引入終端、應(yīng)用、時空等多源動態(tài)數(shù)據(jù),同時還不能完全驅(qū)動網(wǎng)絡(luò)的自動化調(diào)整。

解決方案:用架構(gòu)性創(chuàng)新解決結(jié)構(gòu)化問題

用架構(gòu)性創(chuàng)新解決電信行業(yè)的結(jié)構(gòu)化問題,顧名思義,即是通過商業(yè)模式級創(chuàng)新和系統(tǒng)方案級創(chuàng)新來結(jié)合產(chǎn)品級創(chuàng)新,以實(shí)現(xiàn)自動、自愈、自優(yōu)、自治的自動駕駛網(wǎng)絡(luò)和業(yè)務(wù)數(shù)字化運(yùn)營,并在運(yùn)維效率、能源效率、資源利用率、業(yè)務(wù)體驗(yàn)等方向上取得突破性結(jié)果。

在業(yè)務(wù)場景上,基于運(yùn)營商業(yè)務(wù)流程,首先沿“規(guī)劃、設(shè)計、部署、開通、運(yùn)維、優(yōu)化”的業(yè)務(wù)流程,分析活動分布、成本分布、人力分布,并以自動化為目標(biāo)進(jìn)行架構(gòu)性的創(chuàng)新。針對線纜、電力、環(huán)境等無源設(shè)備故障率高的情況,提出有源管理無源的突破目標(biāo),即用有源設(shè)備實(shí)現(xiàn)無源設(shè)備可預(yù)測、可管理。針對無流量時網(wǎng)絡(luò)大量能源消耗的情況,提出比特決定瓦特的突破目標(biāo),有比特流動時才有瓦特消耗。針對流量在時空和空間的不均衡情況,提出時間空間復(fù)用目標(biāo),最大程度復(fù)用網(wǎng)絡(luò)容量。針對終端應(yīng)用豐富化和體驗(yàn)全流程的特點(diǎn),提出應(yīng)用驅(qū)動體驗(yàn)改進(jìn),引入更多終端應(yīng)用要素,并用體驗(yàn)結(jié)果直接驅(qū)動網(wǎng)絡(luò)自動調(diào)整。上述突破從Use Case開始,如同一粒粒珍珠,基于重構(gòu)的業(yè)務(wù)流程,我們可以將珍珠一一串起形成業(yè)務(wù)場景改進(jìn)。

在訓(xùn)練平臺上,華為將著力構(gòu)建面向電信領(lǐng)域的AI訓(xùn)練平臺,訓(xùn)練平臺用公有云+Stack模式部署,其中Stack模式可延伸至運(yùn)營商網(wǎng)絡(luò)部署,在數(shù)據(jù)不出網(wǎng)絡(luò)前提下完成訓(xùn)練。訓(xùn)練平臺提供電信領(lǐng)域AI工具鏈,并提供電信領(lǐng)域通用模型服務(wù);诰W(wǎng)絡(luò)產(chǎn)品基礎(chǔ)數(shù)據(jù)、實(shí)驗(yàn)室測試數(shù)據(jù)、外場數(shù)據(jù)、在服務(wù)作業(yè)過程中形成的標(biāo)注數(shù)據(jù),和脫敏的典型樣板網(wǎng)絡(luò)設(shè)備運(yùn)行數(shù)據(jù)一起,形成電信數(shù)據(jù)湖用于持續(xù)訓(xùn)練。網(wǎng)絡(luò)領(lǐng)域“服務(wù)2.0”,目標(biāo)是提供在線數(shù)字化的“智慧服務(wù)”,提供基于人工智能的在線服務(wù),這種服務(wù)基于持續(xù)迭代原則,依據(jù)業(yè)界慣例,構(gòu)建起“模型即服務(wù)”模式,永遠(yuǎn)處于Beta階段,不斷自我更新和完善。電信模型不斷發(fā)布到模型市場上迭代更新和優(yōu)化。

在網(wǎng)絡(luò)與設(shè)備層面,目標(biāo)是構(gòu)建一個敏捷的自動化和智能化網(wǎng)絡(luò)。把下層設(shè)備和云基礎(chǔ)設(shè)施、中間層的網(wǎng)絡(luò)管理和控制,以及上層全流程系統(tǒng),分別引入三方面能力達(dá)到網(wǎng)絡(luò)自動駕駛目標(biāo):一是設(shè)備數(shù)字化能力,在大容量、低時延、高可用的基礎(chǔ)上,增強(qiáng)動態(tài)感知環(huán)境的數(shù)據(jù)采集解析能力,包括對網(wǎng)絡(luò)周邊環(huán)境與啞設(shè)備的感知,典型如無線領(lǐng)域?qū)μ祓仩顟B(tài)的感知,網(wǎng)絡(luò)領(lǐng)域?qū)饫w、信號、路由的感知,IP領(lǐng)域動態(tài)按需對大規(guī)模分布式流式數(shù)據(jù)的處理,對網(wǎng)絡(luò)拓?fù)涞膶?shí)時動態(tài)還原能力,這些網(wǎng)絡(luò)與設(shè)備的感知與數(shù)字化能力是自動化、智能化的基礎(chǔ)。二是根據(jù)AI模型進(jìn)行推理執(zhí)行的能力,網(wǎng)絡(luò)及設(shè)備能夠利用AI模型進(jìn)行推理執(zhí)行,包括數(shù)據(jù)預(yù)處理、AI模型管理等能力,推理執(zhí)行的過程要保證網(wǎng)絡(luò)安全性與魯棒性,部署上可分為嵌入式、網(wǎng)絡(luò)管控集成、獨(dú)立部署或以公有云服務(wù)形式部署。三是業(yè)務(wù)流程編排能力,電信領(lǐng)域模型與運(yùn)營商本地商業(yè)流程結(jié)合發(fā)揮作用,利用模型驅(qū)動、流程編排、數(shù)據(jù)分析、AI等數(shù)字技術(shù),逐步實(shí)現(xiàn)業(yè)務(wù)的自動開通與基于業(yè)務(wù)/網(wǎng)絡(luò)運(yùn)維自動化,并使能ROADS體驗(yàn)的實(shí)現(xiàn)。

以光網(wǎng)絡(luò)為例,我們可以了解到AI如何使能全流程的業(yè)務(wù)發(fā)展:從業(yè)務(wù)場景看,需通過 “開通零等待、運(yùn)維零接觸、體驗(yàn)零差評”的目標(biāo)牽引,找到開局自動檢查光纖、業(yè)務(wù)發(fā)放、網(wǎng)絡(luò)優(yōu)化、故障定位以及資源自動調(diào)度等具體場景并確定突破目標(biāo)。訓(xùn)練平臺提供電信領(lǐng)域適應(yīng)的數(shù)據(jù)及人工智能算法,包括光模塊數(shù)據(jù)、實(shí)驗(yàn)室光纖彎折、松動、染灰等測試數(shù)據(jù)、光網(wǎng)現(xiàn)網(wǎng)運(yùn)行故障數(shù)據(jù)等,算法包括基礎(chǔ)的數(shù)據(jù)清洗、信息整合、機(jī)器學(xué)習(xí)建模、深度學(xué)習(xí)等,共同訓(xùn)練出光纖故障模型、濾波器模型等。通過管控平臺與現(xiàn)網(wǎng)相結(jié)合,進(jìn)而實(shí)現(xiàn)快速發(fā)放、極簡運(yùn)維和智能運(yùn)營。而這一切的基礎(chǔ)就是網(wǎng)絡(luò)設(shè)備層面新增數(shù)據(jù)采集與解析能力,包括光纖數(shù)據(jù)、光信號數(shù)據(jù)、路由數(shù)據(jù)等的采集能力,同時設(shè)備需要具備可靠的推理執(zhí)行能力。

目標(biāo):運(yùn)維效率、能源效率、資源利用率和業(yè)務(wù)體驗(yàn)大幅提升

在運(yùn)維效率層面,運(yùn)維水平分為三個發(fā)展階段。第一個階段稱為R2F(Run-to-Failure),即網(wǎng)絡(luò)在運(yùn)行中突發(fā)故障后,運(yùn)維人員迅速趕去處理,這是最低層級的水平;第二個階段是PvM(Preventive Maintenance),即例行巡檢,也就是對每臺設(shè)備進(jìn)行檢查來預(yù)防故障發(fā)生,但這種做法效率十分低下;第三個階段是PdM(Predictable Maintenance),我們稱之為可預(yù)測性維護(hù),即能夠?qū)崿F(xiàn)預(yù)測某設(shè)備未來有多大概率發(fā)生故障,再基于狀態(tài)進(jìn)行針對性的維護(hù)。

自治網(wǎng)絡(luò)與服務(wù)2.0一方面通過網(wǎng)絡(luò)簡化實(shí)現(xiàn)設(shè)備收編站點(diǎn),減少電源、連接器、線纜等啞設(shè)備問題,另一方面通過“有源管理無源”,促使線纜、連接器、動力環(huán)境等問題能夠通過有源設(shè)備實(shí)現(xiàn)管理,如針對光纖實(shí)現(xiàn)路由可視、光纖可視、信號可視,從而可以基于狀態(tài)對光纖老化、過度彎曲、接口松動、路由過長等問題做出預(yù)測和定位。通過智能故障預(yù)測及網(wǎng)絡(luò)智能設(shè)計,網(wǎng)絡(luò)負(fù)荷被有效分擔(dān),搶修和巡檢工作也可以因而轉(zhuǎn)換為基于狀態(tài)的預(yù)測性維護(hù),從而將人工開環(huán)處理問題,轉(zhuǎn)換為設(shè)備閉環(huán)處理,實(shí)現(xiàn)非物理故障恢復(fù)自動化,助力運(yùn)維效率倍增。

在能源效率上,我們用“比特決定瓦特”的目標(biāo)作為牽引,即以網(wǎng)絡(luò)流量大小決定能耗多少。在沒有流量的時候降低能耗,通過AI 來基于流量做出預(yù)測、實(shí)時調(diào)整運(yùn)營商站點(diǎn)和數(shù)據(jù)中心能源效率,達(dá)到節(jié)能目的。從站點(diǎn)配套設(shè)施收編到設(shè)備柜,實(shí)現(xiàn)站點(diǎn)能效比最大化;準(zhǔn)確預(yù)測業(yè)務(wù)流量,讓設(shè)備做到深度休眠快速啟動,在保證客戶體驗(yàn)的前提下,實(shí)現(xiàn)設(shè)備比特決定瓦特的能耗管理。

在數(shù)據(jù)中心機(jī)房或者站點(diǎn),每個系統(tǒng)都有數(shù)十個參數(shù)。通過AI訓(xùn)練,自治網(wǎng)絡(luò)與服務(wù)2.0可以生成散熱、環(huán)境及業(yè)務(wù)負(fù)荷模型,使得日照、溫度和配套設(shè)施油機(jī)、太陽能和電池等達(dá)到最佳能效,為制冷設(shè)備的數(shù)十個參數(shù)尋找最佳模型;在設(shè)備層面,可以根據(jù)業(yè)務(wù)負(fù)載進(jìn)行動態(tài)能量投放,在沒有流量時利用時隙關(guān)斷、RF深度休眠、載頻關(guān)斷等減少耗電量,同時實(shí)現(xiàn)數(shù)據(jù)中心對象(如服務(wù)器組件)的動態(tài)節(jié)能管理;在網(wǎng)絡(luò)系統(tǒng)層面,可以構(gòu)建準(zhǔn)確的業(yè)務(wù)負(fù)荷預(yù)測模型,達(dá)到整網(wǎng)流量最優(yōu),從而實(shí)現(xiàn)能耗效率優(yōu)化。

在資源利用率上,自治網(wǎng)絡(luò)與服務(wù)2.0可準(zhǔn)確預(yù)測長周期流量規(guī)律,實(shí)現(xiàn)站點(diǎn)、管線、機(jī)房等設(shè)施的最佳利用;根據(jù)用戶、終端和業(yè)務(wù)分布,結(jié)合時空數(shù)據(jù)預(yù)測,實(shí)現(xiàn)空口頻譜最大程度利用;通過業(yè)務(wù)與流量臨近性、周期性、趨勢性、事件性特征識別、趨勢預(yù)測、路徑性能預(yù)測,來動態(tài)合理的分配流量、錯峰填谷,大幅度提升網(wǎng)絡(luò)利用率。同時在不犧牲 QoS 或 SLA的情況下,可讓流量路徑幾乎實(shí)時改動,達(dá)到最優(yōu)化。

在客戶體驗(yàn)上,對于個人用戶可引入終端和應(yīng)用數(shù)據(jù),結(jié)合網(wǎng)絡(luò)的自動閉環(huán),實(shí)現(xiàn)基于用戶、業(yè)務(wù)、位置最佳體驗(yàn)。企業(yè)用戶可分鐘級構(gòu)建云網(wǎng)協(xié)同業(yè)務(wù),統(tǒng)籌多地域全球網(wǎng)絡(luò),全網(wǎng)路由基于自動轉(zhuǎn)發(fā)和學(xué)習(xí),實(shí)現(xiàn)用戶無感知的調(diào)度和路由。家庭用戶端實(shí)現(xiàn)云協(xié)同,解決家寬品質(zhì),用戶體驗(yàn)提升由此可被延伸至家庭網(wǎng)絡(luò)。

自治網(wǎng)絡(luò)與服務(wù)2.0實(shí)現(xiàn)路徑

實(shí)現(xiàn)網(wǎng)絡(luò)的自動駕駛必將是一個長期的過程,既要有明確的長期目標(biāo)作為牽引,又不能一蹴而就,需要以終為始、沿途下蛋、逐步落地。我們可以將網(wǎng)絡(luò)自治分為五個層級,0級為人工運(yùn)維;1級為輔助運(yùn)維,系統(tǒng)可持續(xù)執(zhí)行控制某一子任務(wù),如單板倒換與自動重路由;2級為部分自治網(wǎng)絡(luò),在適用的設(shè)計范圍下,系統(tǒng)可根據(jù)AI模型或規(guī)則完成部分單元控制任務(wù),如根據(jù)訓(xùn)練模型數(shù)據(jù)中心可自動調(diào)節(jié)水冷設(shè)備單元的參數(shù),從而達(dá)到提升能源效率降低PUE的目標(biāo),但這種動態(tài)的預(yù)測和調(diào)整限制在某一單元內(nèi);3級有條件自治網(wǎng)絡(luò),可持續(xù)執(zhí)行完整的子系統(tǒng)級全周級閉環(huán)自動化,以無線領(lǐng)域?yàn)槔,能夠做到從用戶流量的洞察與預(yù)測、無線空口資源調(diào)度及參數(shù)調(diào)整、網(wǎng)絡(luò)調(diào)整后的的評估,從感知、決策、執(zhí)行和后評估都能做到自動化。4級高度自治網(wǎng)絡(luò),系統(tǒng)可做到單業(yè)務(wù)跨領(lǐng)域全生命周期自動化,如Cloud VPN業(yè)務(wù)設(shè)計、部署發(fā)放、動態(tài)調(diào)度、故障自愈實(shí)現(xiàn)自動化;5級完全自治網(wǎng)絡(luò)可在所有網(wǎng)絡(luò)環(huán)境下執(zhí)行完整動態(tài)任務(wù),并能對例外做出合適處理。

網(wǎng)絡(luò)自治從易到難,依次是重復(fù)性執(zhí)行動作的替代、對網(wǎng)絡(luò)環(huán)境與網(wǎng)絡(luò)設(shè)備自身狀態(tài)的感知與監(jiān)控、綜合多種要素和策略的分析決策、對最終客戶體驗(yàn)的有效感知。系統(tǒng)能力也從某些業(yè)務(wù)場景起步,最終覆蓋全業(yè)務(wù)場景。

等級

名稱

概念界定

執(zhí)行

感知

決策

體驗(yàn)

系統(tǒng)

能力

0

人工運(yùn)維

即便有輔助工具,仍由運(yùn)維人員執(zhí)行全部的動態(tài)任務(wù)。

n/a

1

輔助運(yùn)維

在適用的設(shè)計范圍下,系統(tǒng)基于規(guī)則可重復(fù)執(zhí)行某一子任務(wù)。

人和系統(tǒng)

某些業(yè)務(wù)場景

2

部分自治網(wǎng)絡(luò)

在適用的設(shè)計范圍下,系統(tǒng)基于模型持續(xù)完成某一單元的控制任務(wù)。

系統(tǒng)

某些業(yè)務(wù)場景

3

有條件自治網(wǎng)絡(luò)

在適用的設(shè)計范圍下,系統(tǒng)可以持續(xù)執(zhí)行完整的單域場景的閉環(huán)自動化,用戶在系統(tǒng)失效時接受干預(yù)請求及時做出響應(yīng)。

系統(tǒng)

系統(tǒng)

某些業(yè)務(wù)場景

4

高度自治網(wǎng)絡(luò)

在適用的設(shè)計范圍下,系統(tǒng)可以自動分析執(zhí)行跨域及業(yè)務(wù)的閉環(huán)自動化。

系統(tǒng)

系統(tǒng)

系統(tǒng)

某些業(yè)務(wù)場景

5

完全自治網(wǎng)絡(luò)

系統(tǒng)能在所有網(wǎng)絡(luò)環(huán)境,執(zhí)行完整動態(tài)任務(wù)和例外處理,運(yùn)維人員無需介入。

系統(tǒng)

系統(tǒng)

系統(tǒng)

系統(tǒng)

全部業(yè)務(wù)場景

網(wǎng)絡(luò)自治與服務(wù)2.0模式道阻且長,還需歷經(jīng)長期的實(shí)踐摸索,華為推出SoftCOM AI,依托于華為對All Intelligence長期而堅決的戰(zhàn)略投入,依托于對網(wǎng)絡(luò)及設(shè)備數(shù)字化、智能化的體系化投入,依托于在服務(wù)領(lǐng)域持續(xù)的數(shù)字化實(shí)踐和平臺建設(shè)投入,打造自治網(wǎng)絡(luò)方案并實(shí)現(xiàn)服務(wù)模式升級,發(fā)布系列化解決。網(wǎng)絡(luò)自治如同自動駕駛,同時需要全業(yè)界同仁將運(yùn)營維護(hù)經(jīng)驗(yàn)不斷注入系統(tǒng),共同努力實(shí)現(xiàn)網(wǎng)絡(luò)自動、自愈、自優(yōu)、自治和業(yè)務(wù)數(shù)字化運(yùn)營。

聲明: 本文由入駐維科號的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評論

暫無評論

安防 獵頭職位 更多
文章糾錯
x
*文字標(biāo)題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號