发布AIOps系列云服务,华为想要实现企业网络的“自动驾驶”

界面新闻

text

9月25日,在华为全联接大会2020第三日,华为发布的自动驾驶解决方案ADN成为了当天主角之一。这是一套全栈引入AI打造自动驾驶网络的解决方案,它并非汽车的自动驾驶,而是旨在帮助电信业建立以人工智能为核心的自治网络,让企业网络实现“自动驾驶”。

国信证券观点认为,未来自动驾驶网络将对现有网络架构和运维模式产生深远的变革,而华为ADN自动驾驶网络战略是继华为全云化战略之后,面向未来十年的关键战略之一。

在政企行业,电信运营商是华为最大的客户群体。而在运营商电信领域,最大的AI应用场景就是网络运维。大会当天,华为还发布了AIOps系列云服务,使能智能运维,聚焦提升电信运营商和企业专网的智能化运维能力。

在普通用户眼中,运维并不是个容易接触到的概念。通俗地说,企业的数字化程度越高,IT规模越大也越复杂,就越需要快捷、高效、精准的运维管理平台作为业务的有效支撑。而电信运维,则与上亿用户的网络稳定息息相关。

电信运维网络挑战正在加剧。一方面,运营商网络2G、3G、4G、5G四代同堂,网络越来越复杂,运维成本也相应升高,运营商迫切希望引入AIOPS技术来提高运维效率。目前,有63% 的电信运营商已经开始投资AI、大数据分析等技术,实现故障“自愈”与进行主动维护,这也是华为切入这项业务的初衷。

另一方面,运维自动化程度低,人工参与环节占比极高,导致运营商人力成本激增。而人工积累的经验难以应对网络复杂化带来的新问题,使得75%的网络问题都是由用户发现,严重影响用户在终端的使用体验。

“运维能力的演进成为电信网络能否持续发挥效能的关键因素”,华为NAIE产品部总经理韩雨发在接受界面新闻采访时表示。

目前,63%的电信运营商已经开始投资AI、大数据分析等技术,实现故障“自愈”与进行主动维护,推进运维模式向智能转型。其中,AIOps成为电信网络运维智能化转型的核心手段,也是行业转型的共识。

AIOps的概念最早出现在Gartner的报告上,即将人工智能应用于运维领域,基于已有的运维数据(日志、监控信息、应用信息等),通过机器学习的方式来进一步解决自动化运维没办法解决的问题。简单地说,过去需要花费数个小时、数天甚至数周才能完成的故障诊断和修复工作,AIOps可能只需要花几秒钟,而且判断更加精准。

Gartner相关报告预测,AIOps的全球部署率将从2017年的10%增加到2020年的50%。到了2022年,部署AIOps平台的大型企业数量将2017年的不足5%,迅速提升到40%左右。其应用行业,除了电信之外,还包括互联网、金融、电力、物联网、 医疗等多个涉及IT运维的领域。

目前,包括华为、平安、BATJ、360在内的多家科技企业都推出了自研的AIOps服务,但AIOps行业也一直存在没有标准产品形态、落地效果差等争议。为此,各大厂商也在对AIOps能力进行更新迭代。

华为AIOps服务背后是华为网络人工智能(NAIE)业务团队。官网信息显示,华为NAIE主要包含数据服务、训练服务、AI市场和网络AI应用,以云服务的方式,向运营商和第三方业务应用开发者提供各项AI服务,降低AI应用开发的门槛。2019年8月,华为网络人工智能引擎宣布商用,目前已落地近100个AI应用。

NAIE的核心能力就是AIOps服务。据韩雨发介绍,华为AIOps服务主要面向运营商电信网络,目前已实现规模应用,共覆盖6个网络领域、30+个现网局点,每月API调动次数达到3.2亿次,是国内AIOps服务的主要供应商之一。

韩雨发认为,相比起同行,华为AIOps服务的优势在于,并非简单的算法,而是与电信运维系统相结合,在电信行业具备较丰富的运维经验。他总结,目前华为已经培养起了电信领域AIOps原子能力、组合编排与DevOps能力、通信领域主流数据对接、场景组合服务这四大核心竞争力。

“具体而言,华为AIOps服务支持多个电信领域运维系统的主流数据及对接方式,能够基于华为在电信领域的运营经验,有效地将领域知识与AI算法融合,解决当前通用算法模型在具体行业落地效果差的难题。而通过组合编排与DevOps能力,可助力各运维系统的应用快速上线”,韩雨发解释道。

基于AIOps的核心能力,华为AIOps为运营商提供开箱即用的多项服务,包括KPI异常检测、故障识别与根因定位、日志异常检测以及硬盘异常预测服务等。

以典型的KPI异常检测为例,传统的运维工作是被动式的,问题先发生再排查,缺乏对网络故障预测能力。AIOps通过对典型KPI持续数据监控和算法拟合,能够在异常苗头出现时就掐灭。

这种异常检测的能力,在用户层面最直观的反应就是网络稳定,不影响日常的工作和生活。韩雨发提到,今年4月,在某运营商网络,华为AIOps服务的异常检测模块提前5小时发现网络异常行为,而后来运维团队也准确识别到了故障根因,并提前修改配置参数,避免在早高峰时候引起更大的用户体验问题。

在提升运维效率的同时,华为也在和运营商探讨更多AIOps服务使能变现的可能性,比如家庭终端业务识别。“举个例子,疫情期间大家都在家里上课、打游戏,这两件事对网络稳定要求都很高。我们通过AI识别可以把不同业务识别出来,对重点业务做重点保障。这样运营商可以面向消费者提供教育、游戏套餐,丰富增收渠道。”