IT之道-艾锑知道

您当前位置: 主页 > 资讯动态 > IT知识库 >

IT运维 | IT运维下一个趋势AIOps


2020-06-22 16:47 作者:艾锑无限 浏览量:

 
“工欲善其事,必先利其器”,运维工具是我们实现各种运维操作的有效帮手,它解放了IT运维人员,让他们可以更多更好地维护各种IT系统。IT运维体系的发展当然也离不开运维工具的发展。
 
手工运维

二十多年前,企业IT信息化刚刚起步,IT运维基本还处于刀耕火种的时代,没有所谓运维工具也没有意识其存在必要性。几个小姑娘定时在终端上敲些命令,并在纸质的表格上一丝不苟地记录着读数,这还是当时比较规范运维做法。原因是当年那个年代需要维护IT系统的量很少,单靠人也看得过来。在IOE架构统治的时代,运维团队的人工维护还是占绝大部分。当然其中也不乏一些人,开始总结他们的运维操作,将一些常用的操作写成大量的脚本以便于从事一些机械、重复的事情时候可以“偷个懒”。但是,在这个阶段手工运维还是占了绝大部分的工作量。
 
ITOM

在IOE架构时代的后期以及互联网架构开始普及,也同时伴随着企业IT信息化的不断深入,企业中IT设备量呈现爆发性的增长,单靠人力开始逐渐管不过来。以我们服务过的某运营商客户为例,最初的业务支撑部门负责维护其核心系统,当时只有区区20来台主机,几个数据库。然而其后数年,维护系统规模上升了十数倍,IT运维团队规模只增加了不到一倍。维护规模和运维团队能力只会形成了事实上的越来越明显的剪刀差,这成为运维管理中最核心的矛盾。而后到了企业开始尝试引入互联网架构,系统的复杂度更是陡然上升、维护目标更是迅速增长,按照传统的手工或者半自动维护来做,就更是走不通。因此,企业为解决这种问题,尝试引入各种运维工具通过自动化的手段解决运维人手和能力不足的问题,IT运营管理也就应运而生。IT运营管理(ITOM)是指对IT基础设施以及软件应用等对象的运营进行实时监控管理并提供反馈的服务,为监测对象保持最佳运行状态提供保障。ITOM领域的工具分为三大类别,分别是:

· 监控类:各种提供应用性能监控、基础软件服务监控、主机存储设备、网络设备等自动化监控和告警的软件服务,例如,商用软件中的Tivoli、开源软件中的Zabbix等为代表。

· 管理类:各种提供IT运维支撑服务以及配置管理等方式的软件服务,例如,各种ITSM系统和CMDB软件系统,例如,HP的OpenView之类。

· 自动化类:各种提供自动化运维手段的工具和软件,例如,开源的Ansible、Puppet之类。

IT 运维管理(ITOM)将从原有的人工加被动响应,转变为更高效、更为自动化的运维体系。


 

 
AIOps

通过大数据和人工智能技术分析日志和运维数据,发掘更多运维人员尚未觉察的潜在的系统安全和运维问题。

Gartner在2016年发布的报告中首先提出了基于大数据及算法(Algorithmic IT Operations)的IT运维概念。随着人工智能的快速兴起,Gartner将AIOps的概念从原本的基于数据分析,扩充为基于人工智能,期望通过大数据、现代机器学习及更多高级分析技术,提供具备主动性、人性化及动态可视化的能力,直接或间接地提升目前传统IT运维(监控、自动化、服务台)的能力。AIOps真正应用和落地时间还很短,从目前的应用而言主要是在运维数据集中化的基础上,应用机器学习算法进行各种数据分析和挖掘的工作。主要的应用场景包括:

· 异常告警:根据历史监控指标数据,运用基于时序的相关算法对监控指标异常分析,并对出现异常的监控指标发出精准告警。

· 告警收敛:根据历史事件和告警数据,发现这些事件和告警之间的关系,整合频繁一起出现的事件和告警,并将其认看作同一类故障的告警,从而把多个告警和指标合并,推送给运维人员,做到精细化告警,避免传统监控工具因一故障而导致的告警风暴,生产告警噪音。

· 故障分析:通过运维数据及事件、告警,结合以前发现问题的经验知识库和模型,建立故障树分析,结合决策树等相关算法,通过推导路径使运维人员对于问题的定位更加快速、直观,使得问题的解决更加容易。

· 趋势预测:进行历史数据拟合等算法,进行资源趋势/容量预测。例如,主机CPU,交换页不足、内存不足、存储不足会逐渐导致系统故障或应用故障,该系统建立关联模型,提醒用户可能后继可能发生系统故障或应用故障。在故障产生真正业务影响前,告知运维人员事先解决问题。

· 故障画像:通过采集多维度运维数据,构建多元结构化底层运维数据模型,配合各类运维场景,并在场景里对故障进行画像,通过各种故障画像标准形式来辅助企业进行IT运维 决策和处理过程。

当然,AIOps的应用场景远不止于此,正是由于这个概念出现的时间比较短,也就有更多的发挥空间容我们去细细发掘。总体而言,从手工运维、ITOM、ITOA、AIOps的发展路径体现了运维自动化、数据化到智能化这一主要发展趋势。
 
以上内容由北京艾锑无限科技发展有限公司整理

相关文章

IT外包服务
二维码 关闭