目前,国家正在大力推动传统企业的改造与升级,企业运营的自动化也成为重要的升级目标。中培教育《IT治理与审计最佳实践》培训专家王教授认为,自动化运维对企业实现卓越运营有着重要的推动力,而互联网则在这其中发挥着不可替代的作用。
一、企业为何要实施自动化?
随着,企业业务的迅速发展、不断创新及虚拟化、大数据与云等新兴IT技术的应用,各企业的IT管理者都正在面临一个重要挑战-如何在满足各项合规要求下,迅速的为客户交付真正的价值。例如,部署效率是否满足业务产品上线频率,因员工的误操作影响业务的可用性,IT运维团队一天中大量的工作时间在处理一样的事件或完成一样的任务等。
企业可通过实施自动化运维降低运维工作占用的大量人力资源,提升效率;减少因运维过程中因依赖人工操作造成的人工操作失误,保障系统安全稳定。
二、企业目前实施自动化运维面临的问题。
企业实施自动化运维通常希望事情能变的更简单,效率能有所提高,例如执行调度、自动运行的脚本、部署、云资源管理平台等自动化运维任务,目标是使这些任务能有效运行,并减少人为干预。但事实上,自动化运维带来的效果往往并不明显,甚至使运维更加混乱。主要的问题如下:
1. 大部分企业实施自动化运维更多的是从“流行技术”的角度考虑,未从减少运营成本,增加效率的角度对需要自动化运维的工作进行评估,使自动化运维的投入与产出不成正比。
2. 目前,大部分企业运维部门的各个组,例如服务器组、网络组、数据库组的管理员已经编写了一些脚本去自动执行一些常规的IT运维工作,例如配置文件的自动备份、数据库的日志检查等工作。这种孤岛式的工具的蔓延将会导致自动化运维工具功能上的重复使用及运维人员的误用。
3. 由于缺少对自动化工具或产品的统一管理,包括评估、测试、部署、变更等控制环节,为业务带来了额外的风险。
三、企业实施自动化运维的五个步骤。
1. 按照运维组(例如,服务器组、网络组、存储组、数据库组、应用组等)梳理可以自动化运维的工作及已经实现自动化运维的工具。
2. 识别需要自动化运维工作的工作量、难易程度、工具所运行的环境等内容,并对工具进行评估。
3. 确认需要自动化运维的工作,进行测试、部署并最终纳入CMDB及变更管理控制。
4. 将自动化运维的任务与IT流程集成,例如监控管理、事件管理、变更管理和发布管理,提高服务的效率及质量。
5. 将自动化运维的任务及IT流程与IT服务进行关联,整体展现对业务带来的价值。
四、某大行自动化运维的案例分享
某大型商业银行近年来构建了自动化运维体系,此运维体系一方面可以实现对系统、网络、存储等基础设施环境资源实时监测与故障快速定位,也可以对应用容量、交易量、成功率等进行在线监控与预警。截至2014年10月底,该行数据中心全年事件总数2165个,自动发现2034个,占事件数量94%,为应急事件的及时处置提供了技术保障。
另一方面,此运维体系还实现了应用一键式部署,可推进故障自动恢复。该行将自主研发的云平台应用于生产,实现了基础设施云服务的自动化供给、系统“一键式”启停、“一键式”应用安装部署、自动化变更等功能,人均维护设备数量从几十二台提升到几百台,极大地提高了工作效率,这既减轻了人员负担,更降低了操作风险。