关于自动化运维的实践×××

author author     2022-11-18     242

关键词:

谈起自动化运维,现在已经成为运维工作最热门的词语,关于运维自动化本人早在2012年就已经接触了BMC的ITSM系统,将ITIL运维管理体系和自动化运维工具的有效的结合大幅度的提高了运维工作效率。下图为HP提的统一运维自动化理念和运维手册,从目前企业基础架构层来看,运维人员无关乎关心的如下几个方面的自动化。
技术分享图片

要了解运维自动化在企业当中应用场景和是否真正能够解决运维团队工作的问题。那我们则需要站到企业运维人员的角度去考虑问题。那么我首先要知道一个企业或者运维团队在规划运维的时候所需要考虑的问题及面临的挑战。
技术分享图片
那么我们针对运维决策着的问题和目标逐个展开,因为产品的本质是为了解决用户问题,帮助用户完成自己内心预期的目标。

我们首先来看下传统运维和自动化运维的比较:
技术分享图片
我们从运维发展的过程来看,首先是传统运维,主要靠手工操作。比如上线一台服务器,登陆服务器按照操作文档一步一步操作,更高级一点,把配置命令写到脚本里,运行一个或多个脚本完成配置。
有什么缺点呢?首先,人每天重复这样的工作,很累,又没有体现价值,交付效率低,疲劳时还容易出错,忘记某些配置。
使用脚本呢,容易相同功能重复开发,很多脚本不专门记录日志,查找历史操作比较困难。使用脚本进行运维操作,发生了故障,由于没有统一的运维操作日志,无法及时了解谁做了什么。
技术分享图片
随着时间的发展,运维发展到更高级的 DevOps 时代,我们也正处于这个时代。这个时代有一个明显的特征,就是各种各样开源工具的使用,同时自己会开发很多工具。工具带来了效率的提升,大大加速了运维自动化的进程。
技术分享图片
那么这就需要一个统一的自动化运维平台,在一个平台内将运维工作的自动化工作完成,我们降云产品所谓的自动化模块顶多是网络自动化的一个分支,随后还请看我分享的BBNA网络自动化的PPT详情。 降云只是完成了工单流程的自动化,还有策略下发的自动化,那么什么是运维环境的自动化,那么我们就开始详细说明,本章主要讲述网络自动化。
关于网络自动化主要围绕三个关键点:变更、配置、合规管理
关键挑战:

设备与配置无法可视化
大批量的变更耗时长
合规&修正复杂
网络及其复杂程度增长快,难以做到有效管理
网络自动化产品的目标:

设备、配置、变更实时可视化
策略执行、合规报表、漏洞警告
减少错误、宕机事件、审计失败
单一平台支持多设备厂商
提高生产力,降低风险与成本。

针对上述产品要求落实到自动化的功能对照如下:
配置管理
配置采集:自动采集设备的软硬件信息,比如型号、板卡、Flash、序列号、软件版本、路由表、ACL等
配置备份:定期或触发式备份设备的running和startup配置文件,并保存所有历史
配置比对:对任意的配置文件进行比对,并醒目地标注差异部分
配置检索:根据各种条件搜索当前或历史配置
配置检查
配置基线:定义受信任的配置作为配置基线,自动跟踪当前配置与基线之间的差异
日常检查:根据规则检查配置是否符合一定的要求或规范,并自动通知管理员;内置大量开箱即用的规则,用户也可以自定义规则
合规检查:内置PCI、ITIL等合规检查报表
运维面板:将所有检查出来的问题通过运维面板进行集中展现
配置变更
自动生成变更脚本:对于检查有问题的配置可自动生成变更脚本进行修复
批量并发执行作业:将以前手工执行的作业自动化,大批量并发在多台设备设备上执行
配置恢复或回滚:不需要重启设备实现对任意配置文件的恢复或回滚
ACL安全切换:自动生成ACL的切换步骤,确保安全无风险切换
配置模板:可定义多厂商的配置模板,可引用变量
软件管理
软件介质库:自动收集所有的设备软件,并集中保存和管理
软件版本检查:自动检查软件版本是否符合规范要求
软件升级:批量更新软件版本
安全管理
操作审计:自动记录用户的命令以及命令输出
分辖域管理:不同用户可以分配不同的设备管辖范围
分权管理:不同用户可以指定不同的权限
工作流审批:可以快速建立工作流,用户的操作必须经过审批才能执行
报表
配置差异报表
设备库存报表
变更统计报表
标准合规报表
合规趋势分析报表
技术分享图片
该图为BMC的BBNA系统设计架构图,降云为内网安全策略管理平台,网络安全设备及网络设备的自动化运维,安全策略的变更只是其中的一个范畴,降云产品的目前来看在自动化运维提到的亮点就是,安全策略的自动化下发,并且能够自动寻路。但是从目前寻路的现状来看,寻路的稳定性强依赖于网络的健壮性(即三层路由信息,二层及透明部署则不见得准确性有所保障)。

结合以往工作经验有了以下想法:

在BMC的ITSM系统中,其实不管是哪家的统一自动化运维平台,都是依赖CMDB库,资产之间的CI关系完成变更的可视化,在大型企业的运维管理工作大多数依赖于资产管理,那么如果资产管理形成了CI之间的管理,例如核心交换机精确到板卡上的光模块的级联设备(需要人工干预),当我们发起变更请求时(安全策略开通)那么在变更视图下,就可以看到与该策略的干系的所有设备,可以根据源IP地址所在的地址和目的IP所在的地址确定数据流在CI视图下的路径。然后逐个匹配路径上的设备的安全策略,进行开通。并且记录变更状态。

个人总结:

目前各个公司运维团队都在开发适应自己现有场景的自动化工具,可以高效率的替代了许多重复性工作,例如策略开通,端口开放,虚拟机初始化配置等等。但是自动化高效运维一定是建立在标准化的基础之上,所以企业在信息化建设过程中,一定要做到统筹规划,业务方、运维方、用户方共同计划,提取共性部分方可在此基础上建立标准化,对于多种产品异构的环境,还需建立标准的适配库,提取多种设备特征方可为以后的自动化打下牢固基础。再建立自动化平台时,架构、使用语言、并发承载能力、多场景适应性都是考虑的范畴之内,所以高效的自动化运维平台,一定是持续优化持续改进的过程。

优云cmdb专家实践谈:自动化运维的基石cmdb

CMDB是什么?运维百花齐放繁荣景象的同时,也让碎片化问题产生;每个人都想整合运维平台,但是往往事与愿违。CMDB就像一个人的大脑核心,是一个信息协调库,其存储的资料是协调身体完成各种复杂运动的信息来源。我心中... 查看详情

自动化运维的资料整理

持续集成、持续交付、持续部署简介http://www.fblinux.com/?p=646内容:1、持续集成是指软件个人研发的部分向软件整体部分交付,频繁进行集成以便更快地发现其中的错误。“持续集成”源自于极限编程(XP),... 查看详情

自动化运维的理解

我认为自动化运维之需要的几个场景1.软件升级,由于很多地方独立的部署了很多软件,现在由于敏捷开发小版本特别多,需要很多地方频繁升级。特别是升级复杂的软件,容易出错。 2.软件监控,对系统性能,数据库,安... 查看详情

云时代idc自动化运维的几大神器

云时代IDC自动化运维的几大神器2016年09月18日10:27:41 天府云创 阅读数:1715 版权声明:本文为EnweiTech原创文章,未经博主允许不得转载。https://blog.csdn.net/English0523/article/details/52572114自动化运维是数据中心、互联网企业... 查看详情

ansible自动化运维的使用领域和架构(代码片段)

Ansible一、自动化运维简介:自动化运维:将周期性、重复性、规律性的工作都交给工具去做,具体来说有应用系统维护自动化,巡检自动化和故障处理自动化这三个方面;自动化运维依赖于具体的智能管理平台,最终达到提升运... 查看详情

serverless时代下大规模微服务应用运维的最佳实践

...建非常多的组件,包括PaaS微服务一些技术框架,运维IaaS、K8s,还包括可观测组件等。SAE针对这些方面都做了整体的解决方案,使用户只需要关注自己的业务系统,这极大地降低了用户使用微服务技术的门槛。... 查看详情

serverless时代下大规模微服务应用运维的最佳实践

...建非常多的组件,包括PaaS微服务一些技术框架,运维IaaS、K8s,还包括可观测组件等。SAE针对这些方面都做了整体的解决方案,使用户只需要关注自己的业务系统,这极大地降低了用户使用微服务技术的门槛。... 查看详情

从一个工程师成长看自动化运维的过程

自动化虽然涉及的应用领域很多,但其中存在一般的发展过程。下面以云计算领域的自动化运维场景为例,对自动化的一般发展过程进行讲解。十多年前,M工程师还是一名刚毕业的计算机专业的学生,和其他同学大多选择研发... 查看详情

随想之二(运维)

一运维的发展历史二运维的管理   三总体架构四基础数据管理五运维自动化 查看详情

linux运维的工作内容都有啥

...等)、软件(网络服务)、各类业务服务故障。9、编写自动化脚本(Shell、Python),自动化部署服务。高级运维涉及的工作:1、监控带宽、流量、并发、业务接口等关键资源及访问信息的变化趋势。2、根据相应趋势变化不断优化... 查看详情

2016全球运维大会,优云蒋君伟演讲“cmdb+自动化的管理融合”成一大亮点

...作为国内运维行业的重量级大会,优云产品总监蒋君伟在自动化专场与来自全国各地的运维同行一起探讨、分享业内自动化运维的最佳实践。现场情绪热烈,气氛高涨,成为了本届全球运维大会的一大亮点。全新梳理自动化与CMD... 查看详情

转:理念篇关于数据驱动运维的几点认识

转自: http://mp.weixin.qq.com/s?__biz=MzA4NjAzMjEyOA==&mid=200143127&idx=1&sn=b8d3f71659958a9ff60291b3892cfb66#rd 在一个新的环境中工作了两个多月,从业务模式、平台建设、工作方法和团队工作风格各个方面都有了一些认识。有了这... 查看详情

初学者如何学习运维?

老男孩教育老男孩老师总结了初学者学好运维的几个办法,希望能帮到大家。①先实践后看原理很多初学者思维的误区是先了解原理在去实践很多有经验的运维给初学者的建议是先把原理看懂,在去实践。他们的思想是原理比操... 查看详情

基于开源打造智能云上自动运维

自动化能自动化的一切然后介绍了使用Terraform和Packer开源工具完成云上自动运维的具体实现过程云上自动化资源架构和变更实践 https://yq.aliyun.com/articles/218891?spm=5176.100239.blogcont159008.36.Vzs09S如何用开源工具进行Multi-Cloud的自动... 查看详情

当我在谈论运维的时候,我究竟在说什么(代码片段)

...,我在说什么?当我在谈论运维的时候,我究竟在说什么关于定位关于职责如何起步关于发展结论 关于定位运维和开发,是任何一家IT公司中都非常常见的两大岗位。也是devops中绕不开的两大事务,一个创造产品,一个维护... 查看详情

2021云上架构与运维峰会12月10日线上开启,五大精彩看点不容错过

...0c;推动了敏捷弹性、DevOps、智能运维和基础设施即代码等自动化运维趋势。云计算,已经是任何一个运维人员、架构师,甚至是程序员必备的专业技能和知识。小编为你总结了本次峰会的五大看点:上手体验云端自动... 查看详情

我回来了-以数据分析和自动化运维的角度

曾几何时,我也是一门高手!!!!在专业方面技术,不说前三,前十应该还是有我的位置。那是从2008年到2013年,我在宏基工作的时候,也是这辈子学识、见识和世界观成长的最快的时候。这... 查看详情

it运维管理包含哪些内容

在IT服务管理和运维自动化这个领域,业界近年来的发展比较快。从IT服务管理(ITSM)、数据中心自动化(DCA)到开发运营一体化(DevOps),相关概念和理论不断涌现。从IBM、BMC、HP等传统厂商各类工具产品纷纷面世到Puppet、Ansib... 查看详情