对运维的初步了解

xizhi--123 xizhi--123     2023-01-23     789

关键词:

       运维,这里指互联网运维,通常属于技术部门,与研发测试系统管理同为互联网产品技术支撑的4大部门,这个划分在国内和国外以及大小公司间都会多少有一些不同。

一个互联网产品的生成一般经历的过程是:产品经理、需求分析、研发部门开发、测试部门测试、运维部门部署发布以及长期的运行维护。

     对于初创公司,运维部和系统部一般是合二为一的,相关工作由同一批人负责,界限可能不是很明显。大型公司对运维工作的要求更高,需要有更精细的分工,因此机房/网络/操作系统相关的底层工作分离出来由专人负责,成为系统管理部,而上层和应用产品相关的工作则由运维负责,成为运维部。以下从互联网产品生命周期和运维涉及的技术分别来看分工较细的大型互联网公司中运维工作的职责。

      运维的职责覆盖了产品从设计到发布、运行维护、变更升级及至下线的生命周期,各个阶段的职责包括:

产品发布前

       这个阶段运维工程师的职责是参与设计并把有关运维准入,主要包括:

       (1) 产品的业务熟悉;

       (2) 产品架构设计的合理性评估,包括是否存在单点,是否可容错,是否有强耦合等,同时需要提供产品设计的合理性建议以使产品能够满足上线发布并稳定运行的基本要求;

       (3) 资源评估,包括所需的服务器资源、网络资源以及资源的分布等,同时把相关产品对资源预算申请的合理性,控制服务成本;

       (4) 资源就位,将申请的服务器及基础环境/域名准备就位。

产品发布

         这个阶段运维工程师负责发布的具体工作,将具体的软件和系统/硬件资源整合形成产品并对外提供服务。

         对于已在线服务的更新也属于发布范畴,这个时候的产品发布一般要保障在线发布,在不中断对外服务的情况下完成产品的升级。对于大型复杂的变更也存在中止服务部署完成后再重新提供服务的情况,但这种情况需要运维工程师通过尽可能的技术手段来避免。

产品运行维护

        这个阶段的主要工作包括:

         (1) 监控:对服务运行的状态进行实时的监控,随时发现服务的运行异常和资源消耗情况;输出重要的日常服务运行报表以评估服务/业务整体运行状况,发现服务隐患;

         (2) 故障处理:对服务出现的任何异常进行及时处理,尽可能避免问题的扩大化甚至中止服务。这之前运维工程师需要针对各类服务异常,如机房/网络故障、程序bug等问题制定处理的预案,问题出现时可以自动或手动执行预案达到止损的目的。除了日常小故障外,运维工程师还需要考虑产品不同程度受损情况下的灾难恢复,包括诸如地震等不可抗力导致大规模机房故障、在线产品被删除等对产品造成致命伤害的情况。

      容量管理:包括服务规模扩张后的资源评估、扩容、机房迁移、流量调度等规划和具体实施。

产品性能/成本优化

       产品对外提供服务最重要的一点是用户体验,用户体验中非常重要的是产品的可用性和响应速度。而如何用最合理的资源(如机器、带宽等)支持产品提供高可用和高速度的用户体验,这也是运维工程师的重要职责。

产品下线

       发展良好的互联网产品将始终在线对外提供服务,但互联网产品快速迭代,也存在相当多孵化的产品最后被淘汰的情况,这些产品都需要做下线处理,这个过程运维工程师主要做好资源回收的工作,将机器/网络等资源回收后纳入资源池中供其它服务使用。

对运维工作的理解

(一)运维,从字面意思很容易理解,就是运营、维护。有很多朋友认为,在互联网公司中Linux系统运维的工作就是安装系统,部署服务处理紧急故障,为公司里的开发人员及其他部门提供支持服务。同时,还可能负责公司办公... 查看详情

老男孩:做运维比做开发岗位有哪些特殊好处,你知道么?

...sp;现实中很多网友,包括大学生对编程开发了解很多,但对运维了解较少,有经验的部分人员(包括一些从事运维的)也会觉得开发更牛逼,运维就是背黑锅(如何不背黑锅,看老男孩的以后文章)的,运维==黑锅侠。那么,老... 查看详情

viiiopenstack

...(要快)、管理方面(物理机、云主机); 云计算:对运维需求总体量是减少了,尤其是硬件工程师,对运维的技术要求提高了;云计算是个概念,指资源的使用模式;云计算特点:必须通过网络使用;弹性计算(按需付费... 查看详情

运维的就业前景

运维的就业前景   从行业角度来看,随着中国互联网的高速发展、网站规模越来越来大、架构越来越复杂,对专职网站运维工程师、网站架构师的要求会越来越急迫,特别是对有经验的优秀运维人才需求量大,而且是... 查看详情

自动化运维的理解

我认为自动化运维之需要的几个场景1.软件升级,由于很多地方独立的部署了很多软件,现在由于敏捷开发小版本特别多,需要很多地方频繁升级。特别是升级复杂的软件,容易出错。 2.软件监控,对系统性能,数据库,安... 查看详情

运维百家讲坛第1期:井源-运维几何

...师,前小米运维负责人,前美菜CIO有些运维人员反映公司对运维的价值所知甚少,您当年是怎么给公司讲清楚运维的价值的呢?首先需要和公司讲清楚运 查看详情

关于自动化运维的实践×××

谈起自动化运维,现在已经成为运维工作最热门的词语,关于运维自动化本人早在2012年就已经接触了BMC的ITSM系统,将ITIL运维管理体系和自动化运维工具的有效的结合大幅度的提高了运维工作效率。下图为HP提的统一运维自动化... 查看详情

我对运维工程师的思考

运维就像升级打怪,需要不断变强,才能与时俱进。给自己合理的定位才能明确目标,不断向前。我把运维分成入门--中级--高级,这级别的界定有两方面:1、运维知识:DNS、http、zabbix等等的配置和使用,熟练程度和广度,影响... 查看详情

转载----运维人员的心态对运维影响大吗?

鉴于运维人员的主要工作内容是保障机房数据中心的正常工作。当机房数据中心从建设投入到生产之后,所有设备的“命运”就由施工人员转移到了运维人员身上,机房设备的日常使用管理及维护的责任也相应的由运维人... 查看详情

读sregoogle运维解密有感

...值班制度,本人到目前为止也还在参与一线运维的值班,对运维值班体系也有一些感悟和心得,再参考SRE的“oncall”中的方法来说说这个让运维同学“又爱又恨”的值班。值班因为运维人员的工作性质,要时刻保障线上服务的稳... 查看详情

gops2016全球运维大会•北京站运维的一次思想盛宴

GOPS2016全球运维大会上海站已圆满落幕,错过上海站的朋友或许会感到一些遗憾。不过在12月16日,GOPS2016全球运维大会还将在北京站召开,错过上海站的朋友可以赶上北京站哦。感兴趣的小伙伴们一起来了解一下北京站的信息吧... 查看详情

信息系统运维的发展现状趋势及运维的主要内容和目标

信息系统运维,特指新建或升级改造类信息系统项目实施完成后的系统在完成其试运行周期后,正式进入生产环境交付合适阶段的维护和保养工作。一、信息系统运维的发展现状:1.从建设向运维的转型时期;2.缺少全面性的运... 查看详情

运维的升级打怪之路v2版

本版本是2022年第二个版本运维技术的内容已经足够多了,不要乱学。眉毛胡子一把抓,就会学的很累。比如dhcp,dns,以前属于必会内容,而现在不学,只需要了解是干嘛的,哪怕连拼写都不会,也... 查看详情

运维的升级打怪之路v2版

本版本是2022年第二个版本运维技术的内容已经足够多了,不要乱学。眉毛胡子一把抓,就会学的很累。比如dhcp,dns,以前属于必会内容,而现在不学,只需要了解是干嘛的,哪怕连拼写都不会,也... 查看详情

运维体系建设思考-稳定性篇

...以来一直在做运维平台相关的研发工作,最近计划总结下对运维体系建设的思考,总结出一个通用模型,后续持续迭代,欢迎一起探讨交流。运维的工作主要有三个方向,稳定性、效率、成本,本篇是第一篇,稳定性篇。下面开... 查看详情

171128

...环If elif elsebreak 变量=下载了老男孩的linux高级运维的部分视频,准备明天看下明日计划安排:对部门收到的维护需求分类.沟通达到一致.长 查看详情

http协议初步了解

...是使用的http协议。既然是使用最广泛的协议,那么我们运维必须了解它的一些原理,同时也要了解http协议传输的数据都有哪些。一http协议1请求流程650)this.width=650;"src="http://s2.51cto.com/wyfs02/M02/8B/B2/wK 查看详情

linux运维是怎样的一个工作

...随着企业增长,服务器和服务数量、要求也会成倍增加,对运维的能力和运维人员的数量都有更多的要求。在整个企业业务系统运转过程中,涉及到系统、网络、数据库、存储、开发、安全、监控、架构等综合的技术于一身的技... 查看详情