架构师日常-稳定性工作

Q博士 Q博士     2022-12-04     537

关键词:

01 值班制度

这里的值班制度是针对一些高峰期不在我们上班时间的业务,也会在一些特殊的业务高峰期,比如618,双11,双12这种节点。而目前我们业务采用的值班制度是在早高峰9点到11点,一般这个时间点,我们刚起床,或者在路上。出现问题时,没有人跟进,而时间一过11点,当天订单全部结束,所以影响较大。在经历过几次线上事故,线上恢复时间都较慢后,所以制定了值班制度。

何人值班

值班角色有RD/QA/OP/FE,几乎全角色每天都有一人,以周为单位循环,除了QA/OP/FE周一到周五是固定,RD是每周更新一次,更新的机制就是模块报警数量前5的模块负责人,我们有报警统计平台,利用平台数据,可以每周末得到前5名单。同时每天有值班负责人,由各个方向高工服务,主要是确保值班人员到位,辅助协调其他人员配合。

值班做什么

  • 跟进服务报警,快速排除恢复服务
  • 快速跟进业务反馈的问题,跟服务异常有关的,快速跟进,业务问题研发不跟进

02模块负责人制度

在微服务架构下,模块众多是个常态,模块多没问题,但如果模块问题没人跟进就会威胁稳定性,一个模块出问题没人跟进,关联模块都会受影响,所以在我转到当前业务的时候,首先将每个模块都指定了专人负责,模块负责人负责该模块的所有事情,包括但不限于以下

  • 报警梳理与跟进
  • 功能维护与架构优化
  • 框架升级跟进与底层库升级

可能很多人会有疑惑,模块不是本身就有负责人,为啥还要指定。有一些历史原因,一是新人较多,我来的时候团队60%的人都是新招来的,对已有功能不熟悉是个实际情况,二是模块划分不清晰,平时大家都在开发需求,一个模块里面什么功能都有,所以也就分不清楚该谁维护。

历史原因是历史原因,只要影响了服务稳定性,就要改变,所以就指定了该制度

03线上问题跟进

明确线上问题的生命周期,我切分了6个周期。如下:

  • 问题发现
  • 问题跟进
  • 问题定位
  • 问题修复
  • 问题消除
  • 问题回顾

且明确了每个阶段要做的事情,且每件事都很具体,不抽象。只要大家按照流程跟进问题,大多数问题就会很快得到解决。特别是问题回顾,让整个事情能形成有效问题闭环,每一个问题产生的共性问题以及措施,都能在后面提升我们解决问题的速度。

04架构优化

这里的架构优化,不是是涉及到危害稳定性的架构优化工作,当然后面我会专门说架构优化这个专项,因为我做过0-1,1-n的架构优化很多次,也有一些经验沉淀。

这里面的一些优化点,大多是从一些线上问题中发现的,一些设计不合理的点,但是不是很快能解决。这类问题越来越多的时候,且有一些共性的时候,我们就会起一些优化需求。

05意识提升

其实很多问题,归根到底是人的问题,就比如你指定了制度和流程,那么有人就是不遵守,那你也达不到提升稳定性的效果。所以也有慢慢灌输稳定性的重要性,所以这里面就涉及了团队管理工作。刚好我又是研发团队技术负责人,所以这个工作会渗透在日常管理各种事情上

架构师日常-稳定性工作

01值班制度这里的值班制度是针对一些高峰期不在我们上班时间的业务,也会在一些特殊的业务高峰期,比如618,双11,双12这种节点。而目前我们业务采用的值班制度是在早高峰9点到11点,一般这个时间点ÿ... 查看详情

架构师日常-稳定性工作

01值班制度这里的值班制度是针对一些高峰期不在我们上班时间的业务,也会在一些特殊的业务高峰期,比如618,双11,双12这种节点。而目前我们业务采用的值班制度是在早高峰9点到11点,一般这个时间点ÿ... 查看详情

架构师日常-团队管理

文章目录日常工作集锦团队组建招人优化人人员培养新人培养全员培养氛围建设日常沟通总结日常工作集锦关于团队管理范畴的事情,我简单总结为下面几个方向团队组建人员培养氛围建设日常沟通团队组建招人去年年初团... 查看详情

架构师日常-团队管理

文章目录日常工作集锦团队组建招人优化人人员培养新人培养全员培养氛围建设日常沟通总结日常工作集锦关于团队管理范畴的事情,我简单总结为下面几个方向团队组建人员培养氛围建设日常沟通团队组建招人去年年初团... 查看详情

架构师日常-团队管理

文章目录日常工作集锦团队组建招人优化人人员培养新人培养全员培养氛围建设日常沟通总结日常工作集锦关于团队管理范畴的事情,我简单总结为下面几个方向团队组建人员培养氛围建设日常沟通团队组建招人去年年初团... 查看详情

架构师日常-开年篇

前言长路漫漫,继续远征,过往归零,重新出发今年目标今年会把架构师日常这个专题多丰富丰富,还欠一个总问-管理工作,接下来就是一个一个小细节开始阐述,争取把我的心得都记录下来 查看详情

架构师日常-开年篇

前言长路漫漫,继续远征,过往归零,重新出发今年目标今年会把架构师日常这个专题多丰富丰富,还欠一个总问-管理工作,接下来就是一个一个小细节开始阐述,争取把我的心得都记录下来 查看详情

架构师日常-开年篇

前言长路漫漫,继续远征,过往归零,重新出发今年目标今年会把架构师日常这个专题多丰富丰富,还欠一个总问-管理工作,接下来就是一个一个小细节开始阐述,争取把我的心得都记录下来 查看详情

百度开放云首席架构师徐串:架构师必须理解程序员的痛

...串表示,云计算环境下的架构,除了高吞吐、可扩展性、稳定性的需求,灵活性的实现也很重要。架构师的工作就是在各种矛 查看详情

架构师日常-团队管理

文章目录日常工作集锦团队组建招人优化人人员培养新人培养全员培养氛围建设日常沟通总结日常工作集锦关于团队管理范畴的事情,我简单总结为下面几个方向团队组建人员培养氛围建设日常沟通团队组建招人去年年初团... 查看详情

[架构漫谈]软件架构师如何工作

...的浪费,这也是架构需要解决的问题,即提高效率,增强稳定性,并在效率和稳定之中寻找一个最优的方案。  架构其实就是指人们主动认识、解决问题的一个过程,对问题进行切分、合并并解决这个问题的实践活动。  而... 查看详情

架构师日常-架构设计

阶段0-1的架构设计1-N的架构优化0-1的架构设计,这种场景很少碰到,这种是没有历史包袱的,这种是很考验架构师的专业能力,需求理解能力,还要做好产出收益比的衡量。1-N的应该经常遇到的,目前的互... 查看详情

歪歪架构师(软件)提升心法

 工作这些年,结合本人过往有限的经历,总结提炼下,看官可在日常有意识的从下列提升自己。至于架构范式(架构模式如分层,主从等,编码层面设计模式),文章大把,此处不做描述。欢迎讨论交流。  查看详情

稳定性监控业务后期-架构师

稳定性监控业务后期-架构师整体思路:   1.突增原因           底层某一个系统资源紧缺的原因肯定来自于上游业务请求量乘以耗时的增长.(如果是耗时,那原因是下游.如果是流量,... 查看详情

架构师日常-架构设计

阶段0-1的架构设计1-N的架构优化0-1的架构设计,这种场景很少碰到,这种是没有历史包袱的,这种是很考验架构师的专业能力,需求理解能力,还要做好产出收益比的衡量。1-N的应该经常遇到的,目前的互... 查看详情

linux互联网系统架构师,linux嵌入式软件工程师,oracle数据中心运维架构师,高级网络工程师工作分析

...标,起码的在这个行业上摸爬滚打5年以上才有可能做到架构师这一个级别,你计划的有点远说实话。如果你想稳定的话就是选择Oracle吧稳定收入高但开头很难而且不好找工作,系统架构师需要从运维开始,一步步学习一点点提... 查看详情

[架构之路-6]:架构师-架构师应该具备的架构思维

...2.1完美VS适合2.2适合 VS前瞻性+潜在演进2.3持续演进VS稳定性2.4功能性需要VS非功能性需求2.5 定性VS定量三、开发与测试环节3.1 让听到炮火声的人决策3.2架构的改进必须支持可测试、可验证的四、端到端的系统思考4.1端到端思... 查看详情

怎样成为一名架构师

怎样成为一名架构师今天听了一节如何成为合格的架构师视频课,现在总结下:一、架构师要具备什么素质1、要有良好的沟通协调能力,能够促进团队共同合作。2、技术前瞻性,需要洞察新技术并加以分析,如果新技术适用,... 查看详情