阿里游戏高可用架构设计实践

qilin20 qilin20     2022-12-20     353

关键词:

 

 

    今天读了李云华老师写的《阿里游戏高可用架构设计实践 》,有一些感受想分享一下。

    印象很深的一句话那就是他最开始说的“把韵味的锅让研发去背!”也就是说,高可用的系统是设计出来的,不是靠运维保障出来的! 他提到出现问题人们的思考顺序为:首先想到的是不是运维太LOW了,比如说硬件质量太差,为什么这个月机柜也坏、交换机也坏,是不是到电脑城买个二手货放里面了?第二想到的是不是运气不好,之前一个月、两个月才遇到一次,这个月遇到了4次,是不是你们没有在机房烧香?第三个是不是测试不足,为什么这些Bug测试阶段不能发现,线上才发现?还有运维经验不足,比如交换机出现故障,有的人以为很简单,倒换一下就行了。甚至有的同学提到了流程不完善,说整个流程中有很多可以改进的地方。比如说故障发生之后,响应机制是不是不够顺畅,故障发生之后一堆人,包括研发、测试、运维手忙脚乱,是不是要定一个全流程的处理方案,指定一堆的责任人?然而最主要的问题还是系统设计方案的问题。解决方案有下面就几个方式:高可用目标-传统方法:确定这个方向之后我们就需要定一个目标,首先确定一个目标。高可用其实都是指几个9,5个9的话可能就是电信级或者金融级的,互联网大部分是3个9到4个9。 但是有一个缺点,除了技术人员,其他同学不是很好理解,他们没有办法将4个9或者5个9转换成直观的理解。所以,我们当时在定项目目标的时候并没有这样去定。 高可用目标-面向业务:我们最终确定的目标跟几个9的目标有一个比较大的区别,几个9的目标主要是从系统的角度去考虑的,就是说这个系统的可靠性是几个9。 这个目标的优点:1、聚焦业务。2、容易分解。目标本身就是我们的工作方向,首先要定位问题,怎么定位问题?我们就可以想一个办法,其次是恢复业务,第三是故障的频率不能太高;3、容易衡量。我们后来再做方案的时候,很多方案只要拿这个标准一套,基本上就能够判断这个方案是否可行。整个目标最后折算下来,对应的差不多是4个9左右,比4个9高一点点。 高可用整体架构整体架构一共分为四层:用户层、网络层、服务层、运维层。整个架构其实跟目标是一样的,我们是面向整个业务的,没有说哪个系统应该具备几个9的高可用,而是站在整个业务的全流程来看假设要达到目标,每一个应该怎么去做。每一层都需要做一些应对的方案,才能达到目标。接下来我就详细给大家介绍一下,每一个方案的基本思路和做法。 

        接下来就是架构解耦了:业务分离下图是原来的架构,这个系统把所有的功能都包含了,比如说登录、注册、参数下发、消息、日志、更新。其实对于玩家来玩游戏来说,真正强相关的只有登录注册和参数下发,消息和日志、更新其实并不是玩家玩游戏必须具备或者强相关的。所以,业务分离的做法就是把核心业务和非核心业务分拆到不同的系统中,把两个系统之间通过接口调用,互相访问。这样做的好处,假设非核心业务系统出现故障,它并不影响核心业务系统,因为它们之间是通过接口调用的,并不共享相同的资源。

技术图片 服务中心服务中心类似于DNS,是实现整个内部系统之间服务调用时候的调度功能,服务中心是一个类似于服务的名字系统。业务降级整个系统拆分成核心业务系统和非核心业务系统,在一些紧急情况下,比如说非核心业务系统重启也没有办法,甚至说某个数据库搞挂了,它又影响业务核心系统。这个时候,接口是可以访问的,但是响应时间特别慢,核心系统就有点被拖慢。那么,在这种比较极端的情况下,我们可以通过人工的方式下发降级指令,把这个非核心业务系统的功能给停掉,这个停掉并不是把程序停掉,而是说把其中的一个接口或者url停掉,核心系统去访问的时候就得到一个500或者503错误。

服务中心
服务中心类似于DNS,是实现整个内部系统之间服务调用时候的调度功能,服务中心是一个类似于服务的名字系统。业务降级
整个系统拆分成核心业务系统和非核心业务系统,在一些紧急情况下,比如说非核心业务系统重启也没有办法,甚至说某个数据库搞挂了,它又影响业务核心系统。这个时候,接口是可以访问的,但是响应时间特别慢,核心系统就有点被拖慢。那么,在这种比较极端的情况下,我们可以通过人工的方式下发降级指令,把这个非核心业务系统的功能给停掉,这个停掉并不是把程序停掉,而是说把其中的一个接口或者url停掉,核心系统去访问的时候就得到一个500或者503错误。
360度监控:立体化、自动化以及可视化。

 

技术图片

总结:研发、测试、运维,大家一起来设计高可用性。 

 

各大互联网公司架构演进之路汇总

...淘宝架构演进背后——零售业务中台架构设计探讨及实践阿里游戏高可用架构设计实践阿里B2B技术架构演进详解秒杀系统 查看详情

高可用架构设计与实践

第一节:了解常用的分布式解决方案一、分布式事务方案:最终一致性、事务补偿、TCC、两阶段提交、最大能力通知等。具体结合业务场景。很多大型企业自主研发了自己的分布式事务解决方案,如:支付宝XTS,去哪儿QMQ。1.基... 查看详情

架构实践架构师十项能力清单:对标阿里p8晋升要求

...全性维度——流程安全性、架构安全性弹性伸缩维度——阿里云Knative弹性伸缩、有状态/无状态应用弹性伸缩架构设计实战架构设计模式架构设计输入、输出需求分析核心方法论——架构立方体功能性模型——模块定义、模块关... 查看详情

构建高并发高可用的电商平台架构实践

从各个角度总结了电商平台中的架构实践,由于时间仓促,定了个初稿,待补充完善,欢迎大家一起交流。转载请声明出处:http://blog.csdn.net/yangbutao/article/details/12242441作者:杨步涛关注分布式架构、大数据、搜索、开源技术QQ:30... 查看详情

构建高并发高可用的电商平台架构实践(转)

转载自:http://blog.csdn.net/yangbutao/article/details/12242441一、 设计理念  1.      空间换时间1)      多级缓存,静态化客户端页面缓存(httpheader中包含Expires 查看详情

云时代架构读后感

阿里游戏高可用架构设计实践原文地址:https://mp.weixin.qq.com/s?__biz=MzA4Nzg5Nzc5OA==&mid=2651660980&idx=1&sn=640c3d2280d7657f236434ff6ba0b22b&scene=21#wechat_redirect 这篇文章文章主要是对游戏架构的设计,因为作为一名游戏玩家, 查看详情

高并发高性能下的会员系统[同程艺龙]—高可用架构设计实践

目录会员系统[同程艺龙]—高可用架构设计实践ES高可用方案ES双中心主备集群架构ES流量隔离三集群架构ES集群深度优化提升会员Redis缓存方案Redis双中心多集群架构高可用会员主库方案MySQL双中心Partition集群方案会员主库平滑迁... 查看详情

高并发高可用的架构实践-静态架构蓝图

高并发高可用的架构实践参考博客:https://blog.csdn.net/taotoxht/article/details/46931045二、 静态架构蓝图  整个架构是分层的分布式的架构,纵向包括CDN,负载均衡/反向代理,web应用,业务层,基础服务层,数据存储层。水... 查看详情

java大型互联网-构建高并发和高可用的电商平台架构实践原理

...,但任一个时刻点上只有一个程序在处理机上运行。“高可用性”(HighAvailability)通常来描述一个系统经过专门的设计,从而减少停工时间,而保持其服务的高度可用性。一、设计理念1.空间换时间多级缓存,静态化客户端页面... 查看详情

9.携程架构实践---网站高可用(代码片段)

第9章网站高可用 网站可用性的提升,要同时从多方面入手,如软件架构设计实现,监控告警,紧急事件的响应,运维管理,容量管理,信息安全,灾备数据中心,故障演练等,这就是一个&#... 查看详情

架构高可用高并发系统的设计原则

...linux就该这么学》学习笔记及自己的感悟:架构设计之高可用高并发系统设计原则,架构设计包括墨参考技术A通过学习《亿级流量网站架构核心技术》及《linux就该这么学》学习笔记及自己的感悟:架构设计之高可用高并发系统... 查看详情

面向大规模流量活动的高可用架构实践

...三个部分:1.大流量活动的系统扩容评估方法2.系统高可用架构设计实践3.大规模流量活动的实践案例大流量活动的系统扩容评估方法大流量活动有多种形式,除了我们常见的电商大促(双11、618等),近几年还... 查看详情

服务发现与配置管理高可用实践(代码片段)

...持续更新中,期待大家的关注。作者:三辰|阿里云云原生微服务基础架构团队技术专家,负责MSE引擎高可用架构本篇是微服务高可用最佳实践系列分享的开篇,系列内容持续更新中,期待大家的关注。引... 查看详情

爆赞!这份由数位阿里大牛编写的583页高可用架构设计核心要点笔记

...人享受互联网技术的红利,让技术拓展商业的边界。阿里巴巴的双11技术已经越来越成熟,因为阿里巴巴已经逐步具备了基于云的计算能力,可以轻松应对各种业务压力。本书的上册《分布式服 查看详情

构建高并发高可用的电商平台架构实践

版权声明:本文为博主原创文章,未经博主允许不得转载。从各个角度总结了电商平台中的架构实践,由于时间仓促,定了个初稿,待补充完善,欢迎大家一起交流。转载请声明出处:http://blog.csdn.net/yangbutao/article/details/12242441... 查看详情

2017年文章汇总

...不同类型业务系统技术架构的差异化 》《超全总结|阿里电商故障治理和故障演练实践》《从100PV到 查看详情

高并发高可用架构设计之目录

简介架构图 查看详情

高并发高可用架构设计之目录

简介架构图 查看详情