分布式计算,大型网站技术架构:核心原理与案例分析

Kaffee Kaffee     2022-10-24     362

关键词:

分布式计算,大型网站技术架构:核心原理与案例分析

 这个回答,非常详细。
 但是,大部分内容,都来自“大型网站技术架构:核心原理与案例分析”。
 最近,初步看了这本书,觉得写得太好了,比较系统和全面。
 不过,我还是不喜欢吹B“听群一席话,胜读十年书”之类的。
没有之前7年多的技术学习,这本书根本看不懂,很多内容,之前都接触过了。
这本书,对我来说,最大的意义是,有条理,全面系统分析。
 
著作权归作者所有。
商业转载请联系作者获得授权,非商业转载请注明出处。
作者:李小翀
链接:https://www.zhihu.com/question/22764869/answer/31277656
来源:知乎

首先推荐4本书

大型分布式网站架构设计与实践


大型网站技术架构:核心原理与案例分析


大型网站系统与Java中间件实践


分布式Java应用:基础与实践


貌似都是4位阿里人写的,一本一本的看吧,绝对会增强你的内功。下面是本人的一个简要小结,供参考。

分布式架构的演进


系统架构演化历程-初始阶段架构

初始阶段 的小型系统 应用程序、数据库、文件等所有的资源都在一台服务器上通俗称为LAMP

特征:
应用程序、数据库、文件等所有的资源都在一台服务器上。

描述:
通常服务器操作系统使用linux,应用程序使用PHP开发,然后部署在Apache上,数据库使用Mysql,汇集各种免费开源软件以及一台廉价服务器就可以开始系统的发展之路了。

系统架构演化历程-应用服务和数据服务分离

好景不长,发现随着系统访问量的再度增加,webserver机器的压力在高峰期会上升到比较高,这个时候开始考虑增加一台webserver

特征:
应用程序、数据库、文件分别部署在独立的资源上。

描述:
数据量增加,单台服务器性能及存储空间不足,需要将应用和数据分离,并发处理能力和数据存储空间得到了很大改善。

系统架构演化历程-使用缓存改善性能

特征:
数据库中访问较集中的一小部分数据存储在缓存服务器中,减少数据库的访问次数,降低数据库的访问压力。

描述:
系统访问特点遵循二八定律,即80%的业务访问集中在20%的数据上。
缓存分为本地缓存和远程分布式缓存,本地缓存访问速度更快但缓存数据量有限,同时存在与应用程序争用内存的情况。

系统架构演化历程-使用应用服务器集群

在做完分库分表这些工作后,数据库上的压力已经降到比较低了,又开始过着每天看着访问量暴增的幸福生活了,突然有一天,发现系统的访问又开始有变慢的趋势了,这个时候首先查看数据库,压力一切正常,之后查看webserver,发现apache阻塞了很多的请求,而应用服务器对每个请求也是比较快的,看来 是请求数太高导致需要排队等待,响应速度变慢

特征:
多台服务器通过负载均衡同时向外部提供服务,解决单台服务器处理能力和存储空间上限的问题。

描述:
使用集群是系统解决高并发、海量数据问题的常用手段。通过向集群中追加资源,提升系统的并发处理能力,使得服务器的负载压力不再成为整个系统的瓶颈。

系统架构演化历程-数据库读写分离

享受了一段时间的系统访问量高速增长的幸福后,发现系统又开始变慢了,这次又是什么状况呢,经过查找,发现数据库写入、更新的这些操作的部分数据库连接的资源竞争非常激烈,导致了系统变慢

特征:
多台服务器通过负载均衡同时向外部提供服务,解决单台服务器处理能力和存储空间上限的问题。

描述:
使用集群是系统解决高并发、海量数据问题的常用手段。通过向集群中追加资源,使得服务器的负载压力不在成为整个系统的瓶颈。

系统架构演化历程-反向代理和CDN加速

特征:
采用CDN和反向代理加快系统的 访问速度。

描述:
为了应付复杂的网络环境和不同地区用户的访问,通过CDN和反向代理加快用户访问的速度,同时减轻后端服务器的负载压力。CDN与反向代理的基本原理都是缓存。

系统架构演化历程-分布式文件系统和分布式数据库

随着系统的不断运行,数据量开始大幅度增长,这个时候发现分库后查询仍然会有些慢,于是按照分库的思想开始做分表的工作

特征:
数据库采用分布式数据库,文件系统采用分布式文件系统。

描述:
任何强大的单一服务器都满足不了大型系统持续增长的业务需求,数据库读写分离随着业务的发展最终也将无法满足需求,需要使用分布式数据库及分布式文件系统来支撑。
分布式数据库是系统数据库拆分的最后方法,只有在单表数据规模非常庞大的时候才使用,更常用的数据库拆分手段是业务分库,将不同的业务数据库部署在不同的物理服务器上。

系统架构演化历程-使用NoSQL和搜索引擎

特征:
系统引入NoSQL数据库及搜索引擎。

描述:
随着业务越来越复杂,对数据存储和检索的需求也越来越复杂,系统需要采用一些非关系型数据库如NoSQL和分数据库查询技术如搜索引擎。应用服务器通过统一数据访问模块访问各种数据,减轻应用程序管理诸多数据源的麻烦。

系统架构演化历程-业务拆分

特征:
系统上按照业务进行拆分改造,应用服务器按照业务区分进行分别部署。

描述:
为了应对日益复杂的业务场景,通常使用分而治之的手段将整个系统业务分成不同的产品线,应用之间通过超链接建立关系,也可以通过消息队列进行数据分发,当然更多的还是通过访问同一个数据存储系统来构成一个关联的完整系统。

纵向拆分:
将一个大应用拆分为多个小应用,如果新业务较为独立,那么就直接将其设计部署为一个独立的Web应用系统

纵向拆分相对较为简单,通过梳理业务,将较少相关的业务剥离即可。

横向拆分:将复用的业务拆分出来,独立部署为分布式服务,新增业务只需要调用这些分布式服务

横向拆分需要识别可复用的业务,设计服务接口,规范服务依赖关系。


系统架构演化历程-分布式服务

特征:
公共的应用模块被提取出来,部署在分布式服务器上供应用服务器调用。

描述:
随着业务越拆越小,应用系统整体复杂程度呈指数级上升,由于所有应用要和所有数据库系统连接,最终导致数据库连接资源不足,拒绝服务。

Q:分布式服务应用会面临哪些问题?

A:
(1) 当服务越来越多时,服务URL配置管理变得非常困难,F5硬件负载均衡器的单点压力也越来越大。
(2) 当进一步发展,服务间依赖关系变得错踪复杂,甚至分不清哪个应用要在哪个应用之前启动,架构师都不能完整的描述应用的架构关系。
(3) 接着,服务的调用量越来越大,服务的容量问题就暴露出来,这个服务需要多少机器支撑?什么时候该加机器?
(4) 服务多了,沟通成本也开始上升,调某个服务失败该找谁?服务的参数都有什么约定? 
(5) 一个服务有多个业务消费者,如何确保服务质量?
(6) 随着服务的不停升级,总有些意想不到的事发生,比如cache写错了导致内存溢出,故障不可避免,每次核心服务一挂,影响一大片,人心慌慌,如何控制故障的影响面?服务是否可以功能降级?或者资源劣化? 

Java分布式应用技术基础


分布式服务下的关键技术:消息队列架构


消息对列通过消息对象分解系统耦合性,不同子系统处理同一个消息

分布式服务下的关键技术:消息队列原理


分布式服务下的关键技术:服务框架架构

服务框架通过接口分解系统耦合性,不同子系统通过相同的接口描述进行服务启用
服务框架是一个点对点模型
服务框架面向同构系统
适合:移动应用、互联网应用、外部系统

分布式服务下的关键技术:服务框架原理

分布式服务下的关键技术:服务总线架构


服务总线同服务框架一样,均是通过接口分解系统耦合性,不同子系统通过相同的接口描述进行服务启用
服务总线是一个总线式的模型
服务总线面向同构、异构系统
适合:内部系统

分布式服务下的关键技术:服务总线原理


分布式架构下系统间交互的5种通信模式

request/response模式(同步模式):客户端发起请求一直阻塞到服务端返回请求为止。

Callback(异步模式):客户端发送一个RPC请求给服务器,服务端处理后再发送一个消息给消息发送端提供的callback端点,此类情况非常合适以下场景:A组件发送RPC请求给B,B处理完成后,需要通知A组件做后续处理。

Future模式:客户端发送完请求后,继续做自己的事情,返回一个包含消息结果的Future对象。客户端需要使用返回结果时,使用Future对象的.get(),如果此时没有结果返回的话,会一直阻塞到有结果返回为止。

Oneway模式:客户端调用完继续执行,不管接收端是否成功。

Reliable模式:为保证通信可靠,将借助于消息中心来实现消息的可靠送达,请求将做持久化存储,在接收方在线时做送达,并由消息中心保证异常重试。

五种通信模式的实现方式-同步点对点服务模式


五种通信模式的实现方式-异步点对点消息模式1


五种通信模式的实现方式-异步点对点消息模式2


五种通信模式的实现方式-异步广播消息模式


分布式架构下的服务治理
服务治理是服务框架/服务总线的核心功能。所谓服务治理,是指服务的提供方和消费方达成一致的约定,保证服务的高质量。服务治理功能可以解决将某些特定流量引入某一批机器,以及限制某些非法消费者的恶意访问,并在提供者处理量达到一定程度是,拒绝接受新的访问。

基于服务框架Dubbo的服务治理-服务管理
道你的系统,对外提供了多少服务,可以对服务进行升级、降级、停用、权重调整等操作
可以知道你提供的服务,谁在使用,因业务需求,可以对该消费者实施屏蔽、停用等操作

基于服务框架Dubbo的服务治理-服务监控


可以统计服务的每秒请求数、平均响应时间、调用量、峰值时间等,作为服务集群规划、性能调优的参考指标。

基于服务框架Dubbo的服务治理-服务路由


基于服务框架Dubbo的服务治理-服务保护


基于服务总线OSB的服务治理-功能介绍


基于服务总线OSB的服务治理


Q:Dubbo到底是神马?
A:

淘宝开源的高性能和透明化的RPC远程调用服务框架
SOA服务治理方案

Q:Dubbo原理是?
A:

《大型网站技术架构:核心原理与案例分析》--读书笔记:大型网站核心架构要素--性能

1.性能   在浏览器端,可能通过浏览器缓存、使用页面压缩、合理布局页面、减少cookie传输等手段改善性能。还可以使用CDN,将网站静态内容分发至离用户最近的网络服务商机房。可以在网站机房部署反向代理服务器... 查看详情

大型网站技术架构-核心原理与案例分析-阅读笔记5

   在第四章案例章节中的海量分布式存储系统Doris的高可用架构设计分析的小节中作者主要分析介绍了分布式存储的高可用架构和不同故障情况下的高可用解决两个方面,在两小节前作者给我们介绍了Doris是一个海量... 查看详情

《大型网站技术架构:核心原理与案例分析》阅读笔记二

   本次写写第二章《大型网站架构模式》概要内容和个人体会。   网站架构模式可以从分层、分割、分布式、集群、缓存、异步、冗余、自动化和安全九个方面描述。  分层是应用系统中最常见的一种架... 查看详情

大型网站技术架构-核心原理与案例分析-阅读笔记3

    在第二章的架构章节中的随机应变:网站的可拓展架构的篇章中作者介绍了构建网站的可扩展架构、利用分布式队列降低系统的耦合性、利用分布式可复用的业务平台、可拓展的数据结构、利用开放平台建设网... 查看详情

读《大型网站技术架构核心原理与案例分析》

读《大型网站技术架构核心原理与案例分析》1人们对于网站的期望是:高可用、高性能、易扩展、可伸缩且安全的网站。大型网站软件系统的特点:高并发,大流量看,高可用,海量数据,用户分布广泛,网络情况复杂,安全... 查看详情

《大型网站技术架构》核心原理与案例分析

内容简介  本书通过梳理大型网站技术发展历程,剖析大型网站技术架构模式,深入讲述大型互联网架构设计的核心原理,并通过一组典型网站技术架构设计案例,为读者呈现一幅包括技术选型、架构设计、性能优化、Web安全... 查看详情

《大型网站技术架构:核心原理与案例分析》笔记00

《大型网站技术架构:核心原理与案例分析》笔记00大型网站需要解决的问题:1.高并发,大流量2.高可用3.海量数据4.用户分布广泛,网络情况复杂5.安全环境恶劣6.需求快速变更,发布频繁7.渐进式发展:好的互联网产品都是慢... 查看详情

大型网站技术架构:核心原理与案例分析笔记

1.大型网站软件系统的特点:  高并发,大流量  高可用    海量数据  用户分布广泛,网络情况复杂  安全环境恶劣  需求快速变更,发布频繁  渐进式发展  2.大型网站演变架构  1)初步应用:... 查看详情

《大型网站技术架构:核心原理与案例分析》读书笔记系列

作者:13GitHub:https://github.com/ZHENFENG13版权声明:本文为原创文章,未经允许不得转载。笔记目录1.《大型网站技术架构:核心原理与案例分析》读书笔记2.大型网站技术架构(二)--大型网站架构演化 查看详情

《大型网站技术架构:核心原理与案例分析》pdf下载

《大型网站技术架构:核心原理与案例分析》【PDF】下载链接:https://u253469.pipipan.com/fs/253469-230062557   内容简介本书通过梳理大型网站技术发展历程,剖析大型网站技术架构模式,深入讲述大型互联网架构设计的核心原... 查看详情

大型网站技术架构:核心原理与案例分析阅读笔记六

大型网站核心架构要素之可扩展性   扩展性是指对现有系统影响最小的情况下,系统功能可持续扩展或提升的能力。它是系统架构设计层面的“开闭原则”。伸缩性是指系统能够通过增加(减少)自身资源规模的方式增强... 查看详情

《大型网站技术架构:核心原理与案例分析》笔记03

《大型网站技术架构:核心原理与案例分析》笔记011.大型网站核心架构要素。  架构:“最高层次的规划,难以改变的决定。”从这个角度而言,人生规划也是一种架构。选什么学校、学什么专业、进什么公司、找什么对象... 查看详情

分布式环境下5种session处理策略(大型网站技术架构:核心原理与案例分析里面的方案)

前言在搭建完集群环境后,不得不考虑的一个问题就是用户访问产生的session如何处理。如果不做任何处理的话,用户将出现频繁登录的现象,比如集群中存在A、B两台服务器,用户在第一次访问网站时,Nginx通过其负载均衡机制... 查看详情

《大型网站技术架构核心原理与案例分析》阅读笔记-01

...够更加清楚的树立大型网站的的技术发展历程,剖析大型网站技术架构模式,深入的讲述大型互联网架构核心原理,并通过一些典型的技术案例来讲述大型网站开发全景视图,该书籍深入的阐述了各种大型网站面临的各种架构问... 查看详情

大型网站技术架构:核心原理与案例分析pdf

...地址:网盘下载  内容简介编辑本书通过梳理大型网站技术发展历程,剖析大型网站技术架构模式,深入讲述大型互联网架构设计的核心原理,并通过一组典型网站技术架构设计案例,为读者呈现一幅包括技术选型、架构... 查看详情

《大型网站技术架构:核心原理与案例分析》读后感

 李智慧的著作《大型网站技术架构:核心原理与案例分析》,写得非常好, 本着学习的态度,对于书中的关于性能优化的讲解做了一个思维导图,供大家梳理思路和学习之用。抛砖引玉。   查看详情

《大型网站技术架构:核心原理与案例分析》笔记

目录· 大型网站软件系统的特点· 大型网站架构演化发展历程    · 初始阶段的网站架构        · 需求/解决问题        · 架构&n 查看详情

《大型网站技术架构:核心原理与案例分析》结合需求征集系统分析

  阅读《大型网站技术架构:核心原理与案例分析》第五、六、七章,结合《河北省重大技术需求征集系统》,列举实例分析采用的可用性和可修改性战术,将上述内容撰写成一篇1500字左右的博客阐述你的观点。  ... 查看详情