大型网站架构之架构模式

Arvins Arvins     2022-10-26     321

关键词:

上节讲了《大型网站架构之架构演变》,今天讲下架构的模式,什么是模式呢?每一个模式描述了一个再我们周围不断重复发生的问题及问题解决方案的核心,这样你就能一次次重用该方案而不必去做重复的工作,可见模式的关键在于可重复性。

网站架构模式的目标:面临高并发访问,海量数据处理,高可靠运行等问题和挑战,我们在实践中提出很多解决方案,主要为了实现网站的高性能、高可用、易伸缩、可扩展、安全等架构目标。

网站架构模式具体方案如下:

1、分层

分层是一种常见的架构模式,将系统在横向维度上切分为几个部分,每个部分负责单一的职责,然后通过上层对下层的依赖和调用完成整个系统工作。一般大型网站系统都分为下面3层:

  • 应用层:负责具体业务和视图展示;

  • 服务层:为应用层提供服务支持;

  • 数据层:提供数据存储访问服务;

分层架构的挑战:必须合理规划层次边界和接口;

分层架构的约束:禁止跨层次调用及逆向调用(数据层不允许调用服务层,服务层不允许调用应用层)

2、分割

分层是横向切分,分割则是纵向切分,将不同的功能和服务分割开,包装成高内聚低耦合的模块单元,这样做的好处在于:

  • 有助于软件开发和维护;

  • 便于不同模块的分布式部署,提高网站的并发处理能力和功能扩展能力;

3、分布式

对于大型网站,分层和分割的目的都是为了便于分布式部署,将不同的模块部署在不同的服务器上,通过远程调用协同工作,分布式意味着我们可以使用更多的计算机完成同一个任务,计算机物理机越多,CPU,内存,存储资源就越多,能处理的并发访问和数据量也就更大,但是分布式也会带来一些问题:

  • 分布式服务意味着通过网络调用,会对性能造成影响;

  • 服务器越多,服务器宕机的概率就越大,使网站的可用性降低;

  • 数据在分布式环境下保持数据一致性也就比较困难;

  • 分布式下的事务也难以保证;

  • 分布式管理增了开发和维护的难度,切记不要为了分布式而分布式;

分布式的常见几种方案:

  • 分布式应用和服务:将分层和分割后的应用和服务模块分布式部署,可以改善网站性能和并发性,加快开发和发布的速度,减少数据库连接资源消耗,使不同的应用复用共同的服务,便于业务扩展;

  • 分布式静态资源:网站的静态资源例如js,css,图片等资源独立分布式部署,并采用独立的域名,即动静分离;静态资源分布式部署可以减轻应用服务器的负载压力,通过域名独立加快浏览器并发加载的速度;

  • 分布式数据和存储:大型网站需要处理以P为单位的海量数据,单台计算机无法提供如此大的存储空间,这些数据需要分布式存储;

  • 分布式计算:目前网站普遍使用Hadoop和MapReduce分布式计算框架进行批处理计算,其特点就是移动计算而不是移动数据,将计算程序分发到数据所在的位置,以加速计算和分布式计算;

  • 分布式配置:网站线上服务器配置实时更新;

  • 分布式锁:分布式环境下实现并发和协同工作;

  • 分布式文件:支持云存储的分布式文件系统;

4、集群

对于用户访问集中的模块,我们还需要考虑将其集群化,多台服务器部署相同应用构成一个集群,通过负载均衡器将请求分发给集群中不同的服务器处理。集群模式可以很好的扩展,当有更多用户访问时,只需要向集群中添加一台新的服务器加入集群即可,同时因为一个应用由多台服务器提供服务,当某台服务器发生故障时,负载均衡器或者系统的失效转移机制会将请求转发到集群中其他的服务器上,所以我们在配置集群时,至少需要2台以上服务器构成一个集群,目的就是为了提供系统的可用性。

5、缓存

将数据存放在距离计算最近的位置,加快处理速度。大型网站架构设计一般在下面几个方面使用缓存设计:

  • CDN:即内容分发网络,部署在距离终端用户最近的网络服务商,用户网络请求总是先到达他的网络服务商那里,在这里缓存一些静态资源,就可以以最快的速度返回资源给用户;

  • 反向代理:属于网站前端部分,部署在网站的前端,当用户请求到达网站的时候,最先访问到的就是反向代理服务器,这里缓存网站的静态资源,无需将请求继续转发给应用服务器就能直接返回给用户;

  • 本地缓存:在应用服务器本地缓存一些热点数据(段时间内经常被访问的数据),应用程序可以在本机内存中直接访问数据,而无需访问数据库;

  • 分布式缓存:将数据缓存在一个专门的分布式缓存集群中,应用程序通过网络通信获取缓存的数据;

使用缓存有2个前提条件:

  • 数据访问热点不均衡,某些数据会被更频繁的访问,这部分数据就该放入缓存;

  • 数据在某个时间段内有效,不会很快过期,否则缓存失效的数据就会因为失效而产生脏读,影响结果的正确性;

使用缓存的优势:加快数据访问速度以及减轻后端应用和数据存储的负载压力;

6、异步

大型网站的一个重要目标是降低软件的耦合性,系统解耦合的手段除了前面提到的分层、分割和分布式等,还有一个异步,业务之间的消息传递不是同步调用,而是将业务操作分成多个阶段,每个阶段之间通过共享数据的方式异步的进行协作;

  • 在单一服务器内部可以通过多线程共享内存队列的方式实现异步,业务前执行的线程将数据写入队列,后续线程从队列中读取数据进行处理;

  • 在分布式系统中,多个服务器集群通过分布式消息队列实现异步,分布式消息队列可以看做是内存队列的分布式部署;

异步架构是典型的生产者和消费者模式,此外异步消息队列还有如下特性:

  • 提高系统可用性:消费者服务器宕机时,数据会堆积在消息队列中,生产者服务器可以继续处理业务请求,不影响系统整体运行,当消费者服务器恢复正常后可以继续处理消息队列中的数据;

  • 加快网站响应速度:处在业务处理前端的生产者服务器在处理完业务请求后,可以将数据写入消息队列,不需要等待结果直接返回,减少响应延迟;

  • 消除并发访问高峰:使用消息队列将突发的高峰访问请求数据放入消息队列中,等待消费者依次处理,不会对整个网站负载造成太大的压力;

7、冗余

网站需要24小时为用户提供服务,想要保证在服务器宕机的情况下,不影响网站的运行,不丢失数据,就需要将一定程度的服务器冗余运行,数据冗余备份,这样,当某台服务器宕机时,可以将其上面的服务和数据访问转移到其他冗余的服务器上。

数据库除了定期备份,存档保存,实现冷备份之外,为了保证在线业务高可用,还需要对数据库进行主从分离,实时同步实现热备份。

为了抵制一些非人为的天灾,一般还需要对整个网站数据中心进行备份,全球范围内部署灾备数据中心,网站程序和数据实时同步到多个灾备中心。

8、自动化

主要包括自动化代码管理、自动化测试、自动化安全检测、自动化部署等实现发布过程自动化;此外还需要对服务器进行自动化监控、自动化报警、自动化失效转移(将失效的服务器从集群中隔离出去)、自动化失效恢复(重启服务之后同步数据保证数据的一致性)、自动化降级(通过拒绝部分请求及关闭一些不重要的服务将系统负载降至一个安全的水平)以及自动化分配资源(将空闲资源分配给重要的服务,扩大部署规模)。

9、安全

主要从下面几点考虑

  • 通过密码手机校验码进行身份验证;

  • 登录,交易等操作对网络通信进行加密;

  • 防止机器人程序滥用网络资源攻击网站,使用验证码进行识别;

  • 对常见的XSS攻击、SQL注入进行编码转换等处理;

  • 对垃圾信息。敏感信息进行过滤;

  • 对交易转账等重要操作根据交易模式和交易信息进行风险控制;

10、总结

技术分享图片

大型网站架构之百万pv

一:百万PV架构概述PV(pageview,页面浏览量)即点击量,通常是衡量一个网站受欢迎程度的主要指标。本案例采用四层模式实现,主要分为前端反向代理层、web层、数据库缓存层和数据库层。前端反向代理层采用主备模式,web层采... 查看详情

大型网站架构之百万pv(代码片段)

PV(pageview)即页面浏览量,通常是衡量一个网络新闻频道或网站甚至一条网络新闻的主要指标。网页浏览数是评价网站流量最常用的指标之一,简称为PV。案例概述本案例设计采用四层模式来实现,主要分为前端反向代理、web层... 查看详情

大型网站技术架构:核心原理与案例分析阅读笔记之二

网站架构模式   首先模式的关键在于模式的可重复性,问题和场景的可重复性带来解决方案的可重复使用。而网站架构模式是用来解决高并发访问,海量数据处理,高可靠运行等一系列问题与挑战的。 而且主要通... 查看详情

大型网站架构之百万pv(代码片段)

简介PV即点击量,通常是衡量一个网络新闻频道或网站甚至一条网络新闻的重要指标。PV从某种程度上已经成为投资者衡量商业网站表现的最重要的尺度。PV是一个访问者在24小时到底看了网站的几个页面。案例描述本案例设计采... 查看详情

大型网站技术架构:大型网站架构模式

...后通过上层对下层的依赖和调用组成一个完整的系统。在大型网站架构中采用分层结构,将网站软件分为应用层、服务层、数据层。应用层负责具体业务和视图展示 查看详情

大型网站架构之分布式消息队列

...息队列应用场景消息中间件示例JMS消息服务(见第二篇:大型网站架构系列:分布式消息队列(二))常用消息队列(见第二篇:大型网站架构系列:分布式消息队列(二))参考(推荐)资料(见第二篇:大型网站架构系列:... 查看详情

大型网站架构之百万pv(代码片段)

简介网站架构网站架构,一般认为是根据客户需求分析的结果,准确定位网站目标群体,设定网站整体架构,规划、设计网站栏目及其内容,制定网站开发流程及顺序,以最大限度地进行高效资源分配与管理的设计。其内容有程... 查看详情

《大型网站技术架构》读书笔记之八:固若金汤之网站的安全性架构

此篇已收录至《大型网站技术架构》读书笔记系列目录贴,点击访问该目录可获取更多内容。一、网站应用攻击与防御二、信息加密技术与密钥安全三、信息过滤与反垃圾四、电子商务风险控制五、学习总结  转眼之间,《大... 查看详情

《大型网站技术架构》读书笔记之七:随需应变之网站的可扩展架构

此篇已收录至《大型网站技术架构》读书笔记系列目录贴,点击访问该目录可获取更多内容。一、可伸缩与可扩展—傻傻分不清楚  上篇笔记我们学习了可伸缩架构,但在实际场合中,包括许多架构师也常常混淆可伸缩和可扩... 查看详情

大型网站架构之分布式消息队列

大型网站架构之分布式消息队列转载2016年01月26日08:48:40标签:105329编辑删除大型网站架构之分布式消息队列 以下是消息队列以下的大纲,本文主要介绍消息队列概述,消息队列应用场景和消息中间件示例(电商,日志系统... 查看详情

《大型网站技术架构》读书笔记之六:永无止境之网站的伸缩性架构

此篇已收录至《大型网站技术架构》读书笔记系列目录贴,点击访问该目录可获取更多内容。首先,所谓网站的伸缩性,指不需要改变网站的软硬件设计,仅仅通过改变部署的服务器数量就可以扩大或者缩小网站的服务处理能力... 查看详情

3.软件架构设计:大型网站技术架构与业务架构融合之道---语言(代码片段)

第2部分计算机功底第3章语言3.1层出不穷的编程语言3.2精通一门语言    查看详情

《大型网站技术架构》读书笔记——大型网站系统架构图

网站架构模式架构要素高性能架构高可用架构伸缩性架构可拓展性架构安全性架构负载均衡方式 查看详情

大型网站技术架构,4网站的高性能架构之存储性能优化

4.4存储性能优化前面虽然通过缓存可以减轻一部分数据访问的压力,但是很多时候,磁盘仍然是系统最严重的瓶颈。而且磁盘是网站最重要的资产,磁盘的可用性和容错性至关重要。 4.4.1机械硬盘vs.固态硬盘 机械硬盘适... 查看详情

大型网站架构之分布式消息队列

大型网站架构之分布式消息队列 以下是消息队列以下的大纲,本文主要介绍消息队列概述,消息队列应用场景和消息中间件示例(电商,日志系统)。本次分享大纲消息队列概述消息队列应用场景消息中间件示例JMS消息服务... 查看详情

《大型网站技术架构》核心原理与案例分析

内容简介  本书通过梳理大型网站技术发展历程,剖析大型网站技术架构模式,深入讲述大型互联网架构设计的核心原理,并通过一组典型网站技术架构设计案例,为读者呈现一幅包括技术选型、架构设计、性能优化、Web安全... 查看详情

4网站架构模式

为了解决大型网站面临的高并发访问、海量数据处理、高可靠运行等一系列问题与挑战,大型互联网公司在实践中提出了许多解决方案,以实现网站高性能、高可用、易伸缩、可扩展、安全等各种技术架构目标。这些解决方案又被... 查看详情

大型网站技术架构:核心原理与案例分析阅读笔记之四

...软件架构是关于软件的结构与组建的抽象描述,用于指导大型软件系统各个方面的设计。往往软件架构决定了软件以后的发展,对于一个成熟的软件应当具备以下几个要素:1:性能通常来说如果不是一些特殊的网站,往往响应... 查看详情