linux磁盘i/o是怎么工作的(上)

hanson世纪 hanson世纪     2022-12-01     677

关键词:

在​​Linux文件系统是怎么工作的?​​中讲了Linux文件系统的工作原理。目录项是一个内存缓存;而超级块、索引节点和逻辑块,都是存储在磁盘中的持久化数据。

那么,磁盘是怎么工作的呢?又有哪些指标可以用来衡量它的性能呢?

一、磁盘

磁盘是可以持久化存储的设备,根据存储介质的不同,常见磁盘可以分为两类:机械磁盘固态磁盘

第一类,机械磁盘,也称为硬盘驱动器(Hard Disk Driver),通常缩写为 HDD。机械磁盘主要由盘片和读写磁头组成,数据就存储在盘片的环状磁道中。在读写数据前,需要移动读写磁头,定位到数据所在的磁道,然后才能访问数据。

显然,如果 I/O 请求刚好连续,那就不需要磁道寻址,自然可以获得最佳性能。这其实就是我们熟悉的,连续 I/O 的工作原理。与之相对应的,当然就是随机 I/O,它需要不停地移动磁头,来定位数据位置,所以读写速度就会比较慢。

第二类,固态磁盘(Solid State Disk),通常缩写为 SSD,由固态电子元器件组成。固态磁盘不需要磁道寻址,所以,不管是连续 I/O,还是随机 I/O 的性能,都比机械磁盘要好得多。

其实,无论机械磁盘,还是固态磁盘,相同磁盘的随机 I/O 都要比连续 I/O 慢很多,原因也很明显。

  • 对机械磁盘来说,我们刚刚提到过的,由于随机 I/O 需要更多的磁头寻道和盘片旋转,它的性能自然要比连续 I/O 慢。
  • 而对固态磁盘来说,虽然它的随机性能比机械硬盘好很多,但同样存在“先擦除再写入”的限制。随机读写会导致大量的垃圾回收,所以相对应的,随机 I/O 的性能比起连续 I/O 来,也还是差了很多。
  • 此外,连续 I/O 还可以通过预读的方式,来减少 I/O 请求的次数,这也是其性能优异的一个原因。很多性能优化的方案,也都会从这个角度出发,来优化 I/O 性能。

此外,机械磁盘和固态磁盘还分别有一个最小的读写单位。

  • 机械磁盘的最小读写单位是扇区,一般大小为 512 字节。
  • 而固态磁盘的最小读写单位是页,通常大小是 4KB、8KB 等。

如果每次都读写 512 字节这么小的单位的话,效率很低。所以,文件系统会把连续的扇区或页,组成逻辑块,然后以逻辑块作为最小单元来管理数据。常见的逻辑块的大小是 4KB,也就是说,连续 8 个扇区,或者单独的一个页,都可以组成一个逻辑块。

除了可以按照存储介质来分类,另一个常见的分类方法,是按照接口来分类,比如可以把硬盘分为 IDE(Integrated Drive Electronics)、SCSI(Small Computer System Interface) 、SAS(Serial Attached SCSI) 、SATA(Serial ATA) 、FC(Fibre Channel) 等。

不同的接口,往往分配不同的设备名称。比如, IDE 设备会分配一个 hd 前缀的设备名,SCSI 和 SATA 设备会分配一个 sd 前缀的设备名。如果是多块同类型的磁盘,就会按照 a、b、c 等的字母顺序来编号。

除了磁盘本身的分类外,当你把磁盘接入服务器后,按照不同的使用方式,又可以把它们划分为多种不同的架构。

最简单的,就是直接作为独立磁盘设备来使用。这些磁盘,往往还会根据需要,划分为不同的逻辑分区,每个分区再用数字编号。比如 /dev/sda ,还可以分成两个分区 /dev/sda1 和 /dev/sda2。

另一个比较常用的架构,是把多块磁盘组合成一个逻辑磁盘,构成冗余独立磁盘阵列,也就是 RAID(Redundant Array of Independent Disks),从而可以提高数据访问的性能,并且增强数据存储的可靠性。

根据容量、性能和可靠性需求的不同,RAID 一般可以划分为多个级别,如 RAID0、RAID1、RAID5、RAID10 等。

  • RAID0 有最优的读写性能,但不提供数据冗余的功能。
  • 而其他级别的 RAID,在提供数据冗余的基础上,对读写性能也有一定程度的优化。

最后一种架构,是把这些磁盘组合成一个网络存储集群,再通过 NFS、SMB、iSCSI 等网络存储协议,暴露给服务器使用。

其实在 Linux 中,磁盘实际上是作为一个块设备来管理的,也就是以块为单位读写数据,并且支持随机读写。每个块设备都会被赋予两个设备号,分别是主、次设备号。主设备号用在驱动程序中,用来区分设备类型;而次设备号则是用来给多个同类设备编号。

二、通用块层

跟虚拟文件系统VFS类似,为了减小不同块设备的差异带来的影响,Linux 通过一个统一的通用块层,来管理各种不同的块设备。

通用块层,其实是处在文件系统和磁盘驱动中间的一个块设备抽象层。它主要有两个功能 。

  • 第一个功能,跟虚拟文件系统的功能类似。向上,为文件系统和应用程序,提供访问块设备的标准接口;向下,把各种异构的磁盘设备抽象为统一的块设备,并提供统一框架来管理这些设备的驱动程序。
  • 第二个功能,通用块层还会给文件系统和应用程序发来的 I/O 请求排队,并通过重新排序、请求合并等方式,提高磁盘读写的效率。

其中,对 I/O 请求排序的过程,也就是我们熟悉的 I/O 调度。事实上,Linux 内核支持四种 I/O 调度算法,分别是 NONENOOPCFQ 以及 DeadLine

第一种 NONE ,更确切来说,并不能算 I/O 调度算法。因为它完全不使用任何 I/O 调度器,对文件系统和应用程序的 I/O 其实不做任何处理,常用在虚拟机中(此时磁盘 I/O 调度完全由物理机负责)。

第二种 NOOP ,是最简单的一种 I/O 调度算法。它实际上是一个先入先出的队列,只做一些最基本的请求合并,常用于 SSD 磁盘。

​第三种 CFQ(Completely Fair Scheduler),也被称为完全公平调度器,是现在很多发行版的默认 I/O 调度器,它为每个进程维护了一个 I/O 调度队列,并按照时间片来均匀分布每个进程的 I/O 请求。

​类似于进程 CPU 调度,CFQ 还支持进程 I/O 的优先级调度,所以它适用于运行大量进程的系统,像是桌面环境、多媒体应用等。

​最后一种 DeadLine 调度算法,分别为读、写请求创建了不同的 I/O 队列,可以提高机械磁盘的吞吐量,并确保达到最终期限(deadline)的请求被优先处理。DeadLine 调度算法,多用在 I/O 压力比较重的场景,比如数据库等。

三、I/O栈

我们可以把 Linux 存储系统的 I/O 栈,由上到下分为三个层次,分别是文件系统层、通用块层和设备层。这三个 I/O 层的关系如下图所示,这其实也是 Linux 存储系统的 I/O 栈全景图

Linux磁盘I/O是怎么工作的(上)_通用块层

根据这张 I/O 栈的全景图,我们可以更清楚地理解,存储系统 I/O 的工作原理。

  • 文件系统层,包括虚拟文件系统和其他各种文件系统的具体实现。它为上层的应用程序,提供标准的文件访问接口;对下会通过通用块层,来存储和管理磁盘数据。
  • ​通用块层,包括块设备 I/O 队列和 I/O 调度器。它会对文件系统的 I/O 请求进行排队,再通过重新排序和请求合并,然后才要发送给下一级的设备层。
  • ​设备层,包括存储设备和相应的驱动程序,负责最终物理设备的 I/O 操作。

​存储系统的 I/O ,通常是整个系统中最慢的一环。所以, Linux 通过多种缓存机制来优化 I/O 效率。

​比方说,为了优化文件访问的性能,会使用页缓存、索引节点缓存、目录项缓存等多种缓存机制,以减少对下层块设备的直接调用。

​同样,为了优化块设备的访问效率,会使用缓冲区,来缓存块设备的数据。

四、小结

​通用块层是 Linux 磁盘 I/O 的核心。向上,它为文件系统和应用程序,提供访问了块设备的标准接口;向下,把各种异构的磁盘设备,抽象为统一的块设备,并会对文件系统和应用程序发来的 I/O 请求进行重新排序、请求合并等,提高了磁盘访问的效率。思考





linux磁盘i/o是怎么工作的(下)

掌握了磁盘I/O的工作原理,怎么才能衡量磁盘的I/O性能?一、磁盘性能指标​说到磁盘性能的衡量标准,必须要提到五个常见指标,也就是我们经常用到的,使用率、饱和度、IOPS、吞吐量以及响应时间等。这五个指标,是衡量... 查看详情

rk3399平台开发系列讲解(内核入门篇)1.43linux磁盘i/o是怎么工作的?

平台内核版本安卓版本RK3399Linux4.4Android7.1 查看详情

rk3399平台开发系列讲解(内核入门篇)1.43linux磁盘i/o是怎么工作的?

平台内核版本安卓版本RK3399Linux4.4Android7.1 查看详情

linux磁盘i/o是怎么工作的(代码片段)

...节点,记录了文件的元数据。逻辑块,是由连续磁盘扇区构成的最小读写单元,用来存储文件数据。超级块,用来记录文件系统整体的状态,如索引节点和逻辑块的使用情况等。其中,目录项是一个内存缓... 查看详情

kafka核心技术与实战——06|kafka线上集群部署方案怎么做?

...消息都是通过网络传输的,而消息保存在哪里呢?肯定是磁盘故Kafka需要在磁盘和网络间进行大量数据传输如果你熟悉Linux,你肯定听过零拷贝(ZeroCopy)技术,就是当数据在磁盘和网络进行传输时避免昂贵的内核态数据拷贝从而... 查看详情

文件系统和磁盘工作原理

...子目录(称为挂载点),然后才能访问其中的文件。机械磁盘的最小读写单位是扇区,一般大小为512字节。如果每次都读写512字节这么小的单位的话,效率很低。所以,文件系统会把连续的扇区或页,组成逻辑块,然后以逻辑块... 查看详情

请教nginx是怎么处理静态文件的

...的异步I/O时由Linux内核实现,只有在内核中成功地完成了磁盘操作,内核才会通知进程,进而使得磁盘文件的处理与网络事件的处理同样高效。Linux内核版本2.6.2x以后支持文件异步I/O,Nginx把读取文件的操作异步地提交给内核后,... 查看详情

用于测量磁盘 i/o 等的 Linux 工具

】用于测量磁盘i/o等的Linux工具【英文标题】:Linuxtoolsformeasuringdiski/oetc【发布时间】:2014-11-1301:20:58【问题描述】:我需要在性能测试期间测量RedHat和CentOS上以下资源的利用率。请推荐最好的工具内存使用情况CPU使用率磁盘I/O... 查看详情

iotop—linux上监控磁盘i/o的利器详细使用说明

Iotop工具是一个免费的开源免费工具,用于监控Linux中的磁盘输入/输出(IO)使用情况。它可以帮助系统管理员找到消耗更多磁盘使用的特定进程,并有助于性能分析。从2.6.20内核开始支持Iotop工具。本教程介绍了如何在linux中安装... 查看详情

如何在 Linux 上清除磁盘 I/O 缓存?

】如何在Linux上清除磁盘I/O缓存?【英文标题】:HowtopurgediskI/OcachesonLinux?【发布时间】:2012-03-2201:13:02【问题描述】:我需要这样做以获得更可预测的基准测试。【问题讨论】:sync正在冲洗,而不是清除。在这种情况下,“冲... 查看详情

linux磁盘i/o子系统

...读和写等操作文件,写文件的元数据和文件的实际数据到磁盘。但数据是怎么落地磁盘中的呢?落到磁盘中的都经过什么组件?以一个写数据到磁盘为例,给出LinuxI/O子系统的体系结构。当磁盘执行写入操作时发生的基本操作(假... 查看详情

linux磁盘io调度算法(代码片段)

A、CFQ(完全公平排队I/O调度程序)最新的内核版本和发行版中,都选择CFQ做为默认的I/O调度器,对于通用的服务器是最好的选择。CFQ对于多媒体应用(video,audio)和桌面系统是最好的选择。CFQ赋予I/O请求一个优先级,而I/O优先... 查看详情

linux基础基础i/o(代码片段)

文章目录4.文件系统4.1磁盘4.2inode4.3软/硬链接5.文件的ACM6.动静态库4.文件系统4.1磁盘文件=文件内容+文件属性笼统的讲磁盘是我们计算机中的一个机械设备(SSD等等除外)磁盘写入的基本单位是:扇区站在操作系... 查看详情

linux操作系统基础i/o(代码片段)

文章目录4.文件系统4.1磁盘4.2inode4.3软/硬链接5.文件的ACM6.动静态库4.文件系统4.1磁盘文件=文件内容+文件属性笼统的讲磁盘是我们计算机中的一个机械设备(SSD等等除外)磁盘写入的基本单位是:扇区站在操作系... 查看详情

在linux下怎么看网络流量

...各个版本上,都包含这个工具包.iostat用于输出CPU,I/O系统和磁盘分区的统计信息.可以用来分析磁盘I/O,带宽等信息.mpstat用于输出CPU的各种统计信息.可以用来分析程序运行时在内核态和用户态的工作情况.sar用于定时搜集系统的各种... 查看详情

超深度解析linuxi/o的那些事儿

...看一张图:这张图大体上描述了Linux系统上,应用程序对磁盘上的文件进行读写时,从上到下经历了哪些事情。这篇文章就以这张图为基础,介绍Linux在I/O上做了哪些事情。文件系统什么是文件系统文件系统,本身是对存储设备... 查看详情

rk3399平台开发系列讲解(i/o篇)深刻理解磁盘i/o的工作原理

查看详情

rk3399平台开发系列讲解(i/o篇)linux磁盘i/o的性能指标

查看详情