正文

吃透redis：缓存淘汰篇-lru算法(代码片段)

吃透Java  吃透Java  2023-02-07  288

关键词：

文章目录

一、概述

redis是内存数据库，当内存使用达到了一定阈值，就会触发缓存淘汰策略，这和 Redis 配置文件 redis.conf 中的两个配置参数有关：

maxmemory，该配置项设定了 Redis server 可以使用的最大内存容量，一旦 server 使用的实际内存量超出该阈值时，server 就会根据 maxmemory-policy 配置项定义的策略，执行内存淘汰操作；
maxmemory-policy，该配置项设定了 Redis server 的内存淘汰策略，主要包括近似 LRU 算法、LFU 算法、按 TTL 值淘汰和随机淘汰等几种算法。

maxmemory-policy 内存淘汰策略一共八种：

noeviction：noeviction 策略是不会进行数据淘汰的。
volatile-random：在设置了过期时间的 key 中随机淘汰掉。
allkeys-random：在所有的 key 中随机淘汰掉。
volatile-ttl：把设置了过期时间的 key 中剩余存活时间最短的筛选出来并淘汰掉。
volatile-lru：从设置过期时间的key中挑选出最近最少使用（LRU）的数据淘汰。
allkeys-lru：从所有的 key 中挑选出最近最少使用（LRU）的数据淘汰。
volatile-lfu：从设置过期时间的key中挑选出最近最少使用频率（LFU）的数据淘汰。
allkeys-lfu：从所有的 key 中挑选出最近最少使用频率（LFU）的数据淘汰。

二、LRU算法

1、普通LRU算法

LRU 算法就是指最近最少使用（Least Recently Used，LRU）算法，这是一个经典的缓存算法。

从基本原理上来说，LRU 算法会使用一个链表来维护缓存中每一个数据的访问情况，并根据数据的实时访问，调整数据在链表中的位置，然后通过数据在链表中的位置，来表示数据是最近刚访问的，还是已经有一段时间没有访问了。

LRU 算法的执行，可以分成三种情况来掌握：

当有新数据插入时，LRU 算法会把该数据插入到链表头部，同时把原来链表头部的数据及其之后的数据，都向尾部移动一位。
当有数据刚被访问了一次之后，LRU 算法就会把该数据从它在链表中的当前位置，移动到链表头部。同时，把从链表头部到它当前位置的其他数据，都向尾部移动一位。
当链表长度无法再容纳更多数据时，若再有新数据插入，LRU 算法就会去除链表尾部的数据，这也相当于将数据从缓存中淘汰掉。

所以我们可以发现，如果要严格按照 LRU 算法的基本原理来实现的话，我们需要在代码中实现如下内容：

要为 Redis 使用最大内存时，可容纳的所有数据维护一个链表；
每当有新数据插入或是现有数据被再次访问时，需要执行多次链表操作。

而假设 Redis 保存的数据比较多的话，那么，这两部分的代码实现，就既需要额外的内存空间来保存链表，还会在访问数据的过程中，让 Redis 受到数据移动和链表操作的开销影响，从而就会降低 Redis 访问性能。

所以说，无论是为了节省宝贵的内存空间，还是为了保持 Redis 高性能，Redis 源码并没有严格按照 LRU 算法基本原理来实现它，而是提供了一个近似 LRU 算法的实现。

2、近似 LRU 算法

为了便于你理解，我把 Redis 对近似 LRU 算法的实现分成了三个部分：

全局 LRU 时钟值的计算：这部分包括，Redis 源码为了实现近似 LRU 算法的效果，是如何计算全局 LRU 时钟值的，以用来判断数据访问的时效性；
键值对 LRU 时钟值的初始化与更新：这部分包括，Redis 源码在哪些函数中对每个键值对对应的 LRU 时钟值，进行初始化与更新；
近似 LRU 算法的实际执行：这部分包括，Redis 源码具体如何执行近似 LRU 算法，也就是何时触发数据淘汰，以及实际淘汰的机制是怎么实现的。

2-1、全局 LRU 时钟值的计算

虽然 Redis 使用了近似 LRU 算法，但是，这个算法仍然需要区分不同数据的访问时效性，也就是说，Redis 需要知道数据的最近一次访问时间。因此，Redis 就设计了 LRU 时钟来记录数据每次访问的时间戳。

Redis 在源码中对于每个键值对中的值，会使用一个 redisObject 结构体来保存指向值的指针。那么，redisObject 结构体除了记录值的指针以外，它其实还会使用 24 bits 来保存 LRU 时钟信息，对应的是 lru 成员变量。所以这样一来，每个键值对都会把它最近一次被访问的时间戳，记录在 lru 变量当中。

typedef struct redisObject 
    unsigned type:4;
    unsigned encoding:4;
    unsigned lru:LRU_BITS;  //记录LRU信息，宏定义LRU_BITS是24 bits
    int refcount;
    void *ptr;
 robj;

Redis 首先是设置了全局 LRU 时钟，并在键值对创建时获取全局 LRU 时钟值作为访问时间戳，以及在每次访问时获取全局 LRU 时钟值，更新访问时间戳。

全局 LRU 时钟其实是一个全局变量，在 Redis server 的运行过程中，定时默认 100 毫秒（可配置），获取一次当前时钟值，去更新全局 LRU 时钟变量，那么每次访问 key 时就会获取全局 LRU 时钟值，更新RedisObject中的 lru 访问时间戳。

需要注意的就是，全局 LRU 时钟值是以 1 秒为精度来计算的 UNIX 时间戳，如果一个数据前后两次访问的时间间隔小于 1 秒，那么这两次访问的时间戳就是一样的。因为 LRU 时钟的精度就是 1 秒，它无法区分间隔小于 1 秒的不同时间戳。

2-2、键值对 LRU 时钟值的初始化与更新

在键值对被创建或访问的时候，它的 LRU 时钟值就会被更新，记录的是当前的时间搓。

2-3、近似 LRU 算法的实际执行

现在我们已经知道，Redis 之所以实现近似 LRU 算法的目的，是为了减少内存资源和操作时间上的开销。那么在这里，我们其实可以从两个方面来了解近似 LRU 算法的执行过程，分别是：

何时触发算法执行？
算法具体如何执行？

何时触发算法执行？

近似 LRU 算法的主要逻辑是在 freeMemoryIfNeeded 函数中实现的，而这个函数是 Redis 处理每个命令时都会被调用的。所以，Redis 在每个命令执行的时候都会去判断是否触发淘汰策略。

触发条件：

设置了 maxmemory 配置项为非 0 值。
Lua 脚本没有在超时运行。
当前内存使用量超过 maxmemory。

满足以上条件就会触发 LRU 淘汰策略（前提是 maxmemory-policy 淘汰策略设置的LRU策略）。

算法具体如何执行

而如果当前 server 使用的内存量，的确已经超出 maxmemory 的上限了，那么 freeMemoryIfNeeded 函数就会执行一个 while 循环，来淘汰数据释放内存。

其实，为了淘汰数据，Redis 定义了一个数组 EvictionPoolLRU，用来保存待淘汰的候选键值对。这个数组的元素类型是 evictionPoolEntry 结构体，该结构体保存了待淘汰键值对的空闲时间 idle、对应的 key 等信息。以下代码展示了 EvictionPoolLRU 数组和 evictionPoolEntry 结构体：

static struct evictionPoolEntry *EvictionPoolLRU;

struct evictionPoolEntry 
    unsigned long long idle;    //待淘汰的键值对的空闲时间
    sds key;                    //待淘汰的键值对的key
    sds cached;                 //缓存的SDS对象
    int dbid;                   //待淘汰键值对的key所在的数据库ID
;

该数组的大小默认是 16 个元素，也就是可以保存 16 个待淘汰的候选键值对。

第一步：从待采样的哈希表中随机获取一定数量的 key。如果 maxmemory_policy 配置的是 allkeys_lru，那么待采样哈希表就是 Redis server 的全局哈希表，也就是在所有键值对中进行采样；否则，待采样哈希表就是保存着设置了过期时间的 key 的哈希表。函数采样的 key 的数量，是由 redis.conf 中的配置项 maxmemory-samples 决定的，该配置项的默认值是 5。
第二步：尝试把采样的每一个键值对插入 EvictionPoolLRU 数组。这主要取决于以下两个条件之一：一是，它能在数组中找到一个尚未插入键值对的空位；二是，它能在数组中找到一个空闲时间小于采样键值对空闲时间的键值对。这两个条件有一个成立的话，就会把采样的键值对插入 EvictionPoolLRU 数组。
第三步：选择被淘汰的键值对并删除。遍历 EvictionPoolLRU 数组（这个数组里面的 key，是按照空闲时间从小到大排好序了），从数组的最后一个 key 开始选择，如果选到的 key 不是空值，那么就把它作为最终淘汰的 key。
第四步：一旦选到了被淘汰的 key，就会根据 Redis server 的惰性删除配置，来执行同步删除或异步删除

上面四步是一个循环遍历的过程，也就是说一旦触发了LRU淘汰，如果没有达到我前面介绍的待释放空间，会重复执行上面的四步，直到满足待释放空间的大小要求。

其实，我们可以看到，近似 LRU 算法并没有使用耗时耗空间的链表，而是使用了固定大小的待淘汰数据集合，每次随机选择一些 key 加入待淘汰数据集合中。最后，再按照待淘汰集合中 key 的空闲时间长度，删除空闲时间最长的 key。这样一来，Redis 就近似实现了 LRU 算法的效果了。

三、总结

实现一个严格的 LRU 算法，需要额外的内存构建 LRU 链表，同时维护链表也存在性能开销，Redis 对于内存资源和性能要求极高，所以没有采用严格 LRU 算法，而是采用「近似」LRU 算法实现数据淘汰策略
触发数据淘汰的时机，是每次处理「请求」时判断的。也就是说，执行一个命令之前，首先要判断实例内存是否达到 maxmemory，是的话则先执行数据淘汰，再执行具体的命令
淘汰数据时，会「持续」判断 Redis 内存是否下降到了 maxmemory 以下，不满足的话会继续淘汰数据，直到内存下降到 maxmemory 之下才会停止
可见，如果发生大量淘汰的情况，那么处理客户端请求就会发生「延迟」，影响性能
Redis 计算实例内存时，不会把「主从复制」的缓冲区计算在内，也就是说不管一个实例后面挂了多少个从库，主库不会把主从复制所需的「缓冲区」内存，计算到实例内存中，即这部分内存增加，不会对数据淘汰产生影响

吃透redis：缓存淘汰篇-lru算法(代码片段)

文章目录一、概述二、LRU算法1、普通LRU算法2、近似LRU算法2-1、全局LRU时钟值的计算2-2、键值对LRU时钟值的初始化与更新2-3、近似LRU算法的实际执行何时触发算法执行？算法具体如何执行三、总结一、概述redis是内存数据库&#x... 查看详情

吃透redis：缓存淘汰篇-lfu算法

文章目录一、概述二、LFU算法的基本原理三、LFU算法的实现1、键值对访问频率记录2、键值对访问频率的初始化与更新2-1、键值对被创建时2-2、键值对被访问时3、LFU算法淘汰数据四、总结一、概述Redis在4.0版本后，还引入了LF... 查看详情

吃透redis：缓存淘汰篇-lfu算法

基础篇4#链表（上）：如何实现lru缓存淘汰算法?(代码片段)

说明【数据结构与算法之美】专栏学习笔记链表结构数组需要一块连续的内存空间来存储，对内存的要求比较高，而链表并不需要一块连续的内存空间，它通过指针将一组零散的内存块串联起来使用。结点：指的... 查看详情

缓存淘汰算法--lru算法(代码片段)

importjava.util.LinkedHashMap;importjava.util.Map; /** *LRU(LeastRecentlyUsed) */publicclassLRUCache<K,V>extendsLinkedHashMap<K,V> /*** */privatestati 查看详情

redis中的lru淘汰策略分析(代码片段)

Redis作为缓存使用时，一些场景下要考虑内存的空间消耗问题。Redis会删除过期键以释放空间，过期键的删除策略有两种：惰性删除：每次从键空间中获取键时，都检查取得的键是否过期，如果过期的话，就删除该键；如果没有... 查看详情

缓存淘汰算法-lru实现原理(代码片段)

01、前言我们常用缓存提升数据查询速度，由于缓存容量有限，当缓存容量到达上限，就需要删除部分数据挪出空间，这样新数据才可以添加进来。缓存数据不能随机删除，一般情况下我们需要根据某种算法删... 查看详情

缓存淘汰算法-lru实现原理(代码片段)

图解数据结构与算法lru缓存淘汰算法面试时到底该怎么写(代码片段)

链表实现的LRU缓存淘汰算法的时间复杂度是O(n)，当时我也提到了，通过散列表可以将这个时间复杂度降低到O(1)。Redis的有序集合是使用跳表来实现的，跳表可以看作一种改进版的链表。Redis有序集合不仅使用了跳表&#x... 查看详情

动手写一个lru缓存(代码片段)

...RecentlyUsed的简写，字面意思则是最近最少使用。通常用于缓存的淘汰策略实现，由于缓存的内存非常宝贵，所以需要根据某种规则来剔除数据保证内存不被占满。在redis的数据淘汰策略中就包含LRU淘汰算法如何实现一个完整的LRU... 查看详情

缓存数据库redis之三：内存淘汰策略及优化(代码片段)

目录一、Redis的内存淘汰策略 1.1.概念 1.2.策略一：全局的键空间选择性移除 1.3.策略二：设置过期时间的键空间选择性移除 1.4.LRU、LFU和volatile-ttl都是近似随机算法 1.4.1.LRU算法 1.4.2.LFU算法1.5.过期删除策略1.6.AOF... 查看详情

缓存数据库redis之三：内存淘汰策略及优化(代码片段)

分布式技术专题「系统功能原理分析」缓存淘汰算法之lru和lfu及fifo介绍(代码片段)

前提概要无论是浏览器缓存(如果是chrome浏览器，可以通过chrome:😕/cache查看)，还是服务端的缓存(通过memcached或者redis等内存数据库)。缓存不仅可以加速用户的访问，同时也可以降低服务器的负载和压力。那么了... 查看详情

算法必知---lru缓存淘汰算法(代码片段)

..._x链接：https://www.jianshu.com/p/b7fed77324b9写在前就是一种缓存淘汰策略。计算机的缓存容量有限，如果缓存满了就要删除一些内容，给新内容腾位置。但问题是ÿ 查看详情

redis前传自己手写一个lru策略|redis淘汰策略(代码片段)

一、题目描述146.LRU缓存机制运用你所掌握的数据结构，设计和实现一个LRU(最近最少使用)缓存机制。实现LRUCache类：LRUCache(intcapacity)以正整数作为容量capacity初始化LRU缓存intget(intkey)如果关键字key存在于缓存中，则返回... 查看详情

redis前传自己手写一个lru策略|redis淘汰策略(代码片段)

lru算法的实现(代码片段)

缘由：看到redis的缓存淘汰机制，便自己实现了一下代码实现（双向链表+HashMap）packagecom.jarjune.jdalao.framework.algorithm;importjava.util.*;/***LRU*@authorjarjune*@version1.0.1*@date2020/11/19*/publicclassLRUCache<K,V>//缓存Nod 查看详情