正文

算法技术专题如何用java实现一致性hash算法（consistenthashing）（上）(代码片段)

洛神灬殇  洛神灬殇  2022-12-19  414

关键词：

一致性hash的历史

【Consistent Hashing算法】早在 1997 年就在论文 Consistent hashing and random trees 中被提出，目前在 cache 系统中应用越来越广泛；

一致性hash的目的

一致性哈希算法是分布式系统中常用的算法，一致性哈希算法解决了普通余数Hash算法伸缩性差的问题，可以保证在上线、下线服务器的情况下尽量有多的请求命中原来路由到的服务器。

问题背景

业务开发中，我们常把数据持久化到数据库中，如果需要读取这些数据，除了直接从数据库中读取外，为了减轻数据库的访问压力以及提高访问速度，更多地引入缓存来对数据进行存取。

分布式缓存

分布式缓存，不同机器上存储不同对象的数据。为了实现这些缓存机器的负载均衡，一般就会存在两种Hash算法进行均匀分配数据节点存储：普通Hash算法

普通的Hash算法的

Hash取模做法的缺陷

一个Redis集群中，如果我们把一条数据经过Hash，然后再根据集群节点数取模得出应该放在哪个节点，这种做法的缺陷在于：扩容(增加一个节点)之后，有大量缓存失效。

普通Hash的案例分析

比如你有 N 个 cache 服务器（后面简称 cache ），那么如何将一个对象 object 映射到 N 个 cache 上呢，你很可能会采用类似下面的通用方法计算 object 的 hash 值，然后均匀的映射到到 N 个 cache ；

hash(object)%N

一切都运行正常，再考虑如下的两种情况；

一个 cache 服务器 m down 掉了（在实际应用中必须要考虑这种情况），这样所有映射到 cache m 的对象都会失效，怎么办，需要把 cache m 从 cache 中移除，这时候 cache 是 N-1 台，映射公式变成了 hash(object)%(N-1) ；
由于访问加重，需要添加 cache ，这时候 cache 是 N+1 台，映射公式变成了 hash(object)%(N+1) ；
这意味着突然之间几乎所有的 cache 都失效了。对于服务器而言，这是一场灾难，洪水般的访问都会直接冲向后台服务器；（造成缓存雪崩机制）

一致性Hash算法

一致性hash算法正是为了解决此类问题的方法，它可以保证当机器增加或者减少时，对缓存访问命中的概率影响减至很小。下面我们来详细说一下一致性hash算法的具体过程。

一致性hash算法通过一个叫作一致性hash环的数据结构实现。这个环的起点是0，终点是2^32 - 1，并且起点与终点连接，环的中间的整数按逆时针分布，故这个环的整数分布范围是[0, 2^32-1]
整个哈希值空间组织成一个虚拟的圆环，将节点的IP地址或主机名作为关键字进行哈希计算，得出的结果作为节点在环上的位置。数据经过hash后按顺时针方向找到最近一个节点存放，如图data的hash位置，应该存放在node2。

相比Hash取模，一致性Hash算法的优点就是扩容后影响的缓存数据较少，如果是n个节点扩容到n+1个的话，影响的缓存数是0~1/n，即最多让一个节点的缓存失效。
他的缺点是，缓存在每个节点上分布不均，毕竟hash值随机，那节点在环上的位置也随机。

改良版一致性Hash算法

一致性Hash算法 + 虚拟节点

为了解决数据分布不均的问题，我们引入虚拟节点的概念。我们对每一个服务节点计算多个哈希，每个计算结果位置都放置一个此服务节点，称为虚拟节点。定位到虚拟节点的数据就存到该虚拟节点对应的真实节点上，这样数据分布就相对均匀了，虚拟节点数越多，分布越均匀。

引入“虚拟节点”后，映射关系就从对象 -> 节点转换到了对象 -> 虚拟节点。查询物体所在 cache 时的映射关系

一般虚拟节点数32个以上，dubbo是160个。

处理机器增减的情况

对于线上的业务，增加或者减少一台机器的部署是常有的事情。

例如，增加机器c4的部署并将机器c4加入到hash环的机器c3与c2之间。这时，只有机器c3与c4之间的对象需要重新分配新的机器。对于我们的例子，只有对象o4被重新分配到了c4，其他对象仍在原有机器上。

一致性Hash算法的实现原理

在业务开发中，我们常把数据持久化到数据库中。如果需要读取这些数据，除了直接从数据库中读取外，为了减轻数据库的访问压力以及提高访问速度，我们更多地引入缓存来对数据进行存取。读取数据的过程一般为：

Java代码实现Hash算法的实现

用一个TreeMap来作为环，key为虚拟节点下标，value为真实节点的hash。个人感觉可以加一个Map<T, Set>来维护真实节点-虚拟节点的关系。

/**
 * 一致性Hash算法
 * 算法详解：http://blog.csdn.net/sparkliang/article/details/5279393
 * 算法实现：https://weblogs.java.net/blog/2007/11/27/consistent-hashing
 * @author xiaoleilu
 *
 * @param <T>   节点类型
 */
public class ConsistentHash<T> implements Serializable
    private static final long serialVersionUID = 1L;
    
    /** Hash计算对象，用于自定义hash算法 */
    Hash32<Object> hashFunc;
    /** 复制的节点个数 */
    private final int numberOfReplicas;
    /** 一致性Hash环 */
    private final SortedMap<Integer, T> circle = new TreeMap<>();
    
    /**
     * 构造，使用Java默认的Hash算法
     * @param numberOfReplicas 复制的节点个数，增加每个节点的复制节点有利于负载均衡
     * @param nodes 节点对象
     */
    public ConsistentHash(int numberOfReplicas, Collection<T> nodes) 
        this.numberOfReplicas = numberOfReplicas;
        this.hashFunc = key -> 
            //默认使用FNV1hash算法
            return HashUtil.fnvHash(key.toString());
        ;
        //初始化节点
        for (T node : nodes) 
            add(node);
        
    

    /**
     * 构造
     * @param hashFunc hash算法对象
     * @param numberOfReplicas 复制的节点个数，增加每个节点的复制节点有利于负载均衡
     * @param nodes 节点对象
     */
    public ConsistentHash(Hash32<Object> hashFunc, int numberOfReplicas, Collection<T> nodes) 
        this.numberOfReplicas = numberOfReplicas;
        this.hashFunc = hashFunc;
        //初始化节点
        for (T node : nodes) 
            add(node);
        
    

    /**
     * 增加节点<br>
     * 每增加一个节点，就会在闭环上增加给定复制节点数<br>
     * 例如复制节点数是2，则每调用此方法一次，增加两个虚拟节点，这两个节点指向同一Node
     * 由于hash算法会调用node的toString方法，故按照toString去重
     * @param node 节点对象
     */
    public void add(T node) 
        for (int i = 0; i < numberOfReplicas; i++) 
            circle.put(hashFunc.hash32(node.toString() + i), node);
        
    

    /**
     * 移除节点的同时移除相应的虚拟节点
     * @param node 节点对象
     */
    public void remove(T node) 
        for (int i = 0; i < numberOfReplicas; i++) 
            circle.remove(hashFunc.hash32(node.toString() + i));
        
    

    /**
     * 获得一个最近的顺时针节点
     * @param key 为给定键取Hash，取得顺时针方向上最近的一个虚拟节点对应的实际节点
     * @return 节点对象
     */
    public T get(Object key) 
        if (circle.isEmpty()) 
            return null;
        
        int hash = hashFunc.hash32(key);
        if (false == circle.containsKey(hash)) 
            SortedMap<Integer, T> tailMap = circle.tailMap(hash);   //返回此映射的部分视图，其键大于等于 hash
            hash = tailMap.isEmpty() ? circle.firstKey() : tailMap.firstKey();
        
        //正好命中
        return circle.get(hash);

对一致性hash算法，java代码实现的深入研究

一致性Hash算法关于一致性Hash算法，在我之前的博文中已经有多次提到了，MemCache超详细解读一文中"一致性Hash算法"部分，对于为什么要使用一致性Hash算法和一致性Hash算法的算法原理做了详细的解读。算法的具体原理这里再次贴... 查看详情

对一致性hash算法，java代码实现的深入研究

原文：http://www.cnblogs.com/xrq730/p/5186728.html一致性Hash算法关于一致性Hash算法，在我之前的博文中已经有多次提到了，MemCache超详细解读一文中"一致性Hash算法"部分，对于为什么要使用一致性Hash算法、一致性Hash算法的算法原理做了... 查看详情

一致性hash算法原理，java实现，及用途

学习记录：一致性Hash算法原理及java实现：https://blog.csdn.net/suifeng629/article/details/81567777一致性Hash算法介绍，原理，及使用场景：https://blog.csdn.net/cbmljs/article/details/88021598纯转载，侵删查看详情

一致性hash算法

...构：核心原理与案例分析》时，第一次比较完备的了解了一致性hash算法，一致性哈希算法早在1997年由麻省理工学院提出的一种分布式哈希（DHT）实现算法，而该算法的核心是将hash环的数据结构实现KEY到缓存服务器的HASH映... 查看详情

一致性hash算法及java实现

一致性hash算法是分布式中一个常用且好用的分片算法、或者数据库分库分表算法。现在的互联网服务架构中，为避免单点故障、提升处理效率、横向扩展等原因，分布式系统已经成为了居家旅行必备的部署模式，所以也产出了... 查看详情

如何用java利用贝叶斯算法实现垃圾邮件过滤

参考技术A这个问题很有挑战性,做看其他大佬回答查看详情

手撸一致性hash算法(java实现)(代码片段)

正文在下面，先打个广告：一、一致性Hash(ConsistentHashing)原理剖析引入一致性哈希算法是分布式系统中常用的算法。一致性哈希算法解决了普通余数Hash算法伸缩性差的问题，可以保证在上线、下线服务器的情况下尽量... 查看详情

一致性hash算法java版实现(代码片段)

...字长文聊缓存（下）-应用级缓存》，谈到缓存不说一下一致性Hash算法那就是在耍流氓。分布式缓存集群的访问模型现在通常使用Redis来做分布式缓存，下面我们就以Redis为例：假如当前我们系统的业务发展很快，需要缓存的数据... 查看详情

一致性hash算法原理白话

...ache1.2、技术瓶颈memcached服务器端本身不提供分布式cache的一致性，由客户端实现提供。以余数分布式算法为例。余数分布式算法是根据添加进入缓存时key的hash值通过特定的算法得出余数，然后根据余数映射到关联的缓存服务器... 查看详情

架构实践使用golang实现一致性hash算法代码

【架构实践】使用golang实现一致性Hash算法代码文章目录【架构实践】使用golang实现一致性Hash算法代码分布式系统中的一致性Hash算法具体是什么？再详细一点讲讲一致性Hash算法存在的一些问题一致性Hash算法都有哪些实际的应用... 查看详情

编程实践一致性哈希(hash)算法实现

目录1为什么使用一致性哈希1.1我该访问谁？1.2节点数量变化了怎么办？2算法原理2.1步骤查看详情

java示例代码_如何用Java实现一个在HTML树中循环的算法

java示例代码_如何用Java实现一个在HTML树中循环的算法查看详情

hash一致性算法

一致性hash算法是，1097麻省理工提出的分布式hashDHT实现算法，极倔internet的热点问题平衡性hash结果尽可能的分布到所有的缓存中去，缓冲空间利用率最高单调性保持已有的缓存能映射到对应的位置，新加入的缓存能加入新的... 查看详情

hashmap

java中hashmap是以一致性hash算法基础实现的一个map，hash算法就是散列表算法，hash表的存取都是常数阶。算法本身我就不多说了，我就说说java中的HashMap对象，它是一个hash表算法实现的，hash表是以bucket元素的一个数组，这个数组的... 查看详情

简陋版一致性hash算法实现

1publicfunctionhashAction(){2$server_list=range(14,114);3$server_slot=$this->hashAri($server_list);4$key_list=range(1,100000);5$key_slot=$this->hashAri($key_list);67//分配位子8$result=$this->hash 查看详情

一致性hash算法实现（伪码）(代码片段)

一致性Hash算法原理参考此博客，介绍的比较详细：https://www.cnblogs.com/lpfuture/p/5796398.html预设场景：所有请求过来，会根据一致性hash算法，选择一个服务器转发出去，一致性hash算法获取到的是服务器的ip。假定节点存储结构如下... 查看详情

一致性hash算法

参考帖https://www.cnblogs.com/mushroom/p/4472369.html hash一致性算法hash函数的一种，他的目的在于实现负载均衡，并且每次访问的目标具有一致性，举个例子来说，根据客户端请求ip，经过hash一致性算法，每次计算出来的一致性hash值... 查看详情

深入一致性哈希(consistenthashing)算法原理，并附100行代码实现

...shing算法原理和Java实现，以及效果测试。　背景介绍　　一致性Hashing在分布式系统中经常会被用到，用于尽可能地降低节点变动带来的数据迁移开销。ConsistentHashing算法在1997年就在论文Consistenthashingandrandomtrees中被查看详情