面试腾讯,字节跳动,华为90%会被问到的hashmap!你会了吗?

lwh1019 lwh1019     2023-03-22     239

关键词:

简介

HashMap是平常使用的非常多的,内部结构是 数组+链表/红黑树 构成,很多时候都是多种数据结构组合。

我们先看一下HashMap的基本操作:

 

 
技术图片

new HashMap(n);

第一个知识点,传入n,构造的HashMap容量就是n吗?

答案是:不一定。

    public HashMap(int initialCapacity, float loadFactor) 
        this.loadFactor = loadFactor; //负载因子 默认0.75
        //设置容量
        this.threshold = tableSizeFor(initialCapacity);
    

  

tableSizeFor 这段代码其实就做了一件事,例如,你初始化给了10,它会给你16,大于10的是2的k次幂。

以初始值50为例,讲一下实现原理:

  static final int tableSizeFor(int cap) 
      int n = cap - 1;
      n |= n >>> 1;
      n |= n >>> 2;
      n |= n >>> 4;
      n |= n >>> 8;
      n |= n >>> 16;
      return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
  

  

算法就是让二进制不断右移,与自己异或,把第一位为1(最高位)后面全变为1,111111 + 1 = 1000000 = 26 2^62
6
(符合大于50并且是2的整数次幂 )

 

 
技术图片

第二个知识点,回答开题的问题,为什么hash函数这么设计?

HashMap的hash函数是根据Key值计算的;
一定要尽可能降低hash碰撞,越分散越好;
算法一定要尽可能高效,因为这是高频操作;
再来看一下这段代码:

static final int hash(Object key) 
    int h;
    return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);

  

这段代码有个名字,叫扰动函数,大家想一下,如果hash函数直接使用key.hashCode()作为hash 值怎么样?

key.hashCode()获得的是key的hashcode(), 如果HashMap数组长度为16,求对象在数组存储位置 (n - 1) & hash 就相当于 0000 1111 & hash ,让 hash 高位全部置为0,只用到了 hash 的低位,因为只用了低位,碰撞的几率就会比较大。

聪明的算法设计者兼顾性能和降低碰撞,就考虑用高16位和低16位结合起来异或形成hash 值。如下图所示,

 

 
技术图片

第三个知识点,相比1.7,JDK1.8做了哪些优化?

1.7 使用头插法,1.8使用尾插法;
1.7 hash函数使用4次位运算+5次异或,1.8使用1次位运算+1次异或;
1.7 使用数组+链表的结构,1.8 使用数组 + 链表 +红黑树;
1.7 扩容需要对原始元素重新hash & (len -1), 1.8 计算元素新位置 = 原始位置 / 原始位置 + 旧容量;
下面开始解释??说的四条:

第一条:
1.8 之前都是使用头插法,因为作者认为现在插入的数据是热乎的,最有可能被立即使用到,所以用头插法;

而为什么1.8用尾插法呢,如果是头插法,在多线程环境下,会出现这样一个问题:A线程在插入节点B,B线程也在插入,遇到容量不够开始扩容,重新hash,放置元素,采用头插法,后遍历到的B节点放入了头部,这样形成了环,如下图所示:

 

 
技术图片

第二条:
1.7的hash 函数如下,可以和上面的对比看:

static int hash(int h) 
    h ^= (h >>> 20) ^ (h >>> 12);
    return h ^ (h >>> 7) ^ (h >>> 4);

  

四次无符号右移 五次异或

第三条:
画了一张插入流程图如下:
注意4个点:

先插入新节点再扩容(1.7是先判断容量,不够先扩容再插入);
先判断是否为红黑树,链表插入结束判断是否是否应该转为红黑树;
红黑树转为链表的临界值是6不是8,原因是如果长度经常在8附近,转来转去,浪费资源。
为什么红黑树的阈值是8,因为合理的hash函数,发生碰撞链表长度为8的概率作者计算为千万分之后。

 

 
技术图片
   // 作者给的hash冲突链表长度分别为以下值得概率
    * 0:    0.60653066
     * 1:    0.30326533
     * 2:    0.07581633
     * 3:    0.01263606
     * 4:    0.00157952
     * 5:    0.00015795
     * 6:    0.00001316
     * 7:    0.00000094
     * 8:    0.00000006

  

第四条:
1.7 扩容后会采用 hash & (len -1)重新计算所有数组元素的位置,但是1.8采用简单快捷的方式定位新位置: 直接放在原位置/ 原位置 + 旧容量

这个怎么理解呢?看下面这张图,

 

 
技术图片

分二种情况:

比如现在 数组长度为16,元素的hash值为0101 , 0000 0101 & 0000 1111 = 0000 0101,
扩容之后,因为高位为0,0000 0101 & 0001 1111 = 0000 0101,位置没变,可以直接放到扩容后的原始位置。
数组长度为16,原始的hash值为 0001 0101, 0001 0101 & 0000 1111 = 0101, 扩容到32之后, 0001 0101 & 0001 1111 = 0001 0101, 比原来的位置大16。
有意思吧! 好好品,越品越有意思!
截取了一段扩容代码

final Node<K,V>[] resize()
    //***
    if (loTail != null) 
      loTail.next = null;
       newTab[j] = loHead;
   
   if (hiTail != null) 
       hiTail.next = null;
       newTab[j + oldCap] = hiHead;
   

  

 

深度分享:面试阿里,字节跳动,美团90%会被问到的hashmap知识(代码片段)

一,HashTable哈希表,它相比于hashMap结构简单点,它没有涉及红黑树,直接使用链表的方式解决哈希冲突。我们看它的字段,和hashMap差不多,使用table存放元素privatetransientEntry<?,?>[]table;privatetransientintcount;privateintthreshold;private... 查看详情

面试阿里,字节跳动,腾讯90%会被问到的面试题——单例模式(代码片段)

1.什么是Singleton?Singleton,即单例,在Java中表示的是单例模式,所谓的单例模式,指的就是在程序中,有且仅有一个该实例对象。单:唯一,单独。例:实例对象。2.单例模式有几种创建方式?2.1饿汉式(在程序启动过程中,就... 查看详情

面试阿里,字节跳动90%会被问到的微服务,你确定不进来看看吗?

1、您对微服务有何了解?微服务:又称微服务架构,是一种架构风格,它将应用程序构建为以业务领域为模型的小型自治服务集合。通俗地说,你必须看到蜜蜂如何通过对齐六角形蜡细胞来构建它们的蜂窝状物。他们最初从使... 查看详情

面试阿里,腾讯90%会被问到的25个问题,附答案!(代码片段)

想要确保您的下一次Java面试成功吗?查看这篇文章,了解有关常见Java面试问题的更多信息,以及面试技巧!简介作为最广泛使用和部署的语言,Java是Web领域的三大核心技术之一。它由JamesGosling,PatrickNaughton和MikeSheridan于1991年... 查看详情

史上最全!2020面试阿里,字节跳动90%被问到的jvm面试题(附答案)

...是收到小伙伴的私信问我能不能帮忙整理出一份JVM相关的面试题出来,说自己在大厂去面试的时候这一块问的是特别多的,每次自己学的时候每次都学不到重点去。这不他来了,一份详细的JVM面试真题给大家整理在下方了!一、... 查看详情

深度分析:面试阿里,字节跳动,美团90%被问到的list集合,看完还不懂算我输

1List集合1.1List概述在Collection中,List集合是有序的,可对其中每个元素的插入位置进行精确地控制,可以通过索引来访问元素,遍历元素。在List集合中,我们常用到ArrayList和LinkedList这两个类。关于JavaList的一些重要观点是;JavaList... 查看详情

面试阿里,字节跳动90%会被问到的java异常面试题集,史上最全系列!(代码片段)

Java异常架构与异常关键字Java异常简介Java异常是Java提供的一种识别及响应错误的一致性机制。Java异常机制可以使程序中异常处理代码和正常业务代码分离,保证程序代码更加优雅,并提高程序健壮性。在有效使用异常的情况下... 查看详情

深度分析:面试阿里,字节跳动,美团几乎都会被问到的阻塞队列

基本概念阻塞队列(BlockingQueue)是一个支持两个附加操作的队列。这两个附加的操作支持阻塞的插入和移除方法。1)支持阻塞的插入方法:意思是当队列满时,队列会阻塞插入元素的线程,直到队列不满。2)支持阻塞的移除方... 查看详情

深度分析:面试阿里,字节跳动,美团几乎都会被问到的阻塞队列(代码片段)

基本概念阻塞队列(BlockingQueue)是一个支持两个附加操作的队列。这两个附加的操作支持阻塞的插入和移除方法。1)支持阻塞的插入方法:意思是当队列满时,队列会阻塞插入元素的线程,直到队列不满。2)支持阻塞的移除方... 查看详情

面试阿里,字节跳动美团90%会被问到的面试题内部类,你还没掌握吗?(代码片段)

1.内部类的含义知道内部类这个概念,除了在用链表时定义节点类时,其余情况具体怎么使用感觉很生疏。再次回顾到这个知识点了,做一个系统的总结内部类,从字面意思上理解为“定义在类内部的类”。可以把它理解为汽车... 查看详情

面试阿里,字节跳动99%会被问到的java线程和线程池,看完这篇你就懂了!

...多小伙伴私信问我线程和线程池这一块的问题,说自己在面试的时候老是被问到这一块的问题,被问的很头疼。前几天看到后帮几个小伙伴解决了问题,但是问的人有点多我一个个回答也回答不过来,干脆花了一个上午时间写了... 查看详情

面试大厂,90%会被问到的java面试题(附答案)

面向对象的三个特征封装,继承,多态多态的好处,代码中如何实现多态,虚拟机中如何实现多态允许不同类对象对同一消息作出相应,好处如下:可替换性:多态对已存在的代码具有可替换性可扩充性:增加新的子类不会影响... 查看详情

真香!百度阿里腾讯字节跳动等面试题库,被各大厂要求直接下架

前言Android面试题解析主要内容包括Java知识汇总、Android知识汇总、Android拓展知识点、Android开源库源码分析、设计模式汇总、Gradle知识点汇总、常见面试算法题汇总等等。解析百度、阿里、腾讯大厂面试被问到的题目,也涵... 查看详情

深度分析:面试90%被问到的多线程创建线程线程状态线程安全,一次性帮你全搞定!(代码片段)

一、多线程1.概述多线程(multithreading),是指从软件或者硬件上实现多个线程并发执行的技术。就是在单个程序中同时运行多个线程来完成不同的工作。2.并发与并行并发:指两个或多个事件在同一个时间段内发生。并行:指两... 查看详情

深度分析:面试90%被问到的sessioncookietoken,看完这篇你就掌握了!(代码片段)

Cookie和SessionHTTP协议是一种无状态协议,即每次服务端接收到客户端的请求时,都是一个全新的请求,服务器并不知道客户端的历史请求记录;Session和Cookie的主要目的就是为了弥补HTTP的无状态特性。Session是什么客户端请求服务... 查看详情

web前端求职时都会被问到的redis面试题分享

Web前端人员怎么求职?Redis面试题有哪些?Redis(全称:RemoteDictionaryServer远程字典服务)是一个开源的使用ANSIC语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库,并提供多种语言的API。很多人在Web前端求职... 查看详情

应聘阿里,字节跳动美团90%会问到的jvm面试题!史上最全系列!(代码片段)

Java内存分配?寄存器:程序计数器,是线程私有的,就是一个指针,指向方法区中的方法字节码。?静态域:static定义的静态成员。?常量池:编译时被确定并保存在.class文件中的(final)常量值和一些文本修饰的符号引用(类和接... 查看详情

关于物流项目面试可能会被问到的20题总结

文章目录1.简单介绍一下该项目5.数据来源及数据采集11、数据采集如何完成12、数据量大小3.技术架构(技术选项及框架版本)18、离线数仓数仓分层的作用是什么?我来介绍我们这个项目用到的模型:使用到了拉链表7.业务报表... 查看详情