面试官问我mysql索引,我真的是

Java3y Java3y     2023-01-26     650

关键词:

面试官我看你简历上写了MySQL,对MySQL InnoDB引擎的索引了解吗?

候选者:嗯啊,使用索引可以加快查询速度,其实上就是将无序的数据变成有序(有序就能加快检索速度)

候选者:在InnoDB引擎中,索引的底层数据结构是B+树

面试官那为什么不使用红黑树或者B树呢?

候选者:MySQL的数据是存储在硬盘的,在查询时一般是不能「一次性」把全部数据加载到内存中

候选者:红黑树是「二叉查找树」的变种,一个Node节点只能存储一个Key和一个Value

候选者:B和B+树跟红黑树不一样,它们算是「多路搜索树」,相较于「二叉搜索树」而言,一个Node节点可以存储的信息会更多,「多路搜索树」的高度会比「二叉搜索树」更低。

候选者:了解了区别之后,其实就很容易发现,在数据不能一次加载至内存的场景下,数据需要被检索出来,选择B或B+树的理由就很充分了(一个Node节点存储信息更多(相较于二叉搜索树),树的高度更低,树的高度影响检索的速度)

候选者:B+树相对于B树而言,它又有两种特性。

候选者:一、B+树非叶子节点不存储数据,在相同的数据量下,B+树更加矮壮。(这个应该不用多解释了,数据都存储在叶子节点上,非叶子节点的存储能存储更多的索引,所以整棵树就更加矮壮)

候选者:二、B+树叶子节点之间组成一个链表,方便于遍历查询(遍历操作在MySQL中比较常见)

候选者:我稍微解释一下吧,你可以脑补下画面

候选者:我们在MySQL InnoDB引擎下,每创建一个索引,相当于生成了一颗B+树。

候选者:如果该索引是「聚集(聚簇)索引」,那当前B+树的叶子节点存储着「主键和当前行的数据」

候选者:如果该索引是「非聚簇索引」,那当前B+树的叶子节点存储着「主键和当前索引列值」

候选者:比如写了一句sql:select * from user where id >=10,那只要定位到id为10的记录,然后在叶子节点之间通过遍历链表(叶子节点组成的链表),即可找到往后的记录了。

候选者:由于B树是会在非叶子节点也存储数据,要遍历的时候可能就得跨层检索,相对麻烦些。

候选者:基于树的层级以及业务使用场景的特性,所以MySQL选择了B+树作为索引的底层数据结构。

候选者:对于哈希结构,其实InnoDB引擎是「自适应」哈希索引的(hash索引的创建由InnoDB存储引擎引擎自动优化创建,我们是干预不了)

面试官:嗯…那我了解了,顺便想问下,你知道什么叫做回表吗?

候选者:所谓的回表其实就是,当我们使用索引查询数据时,检索出来的数据可能包含其他列,但走的索引树叶子节点只能查到当前列值以及主键ID,所以需要根据主键ID再去查一遍数据,得到SQL 所需的列

候选者:举个例子,我这边建了给订单号ID建了个索引,但我的SQL 是:select orderId,orderName from orderdetail where orderId = 123

候选者:SQL都订单ID索引,但在订单ID的索引树的叶子节点只有orderId和Id,而我们还想检索出orderName,所以MySQL 会拿到ID再去查出orderName给我们返回,这种操作就叫回表

候选者:想要避免回表,也可以使用覆盖索引(能使用就使用,因为避免了回表操作)。

候选者:所谓的覆盖索引,实际上就是你想要查出的列刚好在叶子节点上都存在,比如我建了orderId和orderName联合索引,刚好我需要查询也是orderId和orderName,这些数据都存在索引树的叶子节点上,就不需要回表操作了。

面试官既然你也提到了联合索引,我想问下你了解最左匹配原则吗?

候选者:嗯,说明这个概念,还是举例子比较容易说明

候选者:如有索引 (a,b,c,d),查询条件 a=1 and b=2 and c>3 and d=4,则会在每个节点依次命中a、b、c,无法命中d

候选者:先匹配最左边的,索引只能用于查找key是否存在(相等),遇到范围查询 (>、<、between、like左匹配)等就不能进一步匹配了,后续退化为线性查找

候选者:这就是最左匹配原则

面试官嗯嗯,我还想问下你们主键是怎么生成的?

候选者:主键就自增的

面试官那假设我不用MySQL自增的主键,你觉得会有什么问题呢?

候选者:首先主键得保证它的唯一性和空间尽可能短吧,这两块是需要考虑的。

候选者:另外,由于索引的特性(有序),如果生成像uuid类似的主键,那插入的的性能是比自增的要差的

候选者:因为生成的uuid,在插入时有可能需要移动磁盘块(比如,块内的空间在当前时刻已经存储满了,但新生成的uuid需要插入已满的块内,就需要移动块的数据)

面试官:OK…

本文总结

  • 为什么B+树?数据无法一次load到内存,B+树是多路搜索树,只有叶子节点才存储数据,叶子节点之间链表进行关联。(树矮,易遍历)
  • 什么是回表?非聚簇索引在叶子节点只存储列值以及主键ID,有条件下尽可能用覆盖索引避免回表操作,提高查询速度
  • 什么是最左匹配原则?从最左边为起点开始连续匹配,遇到范围查询终止
  • 主键非自增会有什么问题?插入效率下降,存在移动块的数据问题

【对线面试官-移动端】系列 一周两篇持续更新中!

【对线面试官-电脑端】系列 一周两篇持续更新中!

原创不易!!求三连!!

面试官问我jvm内存结构,我真的是

面试官:今天来聊聊JVM的内存结构吧?候选者:嗯,好的候选者:前几次面试的时候也提到了:class文件会被类加载器装载至JVM中,并且JVM会负责程序「运行时」的「内存管理」候选者:而JVM的内存... 查看详情

面试官问我tcp三次握手和四次挥手,我真的是

候选者:面试官你好,请问面试可以开始了吗面试官:嗯,开始吧面试官:今天来聊聊TCP吧,TCP的各个状态还有印象吗?候选者:还有些许印象的,要不我就来简单说下TCP的三次握手和四次挥手... 查看详情

面试官问我tcp三次握手和四次挥手,我真的是

候选者:面试官你好,请问面试可以开始了吗面试官:嗯,开始吧面试官:今天来聊聊TCP吧,TCP的各个状态还有印象吗?候选者:还有些许印象的,要不我就来简单说下TCP的三次握手和四次挥手... 查看详情

面试官问我http,我真的是

面试官:今天要不来聊聊HTTP吧?候选者:嗯,HTTP「协议」是客户端和服务器「交互」的一种通迅的格式候选者:所谓的「协议」实际上就是双方约定好的「格式」,让双方都能看得懂的东西而已候选者... 查看详情

redis┃面试官问我redis事务和mysql事务的区别,我

参考技术A1、前言面试官:我看你简历上写了熟悉redis,看来工作中用的很多吧?我:是的,我们项目中经常用到redis(来,随便问,看我分分钟秒杀你)面试官:那你给我说说redis的事务和mysql的事务有什么区别吧我:额。。。... 查看详情

面试官问我jvm内存结构,我真的是

面试官:今天来聊聊JVM的内存结构吧?候选者:嗯,好的候选者:前几次面试的时候也提到了:class文件会被类加载器装载至JVM中,并且JVM会负责程序「运行时」的「内存管理」候选者:而JVM的内存... 查看详情

面试官问我list接口,我

面试官:要不今天来讲讲Java的List吧,你对List了解多少?候选者:List在Java里边是一个接口,常见的实现类有ArrayList和LinkedList,在开发中用得最多的是ArrayList候选者:ArrayList的底层数据结构是数组,... 查看详情

面试官问我注解的使用有没有踩过坑(代码片段)

...很久前,在我还是青铜的时候(现在依旧是青铜段位)去面试,面试官问我怎么获取类,方法上的注解。当时的我也算用过注解,顺口就回答了,用isAnnotationPresent判断是否加了注解,getAnnotation获取注解对象,然后获取注解中的... 查看详情

面试官问我map接口,我

面试官:今天来讲讲Map吧,你对Map了解多少?就讲JDK1.8就好咯候选者:Map在Java里边是一个接口,常见的实现类有HashMap、LinkedHashMap、TreeMap和ConcurrentHashMap候选者:在Java里边,哈希表的结构是数组+链... 查看详情

面试:阿里面试官问我设计模式——代理模式,我是这样回答的!(代码片段)

1.什么是代理模式?为对象提供一种代理以控制对这个对象的访问。代理模式相当于:中介或者经纪人,代理类可以在被代理类的基础之上增加功能(扩展功能),比如日志记录和权限控制,这样被代理类隐藏起来了,比较安全... 查看详情

面试:阿里面试官问我设计模式——代理模式,我是这样回答的!(代码片段)

1.什么是代理模式?为对象提供一种代理以控制对这个对象的访问。代理模式相当于:中介或者经纪人,代理类可以在被代理类的基础之上增加功能(扩展功能),比如日志记录和权限控制,这样被代理类隐藏起来了,比较安全... 查看详情

面试官问我jvm调优,我忍不住了,哈哈哈哈

面试官:今天要不来聊聊JVM调优相关的吧?面试官:你曾经在生产环境下有过调优JVM的经历吗?候选者:没有面试官:…候选者:嗯…是这样的,我们一般优化系统的思路是这样的候选者:1.一... 查看详情

腾讯面试官问我:https是怎么从http转过来的?还好我早有准备

这段时间稍微整理了一下面试题,其中有一个,感觉有必要给大家分享一下,就是问关于HTTP的内容。HTTPHTTP协议是HyperTextTransferProtocol(超文本传输协议)的缩写,是用于从万维网服务器传输超文本到本地浏览器的传送协... 查看详情

阿里p7岗位面试,面试官问我:为什么hashmap底层树化标准的元素个数是8

...明一下,本文有点标题党了,像我这样的菜鸡何德何能去面试阿里的P7岗啊,不过,这确实是阿里p7级岗位的面试题,当然,参加面试的人不是我,而是我部门的一个大佬。他把自己的面试经验分享给了我,也让我间接体会下阿... 查看详情

美团面试官问我一个字符的string.length()是多少,我说是1,面试官说你回去好好学一下吧(代码片段)

本文首发于微信公众号:程序员乔戈里publicclasstestTpublicstaticvoidmain(String[]args)StringA="hi你是乔戈里";System.out.println(A.length());以上结果输出为7。小萌边说边在IDEA中的win环境下选中String.length()函数,使用ctrl+B快捷键进入到Strin... 查看详情

面试:阿里面试官问我设计模式——代理模式,我是这样回答的!(代码片段)

1.什么是代理模式?为对象提供一种代理以控制对这个对象的访问。代理模式相当于:中介或者经纪人,代理类可以在被代理类的基础之上增加功能(扩展功能),比如日志记录和权限控制,这样被代理类隐藏起来了,比较安全... 查看详情

面试:阿里面试官问我设计模式——代理模式,我是这样回答的!(代码片段)

1.什么是代理模式?为对象提供一种代理以控制对这个对象的访问。代理模式相当于:中介或者经纪人,代理类可以在被代理类的基础之上增加功能(扩展功能),比如日志记录和权限控制,这样被代理类隐藏起来了,比较安全... 查看详情

java8新特性面试官问我:java8中创建stream流有哪几种方式?

...解下Java8甚至以后版本的新特性了。今天,一名读者出去面试,面试官问他:说说Java8中创建Stream流有哪几种方式?他竟然没回答上来!!Stream概述Java8中有两大最为重要的改变。第一个是Lambda表达式;另 查看详情