MySQL索引底层数据结构和算法详解_mysql底层是什么数据结构-CSDN博客

本文链接：https://blog.csdn.net/m0_69378371/article/details/148207998

MySQL索引底层数据结构和算法详解

MySQL索引的核心目的是高效定位数据，其底层实现依赖于多种精心设计的数据结构和算法。不同存储引擎和索引类型采用不同的实现方式。

一、主要索引数据结构

1. B+Tree（最核心的索引结构）

InnoDB引擎的默认索引结构，也是MySQL最常用的索引类型。

结构特点：

多路平衡查找树：每个节点包含多个键值和指针
所有数据存储在叶子节点：非叶子节点只存储索引键值和指针
叶子节点形成双向链表：便于范围查询
高度平衡：保证查询效率稳定

算法操作：

查找：O(logₙN)时间复杂度，从根节点开始二分查找
插入：可能导致节点分裂（当节点满时）
删除：可能导致节点合并（当节点过空时）

优势：

适合磁盘存储（减少I/O次数）
支持范围查询和排序
查询效率稳定（所有查询路径长度相同）

2. Hash索引

Memory引擎的默认索引类型，适用于等值查询。

结构特点：

基于哈希表实现
使用键值的哈希值定位数据

算法操作：

插入/查找：平均O(1)时间复杂度
使用链地址法解决哈希冲突

限制：

不支持范围查询
不支持排序
哈希冲突影响性能
不支持部分索引匹配

3. 自适应哈希索引(AHI)

InnoDB特有的自动优化机制。

特点：

自动为频繁访问的索引页建立哈希索引
完全自动管理，无需用户干预
结合了B+Tree的稳定性和Hash的高效性

二、辅助数据结构与算法

1. 跳表(Skip List)

部分存储引擎用于实现有序集合。

特点：

多层链表结构
空间换时间，查找效率接近平衡树
实现比平衡树简单

2. R-Tree（空间索引）

用于地理空间数据存储。

特点：

能够高效处理多维数据
支持空间关系查询（包含、相交等）

3. Trie树（前缀索引）

用于全文索引的特殊场景。

三、B+Tree的详细实现（以InnoDB为例）

1. 聚簇索引结构

[B+Tree节点结构]
+-------------------------------+
| 指针 | 键值1 | 指针 | 键值2 | 指针 |
+-------------------------------+
           /       |       \
          /        |        \
[叶子节点]      [叶子节点]      [叶子节点]
+------------------------------+
| 键值 | 事务ID | 回滚指针 | 所有列数据 |
+------------------------------+

2. 非聚簇索引(二级索引)结构

[B+Tree节点结构]
+-------------------------------+
| 指针 | 键值1 | 指针 | 键值2 | 指针 |
+-------------------------------+
           /       |       \
          /        |        \
[叶子节点]      [叶子节点]      [叶子节点]
+------------------------------+
| 索引键值 | 主键值 |
+------------------------------+

3. 页面结构（InnoDB存储单元）

默认页大小16KB
包含页头、行记录、页目录等部分
使用槽位目录(Slot Directory)加速页内查找

四、核心算法优化

1. 页面预读算法

线性预读：预测即将访问的页面
随机预读：检测到一定数量的页面被连续访问时触发

2. 变更缓冲区(Change Buffer)

对非唯一二级索引的DML操作进行缓冲
减少随机I/O操作

3. 自适应哈希算法

监控查询模式
自动为热点页构建哈希索引

4. MRR(Multi-Range Read)优化

将随机I/O转为顺序I/O
先收集主键再批量查询

五、不同存储引擎的实现差异

特性	InnoDB	MyISAM	Memory
主索引结构	聚簇B+Tree	非聚簇B+Tree	Hash
二级索引	B+Tree(存储主键)	B+Tree(存储数据指针)	Hash/B+Tree可选
全文索引	支持(5.6+)	支持	不支持
空间索引	支持(5.7+)	支持	不支持
哈希索引	自适应哈希	不支持	默认