《MySQL索引背后的数据结构及算法原理》
- 资料大王PDF
-
0 次阅读
-
0 次下载
-
2024-10-19 18:15:20
微信
赏
支付宝
文档简介:
目 录
1. 摘要
2. 数据结构及算法基础
1. 索引的本质
2. B-Tree和B+Tree
3. 为什么实用B-Tree(B+Tree)
3. MySQL索引实现
1. MyISAM索引实现
2. InnoDB索引实现
4. 索引使用策略及优化
1. 示例数据库
2. 最左前缀原理与相关优化
3. 索引选择性与前缀索引
4. InnoDB的主键选择与插入优化
5. 后记&参考文献
摘要
转自 张洋的博客
本文以MySQL数据库为研究对象,讨论与数据库索引相关的一些话
题。特别需要说明的是,MySQL支持诸多存储引擎,而各种存储引擎
对索引的支持也各不相同,因此MySQL数据库支持多种索引类型,如
BTree索引,哈希索引,全文索引等等。为了避免混乱,本文将只关注
于BTree索引,因为这是平常使用MySQL时主要打交道的索引,至于哈
希索引和全文索引本文暂不讨论。
文章主要内容分为三个部分。
第一部分主要从数据结构及算法理论层面讨论MySQL数据库索引的数
理基础。
第二部分结合MySQL数据库中MyISAM和InnoDB数据存储引擎中索引
的架构实现讨论聚集索引、非聚集索引及覆盖索引等话题。
第三部分根据上面的理论基础,讨论MySQL中高性能使用索引的策
略。
数据结构及算法基础
1. 索引的本质
2. B-Tree和B+Tree
3. 为什么实用B-Tree(B+Tree)
索引的本质
MySQL官方对索引的定义为:索引(Index)是帮助MySQL高效获取数
据的数据结构。提取句子主干,就可以得到索引的本质:索引是数据结
构。
我们知道,数据库查询是数据库的最主要功能之一。我们都希望查询数
据的速度能尽可能的快,因此数据库系统的设计者会从查询算法的角度
进行优化。最基本的查询算法当然是 顺序查找 (linear search),这种
复杂度为O(n)的算法在数据量很大时显然是糟糕的,好在计算机科学的
发展提供了很多更优秀的查找算法,例如 二分查找 (binary search)、
二叉树查找 (binary tree search)等。如果稍微分析一下会发现,每种
查找算法都只能应用于特定的数据结构之上,例如二分查找要求被检索
数据有序,而二叉树查找只能应用于 二叉查找树 上,但是数据本身的
组织结构不可能完全满足各种数据结构(例如,理论上不可能同时将两
列都按顺序进行组织),所以,在数据之外,数据库系统还维护着满足
特定查找算法的数据结构,这些数据结构以某种方式引用(指向)数
据,这样就可以在这些数据结构上实现高级查找算法。这种数据结构,
就是索引。
看一个例子:
图1
图1展示了......
评论
发表评论