04-12 03:34 阅读 126

你真的了解Innodb存储引擎？

前言

前几篇记录了如何查看SQL执行计划、数据库事务相关的知识点

除了这两个，数据库还有两个是非常重要的，必须要考的

就是存储引擎和索引

今天先记录以下InnoDB存储引擎相关的知识点

MySQL存储引擎

在MySQL存储引擎中，最为广知的存储引擎是InnoDB和MyISAM存储引擎

而这两个存储引擎的区别应该大家都清楚：

而MySQL目前默认的存储引擎就是InnoDB

「如何查看表使用的是哪种存储引擎？」

show table status like 'table_name'\G

InnoDB

是MySQL的默认事务性存储引擎，最重要、使用最广泛。

用来处理大量的短期事务。

InnoDB的性能和自动崩溃恢复特性，使得它在非事务性存储的需求中也有广泛的应用。

采用MVVC来支持高并发，并实现了四个标准的隔离级别，默认隔离级别是RR（Repeatable Read可重复读），并通过间隙锁来防止幻读的出现。

InnoDB表是基于聚簇索引建立的，聚簇索引对主键查询由很高的性能，不过它的二级索引（非主键索引）必须包含主键列。

「具体架构图如下」

上半部分是实例层（计算层），位于内存中

下半部分是物理层，位于文件系统中

实例层

分为线程和内存，Innodb重要的线程有Master Thread，此线程是Innodb的主线程，负责调度其他各线程。

Master Thread 的优先级最高, 其内部包含几个循环：

主循环（loop）

后台循环（background loop）

刷新循环（flush loop）

暂停循环（suspend loop）。

Master Thread 会根据其内部运行的相关状态在各循环间进行切换

大部分操作在主循环（loop）中完成，其包括1s和10s两种操作：

「1s操作：」

日志缓冲刷新到磁盘

最多刷新100个新脏页到磁盘

执行并改变缓冲的操作

若当前没有用户活动，可能切换到后台循环等

「10s操作：」

最多刷新100个新脏页到磁盘

合并至多5个被改变的缓冲

日志缓冲刷新到磁盘

删除无用的Undo页

刷新 100 个或者 10 个脏页到磁盘（总是）产生一个检查点（总是）等。

「buf dump thread:」

将缓存池中内容dump到磁盘中，实现MySQL热启动

「page_cleaner_thread:」

将缓存池的脏页刷新到磁盘

「purge thread:」

将不再使用的Undo页回收

「read_thread:」

处理读请求，并负责将数据页从磁盘中读取出来

「write_thread:」

负责将数据页从缓冲区写入磁盘，page_cleaner 线程发起刷脏页操作后就开始工作了。

「redo_log_thread:」

负责将日志缓冲区中的内容刷新到Redo log文件中

「insert_buffer_thread：」

负责把 Insert Buffer 中的内容刷新到磁盘

缓存结构

缓冲池中缓存的数据页类型有：

索引页
数据页
undo页
插入缓冲(insert buffer)
自适应哈希索引(adaptive hash index)
InnoDB存储的锁信息(lock info)
数据字典信息(data dictionary)

Redo log 日志缓存

InnoDB存储引擎会首先将重做日志信息先放入重做日志缓冲中，然后再按照一定频率将其刷新到重做日志文件

「缓冲页管理算法：」

页：磁盘管理的最小单位，默认16K。类型有：数据页，undo页，系统页

一般缓冲的管理算法就是LRU(Least recently used)。

一般是把刚如缓冲页的放在LRU的头部，作为最近访问的元素，最后的一个元素被淘汰。

（1）页已经在缓冲池里，那就只做“移至”LRU头部的动作，而没有页被淘汰；

（2）页不在缓冲池里，除了做“放入”LRU头部的动作，还要做“淘汰”LRU尾部页的动作；

比如：有一个LRU链

「第一种情况：」

查找元素为0的，那么链表就变成下面这样子

「第二种情况：」

查找元素为10的，但10不在链中，所以将10添加到head，而tail节点6去除

MySQL在此基础上进行了改造，原因是：

（1）预读失效：

「预读：」

磁盘读写，并不是按需读取，而是按页读取，一次至少读一页数据（一般是16K），如果未来要读取的数据就在页中，就能够省去后续的磁盘IO，提高效率。

「预读失效：」

预读(Read-Ahead)提前把页放入了缓冲池，但最终MySQL并没有从页中读取数据，称为预读失效。

「如何优化？」

（1）让预读失效的页，停留在缓冲池LRU里的时间尽可能短；

（2）让真正被读取的页，才挪到缓冲池LRU的头部；

所以MySQL将LRU分成两部分，分别是：

新生代
老生代

新老生代首位相连。

新页加入缓冲池时，只加入老生代的头部，

「如果数据真正被读取（预读成功），才会加入到新生代的头部」

「如果数据没有被读取，则会比新生代里的“热数据页”更早被淘汰出缓冲池」

新生代跟老生代的比例是 5 : 3

例如：绿色的是新生代，黄色是老生代

如果插入一个9的页，就是如下图：

老年代最后一个被淘汰

如果此时9被读取，那么就变成如下：

9称为新生代head节点，而原先新生代的tail节点5就变成老年代的head节点

（2）缓冲池污染

当一个SQL查询要扫描大量数据，导致把缓冲池中所有页全部替换，导致大量热数据被换出去，这就是缓冲池污染

MySQL在老生代中添加了停留时间窗口

如果数据被读取了并且在老身代中停留时间超过这个窗口，那么才会被加入新生代头部

「如何查看这个停留时间：」

参数innodb_old_blocks_time

「缓冲池相关参数：」

物理层

物理层在逻辑上分为

系统表空间
用户表空间
Redo日志。

系统表空间里有 ibdata 文件和一些 Undo，ibdata 文件里有 insert buffer 段、double write段、回滚段、索引段、数据字典段和 Undo 信息段。

用户表空间是指以 .ibd 为后缀的文件，文件中包含 insert buffer 的 bitmap 页、叶子页（这里存储真正的用户数据）、非叶子页。InnoDB 表是索引组织表，采用 B+ 树组织存储，数据都存储在叶子节点中，分支节点（即非叶子页）存储索引分支查找的数据值。

Redo 日志中包括多个 Redo 文件，这些文件循环使用，当达到一定存储阈值（0.75）时会触发checkpoint 刷脏页操作，同时也会在 MySQL 实例异常宕机后重启，InnoDB 表数据自动还原恢复过程中使用。

用户读取或者写入的最新数据都存储在 Buffer Pool 中

如果 Buffer Pool 中没有找到则会读取物理文件进行查找，之后存储到 Buffer Pool 中并返回给 MySQL Server。Buffer Pool 采用LRU 机制。

Buffer Pool 决定了一个 SQL 执行的速度快慢，如果查询结果页都在内存中则返回结果速度很快，否则会产生物理读（磁盘读），返回结果时间变长，性能远不如存储在内存中。

「Redo 和 Undo」

Redo log 是一个循环复用的文件集，负责记录 InnoDB 中所有对 Buffer Pool的物理修改日志，当 Redo log文件空间中，检查点位置的 LSN 和最新写入的 LSN 差值（checkpoint_age）达到 Redo log 文件总空间的 75% 后，InnoDB 会进行异步刷新操作，直到降至 75% 以下，并释放 Redo log 的空间；当 checkpoint_age 达到文件总量大小的 90% 后，会触发同步刷新，此时 InnoDB 处于挂起状态无法操作。

Redo记录变更后的数据。

Undo记录事务数据变更前的值，用于回滚和其他事务多版本读。

「ARIES 三原则」

ARIES 三原则，是指 Write Ahead Logging（WAL）。

先写日志后写磁盘，日志成功写入后事务就不会丢失，后续由 checkpoint 机制来保证磁盘物理文件与 Redo 日志达到一致性；

利用 Redo 记录变更后的数据，即 Redo 记录事务数据变更后的值；

利用 Undo 记录变更前的数据，即 Undo 记录事务数据变更前的值，用于回滚和其他事务多版本读。