基础
基础架构:一条SQL查询语句是如何执行的
下面是 MySQL 基础架构示意图
总体上,MySQL 可以分为 Server 层和存储引擎层两部分
Server 层包括连接器、查询缓存、分析器、优化器、执行器等,包含了 MySQL 绝大部分核心服务功能,以及所有的内置函数(如日期、时间、数学和加密函数等),所有的跨存储引擎的功能都在这一层进行实现,比如存储过程、触发器、视图等
存储引擎层负责数据的存储和提取。其架构模式是插件式 的,支持 InnoDB、MyISAM、Memory 等多个存储引擎。从 MySQL 5.5.5 开始 InnoDB 称为了 MySQL 的默认存储引擎
可以在使用create table
语句中使用engine=memory
,来指定使用内存引擎创建表
不同的存储引擎共用一个 Server 层
连接器
第一步,先连接到这个数据库上,这时候需要使用连接器。连接器负责跟客户端建立连接、获取权限、维持和管理连接,连接命令为:
mysql -h$ip -P$port -u$user -p
连接命令是用来跟服务端建立连接的。在完成经典的 TCP 握手之后,连接器就要开始用输入的用户名跟密码认证你的身份
- 如果用户名或者密码不对,就会收到一个
Access denied for user
的错误,然后客户端程序结束 - 如果用户名密码认证通过,连接器会到权限表里面查出当前账号拥有的权限,之后这个连接里面的权限判断逻辑,都依赖于此时读到的权限
这就意味着,一个用户成功建立连接后,即使管理员对这个用户的权限做了修改,也不会影响已经存在连接的权限。只有新的连接才会使用新的权限设置
连接完成后,如果没有后续动作,这个连接就处于空闲状态,使用show processlist
命令查看
客户端如何太长时间没有操作,连接器会自动断开。这个时间是由参数 wait_timeout 控制的,默认值是 8 小时
如果连接断开后,客户端再次发送请求的话,就会收到一个错误提醒:Lost connection to MySQL server during query
,如果要继续,就需要重连,然后再执行请求
数据库里面有一种长连接,指的是连接成功后,客户端如果有连续的请求,则一直使用同一个连接。短连接是指每次执行完很少的几次查询后就断开连接,下次查询再重新建立一个
建立连接的过程比较复杂,建议平时开发中尽量减少建立连接的操作,也就是尽量使用长连接
但全部使用长连接后,有时 MySQL 占用内存涨的很快,这是因为 MySQL 在执行过程中临时使用的内存是管理在连接对象中的。这些资源会在断开连接时才释放,所以如果长连接积累下来,可能导致内存占用过大,被系统强行杀掉(OOM),表现出的现象就是 MySQL 异常重启
解决措施:
- 定期断开长连接。使用一段时间,或者程序里面判断执行一个占用内存过大的查询后,断开连接,之后查询要重连
- 如果使用的是 MySQL 5.7 或更新的版本,可以在每次执行完一个比较大的操作后,通过执行
mysql_reset_connection
来重新初始化连接资源,这个过程不需要重连和重新做权限校验,但是会将连接恢复到刚刚创建完的状态
查询缓存
注意:MySQL 8.0 开始,查询缓存功能已经彻底删除了,因为查询缓存弊大于利
MySQL 拿到一个查询请求,会先到查询缓存中查看,之前是否执行过这条语句。之前执行过的语句及其查询结果会以 key-value 的形式,直接缓存在内存里。key 是查询的语句,value 是查询的结果。如果能在查询缓存中找到 key,那么 value 会直接返回给客户端
如果语句不在查询缓存中,会继续走后面的流程
为什么查询缓存弊大于利?
查询缓存失效的非常频繁,只要对一个表有更新,这个表上面的所有查询缓存都会被清空。这就导致缓存的命中率非常低,除非是一张静态配置表
MySQL 提供了“按需使用”的方式来使用查询缓存。将参数query_cache_type
设置成 DEMAND,这样默认的 SQL 语句不会使用查询缓存,如果有语句需要使用的时候,可以用SQL_CACHE
显式指定
select SQL_CACHE * from T where ID=10;
分析器
如果没有命中查询缓存,就要开始真正执行语句了。首先,MySQL 需要知道要做什么,因此需要对 SQL 语句做解析
分析器先会做“词法分析”。输入的是由多个字符串和空格组成的一条 SQL 语句,MySQL 需要识别出里面的字符串分别是什么,代表什么
MySQL 从输入的select
这个关键字识别出来,这是一个查询语句。它也要把字符串T
识别成表名 T
,把字符串ID
识别成列 ID
做完了这些识别以后,就要做“语法分析”。根据词法分析的结果,语法分析器会根据语法规则,判断输入的这个 SQL 语句是否满足 MySQL 语法
如果语句不对,就会收到You have an error in your SQL syntax
的错误提醒,比如下面这个语句 select 少打了开头的字母“s”
mysql> elect * from t where ID=1;
ERROR 1064 (42000): You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'elect * from t where ID=1' at line 1
优化器
分析器让 MySQL 知道了你要做什么,然后需要经过优化器处理
优化器是表中有多个索引的时候,决定使用哪个索引,或者在一个语句有多表连接(join)的时候,决定各个表的连接顺序。比如下面语句
select * from t1 join t2 using(ID) where t1.c=10 and t2.d=20;
可以先从表 t1 中取值,也可以从 t2 中取值,两种方式的逻辑效果是一样的,但是执行效率会不同,而优化器的作用就是决定选择哪一种方案 优化器阶段结束后,就会进入执行器阶段
执行器
执行器开始执行语句
但是在执行之前,要先判断一下当前连接有没有对表执行查询的权限,如果没有,就会返回没有权限的错误(如果查询的时候命中缓存了,在查询缓存返回结果时,也会做权限校验)
如果有权限,就打开表继续执行,打开表的时候,执行器就会根据表的引擎定义,去使用这个引擎提供的接口
比如这个例子中的表 T 中,ID 字段没有索引,那么执行器的执行流程是这样的:
- 调用 InnoDB 引擎接口取这个表的第一行,判断 ID 值是不是 10,如果不是则跳过,如果是则将这行存在结果集中;
- 调用引擎接口取“下一行”,重复相同的判断逻辑,直到取到这个表的最后一行。
- 执行器将上述遍历过 程中所有满足条件的行组成的记录集作为结果集返回给客户端。
至此,这个语句就执行完成了
对于有索引的表,第一次调取“取满足条件的第一行”这个接口,之后循环取“满足条件的下一行”这个接口,这些接口都是引擎中已经定义好的 在数据库的慢查询日志中能看到 rows_examined 字段,表示这个语句在执行过程中扫描了多少行,这个值是在执行器每次调用引擎获取数据行的时候累加的
在有些场景下,执行器调用一次,在引擎内部扫描了多行,因此引擎扫描行数跟 rows_examined 并不是完全相同的
日志系统:一条SQL更新语句是如何执行的
更新流程除了查询流程中的内容外还涉及到了两个重要的日志模块:redo log(重做日志)和 binlog(归档日志)
redo log
在 MySQL 中,如果每一次更新操作都写入磁盘,在磁盘中找到对应的数据然后更新,整个过程的 IO 成本、查找成本是非常高的
为了解决这个问题 MySQL 引入了 WAL 技术,全称是 Write-Ahead Logging,关键点是先写日志,后写磁盘
当有一条记录需要更新时,InnoDB 引擎会先把记录写到 redo log 中,并更新内存,这个时候更新就算完成了;InnoDB 引擎在合适的时候,讲这个操作记录更新到磁盘中,这个更新一般是系统比较空闲时做
InnoDB 的 redo log 是有固定大小的,比如可以配置为一组 4 个文件,每个文件的大小是 1GB,那么 redo log 总共可以记录 4GB 的操作 注意:redo log 是循环写的
write pos 是当前记录的位置,一边写一边向后移,写到第 3 号文件末尾后就回到 0 号文件开头
checkpoint 是要擦除的位置,也是往后推移循环往复的,擦除记录之前要把记录更新到数据文件
如果 wirte pos 追上 checkpoint,表示 redo log 写满了,这时候不能再执行新的更新操作,必须先停下来擦掉一些记录,把 checkpoint 推进一些
有了 redo log,InnoDB 可以保证即使数据库发生异常重启,之前提交的记录不丢失,这个能力称为:crash-safe
binlog
MySQL 整体来看其实就有两块:一块是 Server 层,它主要做的是 MySQL 功能层面的事;还有一块是引擎层,负责存储相关的事宜 redo log 是 InnoDB 特有的日志,binlog 是 Server 层的日志
最开始时候 MySQL 没有 InnoDB 引擎,默认是 MyISAM,InnoDB 是以插件的方式引入 MySQL的 MyISAM 引擎没有 crash-safe 能力,binlog 日志只能用于归档,所以 InnoDB 使用自己的 redo log 来实现 crash-safe 能力
两种日志的不同点:
- redo log 日志是 InnoDB 引擎特有的;binlog 是 MySQL 的 Server 层实现的,所有引擎都可以使用
- redo log 是物理日志,记录的是”在某个数据页上做了什么修改“;binlog 是逻辑日志,记录的是这个语句的原始逻辑,比如”给 ID=2 这一行的 c 字段加 1“
- redo log 是循环写的,空间固定会用完;binlog 是追加写入的。”追加写“是指 binlog 文件写到一定大小后会切换到下一个写,并不会覆盖之前的日志
执行 update 语句时的内部流程:
- 执行器先找引擎取 ID=2 这一行。ID 是主键,引擎用树搜索找到这一行。如果 ID=2 这一行的数据在内存中,就直接返回给执行器;否则,需要先从磁盘中读取到内存,然后返回
- 执行器拿到引擎返回的行数据,把这个值加上 1,得到新的一行数据,再调用引擎接口写入这行新数据
- 引擎将这行新数据更新到内存中,同时将这个更新操作记录到 redo log 中,此时 redo log 处于 prepare 状态,然后告知执行器执行完成了,随时可以提交事务
- 执行器生成这个操作的 binlog,并把 binlog 写入磁盘
- 执行器调用引擎提供的事务提交接口,引擎把刚写入的 redo log 改成提交(commit)状态,更新完成
执行步骤如下:
最后三步是经典的”两阶段提交
两阶段提交
两阶段提交是为了让两份日志之间逻辑一致
由于 redo log 和 binlog 是两个独立的逻辑,如果不用两阶段提交,要么就是先写完 redo log 再写 binlog,或者采用反过来的顺序。看看这两种方式会有什么问题
仍然用前面的 update 语句来做例子。假设当前 ID=2 的行,字段 c 的值是 0,再假设执行 update 语句过程中在写完第一个日志后,第二个日志还没有写完期间发生了 crash,会出现什么情况呢?
- 先写 redo log 后写 binlog。假设在 redo log 写完,binlog 还没有写完的时候,MySQL 进程异常重启。由于前面说过的,redo log 写完之后,系统即使崩溃,仍然能够把数据恢复回来,所以恢复后这一行 c 的值是 1。但是由于 binlog 没写完就 crash 了,这时候 binlog 里面就没有记录这个语句。因此,之后备份日志的时候,存起来的 binlog 里面就没有这条语句。然后就会发现,如果需要用这个 binlog 来恢复临时库的话,由于这个语句的 binlog 丢失,这个临时库就会少了这一次更新,恢复出来的这一行 c 的值就是 0,与原库的值不同
- 先写 binlog 后写 redo log。如果在 binlog 写完之后 crash,由于 redo log 还没写,崩溃恢复以后这个事务无效,所以这一行 c 的值是 0。但是 binlog 里面已经记录了“把 c 从 0 改成 1”这个日志。所以,在之后用 binlog 来恢复的时候就多了一个事务出来,恢复出来的这一行 c 的值就是 1,与原库的值不同
可以看到,如果不使用“两阶段提交”,那么数据库的状态就有可能和用它的日志恢复出来的库的状态不一致
事务隔离:为什么你改了我还看不见?
事务就是要保证一组数据库操作,要么全部成功,要么全部失败
MySQL 中,事务是在存储引擎层实现的,MySQL 的原生引擎 MySIAM 不支持事务
隔离性和隔离级别
当数据库上有多个事务同时执行时,就可能出现脏读、不可重复读、幻读,为了解决这些问题,就出现了”隔离级别“的概念
隔离的越彻底,效率就会越慢。很多时候都需要在二者之间找一个平衡点
SQL 标准的隔离级别包括:
- 读未提交(read uncommitted):一个事务还没提交时,它做的变更能被其他事务看到
- 读提交(read committed):一个事务提交后,它的变更才会被其他事务看到
- 可重复的(repeatable read):一个事务执行过程中看到的数据,总是跟这个事务在启动时看到的数据是一致的
- 可串行化(serializable):对于同一行记录,”写“会加”写锁“,”读“会加”读锁“。当出现读写锁冲突时,后访问的事务必须等前一个事务执行完成,才能继续执行
在实现上,数据库会创建一个视图,访问的时候以视图的逻辑结果为准
在可重复读
隔离级别下,这个视图是在事务启动时创建的,整个事务存在期间都使用这个视图
在读未提交
隔离级别下,直接返回记录上的最新值,没有视图概念
在串行化
隔离级别下,直接用加锁的方式来避免并行访问
事务隔离的实现
这里着重展开说明可重复读
在 MySQL 中,实际上每条记录在更新的时候都会同时记录一条回滚操作,记录上的最新值,通过回滚操作,都可以得到前一个状态的值 假设一个值从 1 被顺序设置成了 2 、3、4,在回滚日志里就会有如下记录
当前值是 4,但是在查询这条记录的时候,不同时刻启动的事务会有不同的 read-view
如图中,在视图 A、B、C 中,一个记录值分别是 1、2、4,同一条记录在系统中可以存在多个版本,就是数据库的多版本并发控制(MVCC) 对于 read-view A,要得到 1,就必须将当前值依次执行图中的回滚操作得到。即使现在有另外一个事务正在将 4 改成 5,这个事务跟 read-view A、B、C 对应的事务是不会冲突的
回滚日志什么时候删除呢?在不需要的时候删除。系统会判断,当没有事务需要用到这些回滚日志的时候,回滚日志会被删除
为什么尽量不要使用长事务?
长事务意味着系统中会存在很老的事务视图,由于这些事务随时可能访问数据库中的任何数据,所以事务提交之前,数据库中它可能用到的回滚记录都必须保留,这会导致占用大量存储空间
在 MySQL 5.5 及以前的版本,回滚日志是跟数据字典一起放在 ibdata 文件里的,即使长事务最终提交,回滚段被清理,文件也不会变小。我见过数据只有 20GB,而回滚段有 200GB 的库。最终只好为了清理回滚段,重建整个库
事务的启动方式
- 显示启动事务语句,
begin
或start transaction
。提交语句是commit
,回滚语句是rollback
set autocommit=0
,这个命令会把当前线程的自动提交关掉。意味着 如果你执行一个 select 语句,这个事务就启动,而且不会自动提交。这个事务持续存在到你主动执行 commit 或 rollback 语句,或断开连接
有些客户端连接框架会默认连接成功后先执行一个 set autocommit=0 的命令。这就导致接下来的查询都在事务中,如果是长连接,就导致了意外的长事务
有时候会纠结“多一次交互”的问题。对于一个需要频繁使用事务的业务,第二种方式每个事务在开始时都不需要主动执行一次 “begin”,减少了语句的交互次数。建议使用 commit work and chain 语法
在 autocommit 为 1 的情况下,用 begin 显式启动的事务,如果执行 commit 则提交事务。如果执行 commit work and chain,则是提交事务并自动启动下一个事务,这样也省去了再次执行 begin 语句的开销。同时带来的好处是从程序开发的角度明确地知道每个语句是否处于事务中
可以在 information_schema 库的 innodb_trx 这个表中查询长事务,比如下面这个语句,用于查找持续时间超过 60s 的事务
select * from information_schema.innodb_trx where TIME_TO_SEC(timediff(now(), trx_started)) > 60;
深入浅出索引
索引的出现就是为了提高查询效率,就像书的目录一样