我所理解的MySQL系列·第4篇·事务与隔离级别全解

2020/10/25 MySQL 共 5797 字,约 17 分钟

MySQL 系列的第四篇,主要内容是事务,包括事务 ACID 特性、隔离级别、脏读、不可重复读以及对幻读的详解等内容。

mysql-4-封面

直入正题,首先事务(Transaction)能够保证一组不可分割的原子性操作集合要么都执行,要么都不执行。在MySQL 常用的存储引擎中,InnoDB 是支持事务的,原生的 MyISAM 引擎则不支持事务。

在本文中,若未特殊说明,使用的数据表及数据如下所示:

CREATE TABLE `user`  (
  `id` int(11) DEFAULT NULL,
  `name` varchar(12) DEFAULT NULL
) ENGINE = InnoDB;

insert into user values(1, '刺猬');

1. ACID 四大特性

首先需要理解的是事务 ACID 四大特性,即原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)、持久性(Durability),这也是事务的四个基本要素。

为了详细解释 ACID 特性,在这里先设想一个场景:我向你转账100元。

假设这个操作可以分为以下几步(假设我和你的账户余额均为100元):

  1. 查询我的账户余额
  2. 我的账户扣款100元
  3. 100元开始转移
  4. 查询你的账户余额
  5. 你的账户到账100元

1.1 原子性(Atomicity)

事务的原子性是指:一个事务必须是不可再分割的最小工作单元,一个事务中的操作要么都成功,要么都失败,不可能存在只执行一个事务中部分操作的情况。

在上述的转账场景中,原子性就要求了这五个步骤要么都执行,要么都不执行,不可能存在我的账户扣款100元,而你的账户100元没有到账的情况。

1.2 一致性(Consistency)

事务的一致性是指:数据库总是从一个一致性状态转换到另一个一致性状态,一致性侧重的是数据的可见性,数据的中间状态对外是不可见的。

同时,事务的一致性要求符合开发人员定义的约束,如金额大于0、身高大于0等。

在上述的转账场景中,一致性能够保证最终执行完整个转账操作后,我账户的扣款金额与你账户到账金额是一致的,同时如果我和你的账户余额不满足金额的约束(如小于0),整个事务会回滚。

1.3 隔离性(Isolation)

事务的隔离性是指:在一次状态转换过程中不会受到其他状态转换的影响。

假设我和你都有100元,我发起两次转账,转账金额都是50元,下面使用伪代码来表示的操作步骤:

  1. 查询我的账户余额 read my
  2. 我的账户扣款50元 my=my-50
  3. 50元开始转移
  4. 查询你的账户余额 read yours
  5. 你的账户到账50元 yours=yours+50

如果未保证隔离性就可能发生下面的情况:

时刻第一次转账第二次转账我的账户余额你的账户余额
1read my(100) my=100yours=100
2 read my(100)my=100yours=100
3my=my-50=100-50=50 my=50yours=100
4read yours(100)my=my-50=100-50=50my=50yours=100
5yours=yours+50=100+50=150 my=50yours=150
6 read yours(150)my=50yours=150
7 yours=yours+50=150+50=200my=50yours=200
7endendmy=50yours=200

两次转账后,最终的结果是我的账户余额为50元,你的账户余额为200元,这显然是不对的。

而如果在保证事务隔离性的情况下,就不会发生上面的情况,损失的只是一定程度上的一致性。

1.4 持久性(Durability)

事务的持久性是指:事务在提交以后,它所做的修改就会被永久保存到数据库。

在上述的转账场景中,持久性就保证了在转账成功之后,我的账户余额为0,你的账户余额为200。

2. 自动提交与隐式提交

2.1 自动提交

在 MySQL 中,我们可以通过 begin 或 start transaction 来开启事务,通过 commit 来关闭事务,如果 SQL 语句中没有这两个命令,默认情况下每一条 SQL 都是一个独立的事务,在执行完成后自动提交

比如:

update user set name='重塑' where id=1;

假设我只执行这一条更新语句,在我关闭 MySQL 客户端然后重新打开一个新的客户端后,可以看到 user 表中的 name 字段值全变成了「重塑」,这也印证了这条更新语句在执行后已被自动提交。

自动提交是 MySQL 的一个默认属性,可以通过 SHOW VARIABLES LIKE 'autocommit' 语句来查看,当它的值为 ON 时,就代表开启事务的自动提交。

mysql> SHOW VARIABLES LIKE 'autocommit';
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| autocommit    | ON    |
+---------------+-------+
1 row in set (0.00 sec)

我们可以通过 SET autocommit = OFF 来关闭事务的自动提交。

2.2 隐式提交

然而,即便我们已经将 autocommit 变量的值改为 OFF 关闭事务自动提交了,在执行某些 SQL 语句的时候,MySQL 还是会将事务自动提交掉,这被称为隐式提交

会触发隐式提交的 SQL 语句有:

  • DDL(Data definition language,数据定义语言),如 create, drop, alter, truncate
  • 修改 MySQL 自带表数据的语句,如 create/drop user, grant, set password
  • 在一个事务中,开启一个新的事务,会隐式提交上一个事务,如:
时刻事务A事务B事务B查询结果
1begin;  
2update user set name=’重塑’ where id=1;  
3 select name from user where id=1;(N1)刺猬
4begin;  
5 select name from user where id=1;(N2)重塑

在事务B中有两个查询语句N1和N2,执行的结果是N1=刺猬,N2=重塑,由此可以证明。

  • 其他还有一些管理语句就不一一举例了,可自行百度。

3. 隔离级别

事务的隔离级别规定了一个事务中所做的修改,在事务内和事务间的可见性。较低级别的隔离通常可以执行更高的并发,系统开销也更低。

在 SQL 标准中定义了四种事务的隔离级别,分别是读未提交(Read Uncommitted)、读已提交(Read Committed)、可重复读(Repeatable Read)、可串行化(Serializable)。

为了详细解释这四种隔离级别及它们各自发生的现象,假设有两个事务即将执行,执行内容如下表:

时刻事务A事务B
1begin; 
2 begin;
3 update user set name=’重塑’ where id=1;
4select name from user where id=1;(N1) 
5 commit;
6select name from user where id=1;(N2) 
7commit; 
8select name from user where id=1;(N3) 

在事务A和事务B执行的过程中,有三处查询 N1,N2,N3,在每个隔离级别下,它们值的情况是不同的,下面分别讨论。

3.1 读未提交(Read Uncommitted)

在读未提交的隔离级别下,事务中的修改,即便没有提交,对其他事务也都是可见的

在上述场景中,若数据库的隔离级别为读未提交,由于事务A可以读取未提交事务B修改后的数据,即时刻3中事务B的修改对事务A可见,所以N1=重塑,N2=重塑,N3=重塑。

3.2 读已提交(Read Committed)

在读已提交的隔离级别下,事务中的修改只有在提交之后,才会对其他事务可见

在上述场景中,若数据库的隔离级别为读已提交,由于事务A只能读取事务B提交后的数据,即时刻3中事务B的修改对事务A不可见,N2处的查询在事务B提交之后,故对事务A可见。所以N1=刺猬,N2=重塑,N3=重塑。

3.3 可重复读(Repeatable Read)

可重复读是 MySQL 的默认事务隔离级别。在可重复读的隔离级别下,一个事务中多次查询相同的记录,结果总是一致的

在上述场景中,若数据库的隔离级别为可重复读,由于查询N1和N2在一个事务中,所以它们的值都是「刺猬」,而N3是在事务A提交以后再进行的查询,对事务B的修改是可见的,所以N3=重塑。

3.4 可串行化(Serializable)

在可串行化的隔离级别下,事务都是串行执行的,读会加读锁,写会加写锁,事务不会并发执行,所以也就不会发生异常情况。

在上述场景中,若数据库的隔离级别为可串行化,首先开启事务A,在开启事务B时被阻塞,直到事务A提交之后才会开启事务B,所以N1=刺猬,N2=刺猬。而N3处的查询会在事务B提交之后才执行(事务B先被阻塞,执行顺序在N3查询语句之前),所以N3=重塑。

4. 隔离级别导致的问题

在不同的事务隔离级别中,如果遇到事务并发执行,就会出现很多问题,如脏读(Dirty Read)、不可重复读(Non-Repeatable Read)、幻读(Phantom Read)等,下面就分别用不同的例子来详细说明这些问题。

4.1 脏读(Dirty Read)

脏读(Dirty Read)是指一个事务可以读取另一个未提交事务修改的数据。

看下面的案例,假设隔离级别为读未提交:

时刻事务A事务B事务A查询结果
1begin;  
2 begin; 
3 update user set name=’重塑’ where id=1; 
4select name from user where id=1;(N1) 刺猬
5 rollback; 
6select name from user where id=1;(N2) 重塑
7commit;  

在读未提交的隔离级别下,N1的值是「重塑」,由于事务B的回滚,N2的值是「刺猬」。这里在N1处就发生了脏读,显然N1处的查询结果是一个脏数据,会对正常业务产生影响。

脏读会发生在读未提交的隔离级别中。

4.2 不可重复读(Non-Repeatable Read)

不可重复读(Non-Repeatable Read)是指,两次执行相同的查询可能会得到不一样的结果。

继续使用介绍隔离级别时的AB事务案例,同时假设隔离级别为读已提交:

时刻事务A事务B事务A查询结果
1begin;  
2 begin; 
3 update user set name=’重塑’ where id=1; 
4select name from user where id=1;(N1) 刺猬
5 commit; 
6select name from user where id=1;(N2) 重塑
7commit;  
8select name from user where id=1;(N3) 重塑

在读已提交的隔离级别下,事务可以读取到其他事务提交的数据。在上述案例中结果是N1=刺猬,N2=重塑,N3=重塑,在事务A中,有两次相同的查询N1和N2,但是这两次查询的结果并不相同,这就发生了不可重复读。

不可重复读会发生在读未提交、读已提交的隔离级别中。

4.3 幻读(Phantom Read)

幻读(Phantom Read)是指,一个事务在读取某个范围内记录时,另外一个事务在该范围内插入一条新记录,当之前的事务再次读取这个范围的记录时,会读到这条新记录。

看下面的案例,假设此时隔离级别为可重复读:

时刻事务A事务B事务A查询结果
1begin;  
2select name from user;(N1) 刺猬
3 begin; 
4 insert into user values(2, ‘五条人’); 
5 commit; 
6select name from user;(N2) 刺猬
7update user set name=concat(name,id); Affected rows: 2
8select name from user;(N3) 刺猬, 五条人
9commit;  

事务A有三次查询,在N1和N2之间,事务B执行了一条 insert语句并提交,在N1和N3之间,事务A执行了一条update 语句。

N1处的结果很显然只有「刺猬」,N2处的结果由于事务A开启在事务B之前,所以也是「刺猬」,而N3处的结果理论上在可重复读的隔离级别中也应该只有「刺猬」,但实际上N3的结果是「刺猬」和「五条人」,这里就发生了幻读。

这就很奇怪了,不是说可重复读的隔离级别能够保证一个事务中多次查询相同的记录,结果总是一致的吗?这种结果并不满足可重复读的定义。

其实这里N3的查询语句的结果是因为第7行的 update 语句将数据的最新版本读取到了。在可重复读的隔离级别下,如果使用的是当前读,那么就可能发生幻读现象。当前读和快照读会在后面介绍事务的实现原理及 MVCC 时讨论,这里先给一个结论。

幻读会发生在读未提交、读已提交、可重复读的隔离级别中。

这里需要额外注意的是:幻读和不可重复读都是说在一个事务中的同一个查询语句结果不同,但幻读更侧重于查询到其他事务新插入的数据(insert)或其他事务删除的数据(delete),而不可重复读的范围更广,只要结果不同就可以认为是不可重复读,但一般我们认为不可重复读更侧重于其他事务对数据的更新(update)。

4.4 小结

通过上面的描述,我们已经知道四种隔离级别的概念以及它们分别会遇到的问题,事务的隔离级别越高,隔离性就越强,所遇到的问题也就越少。但同时,隔离级别越高,并发能力就越弱。

下表是对隔离级别的概念不同隔离级别会发生的问题情况的小结:

隔离级别脏读不可重复读幻读概念
读未提交事务中的修改,即便没有提交,对其他事务也都是可见的
读已提交 事务中的修改只有在提交之后,才会对其他事务可见
可重复读  一个事务中多次查询相同的记录,结果总是一致的
可串行化   事务都是串行执行的,读会加读锁,写会加写锁

5. 温故知新

  1. 事务的ACID四大特性
  2. 自动提交与隐式提交
  3. 事务的隔离级别
  4. 事务各个隔离级别可能出现的问题

6. 参考资料

最后,本文收录于个人语雀知识库: 我所理解的后端技术,欢迎来访。

文档信息

Search

    Table of Contents