MySQL分割数据
引言一般来说讲,提到数据拆分,可以归结为两个层面:一是垂直拆分,二是水平拆分。这里我们来讨论下垂直拆分。垂直拆分是以数据库、表、列等为单位进行拆分的方法。正文MySQL里垂直拆分可以细分为:垂直拆库(...
2024.11.15此账号为华为云开发者社区官方运营账号,提供全面深入的云计算前景分析、丰富的技术干货、程序样例,分享华为云前沿资讯动态
本文分享自华为云社区《【数据库事务与锁机制】- 事务的隔离级别》,原文作者:技术火炬手。
事务这个词来自于英语中的 transactional 这个词的翻译,这个词的含义更多的是指“交易”。在数据库系统或者软件系统中我们通常 称 transactional 为事务。
数据库事务的四个特性 ACID。分别是 原子性、一致性、隔离性、持久性。数据库事务的这四大特性来源于 ISO 标准的 ISO/IEC 10026-1:1992/COR 1:1996,它定义了事务需要具备以上四个特性。那么在 InnoDB 中是如何实现这些特征的呢?下面内容我们讨论 MySQL (下指 InnoDB 引擎)对事务特性的支持是怎么实现的。
讨论 MySQL 的事务处理特性的实现原理之前我们需要先了解下 MySQL 对 MVCC 的支持,关于 MVCC 维基百科有如下解释。
多版本并发控制(Multiversionconcurrency control, MCC 或 MVCC),是数据库管理系统常用的一种并发控制,也用于程序设计语言实现事务内存。MVCC 意图解决读写锁造成的多个、长时间的读操作饿死写操作问题。每个事务读到的数据项都是一个历史快照(snapshot)并依赖于实现的隔离级别。写操作不覆盖已有数据项,而是创建一个新的版本,直至所在操作提交时才变为可见。快照隔离使得事物看到它启动时的数据状态。
数据库事务的隔离级别为了实现事务的隔离性,ISO 标准组织对事务锁需要实现的隔离级别有四种定义,下面我们先对四种事务隔离的级别简单阐述一下。
READ UNCOMMITTED 读未提交RU(READ UNCOMMITTED) 被称为读未提交,有些资料称之为浏览稳定(browse access)但是正确的翻译应该是未提交读。RU 是最低标准的隔离,未提交读的意思就是在事务并发的情况下,可以容许一个事务在没有提交修改的的情况下被另外一个事务读取到这个修改,这就就会产生脏读的情况。下面这个表格是各个事务隔离级别对于脏读、幻读、可重复读的抑制情况,事实上 RU 不但会产生脏读的情况而且其他两种读的情况都会发生。
首先我们有必要澄清一下以上三种数据读问题的概念,对于数据库事务来说我们简单的认识是一系列的数据库操作在一个事务中,这个事务要不全部成功要不全部失败,但是要知道数据库在实际使用的过程中不是串行的,它是并发的,串行场景下我们事先事务就非常简单了,就是一个一个操作嘛,大家排队执行。但是在并发事务的场景下就会出现对同一个数据的竞争问题,简单的理解就是你也要读写这个数据,我也要读写这个数据,那么大家多个事务操作一个数据的时候怎么保证数据的一致和完整?这个时候就会出现数据的脏读、幻读、重复读问题。
脏读当一个事务允许读取另外一个事务修改但未提交的数据时,就可能发生脏读(dirty reads)
脏读是指多个事务同时读写一个数据,当事务 1 中修改和读取数据 A 时,事务 2 对数据 A 做了修改,然后这个修改反映到了事务 A 中。
我们试想有这样的场景,假如两个事务都在操作金额表中的同一条记录,事务 A 需要获得到当前金额值然后给他做加 3 的操作(用于买黄瓜),原来这个金额的值是 5,但是此时事务 B 将这条数据的金额修改成了 8,然后这个修改被事务 A 拿到然后在 8 的基础上加了 3 等于 11。但是万万没想到在 A 事务做完这个操作以后 B 事务回滚了(反悔了,香蕉的钱没给)。这个时候 A 事务完成以后账户的金额莫名其妙的变成了 11,但是事实上应该是 8。这也就是脏读的情况。
不可重复读在一次事务中,当一行数据获取两遍得到不同的结果表示发生了不可重复读(non-repeatable reads)
在理解不可重复读之前先理解什么是可重复读,可重复读的意思就是在一个事务中对同一个数据的多次读取其结果应该是相同的(在这个事务中没有修改它的值)。那么反过来的意思就是在一个事务中对一个数据的多次读取的值是不一样的,什么情况下会出现不可重复读呢?
还是上面的例子,假如事务 A 在做加 3 操作之前先读取了原来的值也就是 5,然后继续其他操作,这个时候事务 B 对这条记录进行了加 3 的操作然后提交了,当事务 A 再次读这个值的时候发现当前值变成了 8,这个时候前后两次的值完全不一样,这也就是不可重复读。
不可重复读是针对单个事务来说的,也就是在一个事务中是否可以对一条数据做重复的读取,如果不能,那么也就意味着不满足可重复读的要求。
不可重复读和脏读非常类似,但是两者是有区别的脏读是指事务 2 没有提交这个修改就被事务 1 获取到了修改后的值,而不可重复读是指提交了修改以后产生了不一致的情况。
幻读在事务执行过程中,当两个完全相同的查询语句执行得到不同的结果集。这种现象称为幻读(phantom read)
幻读实际上是不可重读的一种场景,比如在事务 1 中,第一次按照某个条件读取到了 3 条数据,但是此时事务 2 在这个表中添加了一条满足此条件的数据,在事务 1 第二次读的时候发现多了一条数据(反过来就是少了一条数据),这时候对于事务 1 来说就有点莫名其妙了,貌似产生了幻觉(发多货了),所以称之为幻读。
所以针对未提交读这种隔离级别,这三种读问题都有可能产生,所以它是级别最低的事务隔离。
READ COMMITTED 读提交RC(READ COMMITTED) 读提交是指在提交以后可以读,有些资料称之为提交读(国内翻译也是醉了)。提交读主要针对的场景是 update 语句,就是针对更新只有提交了以后才能读,试想一下在上面介绍脏读的时候,如果事务 2 在修改完金额以后提交了这个值而不是回滚,那么久没有脏读的情况。
这也就是为什么提交读只能解决脏读的问题而不能解决其他两种读的问题。因为很显然就算事务 2 提交了这次修改,那么对于事务 1 来说前后两次的读取都是不一致的(不可重复读),当然幻读的场景更是存在了,因为幻读本来就是不可重复读的特殊场景。
REPEATABLE READS 可重复读RR(REPEATABLE READS)可重复读是仅次于 SERIALIZABLE(串行化)的一种事务隔离级别,通常可重复读是通过锁实现的,它避免不了幻读的产生。在 InnoDB 中默认采用 RR 这种事务隔离级别,但是和其他数据库不同的是 InnoDB 在在 RR 的事务隔离级别下采用了 NKL 的锁算法(Next-Key Lock),避免了幻读的产生。这与其他数据库不同,所以在 InnoDB 中 RR 的事务隔离级别达到了串行化的事务隔离标准。
NKL 是指锁定一个范围和数据本身,而不是只单单锁定数据本身,这样能够避免幻读的产生,官方文档
SERIALIZABLE 可串行化是最高级别的事务隔离,按照定义是指所有事务都按照串行化进行执行,也就是没有并发事务的产生,这样就避免了所有读问题,但是这对于数据库来说是不可能的,因为任何一个数据库都不能忍受这种情况,所以大多数人认为采用这种事务隔离级别会对性能产生非常大的影响,但是有些论文通过实验得出串行化并不会对性能产生太大的影响。
关于串行化是不是对性能产生影响,这取决于数据库对这种事务隔离级别的实现,不能完全说串行就一定慢,反正我是不知道是不是真的对性能影响很大
MySQL 数据库事务隔离级别查询和修改查询事务隔离级别在 MySQL 中我们可以通过以下方式查询数据库采用的事务隔离级别
show variables like ‘%tx_isolation%‘; # 查询回话的事务隔离级别select @@session.tx_isolation;#查看全局的隔离级别select @@global.tx_isolation;修改事务隔离级别MySQL 提供了 SET TRANSACTION 语句,该语句可以改变单个会话或全局的事务隔离级别。语法格式如下:
SET [SESSION | GLOBAL] TRANSACTION ISOLATION LEVEL {READ UNCOMMITTED | READ COMMITTED | REPEATABLE READ | SERIALIZABLE}其中,SESSION 和 GLOBAL 关键字用来指定修改的事务隔离级别的范围
SESSION:表示修改的事务隔离级别将应用于当前 session(当前 cmd 窗口)内的所有事务;GLOBAL:表示修改的事务隔离级别将应用于所有 session(全局)中的所有事务,且当前已经存在的 session 不受影响;如果省略 SESSION 和 GLOBAL,表示修改的事务隔离级别将应用于当前 session 内的下一个还未开始的事务。
任何用户都能改变会话的事务隔离级别,但是只有拥有 SUPER 权限的用户才能改变全局的事务隔离级别
JDBC 修改当前连接的隔离级别connection.setTransactionIsolation(Connection.TRANSACTION_READ_UNCOMMITTED);
引言一般来说讲,提到数据拆分,可以归结为两个层面:一是垂直拆分,二是水平拆分。这里我们来讨论下垂直拆分。垂直拆分是以数据库、表、列等为单位进行拆分的方法。正文MySQL里垂直拆分可以细分为:垂直拆库(...
2024.11.15文章来源:https://blog.csdn.net/qq_39390545/article/details/106414765原文作者:陈哈哈select * from table where us...
2024.11.15分表MySQL 的分表是真正的分表,一张表分成很多表后,每一个小表都是完整的一张表,都对应三个文件,一个.MYD数据文件,.MYI索引文件,.frm表结构文件。分区一张大表进行分区后,它还是一张表,不...
2024.11.15聚簇索引就是innodb默认创建的基于主键的索引结构,而且表里的数据就是直接放在聚簇索引里,作为叶节点的数据页:基于主键的数据搜索:从聚簇索引的根节点开始进行二分查找,一路找到对应数据页,基于页目录就...
2024.11.15概述MySQL中的事务,默认是自动提交的,即autocommit = 1;但是这样的话,在某些情形中就会出现问题:比如:如果你想一次性插入了1000条数据,mysql会commit1000次的,这时候...
2024.11.15