mysql死锁解决方法

发布时间: 2023-11-21 12:51 阅读：文章来源：1MUMB4273PS

前言

最近老顾经常碰到同事说，mysql又死锁了导致业务报错。今天我们就来聊聊死锁以及怎么解决

锁类型

mysql锁级别：页级、表级、行级

表级锁：开销小，加锁快；不会出现死锁；锁定粒度大，发生锁冲突的概率最高,并发度最低。

行级锁：开销大，加锁慢；会出现死锁；锁定粒度最小，发生锁冲突的概率最低,并发度也最高。

页面锁：开销和加锁时间界于表锁和行锁之间；会出现死锁；锁定粒度界于表锁和行锁之间，并发度一般

死锁产生原因和示例1、产生原因：

死锁是指两个或两个以上的进程在执行过程中,因争夺资源而造成的一种互相等待的现象,若无外力作用，它们都将无法推进下去.此时称系统处于死锁状态或系统产生了死锁，这些永远在互相等待的进程称为死锁进程。表级锁不会产生死锁.所以解决死锁主要还是针对于最常用的InnoDB。

死锁的关键在于：两个(或以上)的Session加锁的顺序不一致。

那么对应的解决死锁问题的关键就是：让不同的session加锁有次序

2、产生示例：案例一

需求：将投资的钱拆成几份随机分配给借款人。

起初业务程序思路是这样的：

投资人投资后，将金额随机分为几份，然后随机从借款人表里面选几个，然后通过一条条ｓｅｌｅｃｔ for ｕｐｄａｔｅ去更新借款人表里面的余额等。

例如两个用户同时投资，A用户金额随机分为2份，分给借款人1，2

B用户金额随机分为2份，分给借款人2，1

由于加锁的顺序不一样，死锁当然很快就出现了。

对于这个问题的改进很简单，直接把所有分配到的借款人直接一次锁住就行了。

ｓｅｌｅｃｔ * from xxx where id in (xx,xx,xx) for ｕｐｄａｔｅ

在in里面的列表值mysql是会自动从小到大排序，加锁也是一条条从小到大加的锁

第一个会话：

注意：关闭掉自动提交set autocommit=0;

mysql> ｓｅｌｅｃｔ * from goods where goods_id in (2,3) for ｕｐｄａｔｅ;+----+--------+------+---------------------+| good_id | goods_name | price |+----+--------+------+---------------------+|2 | bbbb | 1.00 ||3 | vvv | 3.00 |+----+--------+------+---------------------+

第二个会话:

ｓｅｌｅｃｔ * from goods where goods_id in (3,4,5) for ｕｐｄａｔｅ;

锁等待中……

案例二

在开发中，经常会做这类的判断需求：根据字段值查询（有索引），如果不存在，则插入；否则更新。

以id为主键为例，目前还没有id=22的行

注意：关闭掉自动提交set autocommit=0;

第一个会话:

ｓｅｌｅｃｔ * from goods where goods_id=22 for ｕｐｄａｔｅ;

第二个会话:

ｓｅｌｅｃｔ * from goods where goods_id=23for ｕｐｄａｔｅ;

再在第一个会话:

ｉｎｓｅｒｔ into goods values(22,‘ac‘,11.5);

锁等待中……

再到第二个会话:

ｉｎｓｅｒｔ into goods values(23,‘bc‘,23.0);

ERROR 1213 (40001): Deadlock found when trying to get lock; try restarting transaction

当对存在的行进行锁的时候(主键)，mysql就只有行锁。

当对未存在的行进行锁的时候(即使条件为主键)，mysql是会锁住一段范围

锁住的范围为：

(无穷小或小于表中锁住id的最大值，无穷大或大于表中锁住id的最小值)

如一：如果表中目前有已有的id为（11 ， 12）

那么就锁住（12，无穷大）

如二：如果表中目前已有的id为（11 ， 30）

那么就锁住（11，30）

对于这种死锁的解决办法是：

ｉｎｓｅｒｔ into goods(xx,xx) on duplicate key ｕｐｄａｔｅ `xx`=‘XX‘;

用mysql特有的语法来解决此问题。因为ｉｎｓｅｒｔ语句对于主键来说，插入的行不管有没有存在，都会只有行锁

死锁检查处理

正常情况下，死锁发生时，权重最小的连接将被kill并回滚。但是为了找出语句来优化，启用可启用死锁将死锁信息记录下来。

#step 1：窗口一mysql> start transaction;mysql> ｕｐｄａｔｅ aa set name=‘aaa‘ where id = 1; #step 2：窗口二mysql> start transaction;mysql> ｕｐｄａｔｅ bb set name=‘bbb‘ where id = 1; #step 3：窗口一mysql> ｕｐｄａｔｅ bb set name=‘bbb‘;

查看方式

#step 4：窗口三#是否自动提交mysql> show variables like ‘autocommit‘;+---------------+-------+| Variable_name | Value |+---------------+-------+| autocommit| ON|+---------------+-------+ 查看当前链接#查看当前连接mysql> show processlist;mysql> show full processlist;mysql> ｓｅｌｅｃｔ * FROM INFORMATION_SCHEMA.PROCESSLIST;+----+------+-----------+------+---------+------+-------+------------------+| Id | User | Host| db| Command | Time | State | Info |+----+------+-----------+------+---------+------+-------+------------------+|4 | root | localhost | test | Sleep|244 || NULL ||5 | root | localhost | test | Sleep|111 || NULL ||6 | root | localhost | NULL | Query|0 | init| show processlist |+----+------+-----------+------+---------+------+-------+------------------+ id列:一个标识，你要kill 一个语句的时候很有用。user列: 显示当前用户，如果不是root，这个命令就只显示你权限范围内的sql语句。host列:显示这个语句是从哪个ip 的哪个端口上发出的。可用来追踪出问题语句的用户。db列:显示这个进程目前连接的是哪个数据库。command列:显示当前连接的执行的命令，一般就是休眠（sleep），查询（query），连接（connect）time列:此这个状态持续的时间，单位是秒。

这个命令中最关键的就是state列，mysql列出的状态主要有以下几种：

Checking table

正在检查数据表（这是自动的）。

Closing tables

正在将表中修改的数据刷新到磁盘中，同时正在关闭已经用完的表。这是一个很快的操作，如果不是这样的话，就应该确认磁盘空间是否已经满了或者磁盘是否正处于重负中。

Connect Out

复制从服务器正在连接主服务器。

Copying to tmp table on disk

由于临时结果集大于tmp_table_size，正在将临时表从内存存储转为磁盘存储以此节省内存。

Creating tmp table

正在创建临时表以存放部分查询结果。

deleting from main table

服务器正在执行多表删除中的第一部分，刚删除第一个表。

deleting from reference tables

服务器正在执行多表删除中的第二部分，正在删除其他表的记录。

Flushing tables

正在执行FLUSH TABLES，等待其他线程关闭数据表。

Killed

发送了一个kill请求给某线程，那么这个线程将会检查kill标志位，同时会放弃下一个kill请求。MySQL会在每次的主循环中检查kill标志位，不过有些情况下该线程可能会过一小段才能死掉。如果该线程程被其他线程锁住了，那么kill请求会在锁释放时马上生效。

Locked

被其他查询锁住了。

Sending data

正在处理ｓｅｌｅｃｔ查询的记录，同时正在把结果发送给客户端。

Sorting for group

正在为GROUP BY做排序。

Sorting for order

正在为ORDER BY做排序。

Opening tables

这个过程应该会很快，除非受到其他因素的干扰。例如，在执ALTER TABLE或LOCK TABLE语句行完以前，数据表无法被其他线程打开。正尝试打开一个表。

Removing duplicates

正在执行一个ｓｅｌｅｃｔ DISTINCT方式的查询，但是MySQL无法在前一个阶段优化掉那些重复的记录。因此，MySQL需要再次去掉重复的记录，然后再把结果发送给客户端。

Reopen table

获得了对一个表的锁，但是必须在表结构修改之后才能获得这个锁。已经释放锁，关闭数据表，正尝试重新打开数据表。

Repair by sorting

修复指令正在排序以创建索引。

Repair with keycache

修复指令正在利用索引缓存一个一个地创建新索引。它会比Repair by sorting慢些。

Searching rows for ｕｐｄａｔｅ

正在讲符合条件的记录找出来以备更新。它必须在ｕｐｄａｔｅ要修改相关的记录之前就完成了。

Sleeping

正在等待客户端发送新请求.

System lock

正在等待取得一个外部的系统锁。如果当前没有运行多个mysqld服务器同时请求同一个表，那么可以通过增加--skip-external-locking参数来禁止外部系统锁。

Upgrading lock

ｉｎｓｅｒｔ DELAYED正在尝试取得一个锁表以插入新记录。

Updating

正在搜索匹配的记录，并且修改它们。

User Lock

正在等待GET_LOCK()。

Waiting for tables

该线程得到通知，数据表结构已经被修改了，需要重新打开数据表以取得新的结构。然后，为了能的重新打开数据表，必须等到所有其他线程关闭这个表。以下几种情况下会产生这个通知：FLUSH TABLES tbl_name, ALTER TABLE, ｒｅｎａｍｅ TABLE, REPAIR TABLE, ANALYZE TABLE,或OPTIMIZE TABLE。

Waiting for handler ｉｎｓｅｒｔ

ｉｎｓｅｒｔ DELAYED已经处理完了所有待处理的插入操作，正在等待新的请求。

查看当前正在被锁的事务 #查看当前正在被锁的事务（锁请求超时后则查不到）mysql> ｓｅｌｅｃｔ * FROM INFORMATION_SCHEMA.INNODB_LOCKS;+------------------+-------------+-----------+-----------+-------------+-----------------+------------+-----------+----------+----------------+| lock_id| lock_trx_id | lock_mode | lock_type | lock_table| lock_index| lock_space | lock_page | lock_rec | lock_data|+------------------+-------------+-----------+-----------+-------------+-----------------+------------+-----------+----------+----------------+| 130718495:65:3:4 | 130718495| X | RECORD| `test`.`bb` | GEN_CLUST_INDEX | 65 | 3 |4 | 0x000000000300 || 130718496:65:3:4 | 130718496| X | RECORD| `test`.`bb` | GEN_CLUST_INDEX | 65 | 3 |4 | 0x000000000300 |+------------------+-------------+-----------+-----------+-------------+-----------------+------------+-----------+----------+----------------+ 查看当前等待锁的事务#查看当前等待锁的事务（锁请求超时后则查不到）mysql> ｓｅｌｅｃｔ * FROM INFORMATION_SCHEMA.INNODB_LOCK_WAITS; +-------------------+-------------------+-----------------+------------------+| requesting_trx_id | requested_lock_id | blocking_trx_id | blocking_lock_id |+-------------------+-------------------+-----------------+------------------+| 130718499 | 130718499:65:3:4| 130718500| 130718500:65:3:4 |+-------------------+-------------------+-----------------+------------------+ 查看当前未提交的事务 #查看当前未提交的事务（如果死锁等待超时,事务可能还没有关闭）mysql> ｓｅｌｅｃｔ * FROM INFORMATION_SCHEMA.INNODB_TRX;

主要看箭头指向的这几个字段，如果有阻塞数据（不为0的就是阻塞的）,找到后在根据下图这个字段：try_mysql_thread_id 作为这条数据的主键id执行这个sql进行删除： kill id ;(杀死对应id的进程).假设这里try_mysql_thread_id=14的这条数据是锁了。我们执行 kill 14删除就不再锁表了。

查看正在被访问的表#查看正在被访问的表mysql> show OPEN TABLES where In_use > 0;+----------+-------+--------+-------------+| Database | Table | In_use | Name_locked |+----------+-------+--------+-------------+| test | bb|1 |0 |+----------+-------+--------+-------------+死锁异常#step 3：窗口一（若第三步中锁请求太久，则出现锁超时而终止执行）mysql> ｕｐｄａｔｅ bb set name=‘bbb‘;ERROR 1205 (HY000): Lock wait timeout exceeded; try restarting transaction #"窗口一" 锁请求超时前，执行第五步，使死锁产生，则该连接 "窗口二" 执行终止，"窗口一" 顺利执行#step 5：窗口二mysql> ｕｐｄａｔｅ aa set name=‘aa‘;ERROR 1213 (40001): Deadlock found when trying to get lock; try restarting transaction查看最近一个死锁情况mysql> SHOW ENGINE INNODB STATUS;

相关参数配置死锁日志#死锁记录只记录最近一个死锁信息，若要将每个死锁信息都保存到错误日志，启用以下参数：mysql> show variables like ‘innodb_print_all_deadlocks‘;+----------------------------+-------+| Variable_name| Value |+----------------------------+-------+| innodb_print_all_deadlocks | OFF|+----------------------------+-------+ 锁等待超时 #上面【step 3：窗口一】若一直请求不到资源，默认50秒则出现锁等待超时。mysql> show variables like ‘innodb_lock_wait_timeout‘; +--------------------------+-------+| Variable_name| Value |+--------------------------+-------+| innodb_lock_wait_timeout | 50|+--------------------------+-------+ ERROR 1205 (HY000): Lock wait timeout exceeded; try restarting transaction #设置全局变量锁等待超时为60秒（新的连接生效）#mysql> set session innodb_lock_wait_timeout=50; mysql> set global innodb_lock_wait_timeout=60; 事务回滚 #上面测试中，当事务中的某个语句超时只回滚该语句，事务的完整性属于被破坏了。为了回滚这个事务，启用以下参数：mysql> show variables like ‘innodb_rollback_on_timeout‘;+----------------------------+-------+| Variable_name| Value |+----------------------------+-------+| innodb_rollback_on_timeout | OFF|+----------------------------+-------+

最终参数设置如下：(重启服务重新连接测试)

[mysqld]log-error =/var/log/mysqld3306.loginnodb_lock_wait_timeout=60 #锁请求超时时间(秒)innodb_rollback_on_timeout = 1#事务中某个语句锁请求超时将回滚真个事务innodb_print_all_deadlocks = 1#死锁都保存到错误日志Command=‘Sleep‘

表示连接休眠，如果太多，可以手动删除

#若手动删除堵塞会话，删除 Command=‘Sleep‘ 、无State、无Info、trx_weight 权重最小的。show processlist;ｓｅｌｅｃｔ trx_mysql_thread_id,trx_state,trx_started,trx_weight FROM INFORMATION_SCHEMA.INNODB_TRX;总结

上面是老顾总结的mysql死锁相关的内容，尤其是死锁检查处理，是比较实用的，小伙伴们可以参考。

mysql死锁解决方法

mysql存储优化方法

mysql填充数据的方法

mysql分布式事务解决方案

mysql间隙锁解决幻读

mysql安装失败原因和解决方法

docker安装homeassistant没有加载项

mysql唯一约束怎么写

MySQL数据库菜鸟教程

mysql优化器如何选择索引

docker安装alist

mysql的关键字有哪些

mysql前缀索引如何创建

mysql密码忘了怎么重置