mysql数据对比工具
导读:笔者最近在采用 trino 代替旧有方案进行媒体接口数据拉取。需通过将 trino 拉取的数据入到测试库,并与旧方案拉取到生产库中的数据进行对比从而验证逻辑准确性。在进行数据对比时为提高效率因此...
2024.11.15我们知道MySQL Innodb 对于索引长度的限制为 767 字节,并且UTF8mb4字符集是4字节字符集,则 767字节 / 4字节每字符 = 191字符(默认索引最大长度),所以在varchar(255)或char(255) 类型字段上创建索引会失败,提示最大索引长度为767字节。
那么怎么去计算mysql数据库索引长度呢?
实验测试先看网上一道题目,针对表t,包含了三个字段a、b、c,假设其默认值都非空,现创建组合索引index(a,b,c) 分析select * from t where a=1 and c=1 和select * from t where a=1 and b=1区别?
1、创建表
create table t(a int(5) not null,b int(5) not null,c int(2) not null);create index idx_all on t(a,b,c);2、分别执行这两条语句
mysql> explain select * from t where a=1 and c=1;mysql> explain select * from t where a=1 and b=1;3、思路
这里可以发现,前面两个的区别主要是在于key_len上,我的理解是:
将组合索引想成书的一级目录、二级目录、三级目录,如index(a,b,c),相当于a是一级目录,b是一级目录下的二级目录,c是二级目录下的三级目录。要使用某一目录,必须先使用其上级目录,除了一级目录除外。
所以
where a=1 and c=1只使用了一级目录,c在三级目录,没有使用二级目录,那么三级目录就没法使用
where a=1 and b=1只使用了一级目录、二级目录。
于是第二条查询的key_len更大。
但是,具体key_len怎么计算的,上面怎样计算出是4和8的呢?
4、key_len的计算.
1.所有的索引字段,如果没有设置not null,则需要加一个字节。
2.定长字段,int占四个字节、date占三个字节、char(n)占n个字符。
3.对于变成字段varchar(n),则有n个字符+两个字节。
4.不同的字符集,一个字符占用的字节数不同。latin1编码的,一个字符占用一个字节,gbk编码的,一个字符占用两个字节,utf8编码的,一个字符占用三个字节。
5.索引长度 char()、varchar()索引长度的计算公式:
(Character Set:utf8mb4=4,utf8=3,gbk=2,latin1=1) * 列长度 + 1(允许null) + 2(变长列)
所以从上面可以得出
where a=1 and c=1而言,key_len=4
where a=1 and b=1而言,key_len=4+4=8
5、创建新的测试表t2
创建一个t2表,数据结构如下
create table t2(id int(5) not null,name varchar(5) not null) engine=innodb default charset=latin1;create index idx_2 on t2(id,name);6、计算key_len
explain select * from t2 where name="001" and id=1;分析key_len=4+5*1+2=11,因为字段都是not null,int类型4个字节,varchar(5) 占用5个字符+2个字节,latin1编码的表一个字符占1个字节,故varchar(5) 占用7个字节。
总结因为MySQL具有查询优化器,所以对where a=1 and c=1类型的查询,字段顺序没有任何影响,查询优化器会自动优化。where c=1 and a=1会被优化成where a=1 and c=1,但是建议还是使用where a=1 and c=1吧,便于理解以及查询缓冲。
后面会分享更多devops和DBA方面的内容,感兴趣的朋友可以关注一下~
导读:笔者最近在采用 trino 代替旧有方案进行媒体接口数据拉取。需通过将 trino 拉取的数据入到测试库,并与旧方案拉取到生产库中的数据进行对比从而验证逻辑准确性。在进行数据对比时为提高效率因此...
2024.11.15构建数据库写程序避免不了使用日期和时间,对于数据库来说,有多种日期时间字段可供选择,如 timestamp 和 datetime 以及使用 int 来存储 unix timestamp。经常会有人用字...
2024.11.15MySQL是一个关系型数据库管理系统,由瑞典MySQL AB 公司开发,目前属于 Oracle 旗下产品。MySQL 是最流行的关系型数据库管理系统之一,在 WEB 应用方面,MySQL是最好的 RD...
2024.11.15阿里云关系型数据库RDS(Relational Database Service)是一种稳定可靠、可弹性伸缩的在线数据库服务。基于阿里云分布式文件系统和SSD盘高性能存储,RDS支持MySQL、SQL...
2024.11.151.MySQL主从同步简介:MySQL实例主从配置,可以实现数据同步、备份、读写分离、容灾:可以在主库挂掉后从备用从库中选举新Master进行数据恢复动作。MySQL主从同步方案2.MySQL支持三种...
2024.11.15