漫谈SQL优化

/ 原创 / 没有评论 / 470浏览

1. 前言

随着业务量的增长,用户数越来越多,随之产生的数据也呈几何级增长,从而慢查询越来越多。SQL优化一方面是找出系统的瓶颈,提高数据库服务器的整体性能,而另一方面需要合理的结构设计和参数调整,以提数据访问的速度,同时还要尽可能的节约系统资源,以便让系统性能最大化。

本文内容主要针对的是关系型数据库,以MySQL为例子

2. 需要准备的知识点

2.1 数据逻辑架构

架构图

2.2 锁

数据库通过锁机制来解决并发场景-共享锁(读锁)和排他锁(写锁)。读锁是不阻塞的,多个客户端可以在同一时刻读取同一个资源。写锁是排他的,并且会阻塞其他的读锁和写锁。简单提下乐观锁和悲观锁。

但是MySQL的存储引擎的真实实现不是简单的行级锁,一般都是实现了多版本并发控制(MVCC)。MVCC是行级锁的变种,多数情况下避免了加锁操作,开销更低。MVCC是通过保存数据的某个时间点快照实现的。

2.3 事务

事务保证一组原子性的操作,要么全部成功,要么全部失败。一旦失败,回滚之前的所有操作。

隔离级别控制了一个事务中的修改,哪些在事务内和事务间是可见的。四种常见的隔离级别:

2.4 常用存储引擎

3. 优化

3.1 优化方法

优化方法

3.2 软优化

3.2.1 查询语句优化

EXPLAIN命令分析一条查询语句的执行信息

EXPLAIN SELECT * FROM `user`

3.2.2 优化子查询

在MySQL中,尽量使用JOIN来代替子查询。因为子查询需要嵌套查询,嵌套查询时会建立一张临时表,临时表的建立和删除都会有较大的系统开销,而连接查询不会创建临时表,因此效率比嵌套子查询高。

3.2.3 使用索引

使用索引可以显著地提高数据库查询速度,但是未恰当使用索引往往适得其反

如何创建索引:

索引未命中:

3.2.4 分解表

3.2.5 中间表

对于将大量连接查询的表可以创建中间表,从而减少在查询时造成的连接耗时

3.2.6 增加冗余字段

在设计数据库时,我们往往依照数据库的范式降低数据间的冗余度,但是冗余字段就像是把双刃剑,在业务需求上,有效的增加数据的冗余度,还可以提高数据的访问效率

3.2.7 分析表

分析表主要是分析表中关键字的分布,检查表主要是检查表中是否存在错误,优化表主要是消除删除或更新造成的表空间浪费

ANALYZE TABLE user;

分析表

3.2.8 检查表

使用 CHECK关键字, 如CHECK TABLE user [option]

CHECK TABLE `user` FAST;

检查表 option 只对MyISAM有效, 共五个参数值:

3.2.9 优化表

使用OPTIMIZE关键字,如OPTIMIZE [LOCAL|NO_WRITE_TO_BINLOG] TABLE user;

OPTIMIZE LOCAL TABLE `user`;

优化表 LOCAL | NO_WRITE_TO_BINLOG都是表示不写入日志,优化表只对VARCHAR, BLOB和TEXT有效, 通过OPTIMIZE TABLE语句可以消除文件碎片, 在执行过程中会加上只读锁

3.3 硬优化

3.3.1 硬件配置

3.3.2 优化数据库参数

优化数据库参数可以提高资源利用率,从而提高MySQL服务器性能.MySQL服务的配置参数都在my.cnf或my.ini,下面列出性能影响较大的几个参数.

3.3.3 分库分表 + 读写分离

当数据量达到一定的数量之后,限制数据库存储性能的就不再是数据库层面的优化就能够解决的;这个时候往往采用的是读写分离与分库分表同时也会结合缓存一起使用,而这个时候数据库层面的优化只是基础。读写分离适用于较小一些的数据量;分表适用于中等数据量;而分库与分表一般是结合着用,这就适用于大数据量的存储了。分库分表 + 读写分离,也就是把一个库拆分为多个库,部署在多个数据库服务上,这时作为主库承载写入请求。然后每个主库都挂载至少一个从库,由从库来承载读请求,从而减轻服务器压力

3.3.4 缓存集群

缓存系统的设计就是为了承载高并发而生。所以单机承载的并发量都在每秒几万,甚至每秒数十万,对高并发的承载能力比数据库系统要高出一到两个数量级。就是在写数据库的时候同时写一份数据到缓存集群里,然后用缓存集群来承载大部分的读请求。这样的话,通过缓存集群,就可以用更少的机器资源承载更高的并发。

4. 结语

要快速定位和解决慢SQL问题需要对数据库结构和运行机制有足够的了解,在设计数据库时就要考虑到数据量级,创建合适的字段类型和索引,设计合理的表结构可以避免慢SQL