专栏名称: 51CTO技术栈

有趣 | 有料 | 有内涵，为您提供最优质的内容，愿我们一起悦享技术，成就人生。

52条实用经验，SQL优化不再难！

51CTO技术栈 · 公众号 · 程序员 · 2021-01-18 18:05

正文

送福利啦

关注 鸿蒙技术社区 ，回复 【鸿蒙】 送价值 399元 的鸿蒙 开发板套件 （数量有限，先到先得），还可以 免费下载 鸿蒙 入门资料 ！

👇 扫码 立刻关注 👇

专注开源技术，共建鸿蒙生态

“

不论是面试还是实际开发（后端），SQL 优化一直是绕不开的一个话题，本文会提到 52 条 SQL 语句性能优化策略。

图片来自 Pexels

有些优化策略需要你有一定的 SQL 实践才能体会其中的道理，当然你也可以根据这些优化策略去实践一下，这样更能加深理解和记忆。

对查询进行优化，应尽量避免全表扫描，首先应考虑在 WHERE 及 ORDER BY 涉及的列上建立索引。

应尽量避免在 WHERE 子句中对字段进行 NULL 值判断，创建表时 NULL 是默认值，但大多数时候应该使用 NOT NULL，或者使用一个特殊的值，如 0，-1 作为默认值。

应尽量避免在 WHERE 子句中使用 != 或 <> 操作符。MySQL 只有对以下操作符才使用索引：，>=，BETWEEN，IN，以及某些时候的 LIKE。

应尽量避免在 WHERE 子句中使用 OR 来连接条件，否则将导致引擎放弃使用索引而进行全表扫描，可以使用 UNION 合并查询：

select id from t where num=10 union all select id from t where num=20

IN 和 NOT IN 也要慎用，否则会导致全表扫描。对于连续的数值，能用 BETWEEN 就不要用 IN：

select id from t where num between 1 and 3

下面的查询也将导致全表扫描：

select id




    
 from t where name like‘%abc%’

或者 select id from t where name like‘%abc’ 若要提高效率，可以考虑全文检索。

而 select id from t where name like‘abc%’ 才用到索引。

如果在 WHERE 子句中使用参数，也会导致全表扫描。

应尽量避免在 WHERE 子句中对字段进行表达式操作，应尽量避免在 WHERE 子句中对字段进行函数操作。

很多时候用 EXISTS 代替 IN 是一个好的选择：

select num from a where num in(select num from b)

用下面的语句替换：

select num from a where exists(select 1 from b where num=a.num)

索引固然可以提高相应的 SELECT 的效率，但同时也降低了 INSERT 及 UPDATE 的效。

因为 INSERT 或 UPDATE 时有可能会重建索引，所以怎样建索引需要慎重考虑，视具体情况而定。

一个表的索引数最好不要超过 6 个，若太多则应考虑一些不常使用到的列上建的索引是否有必要。

应尽可能的避免更新 clustered 索引数据列，因为 clustered 索引数据列的顺序就是表记录的物理存储顺序，一旦该列值改变将导致整个表记录的顺序的调整，会耗费相当大的资源。

若应用系统需要频繁更新 clustered 索引数据列，那么需要考虑是否应将该索引建为 clustered 索引。

尽量使用数字型字段，若只含数值信息的字段尽量不要设计为字符型，这会降低查询和连接的性能，并会增加存储开销。

尽可能的使用 varchar，nvarchar 代替 char，nchar。因为首先变长字段存储空间小，可以节省存储空间，其次对于查询来说，在一个相对较小的字段内搜索效率显然要高些。

最好不要使用返回所有：select from t ，用具体的字段列表代替 “*”，不要返回用不到的任何字段。

尽量避免向客户端返回大数据量，若数据量过大，应该考虑相应需求是否合理。

使用表的别名（Alias）：当在 SQL 语句中连接多个表时，请使用表的别名并把别名前缀于每个 Column 上。

这样一来，就可以减少解析的时间并减少那些由 Column 歧义引起的语法错误。

使用“临时表”暂存中间结果：简化 SQL 语句的重要方法就是采用临时表暂存中间结果。

但是临时表的好处远远不止这些，将临时结果暂存在临时表，后面的查询就在 tempdb 中了，这可以避免程序中多次扫描主表，也大大减少了程序执行中“共享锁”阻塞“更新锁”，减少了阻塞，提高了并发性能。

一些 SQL 查询语句应加上 nolock，读、写是会相互阻塞的，为了提高并发性能。

对于一些查询，可以加上 nolock，这样读的时候可以允许写，但缺点是可能读到未提交的脏数据。

使用 nolock 有 3 条原则：

查询的结果用于“插、删、改”的不能加 nolock。
查询的表属于频繁发生页分裂的，慎用 nolock 。
使用临时表一样可以保存“数据前影”，起到类似 Oracle 的 undo 表空间的功能，能采用临时表提高并发性能的，不要用 nolock。

常见的简化规则如下：不要有超过 5 个以上的表连接（JOIN），考虑使用临时表或表变量存放中间结果。

少用子查询，视图嵌套不要过深，一般视图嵌套不要超过 2 个为宜。

将需要查询的结果预先计算好放在表中，查询的时候再 Select。这在 SQL 7.0 以前是最重要的手段，例如医院的住院费计算。

用 OR 的字句可以分解成多个查询，并且通过 UNION 连接多个查询。

他们的速度只同是否使用索引有关，如果查询需要用到联合索引，用 UNION all 执行的效率更高。

多个 OR 的字句没有用到索引，改写成 UNION 的形式再试图与索引匹配。一个关键的问题是否用到索引。

在 IN 后面值的列表中，将出现最频繁的值放在最前面，出现得最少的放在最后面，减少判断的次数。

尽量将数据的处理工作放在服务器上，减少网络的开销，如使用存储过程。

存储过程是编译好、优化过、并且被组织到一个执行规划里、且存储在数据库中的 SQL 语句，是控制流语言的集合，速度当然快。

反复执行的动态 SQL，可以使用临时存储过程，该过程（临时表）被放在 Tempdb 中。

当服务器的内存够多时，配制线程数量=最大连接数+5，这样能发挥最大的效率；否则使用配制线程数量

查询的关联同写的顺序：

select a.personMemberID, * from chineseresume a,personmember b where personMemberID = b.referenceid and a.personMemberID = ‘JCNPRH39681’ （A = B ,B = ‘号码’） 

select a.personMemberID, * from chineseresume a,personmember b where a.personMemberID = b.referenceid and a.personMemberID = ‘JCNPRH39681’ and b.referenceid = ‘JCNPRH39681’ （A = B ,B = ‘号码’， A = ‘号码’） 

select a.personMemberID, * from chineseresume a,personmember b where b.referenceid = ‘JCNPRH39681’ and a.personMemberID = ‘JCNPRH39681’ （B = ‘号码’， A = ‘号码’）

尽量使用 EXISTS 代替 select count(1) 来判断是否存在记录。count 函数只有在统计表中所有行数时使用，而且 count(1) 比 count(*) 更有效率。

尽量使用 “>=”，不要使用 “>”。

52条实用经验，SQL优化不再难！

正文

请到「今天看啥」查看全文