关注
鸿蒙技术社区
,回复
【鸿蒙】
送
价值
399元
的鸿蒙
开发板套件
(数量有限,先到先得)
,还可以
免费下载
鸿蒙
入门资料
!
👇
扫码
立刻关注
👇
专注开源技术,共建鸿蒙生态
不论是面试还是实际开发(后端),SQL 优化一直是绕不开的一个话题,本文会提到 52 条 SQL 语句性能优化策略。
图片来自 Pexels
有些优化策略需要你有一定的 SQL 实践才能体会其中的道理,当然你也可以根据这些优化策略去实践一下,这样更能加深理解和记忆。
对查询进行优化,应尽量避免全表扫描,首先应考虑在 WHERE 及 ORDER BY 涉及的列上建立索引。
应尽量避免在 WHERE 子句中对字段进行 NULL 值判断,创建表时 NULL 是默认值,但大多数时候应该使用 NOT NULL,或者使用一个特殊的值,如 0,-1 作为默认值。
应尽量避免在 WHERE 子句中使用 != 或 <> 操作符。MySQL 只有对以下操作符才使用索引:,>=,BETWEEN,IN,以及某些时候的 LIKE。
应尽量避免在 WHERE 子句中使用 OR 来连接条件,否则将导致引擎放弃使用索引而进行全表扫描,可以使用 UNION 合并查询:
select id from t where num=10 union all select id from t where num=20
IN 和 NOT IN 也要慎用,否则会导致全表扫描。对于连续的数值,能用 BETWEEN 就不要用 IN:
select id from t where num between 1 and 3
select id
from t where name like‘%abc%’
或者 select id from t where name like‘%abc’ 若要提高效率,可以考虑全文检索。
而 select id from t where name like‘abc%’ 才用到索引。
如果在 WHERE 子句中使用参数,也会导致全表扫描。
应尽量避免在 WHERE 子句中对字段进行表达式操作,应尽量避免在 WHERE 子句中对字段进行函数操作。
很多时候用 EXISTS 代替 IN 是一个好的选择:
select num from a where num in(select num from b)
select num from a where exists(select 1 from b where num=a.num)
索引固然可以提高相应的 SELECT 的效率,但同时也降低了 INSERT 及 UPDATE 的效。
因为 INSERT 或 UPDATE 时有可能会重建索引,所以怎样建索引需要慎重考虑,视具体情况而定。
一个表的索引数最好不要超过 6 个,若太多则应考虑一些不常使用到的列上建的索引是否有必要。
应尽可能的避免更新 clustered 索引数据列, 因为 clustered 索引数据列的顺序就是表记录的物理存储顺序,一旦该列值改变将导致整个表记录的顺序的调整,会耗费相当大的资源。
若应用系统需要频繁更新 clustered 索引数据列,那么需要考虑是否应将该索引建为 clustered 索引。
尽量使用数字型字段,若只含数值信息的字段尽量不要设计为字符型,这会降低查询和连接的性能,并会增加存储开销。
尽可能的使用 varchar,nvarchar 代替 char,nchar。因为首先变长字段存储空间小,可以节省存储空间,其次对于查询来说,在一个相对较小的字段内搜索效率显然要高些。
最好不要使用返回所有:select from t ,用具体的字段列表代替 “*”,不要返回用不到的任何字段。
尽量避免向客户端返回大数据量,若数据量过大,应该考虑相应需求是否合理。
使用表的别名(Alias):当在 SQL 语句中连接多个表时,请使用表的别名并把别名前缀于每个 Column 上。
这样一来,就可以减少解析的时间并减少那些由 Column 歧义引起的语法错误。
使用“临时表”暂存中间结果:简化 SQL 语句的重要方法就是采用临时表暂存中间结果。
但是临时表的好处远远不止这些,将临时结果暂存在临时表,后面的查询就在 tempdb 中了,这可以避免程序中多次扫描主表,也大大减少了程序执行中“共享锁”阻塞“更新锁”,减少了阻塞,提高了并发性能。
一些 SQL 查询语句应加上 nolock,读、写是会相互阻塞的,为了提高并发性能。
对于一些查询,可以加上 nolock,这样读的时候可以允许写,但缺点是可能读到未提交的脏数据。
使用 nolock 有 3 条原则:
-
查询的结果用于“插、删、改”的不能加 nolock。
-
查询的表属于频繁发生页分裂的,慎用 nolock 。
-
使用临时表一样可以保存“数据前影”,起到类似 Oracle 的 undo 表空间的功能,能采用临时表提高并发性能的,不要用 nolock。
常见的简化规则如下:不要有超过 5 个以上的表连接(JOIN),考虑使用临时表或表变量存放中间结果。
少用子查询,视图嵌套不要过深,一般视图嵌套不要超过 2 个为宜。
将需要查询的结果预先计算好放在表中,查询的时候再 Select。这在 SQL 7.0 以前是最重要的手段,例如医院的住院费计算。
用 OR 的字句可以分解成多个查询,并且通过 UNION 连接多个查询。
他们的速度只同是否使用索引有关,如果查询需要用到联合索引,用 UNION all 执行的效率更高。
多个 OR 的字句没有用到索引,改写成 UNION 的形式再试图与索引匹配。一个关键的问题是否用到索引。
在 IN 后面值的列表中,将出现最频繁的值放在最前面,出现得最少的放在最后面,减少判断的次数。
尽量将数据的处理工作放在服务器上,减少网络的开销,如使用存储过程。
存储过程是编译好、优化过、并且被组织到一个执行规划里、且存储在数据库中的 SQL 语句,是控制流语言的集合,速度当然快。
反复执行的动态 SQL,可以使用临时存储过程,该过程(临时表)被放在 Tempdb 中。
当服务器的内存够多时,配制线程数量=最大连接数+5,这样能发挥最大的效率;否则使用配制线程数量
select a.personMemberID, * from chineseresume a,personmember b where personMemberID = b.referenceid and a.personMemberID = ‘JCNPRH39681’ (A = B ,B = ‘号码’)
select a.personMemberID, * from chineseresume a,personmember b where a.personMemberID = b.referenceid and a.personMemberID = ‘JCNPRH39681’ and b.referenceid = ‘JCNPRH39681’ (A = B ,B = ‘号码’, A = ‘号码’)
select a.personMemberID, * from chineseresume a,personmember b where b.referenceid = ‘JCNPRH39681’ and a.personMemberID = ‘JCNPRH39681’ (B = ‘号码’, A = ‘号码’)
尽量使用 EXISTS 代替 select count(1) 来判断是否存在记录。count 函数只有在统计表中所有行数时使用,而且 count(1) 比 count(*) 更有效率。
尽量使用 “>=”,不要使用 “>”。