专栏名称: 数据分析与开发

伯乐在线旗下账号，分享数据库相关技术文章、教程和工具，另外还包括数据库相关的工作。偶尔也谈谈程序员人生 :)

一个 20 秒 SQL 慢查询优化的经历与处理方案

数据分析与开发 · 公众号 · 数据库 · 2016-11-04 21:47

正文

（点击上方蓝字，快速关注我们)

来源：暗夜在火星

链接：my.oschina.net/dogstar/blog/398879

背景

前几天在项目上线过程中，发现有一个页面无法正确获取数据，经排查原来是接口调用超时，而最后发现是因为SQL查询长达到20多秒而导致了问题的发生。

这里，没有高深的理论或技术，只是备忘一下经历和解读一些思想误区。

复杂SQL语句的构成

这里不过多对业务功能进行描述，但为了突出问题所在，会用类比的语句来描述当时的场景。复杂的SQL语句可以表达如下：

SELECT * FROM a_table AS a

LEFT JOIN b_table AS b ON a.id = b.id

WHERE a.id IN (

SELECT DISTINCT id FROM a_table

WHERE user_id IN (100,102,103) GROUP BY user_id HAVING count (id) > 3

)

关联查询

从上面简化的SQL语句，可以看出，首先进行的是关联查询。

子查询

其次，是嵌套的子查询。此子查询是为了找出多个用户共同拥有的组ID。所以语句中的“100,102,103”是根据场景来定的，并且需要和后面“count(id) > 3”的个数对应。简单来说，就是找用户交集的组ID。

耗时在哪？

假设现在a_table表的数据量为20W，而b_table的数据量为2000W。大家可以想一下，你觉得主要的耗时是在关联查询部分，还是在子查询部分？

（思考空间。。。。）

（思考空间。。。。。。。）

（思考空间。。。。。。。。。。）

问题定位

对于SQL底层的原理和高深的理论，我暂时掌握不够深入。但我知道可以通过类比和简单的测试来验证是哪一块环节出了问题。

初步断定

首先，对于只有一个用户ID时，我会把上面的语句简化成：

SELECT * FROM a_table AS a

LEFT JOIN b_table AS b ON a.id = b.id

WHERE user_id IN (100)

所以，初步断定应该是嵌套的子查询部分占用了大部分的时间。

再进一步验证

既然定位到了是嵌套的子查询语句的问题，那又要分为两块待排查的区域：是子查询本身耗时大，还是嵌套而导致慢查询？

请到「今天看啥」查看全文

推荐文章

数据分析与开发 · 为 DeepSeek 辟谣：五大误解与真相解读

16 小时前

AustinDatabases · MySQL 内存那点事你咋就不会--问来问去 --分析+自动分析脚本（1）

2 天前

AustinDatabases · MySQL 内存那点事你咋就不会--问来问去 --分析+自动分析脚本（1）

2 天前

数据分析与开发 · 取代数据岗，某司数据从业人员已集体转行....

3 天前

AustinDatabases · ORACLE 最终会把 MySQL 弄死对吗？原因是什么！（译）

3 天前

数据中心运维管理 · 机房巡检必须关注的指标

4 天前

健身课代表 · 啪~啪~啪多久才正常？？？

8 年前

美食家常菜谱做法 · 这两个生肖在一起，上上等婚姻，一辈子钱财无忧！

7 年前

郑多燕健身时刻 · 其实，她们的马甲线都是在床上炼成的

7 年前

言安堂 · 骚年，莫非你就是传说中的“痣多星”？

7 年前

财税实务课堂 · 手慢无！会计人最需要的每月重点工作流程梳理！

7 年前