这人间有正道 發表於 2023-10-31 00:00:00

生产问题分析!delete in子查询不走索引?!

<p>
       
                <img title="生产问题分析!delete in子查询不走索引?!" alt="生产问题分析!delete in子查询不走索引?!" border="0" src="https://zhuji.jb51.net/uploads/img/202305/0e6a49d951312b576444358e3c313dcc.jpg"></p>
        <h3>
                前言
        </h3>
        <p>
                大家好,我是捡田螺的小男孩。(求个星标置顶)
        </p>
        <p>
                文章开篇前,先问大家一个问题:delete in子查询,是否会走索引呢?很多伙伴第一感觉就是:会走索引。最近我们有个生产问题,就跟它有关。本文将跟大家一起探讨这个问题,并附上优化方案。
        </p>
        <p>
                <img title="生产问题分析!delete in子查询不走索引?!" alt="生产问题分析!delete in子查询不走索引?!" border="0" src="https://zhuji.jb51.net/uploads/img/202305/536560883feb59fc8228acce42436679.jpg"></p>
        <h3>
                问题复现
        </h3>
        <p>
                MySQL版本是5.7,假设当前有两张表account和old_account,表结构如下:
        </p>
        <ol class="dp-sql">
<li class="alt">
                        <span><span class="keyword">CREATE</span><span></span><span class="keyword">TABLE</span><span>`old_account`(</span></span>
                </li>
                <li>
                        <span>`id`<span class="keyword">int</span><span>(11)</span><span class="op">NOT</span><span></span><span class="op">NULL</span><span>AUTO_INCREMENTCOMMENT</span><span class="string">'主键Id'</span><span>,</span></span>
                </li>
                <li class="alt">
                        <span>`<span class="keyword">name</span><span>`</span><span class="keyword">varchar</span><span>(255)</span><span class="keyword">DEFAULT</span><span></span><span class="op">NULL</span><span>COMMENT</span><span class="string">'账户名'</span><span>,</span></span>
                </li>
                <li>
                        <span>`balance`<span class="keyword">int</span><span>(11)</span><span class="keyword">DEFAULT</span><span></span><span class="op">NULL</span><span>COMMENT</span><span class="string">'余额'</span><span>,</span></span>
                </li>
                <li class="alt">
                        <span>`create_time`datetime<span class="op">NOT</span><span></span><span class="op">NULL</span><span>COMMENT</span><span class="string">'创建时间'</span><span>,</span></span>
                </li>
                <li>
                        <span>`update_time`datetime<span class="op">NOT</span><span></span><span class="op">NULL</span><span></span><span class="keyword">ON</span><span></span><span class="keyword">UPDATE</span><span></span><span class="func">CURRENT_TIMESTAMP</span><span>COMMENT</span><span class="string">'更新时间'</span><span>,</span></span>
                </li>
                <li class="alt">
                        <span><span class="keyword">PRIMARY</span><span></span><span class="keyword">KEY</span><span>(`id`),</span></span>
                </li>
                <li>
                        <span><span class="keyword">KEY</span><span>`idx_name`(`</span><span class="keyword">name</span><span>`)USINGBTREE</span></span>
                </li>
                <li class="alt">
                        <span>)ENGINE=InnoDBAUTO_INCREMENT=1570068<span class="keyword">DEFAULT</span><span>CHARSET=utf8ROW_FORMAT=REDUNDANTCOMMENT=</span><span class="string">'老的账户表'</span><span>;</span></span>
                </li>
                <li>
                        <span></span>
                </li>
                <li class="alt">
                        <span><span class="keyword">CREATE</span><span></span><span class="keyword">TABLE</span><span>`account`(</span></span>
                </li>
                <li>
                        <span>`id`<span class="keyword">int</span><span>(11)</span><span class="op">NOT</span><span></span><span class="op">NULL</span><span>AUTO_INCREMENTCOMMENT</span><span class="string">'主键Id'</span><span>,</span></span>
                </li>
                <li class="alt">
                        <span>`<span class="keyword">name</span><span>`</span><span class="keyword">varchar</span><span>(255)</span><span class="keyword">DEFAULT</span><span></span><span class="op">NULL</span><span>COMMENT</span><span class="string">'账户名'</span><span>,</span></span>
                </li>
                <li>
                        <span>`balance`<span class="keyword">int</span><span>(11)</span><span class="keyword">DEFAULT</span><span></span><span class="op">NULL</span><span>COMMENT</span><span class="string">'余额'</span><span>,</span></span>
                </li>
                <li class="alt">
                        <span>`create_time`datetime<span class="op">NOT</span><span></span><span class="op">NULL</span><span>COMMENT</span><span class="string">'创建时间'</span><span>,</span></span>
                </li>
                <li>
                        <span>`update_time`datetime<span class="op">NOT</span><span></span><span class="op">NULL</span><span></span><span class="keyword">ON</span><span></span><span class="keyword">UPDATE</span><span></span><span class="func">CURRENT_TIMESTAMP</span><span>COMMENT</span><span class="string">'更新时间'</span><span>,</span></span>
                </li>
                <li class="alt">
                        <span><span class="keyword">PRIMARY</span><span></span><span class="keyword">KEY</span><span>(`id`),</span></span>
                </li>
                <li>
                        <span><span class="keyword">KEY</span><span>`idx_name`(`</span><span class="keyword">name</span><span>`)USINGBTREE</span></span>
                </li>
                <li class="alt">
                        <span>)ENGINE=InnoDBAUTO_INCREMENT=1570068<span class="keyword">DEFAULT</span><span>CHARSET=utf8ROW_FORMAT=REDUNDANTCOMMENT=</span><span class="string">'账户表'</span><span>;</span></span>
                </li>
        </ol>
<p>
                执行的SQL如下:
        </p>
        <ol class="dp-sql">
<li class="alt">
                        <span><span class="keyword">delete</span><span></span><span class="keyword">from</span><span>account</span><span class="keyword">where</span><span></span><span class="keyword">name</span><span></span><span class="op">in</span><span>(</span><span class="keyword">select</span><span></span><span class="keyword">name</span><span></span><span class="keyword">from</span><span>old_account);</span></span>
                </li>
        </ol>
<p>
                我们explain执行计划走一波,
        </p>
        <p>
                <img title="生产问题分析!delete in子查询不走索引?!" alt="生产问题分析!delete in子查询不走索引?!" border="0" src="https://zhuji.jb51.net/uploads/img/202305/231c242954255632e6c3275b654ce2ad.jpg"></p>
        <p>
                从explain结果可以发现:先全表扫描 account,然后逐行执行子查询判断条件是否满足;显然,这个执行计划和我们预期不符合,因为并没有走索引。
        </p>
        <p>
                但是如果把delete换成select,就会走索引。如下:
        </p>
        <p>
                <img title="生产问题分析!delete in子查询不走索引?!" alt="生产问题分析!delete in子查询不走索引?!" border="0" src="https://zhuji.jb51.net/uploads/img/202305/81ad63353297dfdc5a70992350a3cb06.jpg"></p>
        <p>
                为什么select in子查询会走索引,delete in子查询却不会走索引呢?
        </p>
        <h3>
                原因分析
        </h3>
        <p>
                select in子查询语句跟delete in子查询语句的不同点到底在哪里呢?
        </p>
        <p>
                我们执行以下SQL看看
        </p>
        <ol class="dp-sql">
<li class="alt">
                        <span><span>explain</span><span class="keyword">select</span><span>*</span><span class="keyword">from</span><span>account</span><span class="keyword">where</span><span></span><span class="keyword">name</span><span></span><span class="op">in</span><span>(</span><span class="keyword">select</span><span></span><span class="keyword">name</span><span></span><span class="keyword">from</span><span>old_account);</span></span>
                </li>
                <li>
                        <span>showWARNINGS;</span>
                </li>
        </ol>
<p>
                show WARNINGS 可以查看优化后,最终执行的sql
        </p>
        <p>
                结果如下:
        </p>
        <ol class="dp-sql">
<li class="alt">
                        <span><span class="keyword">select</span><span>`test2`.`account`.`id`</span><span class="keyword">AS</span><span>`id`,`test2`.`account`.`</span><span class="keyword">name</span><span>`</span><span class="keyword">AS</span><span>`</span><span class="keyword">name</span><span>`,`test2`.`account`.`balance`</span><span class="keyword">AS</span><span>`balance`,`test2`.`account`.`create_time`</span><span class="keyword">AS</span><span>`create_time`,`test2`.`account`.`update_time`</span><span class="keyword">AS</span><span>`update_time`</span><span class="keyword">from</span><span>`test2`.`account`</span></span>
                </li>
                <li>
                        <span>semi<span class="op">join</span><span>(`test2`.`old_account`)</span></span>
                </li>
                <li class="alt">
                        <span><span class="keyword">where</span><span>(`test2`.`account`.`</span><span class="keyword">name</span><span>`=`test2`.`old_account`.`</span><span class="keyword">name</span><span>`)</span></span>
                </li>
        </ol>
<p>
                可以发现,实际执行的时候,MySQL对select in子查询做了优化,把子查询改成join的方式,所以可以走索引。但是很遗憾,对于delete in子查询,MySQL却没有对它做这个优化。
        </p>
        <h3>
                优化方案
        </h3>
        <p>
                那如何优化这个问题呢?通过上面的分析,显然可以把delete in子查询改为join的方式。我们改为join的方式后,再explain看下:
        </p>
        <p>
                <img title="生产问题分析!delete in子查询不走索引?!" alt="生产问题分析!delete in子查询不走索引?!" border="0" src="https://zhuji.jb51.net/uploads/img/202305/1a9d5f86617d4cbcce11e71c159b6f31.jpg"></p>
        <p>
                可以发现,改用join的方式是可以走索引的,完美解决了这个问题。
        </p>
        <p>
                实际上,对于update或者delete子查询的语句,MySQL官网也是推荐join的方式优化
        </p>
        <p>
                <img title="生产问题分析!delete in子查询不走索引?!" alt="生产问题分析!delete in子查询不走索引?!" border="0" src="https://zhuji.jb51.net/uploads/img/202305/64ad220c114a6a35143c9f7af1d27a05.jpg"></p>
        <p>
                其实呢,给表加别名,也可以解决这个问题哦,如下:
        </p>
        <ol class="dp-sql">
<li class="alt">
                        <span><span>explain</span><span class="keyword">delete</span><span>a</span><span class="keyword">from</span><span>account</span><span class="keyword">as</span><span>a</span><span class="keyword">where</span><span>a.</span><span class="keyword">name</span><span></span><span class="op">in</span><span>(</span><span class="keyword">select</span><span></span><span class="keyword">name</span><span></span><span class="keyword">from</span><span>old_account)</span></span>
                </li>
        </ol>
<p>
                <img title="生产问题分析!delete in子查询不走索引?!" alt="生产问题分析!delete in子查询不走索引?!" border="0" src="https://zhuji.jb51.net/uploads/img/202305/82ed38704f10c1f9bf6190a4f02c1fea.jpg"></p>
        <h3>
                为什么加个别名就可以走索引了呢?
        </h3>
        <p>
                what?为啥加个别名,delete in子查询又行了,又走索引了?
        </p>
        <p>
                我们回过头来看看explain的执行计划,可以发现Extra那一栏,有个LooseScan。
        </p>
        <p>
                <img title="生产问题分析!delete in子查询不走索引?!" alt="生产问题分析!delete in子查询不走索引?!" border="0" src="https://zhuji.jb51.net/uploads/img/202305/f109cc2f5d885f88fd116b10e0686ee7.jpg"></p>
        <p>
                LooseScan是什么呢? 其实它是一种策略,是semi join子查询的一种执行策略。
        </p>
        <p>
                因为子查询改为join,是可以让delete in子查询走索引;加别名呢,会走LooseScan策略,而LooseScan策略,本质上就是semi join子查询的一种执行策略。
        </p>
        <p>
                因此,加别名就可以让delete in子查询走索引啦!
        </p>
        <h3>
                总结
        </h3>
        <p>
                本博文分析了delete in子查询不走索引的原因,并附上解决方案。delete in在日常开发,是非常常见的,平时大家工作中,需要注意一下。同时呢,建议大家工作的时候,写SQL的时候,尽量养成一个好习惯,先用explain分析一下SQL。
        </p>
        <p>
                本文整体思路参考同事的博文,已经经过他本人同意。也建议大家遇到问题时,多点思考,多点写写总结,避免重蹈覆辙。
        </p>
        <p>
                我是捡田螺的小男孩,码字不易,看完文章有收获的话,可以把我公众号推给身边的程序员哈,感谢、比心~
        </p>
        <p>
                原文链接:https://mp.weixin.qq.com/s/0qvO6eQAa9dSGoY1LF8_pA
        </p>
頁: [1]
查看完整版本: 生产问题分析!delete in子查询不走索引?!