陈瑞芝 發表於 2023-11-18 00:00:00

不同的数据库平台,如何取前百分之N的记录?

<p>
        <img title="不同的数据库平台,如何取前百分之N的记录?" alt="不同的数据库平台,如何取前百分之N的记录?" border="0" height="auto" src="https://zhuji.jb51.net/uploads/img/202305/5610d4c007da23845acfc28f3fd16488.jpg" width="auto"></p>
<p>
        最近帮业务部门梳理业务报表,其中有个需求是就算某指标等待时间最长的前百分之十,其实就是对等待时长进行倒序排序后,取结果集的前百分之十。</p>
<p>
        这个需求在SQL Server和Oracle上都很容易实现,甚至是在MySQL 8.0也很容易实现,只是恰好我们业务数据库是MySQL 5.7</p>
<p>
        先给大家介绍下不同数据库平台的实现方法。</p>
<h3>
        SQL Server实现方法</h3>
<p>
        SQL Server上有个TOP Percent的方法可以直接取结果的前(或后)百分之N</p>
<p>
        例如有如下一张City表</p>
<p>
        <img title="不同的数据库平台,如何取前百分之N的记录?" alt="不同的数据库平台,如何取前百分之N的记录?" border="0" height="auto" src="https://zhuji.jb51.net/uploads/img/202305/7bda81839772d08034a65696b4bb19d6.jpg" width="auto"></p>
<p>
        我们取前10%的数据记录可以这样写:</p>
<ol class="dp-sql">
<li class="alt">
                <span><span class="keyword">SELECT</span><span>  </span></span>
</li>
        <li>
                <span><span class="keyword">TOP</span><span> 10 PERCENT   </span></span>
</li>
        <li class="alt">
                <span>*  </span>
</li>
        <li>
                <span><span class="keyword">FROM</span><span> City  </span></span>
</li>
        <li class="alt">
                <span><span class="keyword">ORDER</span><span> </span><span class="keyword">BY</span><span> ID </span><span class="keyword">DESC</span><span> </span></span>
</li>
</ol>
<p>
        结果如下:</p>
<p>
        <img title="不同的数据库平台,如何取前百分之N的记录?" alt="不同的数据库平台,如何取前百分之N的记录?" border="0" height="auto" src="https://zhuji.jb51.net/uploads/img/202305/9071e0039562be5aad9fbce79ae8cda7.jpg" width="auto"></p>
<h3>
        Oracle实现方法</h3>
<p>
        Oracle有个ROWNUM伪列可以用来帮助我们计算前百分之N。</p>
<p>
        ROWNUM伪列的特点:</p>
<ul>
<li>
                ROWNUM是按照记录插入时的顺序排序的</li>
        <li>
                ROWNUM并不实际存在,是对筛选后的结果集的一个排序,如果不存在结果集就不会有ROWNUM</li>
        <li>
                ROWNUM不能用基表名作为前缀</li>
        <li>
                在使用ROWNUM进行查询时,请注意:</li>
</ul>
<p>
        1)若使用大于号(&gt;),则只能使用(&gt;0),其他均不可以</p>
<p>
        2)若使用小于号(&lt;),同一般情况</p>
<p>
        3)若使用等于号(=),则只能使用等于1(=1)</p>
<p>
        我们可以先计算出整个表的记录行数量</p>
<ol class="dp-sql">
<li class="alt">
                <span><span class="keyword">SELECT</span><span> </span><span class="func">COUNT</span><span>(*) CNT </span><span class="keyword">FROM</span><span> City </span></span>
</li>
</ol>
<p>
        然后根据count聚合查询总条数乘以百分比,来确定要查询的条数</p>
<ol class="dp-sql">
<li class="alt">
                <span><span class="keyword">SELECT</span><span> 0.1*</span><span class="func">COUNT</span><span>(*) CNT </span><span class="keyword">FROM</span><span> City </span></span>
</li>
</ol>
<p>
        最后取出伪列小于共有数据的百分比的数据</p>
<ol class="dp-sql">
<li class="alt">
                <span><span class="keyword">SELECT</span><span> * </span><span class="keyword">FROM</span><span> CITY  </span></span>
</li>
        <li>
                <span><span class="keyword">WHERE</span><span> ID </span><span class="op">IN</span><span> </span></span>
</li>
        <li class="alt">
                <span>( </span>
</li>
        <li>
                <span><span class="keyword">SELECT</span><span> ID </span><span class="keyword">FROM</span><span>  </span></span>
</li>
        <li class="alt">
                <span>( </span>
</li>
        <li>
                <span><span class="keyword">SELECT</span><span> ID </span><span class="keyword">FROM</span><span> CITY </span><span class="keyword">ORDER</span><span> </span><span class="keyword">BY</span><span> ID </span><span class="keyword">DESC</span><span> </span></span>
</li>
        <li class="alt">
                <span>) </span>
</li>
        <li>
                <span><span class="keyword">WHERE</span><span> ROWNUM &lt; (</span><span class="keyword">SELECT</span><span> </span><span class="func">COUNT</span><span>(*)*0.1 </span><span class="keyword">FROM</span><span> CITY) </span></span>
</li>
        <li class="alt">
                <span>) </span>
</li>
</ol>
<p>
        注意:Oracle不支持子查询内ORDER BY,需要在外面再嵌套一层。</p>
<h3>
        MySQL 8.0的实现方法</h3>
<p>
        MySQL 8.0的实现方法主要是借助窗口函数ROW_NUMBER() OVER()。</p>
<p>
        其实就是给排好序的集合添加一个自增长列,与Oracle的ROWNUM有点类似</p>
<ol class="dp-sql">
<li class="alt">
                <span><span class="keyword">SELECT</span><span> * </span><span class="keyword">FROM</span><span> </span></span>
</li>
        <li>
                <span>( </span>
</li>
        <li class="alt">
                <span><span class="keyword">SELECT</span><span> *, </span></span>
</li>
        <li>
                <span>ROW_NUMBER() OVER(<span class="keyword">ORDER</span><span> </span><span class="keyword">BY</span><span> ID </span><span class="keyword">DESC</span><span>) rn  </span></span>
</li>
        <li class="alt">
                <span><span class="keyword">FROM</span><span>  City  </span></span>
</li>
        <li>
                <span><span class="keyword">ORDER</span><span> </span><span class="keyword">BY</span><span> ID </span><span class="keyword">DESC</span><span> </span></span>
</li>
        <li class="alt">
                <span>) a </span>
</li>
        <li>
                <span><span class="keyword">WHERE</span><span> a.rn&lt;=(</span><span class="keyword">SELECT</span><span> 0.1*</span><span class="func">COUNT</span><span>(*) </span><span class="keyword">FROM</span><span> City) </span></span>
</li>
</ol>
<h3>
        MySQL 5.X的实现方法</h3>
<p>
        我们知道MySQL 5.X是没有开窗函数ROW_NUMBER() OVER()的,那该如何实现呢?</p>
<p>
        这里我们需要借助变量来实现,其实思路还是创建一个自增长列,只是方法不同。</p>
<ol class="dp-sql">
<li class="alt">
                <span><span class="keyword">SELECT</span><span>  </span></span>
</li>
        <li>
                <span>  A.*, </span>
</li>
        <li class="alt">
                <span>  @row_num:=@row_num+1 <span class="keyword">AS</span><span> ROW_NUM  </span></span>
</li>
        <li>
                <span><span class="keyword">FROM</span><span>  </span></span>
</li>
        <li class="alt">
                <span>  City A , (<span class="keyword">SELECT</span><span> @row_num:=0) B  </span></span>
</li>
        <li>
                <span><span class="keyword">ORDER</span><span> </span><span class="keyword">BY</span><span> ID </span><span class="keyword">DESC</span><span> </span></span>
</li>
</ol>
<p>
        这样我们就可以得到一张有自增长列的结果集了,接下来还是按照上面类似的方法,取前10%即可。</p>
<ol class="dp-sql">
<li class="alt">
                <span><span class="keyword">SELECT</span><span> * </span><span class="keyword">FROM</span><span> </span></span>
</li>
        <li>
                <span>( </span>
</li>
        <li class="alt">
                <span><span class="keyword">SELECT</span><span>  </span></span>
</li>
        <li>
                <span>  A.*, </span>
</li>
        <li class="alt">
                <span>  @row_num:=@row_num+1 <span class="keyword">AS</span><span> ROW_NUM  </span></span>
</li>
        <li>
                <span><span class="keyword">FROM</span><span>  </span></span>
</li>
        <li class="alt">
                <span>  City A , (<span class="keyword">SELECT</span><span> @row_num:=0) B  </span></span>
</li>
        <li>
                <span><span class="keyword">ORDER</span><span> </span><span class="keyword">BY</span><span> ID </span><span class="keyword">DESC</span><span> </span></span>
</li>
        <li class="alt">
                <span>) C </span>
</li>
        <li>
                <span><span class="keyword">WHERE</span><span> C.ROW_NUM&lt;=(@row_num*0.1) </span></span>
</li>
</ol>
<p>
        其实MySQL 5.X也挺简单的,只是当时不怎么想用变量,想看看有没有其他办法,最后发现还是得用变量图片</p>
<p>
        以上就是不同平台的数据库求前百分之N的方法了,代码可以验证一下收藏起来留着下次直接套用。</p>
<h3>
        总结</h3>
<p>
        其中有涉及一些知识点,需要小伙伴们自己去进一步了解:</p>
<ul>
<li>
                SQL Server的TOP PERCENT</li>
        <li>
                Oracle的ROWNUM,子查询排序</li>
        <li>
                ROW_NUMBER() OVER()</li>
        <li>
                MySQL的变量</li>
</ul>
<p>
        原文链接:https://mp.weixin.qq.com/s/qNHvsYz-T4NcGeG-uptxEA</p>
頁: [1]
查看完整版本: 不同的数据库平台,如何取前百分之N的记录?