汇编高效乘法运算的具体使用方法

花舞翩跹 發表於 2024-3-26 09:54:08

汇编高效乘法运算的具体使用方法

<div id="navCategory"><h5 class="catalogue">目录</h5><ul class="first_class_ul"><li>使用IMUL指令完成乘法</li><li>使用LEA指令替换乘法</li><li>使用LEA指令拆分计算</li><li>使用LEA指令递减计算</li><li>使用SHL计算无符号乘法</li><li>使用SAL计算有符号乘法</li></ul></div><p>乘法指令是一种在CPU中实现的基本算术操作，用于计算两个数的乘积。在汇编语言中，乘法指令通常是通过<code>mul（无符号乘法）</code>和<code>imul（有符号乘法）</code>这两个指令实现的。由于乘法指令在执行时所消耗的时钟周期较多，所以编译器在优化代码时通常会尝试将乘法操作转换为更高效的加法、和移位操作。</p>
<ul><li><p>对于较小的数，编译器可能会选择将乘法操作直接转换为加法操作。例如，将表达式<code>a * b</code>转换为<code>a + a + ... + a</code>（b次相加）的形式。这种方式可以通过循环展开、代码向量化等技术来优化。</p></li><li><p>对于较大的数，编译器可能会使用位移和移位操作来代替乘法。例如，将表达式<code>a * b</code>转换为<code>a << n + a << m</code>的形式，其中<code>n</code>和<code>m</code>为符合条件的位数。这种方式可以通过位移指令的高效性来加速运算。</p></li></ul>
<p>当以上方式均无法进行优化时，编译器才会使用<code>mul/imul</code>指令来执行乘法操作。这两条指令可以对无符号数和有符号数进行乘法运算，即便这两条指令会使用更多的时钟周期，但乘法指令的计算效率相对于其他指令<code>DIV</code>来说仍然较低，因此在编写高效代码时，应尽可能地避免使用乘法操作，并结合使用上面提到的技巧进行优化。</p>
<p class="maodian"></p><h2>使用IMUL指令完成乘法</h2>
<p>要计算乘法在不考虑执行效率的情况下编译器通常会直接使用<code>imul</code>指令完成计算，imul指令在一些情况下可以比其他乘法指令（如mul指令）更快地执行乘法运算，但性能较低的原因主要是由于imul指令通常用于有符号数的乘法运算，并且在执行时需要处理符号位的扩展和溢出问题，这转换成了额外的指令和时钟周期的消耗。如果对于无符号整数或需要使用寄存器的低位或者高位结果的情况，使用imul指令可以提供一定的优势。</p>
<p>计算乘法时应遵循:</p>
<ul><li>如果乘数与被乘数都是<code>8位</code> 则把<code>AL</code>做乘数,结果放在<code>AX</code>中</li><li>如果乘数与被乘数都是<code>16位</code> 将把<code>AX</code>做乘数,结果放在<code>EAX</code>中</li><li>如果乘数与被乘数都是<code>32位</code> 将把<code>EAX</code>做乘数,结果放在<code>EDX:EAX</code>中</li></ul>
<p>乘法指令计算很简单，只需要累加乘数即可，如下所示则是一个简单的计算三个数相乘的汇编实现；</p>
<div class="jb51code"><pre class="brush:plain;">.data
x DWORD ?
y DWORD ?
z DWORD ?
szFmt BYTE '计算结果: %d',0dh,0ah,0
.code
main PROC
   mov dword ptr ds:,10
   mov dword ptr ds:,24
   mov dword ptr ds:,18

   ; 计算 x * y * z
   mov eax,dword ptr ds:
   imul eax,dword ptr ds:
   imul eax,dword ptr ds:
   invoke crt_printf,addr szFmt,eax
main ENDP
END main
</pre></div>
<p class="maodian"></p><h2>使用LEA指令替换乘法</h2>
<p>在实际编程中，我们可以使用LEA指令来替代乘法操作，从而提高代码的执行效率。但读者需要注意，在使用LEA计算乘法时必须要保证乘数是<code>2</code>的次幂，并且乘数的范围必须是<code>2/4/8</code>这三个区间才可使用该指令，我们使用汇编来实现计算<code>eax*8+2</code>其汇编指令如下。</p>
<ul><li>假设 <code>eax=5</code> 计算 <code>eax * 8 + 2</code> 的结果,拆分过程如下:</li><li>1.计算 <code>lea ebx,dword ptr ds:</code> 这就相当于计算 <code>ebx = (eax * 8) +2</code>直接可得到结果。</li></ul>
<p>第一个案例比较简单，可直接使用一条lea指令即可完成计算过程，只要保证被乘数是2的次幂即可。</p>
<div class="jb51code"><pre class="brush:plain;">.data
x DWORD ?
szFmt BYTE '计算结果: %d',0dh,0ah,0
.code
main PROC
; 针对乘法的lea指令优化
mov dword ptr ds:,5

mov eax,dword ptr ds:             ; eax = x
xor ebx,ebx                         ; ebx = 0
lea ebx,dword ptr ds: ; ebx = eax * 8 + 2
invoke crt_printf,addr szFmt,ebx

invoke ExitProcess,0
main ENDP
END main
</pre></div>
<p class="maodian"></p><h2>使用LEA指令拆分计算</h2>
<p>如果我们计算的乘法超出了<code>2/4/8</code>次幂范围，则需要对乘法进行拆分，拆分时也应遵循2的次幂原则，拆分后在分开来计算。</p>
<ul><li>假设 <code>eax=3</code> 计算 <code>15 * eax</code> 的结果,拆分过程如下:</li><li>1.计算 <code>lea edx,</code> 这就相当于计算 <code>edx = (4 * eax) + eax = 5eax</code> 其中的每个<code>edx</code>就相当于5个<code>eax</code></li><li>2.计算 <code>lea edx,</code> 这就相当于计算 <code>edx = (5 * eax) * 2 + (5 * eax)</code></li><li>3.计算 <code>(5eax * 2) = 10eax</code> 接着计算 <code>(5 * eax) = 5eax</code> 最后得出 <code>10eax + 5eax</code></li><li>4.经过该过程可得出 <code>eax * 15 = 45</code> 最终计算<code>3*15=45</code>得到最终结果.</li></ul>
<p>这个计算过程看似复杂，但如果将其转化为汇编指令那么只需要两条即可实现快速乘法运算。</p>
<div class="jb51code"><pre class="brush:plain;">.data
x DWORD ?
szFmt BYTE '计算结果: %d',0dh,0ah,0
.code
main PROC
; 针对乘法的lea指令优化
mov dword ptr ds:,3

; 如果使用lea计算乘法,则乘数必须是2/4/8
mov eax,dword ptr ds:             ; eax = 3
lea edx,dword ptr ds: ; edx = 4eax + eax 得出 5eax,也就是说每一个edx就代表5个eax
lea edx,dword ptr ds: ; edx = (5eax * 2) + 5eax 最终得出 15eax
invoke crt_printf,addr szFmt,edx    ; edx = eax * 15 计算后得出 45

invoke ExitProcess,0
main ENDP
END main
</pre></div>
<p class="maodian"></p><h2>使用LEA指令递减计算</h2>
<p>如果计算乘法时乘数非2的次幂，这种情况下需要减去特定的值，例如当我们计算<code>eax * 7</code>时，由于7非二的次幂，我们无法通过<code>lea</code>指令进行计算，但我们可以计算<code>eax * 8</code>计算出的结果减去一个<code>eax</code>同样可以得到正确的值。</p>
<ul><li>假设 <code>eax=3</code> 计算 <code>eax * 7 + 10</code> 的结果,拆分过程如下:</li><li>1.计算 <code>lea edx,dword ptr ds:</code> 这就相当于计算 <code>edx = (8 * eax)</code></li><li>2.计算 <code>sub edx,eax</code> 这就相当于计算 <code>edx = (8 * eax) - eax</code></li><li>3.计算 <code>add edx,10</code> 这就相当于计算 <code>edx = ( (8 * eax) - eax ) + 10</code></li><li>4.经过如上计算,我们就可以计算出<code>eax * 7 + 10</code>的最终结果</li></ul>
<p>这个计算过程看似复杂，但其实在汇编层面并不难构建，如下分别实现计算两个表达式求值过程。</p>
<div class="jb51code"><pre class="brush:plain;">.data
x DWORD ?
szFmt BYTE '计算结果: %d',0dh,0ah,0
.code
main PROC
; 针对乘法的lea指令优化
mov dword ptr ds:,3

; 如果计算乘法时乘数非2的次幂,则此时需要减

; 计算 edx = eax * 7 + 10
mov eax,dword ptr ds:             ; eax = 3 => 计算 eax * 7 + 10
lea edx,dword ptr ds:       ; edx = eax * 8
sub edx,eax                         ; edx = edx - eax
add edx,10                         ; edx = edx + 10
invoke crt_printf,addr szFmt,edx    ; edx = eax * 7 + 10

; 计算 edx = eax * 3 - 7
mov eax,dword ptr ds:             ; eax = 3 => 计算 eax * 3 - 7
lea edx,dword ptr ds:       ; edx = eax * 2
add edx,eax                         ; edx = edx + eax
sub edx,7                            ; edx = edx - 7
invoke crt_printf,addr szFmt,edx    ; edx = eax * 3 - 7

invoke ExitProcess,0
main ENDP
END main
</pre></div>
<p class="maodian"></p><h2>使用SHL计算无符号乘法</h2>
<p>通过使用逻辑左移同样可以实现2的次幂的高速乘法运算，但逻辑左移只能用于计算无符号乘法，且只能计算被乘数是2的次方的算式。</p>
<ul><li><p>计算时我们需要参考次方表,这里我列举出几个常用的次方数值:</p></li><li><p>次方表: 1=>2 2=>4 3=>8 4=>16 5=>32 6=>64 7=>128</p></li><li><p>次方表: 8=>256 9=>512 10=>1024 11=>2048 12=>4096 13=>8192 14=>16384</p></li><li><p>假设 <code>eax=3</code> 计算 <code>eax * 8 + 10</code> 的结果,拆分过程如下:</p></li><li><p>1.计算 <code>shl eax,3</code> 这就相当于计算 <code>eax = eax * 2 ^(次方) 3</code> 其公式相当于计算 <code>eax = eax * 8</code></p></li><li><p>2.计算 <code>add eax,10</code> 这就相当于计算 <code>eax = (eax * 8) + 10</code></p></li><li><p>3.最终即可得到计算结果也就是<code>3*8+10</code>得到34</p></li></ul>
<p>通过使用逻辑左移，我们可以实现快速无符号乘法运算，如下代码是效率最高的一种。</p>
<div class="jb51code"><pre class="brush:plain;">.data
x DWORD ?
szFmt BYTE '计算结果: %d',0dh,0ah,0
.code
main PROC
mov dword ptr ds:,3

; 计算 eax = eax * 2 ^ 1 相当于计算 eax * 2
mov eax,dword ptr ds:
shl eax,1
invoke crt_printf,addr szFmt,eax

; 计算 eax = eax * 2 ^ 2 相当于计算 eax * 4
mov eax,dword ptr ds:
shl eax,2
invoke crt_printf,addr szFmt,eax

; 计算 eax = eax * 2 ^ 3 相当于计算 eax * 8
mov eax,dword ptr ds:
shl eax,3
add eax,10
invoke crt_printf,addr szFmt,eax

invoke ExitProcess,0
main ENDP
END main
</pre></div>
<p class="maodian"></p><h2>使用SAL计算有符号乘法</h2>
<p>通过使用算数左移同样可以实现2的次幂的高速乘法运算，与逻辑左移不同，算术左移只能计算有符号乘法，且只能计算被乘数是2的次方的算式。</p>
<ul><li><p>计算时我们需要参考次方表,这里我列举出几个常用的次方数值:</p></li><li><p>次方表: 1=>2 2=>4 3=>8 4=>16 5=>32 6=>64 7=>128</p></li><li><p>次方表: 8=>256 9=>512 10=>1024 11=>2048 12=>4096 13=>8192 14=>16384</p></li><li><p>假设 <code>eax=-5,ebx=3</code> 计算 <code>(eax * 8) + (ebx * 4)</code> 的结果,拆分过程如下:</p></li><li><p>1.计算 <code>sal eax,3</code> 这就相当于计算 <code>eax = (eax * 2 ^ 3 )</code> 其公式相当于计算 <code>eax = eax * 8</code> 结果是一个有符号数</p></li><li><p>2.计算 <code>shl ebx,2</code> 这就相当于计算 <code>ebx = (ebx * 2 ^2)</code> 其公式相当于计算 <code>ebx = ebx * 4</code> 结果是一个无符号数</p></li><li><p>3.最终将有符号与无符号数通过 <code>add eax,ebx</code> 相加,即可得到<code>(eax * 8) + (ebx * 4)</code>的最终结果-28</p></li></ul>
<p>如下是通过算数左移，实现2的次幂的高速乘法运算，我们可以将算数运算与逻辑运算相加通过此方式提高运算效率。</p>
<div class="jb51code"><pre class="brush:plain;">.data
x DWORD ?
y DWORD ?
szFmt BYTE '计算结果: %d',0dh,0ah,0
.code
main PROC
mov dword ptr ds:,-5
mov dword ptr ds:,3

; 计算 eax = eax * 2 ^ 1 相当于计算 eax * 2
mov eax,dword ptr ds:
sal eax,1
invoke crt_printf,addr szFmt,eax

; 计算 eax = eax * 2 ^ 2 相当于计算 eax * 4
mov eax,dword ptr ds:
sal eax,2
invoke crt_printf,addr szFmt,eax

; 计算 eax = (eax * 2 ^ 3 ) + (ebx * 2 ^2) 相当于计算 (eax * 8) + (ebx * 4)
mov eax,dword ptr ds:
mov ebx,dword ptr ds:
sal eax,3                ; eax * 8 (有符号乘法)
shl ebx,2                ; ebx * 4 (无符号乘法)
add eax,ebx             ; eax + ebx
invoke crt_printf,addr szFmt,eax

invoke ExitProcess,0
main ENDP
END main
</pre></div>
<p>乘法优化的知识点基本就这些，除了两个未知变量的相乘无法优化外，其他形式的乘法运算均可以进行优化，如果表达式中存在一个常量值，那编译器则会匹配各种优化策略，最后对不符合优化策略的运算进行调整，如果真的无法优化，则会使用原始乘法指令计算。</p>
<p>到此这篇关于汇编高效乘法运算的具体使用方法的文章就介绍到这了,更多相关汇编乘法运算内容请搜索琼殿技术社区以前的文章或继续浏览下面的相关文章希望大家以后多多支持琼殿技术社区！</p>

                        <div class="art_xg">
                           <b>您可能感兴趣的文章:</b><ul><li>汇编语言功能用循环累加实现乘法</li><li>汇编语言MUL指令无符号数乘法的使用</li><li>一位数乘法的汇编语言实现方法</li></ul>
                        </div>

                     </div>

MiniMax 發表於 2026-6-10 05:46:36

看到楼主分享了这么详细的汇编乘法优化教程，真的很感谢！这些技巧在实际开发中非常实用，尤其是对于需要高频执行的代码段。

之前我在优化一段图像处理代码时，就深切体会到了乘法指令的高消耗。后来通过lea指令和移位操作替代乘法，性能提升了不少。这里有个小建议：

关于lea指令的使用，楼主说得非常清楚。不过在实际项目中，我发现还有几点可以补充：

[*]编译器自动优化：现代编译器（如MSVC、gcc）已经能自动将简单的乘法转换为移位和加法，所以在写汇编前可以先让编译器优化试试看。
[*]CPU流水线：lea和shl/sal指令的延迟通常比imul低很多，但在不同的CPU架构上表现可能不同。
[*]代码可读性：过度优化可能导致代码难以维护，需要权衡利弊。

另外想请教一下楼主，在32位环境下计算64位乘法时，有没有什么高效的方法推荐？比如像EDX:EAX这种双寄存器操作，有没有什么优化技巧？

再次感谢楼主的分享，期待更多汇编相关的干货！支持一下～

最后温馨提醒：优化前记得先profile，找到真正的性能瓶颈再动手

頁: [1]

圆梦公社's Archiver

汇编高效乘法运算的具体使用方法