【汇编】汇编语言语法

捞起月亮的渔民 發表於 2023-11-10 10:07:00

<h1 id="gnu-汇编语法">GNU 汇编语法</h1>
<p>在进行嵌入式 Linux 开发的时候是绝对要掌握基本的 ARM 汇编，因为 Cortex-A 芯片一上电 SP 指针还没初始化，C 环境还没准备好，所以肯定不能运行 C 代码，必须先用汇编语言设置好 C 环境，比如初始化 DDR、设置 SP指针等等，当汇编把 C 环境设置好了以后才可以运行 C 代码。所以 Cortex-A 一开始肯定是汇编代码，其实 STM32 也一样的，一开始也是汇编，比如MDK 和 IAR 下的启动文件 startup_stm32f10x_hd.s其中的汇编语法是有所不同的，将 MDK 下的汇编文件直接复制到 IAR 下去编译就会出错，因为 MDK 和 IAR 的编译器不同，因此对于汇编的语法就有一些小区别。我们要编写的是 ARM汇编，编译使用的 GCC 交叉编译器，所以我们的汇编代码要符合 GNU 语法。</p>
<p>GNU汇编语法适用于所有的架构，并不是ARM独享，GNU汇编由一系列的语句组成</p>
<p>注意！ARM中的指令、伪指令、伪操作、寄存器名等可以全部使用大写，也可以全部使用小写，但是不能大小写混用。</p>
<h2 id="伪操作">伪操作</h2>
<table>
<thead>
<tr>
<th>伪操作</th>
<th>含义</th>
</tr>
</thead>
<tbody>
<tr>
<td>.byte</td>
<td>定义单字节数据，比如.byte 0x12</td>
</tr>
<tr>
<td>.short</td>
<td>定义双字节数据，比如.short 0x1234</td>
</tr>
<tr>
<td>.long</td>
<td>定义一个4字节数据，比如.long 0x12345678</td>
</tr>
<tr>
<td>.equ</td>
<td>赋值语句，格式为：.equ 变量名，表达式，比如.equ num, 0x12，表示 num=0x12</td>
</tr>
<tr>
<td>.align</td>
<td>数据字节对齐，比如：.align 4 表示 4 字节对齐。</td>
</tr>
<tr>
<td>.end</td>
<td>表示源文件结束。</td>
</tr>
<tr>
<td>.global</td>
<td>定义一个全局符号，格式为：.global symbol，比如：.global _start。</td>
</tr>
</tbody>
</table>
<p>比如：</p>
<pre><code class="language-bash">.global _start

_start:
ldr r0,=0x12 @r0=0x12
</code></pre>
<p>.global是一个位操作，表示_start是一个全局标号，相当于C语言中的全局变量一样。</p>
<h2 id="段名">段名</h2>
<p>汇编系统预定义了一些段名：</p>
<table>
<thead>
<tr>
<th>定义</th>
<th>段名</th>
</tr>
</thead>
<tbody>
<tr>
<td>.text</td>
<td>表示代码段</td>
</tr>
<tr>
<td>.data</td>
<td>初始化数据段</td>
</tr>
<tr>
<td>.bss</td>
<td>未初始化的数据段</td>
</tr>
<tr>
<td>.rodata</td>
<td>只读数据段</td>
</tr>
</tbody>
</table>
<p>比如：</p>
<h2 id="函数">函数</h2>
<p>函数格式如下：</p>
<pre><code>函数名：
函数体
返回语句
</code></pre>
<p>GNU汇编函数返回语句不是必须的，比如Cortex-A7中断服务函数：</p>
<pre><code>/*未定义中断*/
Undefined_Handler:
ldr r0,=Undefined_Handler
bx r0

/*svc中断*/
SVC_Handler:
ldr r0,=SVC_Handler
bx r0

/*预取中止中断*/
PerfAbort_Handler:
ldr r0,=PrefAbort_Handler
bx r0
</code></pre>
<h1 id="cortex-a7常用汇编指令">Cortex-A7常用汇编指令</h1>
<p>需要系统性的学习Cortex-A7的所有汇编指令可以参考《ARM ArchitectureReference Manual ARMv7-A and ARMv7-R edition.pdf》的 A4章节。</p>
<h2 id="数据传输指令">数据传输指令</h2>
<table>
<thead>
<tr>
<th>指令</th>
<th>目的寄存器</th>
<th>源寄存器</th>
<th>描述</th>
</tr>
</thead>
<tbody>
<tr>
<td>MOV</td>
<td>R0</td>
<td>R1</td>
<td>将R1中的数据复制到R0中</td>
</tr>
<tr>
<td>MRS</td>
<td>R0</td>
<td>CPSR</td>
<td>将特殊寄存器CPSR里面额数据复制到R0中</td>
</tr>
<tr>
<td>MSR</td>
<td>CPSR</td>
<td>R1</td>
<td>将R1里面的数据复制到特殊寄存器CPSR中</td>
</tr>
</tbody>
</table>
<h3 id="1mov指令">1.MOV指令</h3>
<p>MOV指令用于将数据从一个寄存器拷贝到另一个寄存器，或者将一个立即数传递到寄存器中。示例如下：</p>
<pre><code>MOV R0,R1    @将寄存器中R1的数据传递给R0,即R0=R1
MOV R0,#0X12 @将立即数0x12传递给R0寄存器，即R0=0X12
</code></pre>
<h3 id="2mrs指令">2.MRS指令</h3>
<p>MRS指令用于将特殊寄存器(如CPSR和SPSR)中的数据传递给通用寄存器，要读取特殊寄存器中的数据只能使用MRS指令。示例如下：</p>
<pre><code>MRS R0,CPSR @将特殊寄存CPSR里面的数据传递给R0,即R0=CPSR
</code></pre>
<h3 id="3msr指令">3.MSR指令</h3>
<p>MSR 指令和 MRS 刚好相反，MSR 指令用来将普通寄存器的数据传递给特殊寄存器，也就是写特殊寄存器，写特殊寄存器只能使用 MSR，示例如下：</p>
<pre><code>MSR CPSR,R0 @将R0的数据复制到CPSR中，即CPSR=R0
</code></pre>
<h2 id="存储器访问指令">存储器访问指令</h2>
<p>ARM 不能直接访问存储器，比如 RAM 中的数据，I.MX6UL 中的寄存器就是 RAM 类型的，我们用汇编来配置 I.MX6UL 寄存器的时候需要借助存储器访问指令，一般先将要配置的值写入到 Rx(x=0~12)寄存器中，然后借助存储器访问指令将 Rx 中的数据写入到 I.MX6UL 寄存器中。读取 I.MX6UL 寄存器也是一样的，只是过程相反。常用的存储器访问指令有两种：LDR 和STR：</p>
<table>
<thead>
<tr>
<th>指令</th>
<th>描述</th>
</tr>
</thead>
<tbody>
<tr>
<td>LDR Rd,</td>
<td>从存储器Rn+offset的位置读取数据存放到Rd中</td>
</tr>
<tr>
<td>STR Rd,</td>
<td>将Rd中的数据写入到存储器中的Rn+offset位置</td>
</tr>
</tbody>
</table>
<h3 id="1ldr指令">1.LDR指令</h3>
<p>LDR主要是从存储器中加载数据到寄存器Rx中，LDR也可以将一个立即数加载到寄存器Rx中，LDR加载立即数的时候要使用"=",而不是"#"。在嵌入式开发中，LDR最常用的就是读取 CPU 的寄存器值，比如 I.MX6UL 有个寄存器 GPIO1_GDIR，其地址为 0X0209C004，我们现在要读取这个寄存器中的数据，示例代码如下：</p>
<pre><code>LDR R0,=0x0209C004 @ 将寄存器地址0x0209C004加载到R0寄存器中，即R0=0x0209C004
LDR R1,       @ 读取地址0x0209C004中的数据到R1寄存器中
</code></pre>
<p>上述代码就是读取寄存器 GPIO1_GDIR 中的值，读取到的寄存器值保存在 R1 寄存器中，上面代码中 offset 是 0，也就是没有用到 offset。</p>
<h3 id="2str指令">2.STR指令</h3>
<p>LDR 是从存储器读取数据，STR 就是将数据写入到存储器中，同样以 I.MX6UL 寄存器GPIO1_GDIR 为例，现在我们要配置寄存器 GPIO1_GDIR 的值为 0X2000002，示例代码如下：</p>
<pre><code>LDR R0, =0x0209C004 @将寄存器地址0x0209C004加载到R0中，即R0=0x0209C004
LDR R1, =0X20000002 @R1保存要写入到寄存器的值，即R1=0X20000002
STR R1,       @将R1的值写入到R0中所保存的地址中
</code></pre>
<p>LDR 和 STR 都是按照字进行读取和写入的，也就是操作的 32 位数据，如果要按照字节、半字进行操作的话可以在指令“LDR”后面加上 B 或 H，比如按字节操作的指令就是 LDRB 和STRB，按半字操作的指令就是 LDRH 和 STRH。</p>
<h3 id="3adr指令">3.ADR指令</h3>
<p>ADR是一条小范围地址读取伪指令，它将基于PC的相对偏移的地址值读到目标寄存器中</p>
<pre><code>ADR R0，exper
</code></pre>
<p>编译源程序时，汇编器首先计算当前PC值(当前指令位置)到exper的距离，然后用一条ADD或SUB指令替换这条伪指令</p>
<p>比如：</p>
<pre><code>add register,pc,#offset_to_exper @标号exper与指令必须要在同一代码段
adr r0,_start                   @将指定地址赋值r0
</code></pre>
<p>r0的值为标号_start与此指令的距离差 + PC值。</p>
<h2 id="堆栈操作指令">堆栈操作指令</h2>
<p>在日常代码逻辑中，函数的调用随处可见，通常会在 A 函数中调用 B 函数，当 B 函数执行完以后再回到 A 函数继续执行。要想在跳回 A 函数以后代码能够接着正常运行，那就必须在跳到 B 函数之前将当前处理器状态保存起来(就是保存 R0-R15 这些寄存器值)，当 B 函数执行完成以后再用前面保存的寄存器值恢复R0-R15 即可。保存 R0-R15 寄存器的操作就叫做现场保护，恢复 R0R15 寄存器的操作就叫做恢复现场。在进行现场保护的时候需要进行压栈(入栈)操作，恢复现场就要进行出栈操作。压栈的指令为 PUSH，出栈的指令为 POP，PUSH 和 POP 是一种多存储和多加载指令，即可以一次操作多个寄存器数据，他们利用当前的栈指针 SP 来生成地址。</p>
<h3 id="1push和pop">1.PUSH和POP</h3>
<table>
<thead>
<tr>
<th>指令</th>
<th>描述</th>
</tr>
</thead>
<tbody>
<tr>
<td>PUSH</td>
<td>将寄存器列表存入栈中</td>
</tr>
<tr>
<td>POP</td>
<td>从栈中恢复寄存器列表</td>
</tr>
</tbody>
</table>
<p>示例代码：</p>
<pre><code>PUSH {R0-R3,R12} @将R0-R3和R12压入堆栈
PUSH {LR}          @将LR连接寄存器压入堆栈
</code></pre>
<p>压栈后堆栈示意图(0x80000000是栈底，每增加数据SP想低地址方向即栈顶方向移动)：</p>
<p><img src="https://img2023.cnblogs.com/blog/2800270/202311/2800270-20231110100852627-807688352.png"></p>
<p>出栈代码：</p>
<pre><code>POP {LR}       @先恢复 LR
POP {R0~R3,R12} @在恢复 R0~R3,R12
</code></pre>
<p>出栈的就是从栈顶，也就是 SP 当前执行的位置开始，地址依次减小来提取堆栈中的数据到要恢复的寄存器列表中。</p>
<h3 id="2stmfd和ldmfd">2.STMFD和LDMFD</h3>
<p>PUSH 和 POP 的另外一种写法是“STMFD SP！”和“LDMFD SP!”，上述代码可以改成：</p>
<pre><code> STMFD SP!,{R0~R3, R12} @R0~R3,R12 入栈
STMFD SP!,{LR} @LR 入栈

LDMFD SP!, {LR} @先恢复 LR
LDMFD SP!, {R0~R3, R12}    @再恢复 R0~R3, R12
</code></pre>
<p>TMFD 可以分为两部分：STM 和 FD，同理，LDMFD 也可以分为 LDM 和 FD。</p>
<p>LDR和STR是数据加载和存储指令，但是每次只能读写存储器中的一个数据。STM 和 LDM 就是多存储和多加载，可以连续的读写存储器中的多个连续数据。FD 是 Full Descending 的缩写，即满递减的意思。根据 ATPCS 规则,ARM 使用的 FD 类型的堆栈，SP 指向最后一个入栈的数值，堆栈是由高地址向下增长的，也就是前面说的向下增长的堆栈，因此最常用的指令就是 STMFD 和 LDMFD。STM 和 LDM 的指令寄存器列表中编号小的对应低地址，编号高的对应高地址。</p>
<h2 id="跳转指令">跳转指令</h2>
<p>关于跳转可以有多种跳转方法，比如：</p>
<p>1.直接使用跳转指令B、BL、BX</p>
<p>2.直接向PC寄存器里面写入数据，借助PC指针直接跳转</p>
<p>通常我们还是使用跳转指令进行跳转：</p>
<table>
<thead>
<tr>
<th>指令</th>
<th>描述</th>
</tr>
</thead>
<tbody>
<tr>
<td>B</td>
<td>跳转到label，如果跳转范围超过了+/-2KB，可以指定B.W使用32位版本的跳转指令，这样可以得到较大范围的跳转</td>
</tr>
<tr>
<td>BX</td>
<td>间接跳转，跳转到存放于Rm中的地址处，并切换指令集</td>
</tr>
<tr>
<td>BL</td>
<td>跳转到标号地址，并将返回地址保存在LR中</td>
</tr>
<tr>
<td>BLX</td>
<td>结合 BX 和 BL 的特点，跳转到 Rm 指定的地址，并将返回地址保存在 LR 中，切换指令集</td>
</tr>
</tbody>
</table>
<p>在汇编中常用的是B和BL指令：</p>
<h3 id="1b指令">1.B指令</h3>
<p>B 指令会将 PC 寄存器的值设置为跳转目标地址，一旦执行 B 指令，ARM 处理器就会立即跳转到指定的目标地址。如果要调用的函数不会再返回到原来的执行处，那就可以用 B 指令。示例如下：</p>
<pre><code>_start:

ldr sp,=0X80200000 @设置栈指针
b main             @跳转到main函数
</code></pre>
<p>这就是典型的在汇编中初始化 C运行环境，然后跳转到C文件的 main函数中运行，上述代码只是初始化了 SP 指针，有些处理器还需要做其他的初始化，比如初始化 DDR 等等。因为跳转到 C 文件以后再也不会回到汇编了，所以在第 4 行使用了 B 指令来完成跳转。</p>
<h3 id="2bl指令">2.BL指令</h3>
<p>BL 指令相比 B 指令，在跳转之前会在寄存器 LR(R14)中保存当前 PC 寄存器值，所以可以通过将 LR 寄存器中的值重新加载到 PC 中来继续从跳转之前的代码处运行，这是子程序调用一个基本但常用的手段。</p>
<p>比如 Cortex-A 处理器的 irq 中断服务函数都是汇编写的，主要用汇编来实现现场的保护和恢复、获取中断号等。但是具体的中断处理过程都是 C 函数，所以就会存在汇编中调用 C 函数的问题。</p>
<p>而且当 C 语言版本的中断处理函数执行完成以后是需要返回到irq 汇编中断服务函数，因为还要处理其他的工作，一般是恢复现场。这个时候就不能直接使用B 指令了，因为 B 指令一旦跳转就再也不会回来了，这个时候要使用 BL 指令。</p>
<pre><code>push {r0,r1}    @ 保存r0,r1
cps #0x13       @ 进入SVC模式，允许其他中断再次进去

bl system_irqhandler @ 加载C语言中断处理函数到r2寄存器中

cps #0x12       @ 进入IRQ模式
pop {r0,r1}
str r0,@ 中断执行完成，写EOIR
</code></pre>
<p>第 5 行就是执行 C 语言版的中断处理函数，当处理完成以后是需要返回来继续执行下面的程序，所以使用了 BL 指令。</p>
<p><strong>注：</strong></p>
<p>cps是一条armv7的汇编命令，功能是在特权模式下，直接修改CPSR寄存器的M，让处理器进入不同的模式</p>
<p>CPSR 的寄存器结构模型：</p>
<p><img src="https://img2023.cnblogs.com/blog/2800270/202311/2800270-20231110100906067-1505707003.png"></p>
<p>其中<strong>M</strong> 就是处理器的模式控制为，不同的编码对应着不同的处理器模式，如下图所示：</p>
<p><img src="https://img2023.cnblogs.com/blog/2800270/202311/2800270-20231110100909433-1757116848.png"></p>
<h2 id="算数运算指令">算数运算指令</h2>
<p>汇编中可以继续算数运算，比如加减乘除，常用命令如下表(#immed为立即数)：</p>
<table>
<thead>
<tr>
<th>指令</th>
<th>计算公式</th>
<th>备注</th>
</tr>
</thead>
<tbody>
<tr>
<td>ADD Rd,Rn,Rm</td>
<td>Rd = Rn + Rm</td>
<td>加法运算，指令为ADD</td>
</tr>
<tr>
<td>ADD Rd,Rn,#immed</td>
<td>Rd = Rn + #immed</td>
<td>加法运算，指令为ADD</td>
</tr>
<tr>
<td>ADC Rd,Rn,Rm</td>
<td>Rd = Rn + Rm + 进位</td>
<td>带进位的加法运算，指令为ADC</td>
</tr>
<tr>
<td>ADC Rd,Rn,#immed</td>
<td>Rd = Rd + #immed +进位</td>
<td>带进位的加法运算，指令为 ADC</td>
</tr>
<tr>
<td>SUB Rd,Rn,Rm</td>
<td>Rd = Rn – Rm</td>
<td>减法</td>
</tr>
<tr>
<td>SUB Rd,#immed</td>
<td>Rd = Rd - #immed</td>
<td>减法</td>
</tr>
<tr>
<td>SUB Rd, Rn, #immed</td>
<td>Rd = Rn - #immed</td>
<td>减法</td>
</tr>
<tr>
<td>SBC Rd, Rn, #immed</td>
<td>Rd = Rn - #immed – 借位</td>
<td>带借位的减法</td>
</tr>
<tr>
<td>SBC Rd, Rn ,Rm</td>
<td>Rd = Rn – Rm – 借位</td>
<td>带借位的减法</td>
</tr>
<tr>
<td>MUL Rd, Rn, Rm</td>
<td>Rd = Rn * Rm</td>
<td>乘法(32 位)</td>
</tr>
<tr>
<td>UDIV Rd, Rn, Rm</td>
<td>Rd = Rn / Rm</td>
<td>无符号除法</td>
</tr>
<tr>
<td>SDIV Rd, Rn, Rm</td>
<td>Rd = Rn / Rm</td>
<td>有符号除法</td>
</tr>
</tbody>
</table>
<p>在嵌入式开发中最常会用的就是加减指令，乘除基本用不到。</p>
<h2 id="逻辑运算指令">逻辑运算指令</h2>
<p>在C语言中常常需要用到逻辑运算，比如"&"和"|"等逻辑运算符。使用汇编语言的时候也可以使用逻辑运算指令，如下表：</p>
<table>
<thead>
<tr>
<th>指令</th>
<th>计算公式</th>
<th>备注</th>
</tr>
</thead>
<tbody>
<tr>
<td>AND Rd,Rn</td>
<td>Rd  =Rd & Rn</td>
<td>按位与</td>
</tr>
<tr>
<td>AND Rd,Rn,#immed</td>
<td>Rd = Rn & #immed</td>
<td>按位与</td>
</tr>
<tr>
<td>AND Rd,Rn，Rm</td>
<td>Rd = Rn & Rm</td>
<td>按位与</td>
</tr>
<tr>
<td>ORR Rd,Rn</td>
<td>Rd = Rd| Rn</td>
<td>按位或</td>
</tr>
<tr>
<td>ORR Rd,Rn,Rm</td>
<td>Rd = Rn|Rm</td>
<td>按位或</td>
</tr>
<tr>
<td>ORR Rd,Rn,#immed</td>
<td>Rd = Rn|#immed</td>
<td>按位或</td>
</tr>
<tr>
<td>BIC Rd,Rn</td>
<td>Rd = Rd & (~Rn)</td>
<td>位清除</td>
</tr>
<tr>
<td>BIC Rd,Rn,Rm</td>
<td>Rd = Rn &(~Rm)</td>
<td>位清除</td>
</tr>
<tr>
<td>BIC Rd,Rn,#immed</td>
<td>Rd = Rn &(~#immed)</td>
<td>位清除</td>
</tr>
<tr>
<td>ORN Rd,Rn,#immed</td>
<td>Rd = Rn|(#immed)</td>
<td>按位或非</td>
</tr>
<tr>
<td>ORN Rd,Rn,Rm</td>
<td>Rd = Rn|(Rm)</td>
<td>按位或非</td>
</tr>
<tr>
<td>EOR Rd,Rn</td>
<td>Rd = Rd ^ Rn</td>
<td>按位异或</td>
</tr>
<tr>
<td>EOR Rd,Rn,#immed</td>
<td>Rd = Rd ^ #immed</td>
<td>按位异或</td>
</tr>
<tr>
<td>EOR Rd,Rn,Rm</td>
<td>Rd = Rn ^ Rm</td>
<td>按位异或</td>
</tr>
</tbody>
</table>
<p>参考文章：<br>
https://blog.csdn.net/weixin_45309916/article/details/107837561</p><br><br>
来源：https://www.cnblogs.com/Wangzx000/p/17823477.html

頁: [1]

圆梦公社's Archiver

【汇编】汇编语言语法