2024年arm九种寻址方式

本系列文章节选自本人所著《深入浅出嵌入式底层软件开发》。

要想进行ARM的汇编编程，首当其冲要知道最基本、最常用的指令，而要了解指令则必须要了解寻址方式。所以这里将聚焦在——基本寻址方式和基本指令。

首先，来看一看我们已经见过的2条指令：MOV pc, lr和BL addsub

最简单的汇编指令格式是操作码（例如：MOV、BL）和操作数（例如：pc, lr, addsub）。操作码易于理解，例如MOV表示将某个值从一处传送到另一处，BL表示跳转到某处；而操作数则表示一处和另一处到底是哪里（是在寄存器中还是内存中），要跳转的位置在哪里（或者是绝对地址或者是相对地址）。

操作数部分要解决的问题是：到哪里去获得操作数？因此就有了寻址方式的分类。基本上来讲，ARM共有8种寻址方式，这里我们先了解其中最基本的3种寻址方式：寄存器寻址、立即数寻址、寄存器间接寻址。

1.2.1 最常见寻址方式精解

1. 寄存器寻址

MOV pc, lr 表示操作数来源于寄存器（pc和lr）。对于这种寻址方式而言，在指令的32位机器码中的地址码部分，存放的是寄存器（pc和lr）的编号，故称之为寄存器寻址。

2. 立即数寻址

MOV pc, #64 表示将常数64放入寄存器pc，其中常数64被称为立即数。立即数寻址指令中的地址码部分就是操作数本身，也就是说，数据就包含在指令当中，取出指令也就取出了可以立即使用的操作数(故称为立即数)。

这里，可能大家会看出一个问题：由于立即数是位于32位机器码中的，而32位机器码中除了操作数外还有操作码，这就意味着不可能用全部32bit来表示立即数。事实上，ARM机器指令中，仅用了最低的12bit来表示立即数。那么我们自然推论立即数的范围是-2048——2047，这意味着MOV pc, #8192这样的指令是非法的。但事实情况并非如此，MOV pc，#8192是合法且能正常运行的。真实情况是，ARM机器指令可以表示的立即数范围是-2^31--2^31-1，只不过它只能表示这其中的 2^12个数字而已。ARM是这样用12bit来表示一个立即数的：将12bit划分为2部分——高4位和低8位，将低8位补0扩展为32位，然后循环右移 X位（X = 高4位表示的无符号整数*2），例如：如果32位机器码中低12bit为0x512，则其表示的立即数为0x0

图1 - 4 12bit立即数

这里，请大家不妨现在先思考2个问题，我们将在后续章节中予以解答：

（1）为什么ARM要这样设计，而不是按照我们最常见的想法（即：12bit就表示-2^11 --2^11-1中的数）

（2）如果我们需要mov r0, #10000这样的指令，应该怎么办？（常数10000不能按照如上的方法进行表示）

3. 寄存器间接寻址

寄存器间接寻址指令中的地址码给出的是一个通用寄存器的编号，所需的操作数保存在寄存器指定地址的存储单元中，即寄存器中存放的是操作数的内存地址。例如：

LDR R0， [R2]表示将R2中存放的数作为内存地址，到该内存处取出存放的数，放到寄存器R0中

图1 - 5 执行LDRR0， [R2]前的情况图1 -6 执行LDRR0， [R2]后的情况

1.2.2 最常见指令精解

了解了基本的寻址方式后，我们现在来看一看最常用的汇编指令

1. 单寄存器加载指令。主要有

加载字指令：LDR r0, [r1]，将内存中的一个字（4个字节）加载到寄存器r0中

加载字节指令：LDRB r0, [r1]，将内存中的一个字节加载到寄存器r0中

有符号数加载字节指令：LDRSB r0, [r1]，这条指令与上一条指令的不同之处在于，由于加载的是一个字节，而不是一个字，所以需要确定寄存器r0的高24bit是什么。对于上一条指令，r0的高24bit补0，而本条指令，r0的高24bit补符号位，也就是补r0的bit7

2. 单寄存器存储指令。主要有

存储字指令：STR r0, [r1]，将r0中的值存储到内存的4个字节中

存储字节指令：STRB r0, [r1]，将r0的低8bit存储到内存的1个字节中

3. 分支指令，共3条：B、BL、BX

B label ：跳转到标号label处，也就是说在该条b指令执行后，下一条执行的指令是标号label处的指令。

BL label ：与B指令的功能相同，也实现跳转，不同之处在于，bl在跳转的同时还要将返回地址（bl指令的下一条指令的地址）保存到lr中

BX r0 ：将r0的值作为地址，跳转到该地址处，并根据r0的值决定是否在ARM和thumb态之间进行切换。

特别说明：

B和BL指令，其跳转范围限制在当前指令的±32M字节地址内(ARM指令为字对齐，最低2位地址固定为0)。

4. 数据处理指令

MOV r0, r1：将r1的值赋给r0

ADD（SUB） r0, r1, r2：将r1的值加上（减去）r2的值，结果存放到r0中

AND（ORR, EOR） r0, r1, r2：将r1的值与（或、异或）r2的值，结果存放到r0中

CMP r1, r2：比较r1与r2值的大小

特别需要说明的问题：

指令CMP r1，r2，其运行细节是：执行r1 - r2的操作，如果结果为负数，则置位CPSR的N位，清零Z位；结果为0，则清零CPSR的N位，置位Z位；结果为正，则清零CPSR的N位，清零Z位。但r1 - r2的结果并不保存。CMP指令通常用于分支跳转。例如，如下的C程序

int i，j；

if (i = = j) {

i++;

} else {

j++;

}

1.2.1 最常见寻址方式精解

1. 寄存器寻址

1.2.2 最常见指令精解

知秋君

相关推荐