正文

arm汇编基础详解(代码片段)

行稳方能走远  行稳方能走远  2022-12-08  126

关键词：

前言

我们在进行嵌入式 Linux 开发的时候是绝对要掌握基本的 ARM 汇编，因为 Cortex-A 芯片一上电 SP 指针还没初始化，C 环境还没准备好，所以肯定不能运行 C 代码，必须先用汇编语言设置好 C 环境，比如初始化 DDR、设置 SP指针等等，当汇编把 C 环境设置好了以后才可以运行 C 代码。所以 Cortex-A 一开始肯定是汇编代码，其实 STM32 也一样的，一开始也是汇编，以 STM32F103 为例，启动文件startup_stm32f10x_hd.s 就是汇编文件，只是这个文件 ST 已经写好了，我们根本不用去修改，所以大部分学习者都没有深入的去研究。汇编的知识很庞大，本章我们只讲解最常用的一些指令，满足我们后续学习即可。

至于要写多少汇编程序，那就看你能在哪一步把C 语言环境准备好。所谓的C语言环境就是保证C 语言能够正常运行。C 语言中的函数调用涉及到出栈入栈，出栈入栈就要对堆栈进行操作，所谓的堆栈其实就是一段内存，这段内存比较特殊，由SP 指针访问，SP 指针指向栈顶。芯片一上电SP 指针还没有初始化，所以C 语言没法运行，对于有些芯片还需要初始化DDR，因为芯片本身没有RAM，或者内部RAM 不开放给用户使用，用户代码需要在DDR 中运行，因此一开始要用汇编来初始化DDR 控制器。后面学习Uboot 和Linux 内核的时候汇编是必须要会的。在芯片上电以后用汇编来初始化一些外设，不会涉及到复杂的代码，而且使用到的指令都是很简单的，用到的就那么十几个指令。

1.GNU 汇编语法

如果大家使用过 STM32 的话就会知道 MDK 和 IAR 下的启动文件 startup_stm32f10x_hd.s其中的汇编语法是有所不同的，将 MDK 下的汇编文件直接复制到 IAR 下去编译就会出错，因为 MDK 和 IAR 的编译器不同，因此对于汇编的语法就有一些小区别。我们要编写的是 ARM汇编，编译使用的 GCC 交叉编译器，所以我们的汇编代码要符合 GNU 语法。

GNU 汇编语法适用于所有的架构，并不是 ARM 独享的，GNU 汇编由一系列的语句组成，每行一条语句，每条语句有三个可选部分，如下：

label：instruction @ comment

label 即标号，表示地址位置，有些指令前面可能会有标号，这样就可以通过这个标号得到指令的地址，标号也可以用来表示数据地址。注意 label 后面的“：”，任何以“：”结尾的标识符都会被识别为一个标号。

instruction 即指令，也就是汇编指令或伪指令

@ 符号，表示后面的是注释，就跟 C 语言里面的“/”和“/”一样，其实在 GNU 汇编文件中我们也可以使用“/”和“/”来注释。

comment 就是注释内容。

比如如下代码：

add:
MOVS R0, #0X12         @设置 R0=0X12

上面代码中“add:”就是标号，“MOVS R0,#0X12”就是指令，最后的“@设置 R0=0X12”就是注释。

注意！ARM 中的指令、伪指令、伪操作、寄存器名等可以全部使用大写，也可以全部使用小写，但是不能大小写混用。

用户可以使用.section 伪操作来定义一个段，每个段以段名开始，以下一段名或者文件结尾结束，比如：

.section .testsection @定义一个 testsetcion 段

汇编系统预定义了一些段名：

定义	段名
.text	表示代码段。
.data	初始化的数据段。
.bss	未初始化的数据段。
.rodata	只读数据段。

汇编程序的默认入口标号是_start，不过我们也可以在链接脚本中使用 ENTRY 来指明其它的入口点，下面的代码就是使用_start 作为入口标号：

.global _start

_start:
ldr r0, =0x12 @r0=0x12

上面代码中.global 是伪操作，表示_start 是一个全局标号，类似 C 语言里面的全局变量一样，常见的伪操作有（了解即可）：

伪操作	含义
.byte	定义单字节数据，比如.byte 0x12。
.short	定义双字节数据，比如.short 0x1234。
.long	定义一个 4 字节数据，比如.long 0x12345678。
.equ	赋值语句，格式为：.equ 变量名，表达式，比如.equ num, 0x12，表示 num=0x12。
.align	数据字节对齐，比如：.align 4 表示 4 字节对齐。
.end	表示源文件结束。
.global	定义一个全局符号，格式为：.global symbol，比如：.global _start。

GNU 汇编还有其它的伪操作，但是最常见的就是上面这些，如果想详细的了解全部的伪操作，可以参考《ARM Cortex-A(armV7)编程手册 V4.0.pdf》的 57 页。

GNU 汇编同样也支持函数，函数格式如下：

函数名:

	函数体
	返回语句

GNU 汇编函数返回语句不是必须的，如下代码就是用汇编写的。 Cortex-A7 中断服务函数：

                                  汇编函数的定义
/* 未定义中断 */
Undefined_Handler:
	ldr r0, =Undefined_Handler
	bx r0
	
/* SVC 中断 */
SVC_Handler:
	ldr r0, =SVC_Handler
	bx r0

/* 预取终止中断 */
PrefAbort_Handler:
	ldr r0, =PrefAbort_Handler
	bx r0

上述代码中定义了三个汇编函数：Undefined_Handler、SVC_Handler 和PrefAbort_Handler。以函数 Undefined_Handler 为例我们来看一下汇编函数组成，“Undefined_Handler”就是函数名，“ldr r0, =Undefined_Handler”是函数体，“bx r0”是函数返回语句，“bx”指令是返回指令，函数返回语句不是必须的。

2.Cortex-A7 常用汇编指令

介绍一些常用的 Cortex-A7 汇编指令，如果想系统的了解 Cortex-A7 的所有汇编指令请参考《ARM ArchitectureReference Manual ARMv7-A and ARMv7-R edition.pdf》的 A4章节。

2.1 处理器内部数据传输指令

使用处理器做的最多事情就是在处理器内部来回的传递数据，常见的操作有：

①、将数据从一个寄存器传递到另外一个寄存器。
②、将数据从一个寄存器传递到特殊寄存器，如 CPSR 和 SPSR 寄存器。
③、将立即数传递到寄存器。

数据传输常用的指令有三个：MOV、MRS 和 MSR，这三个指令的用法如表 7.2.1.1 所示：

指令	目的	源	描述
MOV	R0	R1	将 R1 里面的数据复制到 R0 中。
MRS	R0	CPSR	将特殊寄存器 CPSR 里面的数据复制到 R0 中。
MSR	CPSR	R1	将 R1 里面的数据复制到特殊寄存器 CPSR 里中。

分别来详细的介绍一下如何使用这三个指令：

1 、MOV 指令

MOV 指令用于将数据从一个寄存器拷贝到另外一个寄存器，或者将一个立即数传递到寄存器里面，使用示例如下：

MOV     R0，R1                      @将寄存器 R1 中的数据传递给 R0，即 R0=R1
MOV     R0, #0X12                   @将立即数 0X12 传递给 R0 寄存器，即 R0=0X12

2 、MRS 指令

MRS 指令用于将特殊寄存器(如 CPSR 和 SPSR)中的数据传递给通用寄存器，要读取特殊寄存器的数据只能使用 MRS 指令！使用示例如下：

MRS    R0, CPSR       @将特殊寄存器 CPSR 里面的数据传递给 R0，即 R0=CPSR

3 、MSR 指令

MSR 指令和 MRS 刚好相反，MSR 指令用来将普通寄存器的数据传递给特殊寄存器，也就是写特殊寄存器，写特殊寄存器只能使用 MSR，使用示例如下：

MSR    CPSR, R0            @将 R0 中的数据复制到 CPSR 中，即 CPSR=R0

上面三条指令均不能实现a=b（赋值），因为他们直接操作的是处理器内部寄存器（上篇博文给出了内部寄存器的示意图），而a=b（赋值）是对内存（RAM）的操作。
下面的存储器（即RAM，不是SD卡，不是FLASH）访问指令才可以实现。

2.2 存储器访问指令

ARM的CPU 不能直接访问存储器(RAM)中的数据，I.MX6UL 中的寄存器就是 RAM 类型的，我们用汇编来配置 I.MX6UL 寄存器的时候需要借助存储器访问指令，一般先将要配置的值写入到 Rx(x=0~12)（通用）寄存器中，然后借助存储器访问指令将 Rx 中的数据写入到 I.MX6UL 寄存器中。读取 I.MX6UL 寄存器也是一样的，只是过程相反。常用的存储器访问指令有两种：LDR 和STR，用法如表：

指令	描述
LDR Rd, [Rn , #offset]	从存储器(RAM) Rn+offset 的位置读取数据存放到 Rd 中。
STR Rd, [Rn, #offset]	将 Rd 中的数据写入到存储器(RAM)中的 Rn+offset 位置。

分别来详细的介绍一下如何使用这两个指令（写驱动最常用的两个指令）：

1 、LDR 指令

LDR 主要用于从存储器(RAM)加载数据到寄存器 Rx 中，LDR 也可以将一个立即数加载到寄存器 Rx中，LDR 加载立即数的时候要使用“=”，而不是“#”。在嵌入式开发中，LDR 最常用的就是读取 CPU 的寄存器值，比如 I.MX6UL 有个寄存器 GPIO1_GDIR，其地址为 0X0209C004，我们现在要读取这个寄存器中的数据，示例代码如下：

                            示例代码  LDR 指令使用
                            
 LDR   R0, =0X0209C004      @将寄存器地址 0X0209C004 加载到 R0 中，即 R0=0X0209C004

 LDR   R1, [R0]             @读取地址 0X0209C004 中的数据到 R1 寄存器中

上述代码就是读取寄存器 GPIO1_GDIR 中的值，读取到的寄存器值保存在 R1 寄存器中，上面代码中 offset 是 0，也就是没有用到 offset。

2 、STR 指令

LDR 是从存储器读取数据，STR 就是将数据写入到存储器中，同样以 I.MX6UL 寄存器GPIO1_GDIR 为例，现在我们要配置寄存器 GPIO1_GDIR 的值为 0X2000002，示例代码如下：

                          示例代码  STR 指令使用
 LDR     R0, =0X0209C004 	  @将寄存器地址 0X0209C004 加载到 R0 中，即 R0=0X0209C004
 LDR	 R1, =0X20000002 	  @R1 保存要写入到寄存器的值，即 R1=0X20000002
 STR	 R1, [R0] 		      @将 R1 中的值写入到 R0 中所保存的地址中

LDR 和 STR 都是按照字进行读取和写入的，也就是操作的 32 位数据，如果要按照字节、半字进行操作的话可以在指令“LDR”后面加上 B 或 H，比如按字节操作的指令就是 LDRB 和STRB，按半字操作的指令就是 LDRH 和 STRH。

2.3 压栈和出栈指令（了解）

我们通常会在 A 函数中调用 B 函数，当 B 函数执行完以后再回到 A 函数继续执行。要想在跳回 A 函数以后代码能够接着正常运行，那就必须在跳到 B 函数之前将当前处理器状态保存起来(就是保存 R0~R15 这些寄存器值)，当 B 函数执行完成以后再用前面保存的寄存器值恢复R0~R15 即可。保存 R0~R15 寄存器的操作就叫做现场保护，恢复 R0~R15 寄存器的操作就叫做恢复现场。在进行现场保护的时候需要进行压栈(入栈)操作，恢复现场就要进行出栈操作。压栈的指令为 PUSH，出栈的指令为 POP，PUSH 和 POP 是一种多存储和多加载指令，即可以一次操作多个寄存器数据，他们利用当前的栈指针 SP 来生成地址，PUSH 和 POP 的用法如表所示：

指令	描述
PUSH	将寄存器列表存入栈中。
POP	从栈中恢复寄存器列表。

假如我们现在要将 R0~R3 和 R12 这 5 个寄存器压栈，当前的 SP 指针指向 0X80000000，处理器的堆栈是向下增长的，使用的汇编代码如下:

PUSH 	R0~R3, R12 	@将 R0~R3 和 R12 压栈

压栈完成以后的堆栈如图所示：

在这里插入图片描述
就是分两步对 R0~R3,R2 和 LR 进行压栈以后的堆栈模型，如果我们要出栈的话就是使用如下代码：

POP   LR          @先恢复 LR
POP   R0~R3,R12   @在恢复 R0~R3,R12

出栈的就是从栈顶，也就是 SP 当前执行的位置开始，地址依次减小来提取堆栈中的数据到要恢复的寄存器列表中。PUSH 和 POP 的另外一种写法是“STMFD SP！”和“LDMFD SP!”，
因此上面的汇编代码可以改为：

 STMFD 	SP!,R0~R3, R12 	@R0~R3,R12 入栈
 STMFD 	SP!,LR 			@LR 入栈

 LDMFD 	SP!, LR 			@先恢复 LR
 LDMFD	 SP!, R0~R3, R12  @再恢复 R0~R3, R12

STMFD 可以分为两部分：STM 和 FD，同理，LDMFD 也可以分为 LDM 和 FD。看到 STM和 LDM 有没有觉得似曾相识(不是 STM32 啊啊啊啊)，前面我们讲了 LDR 和 STR，这两个是数据加载和存储指令，但是每次只能读写存储器中的一个数据。STM 和 LDM 就是多存储和多加载，可以连续的读写存储器中的多个连续数据。FD 是 Full Descending 的缩写，即满递减的意思。根据 ATPCS 规则,ARM 使用的 FD 类型的堆栈，SP 指向最后一个入栈的数值，堆栈是由高地址向下增长的，也就是前面说的向下增长的堆栈，因此最常用的指令就是 STMFD 和 LDMFD。STM 和 LDM 的指令寄存器列表中编号小的对应低地址，编号高的对应高地址。

2.4 跳转指令

有多种跳转操作，比如：

①、直接使用跳转指令 B、BL、BX 等。
②、直接向 PC 寄存器里面写入数据。
上述两种方法都可以完成跳转操作，但是一般常用的还是 B、BL 或 BX，用法如表:

指令	描述
B	跳转到 label，如果跳转范围超过了+/-2KB，可以指定 B.W使用 32 位版本的跳转指令，这样可以得到较大范围的跳转
BX	间接跳转，跳转到存放于 Rm 中的地址处，并且切换指令集
BL	跳转到标号地址，并将返回地址保存在 LR 中。
BLX	结合 BX 和 BL 的特点，跳转到 Rm 指定的地址，并将返回地址保存在 LR 中，切换指令集。

我们重点来看一下 B 和 BL 指令，因为这两个是我们用的最多的，如果要在汇编中进行函数调用使用的就是 B 和 BL 指令：

1 、B 指令

这是最简单的跳转指令，B 指令会将 PC 寄存器的值设置为跳转目标地址，一旦执行 B 指令，ARM 处理器就会立即跳转到指定的目标地址。如果要调用的函数不会再返回到原来的执行处，那就可以用 B 指令，如下示例：

					示例代码  B 指令示例
 _start:

 	ldr   sp,=0X80200000 	@设置栈指针
	b  main 				@跳转到 main 函数

上述代码就是典型的在汇编中初始化 C运行环境，然后跳转到C文件的 main函数中运行，上述代码只是初始化了 SP 指针，有些处理器还需要做其他的初始化，比如初始化 DDR 等等。因为跳转到 C 文件以后再也不会回到汇编了，所以在第 4 行使用了 B 指令来完成跳转。

2 、BL 指令

BL 指令相比 B 指令，在跳转之前会在寄存器 LR(R14)中保存当前 PC 寄存器值，所以可以通过将 LR 寄存器中的值重新加载到 PC 中来继续从跳转之前的代码处运行，这是子程序调用一个基本但常用的手段。比如 Cortex-A 处理器的 irq 中断服务函数都是汇编写的，主要用汇编来实现现场的保护和恢复、获取中断号等。但是具体的中断处理过程都是 C 函数，所以就会存在汇编中调用 C 函数的问题。而且当 C 语言版本的中断处理函数执行完成以后是需要返回到irq 汇编中断服务函数，因为还要处理其他的工作，一般是恢复现场。这个时候就不能直接使用B 指令了，因为 B 指令一旦跳转就再也不会回来了，这个时候要使用 BL 指令，示例代码如下：

				示例代码 BL 指令示例
1 	push 	r0, r1 			@保存 r0,r1
2 	cps 	#0x13 				@进入 SVC 模式，允许其他中断再次进去
3
5 	bl 		system_irqhandler 	@加载 C 语言中断处理函数到 r2 寄存器中
6
7 	cps 	#0x12 				@进入 IRQ 模式
8 	pop 	r0, r1
9 	str 	r0, [r1, #0X10] 	@中断执行完成，写 EOIR

上述代码中第 5 行就是执行 C 语言版的中断处理函数，当处理完成以后是需要返回来继续执行下面的程序，所以使用了 BL 指令。

2.5 算术运算指令

汇编中也可以进行算术运算，比如加减乘除，常用的运算指令用法如表所示：

指令	计算公式	备注
ADD Rd, Rn, Rm	Rd = Rn + Rm	加法运算，指令为 ADD
ADD Rd, Rn, #immed	Rd = Rn + #immed	加法运算，指令为 ADD
ADC Rd, Rn, Rm	Rd = Rn + Rm + 进位	带进位的加法运算，指令为 ADC
ADC Rd, Rn, #immed	Rd = Rn + #immed +进位	带进位的加法运算，指令为 ADC
SUB Rd, Rn, Rm	Rd = Rn – Rm	减法
SUB Rd, #immed	Rd = Rd - #immed	减法
SUB Rd, Rn, #immed	Rd = Rn - #immed	减法
SBC Rd, Rn, #immed	Rd = Rn - #immed – 借位	带借位的减法
SBC Rd, Rn ,Rm	Rd = Rn – Rm – 借位	带借位的减法
MUL Rd, Rn, Rm	Rd = Rn * Rm	乘法(32 位)
UDIV Rd, Rn, Rm	Rd = Rn / Rm	无符号除法
SDIV Rd, Rn, Rm	Rd = Rn / Rm	有符号除法

在嵌入式开发中最常会用的就是加减指令，乘除基本用不到。

2.6 逻辑运算指令

我们用 C 语言进行 CPU 寄存器配置的时候常常需要用到逻辑运算符号，比如“&”、“|”等逻辑运算符。使用汇编语言的时候也可以使用逻辑运算指令，常用的运算指令用法如表所示：
在这里插入图片描述
逻辑运算指令都很好理解，后面时候汇编配置 I.MX6UL 的外设寄存器的时候可能会用到

ios汇编入门教程arm64汇编基础(代码片段)

__attribute__anti_debug__arm64____asm____volatile__testabresabresmainrestesthelloBBspspstrw0strw1ldrw0ldrw1addw0w0w1strw0ldrw0addspspretBBspspstpx29x30addx29sporrw0wzrorrw1wzrsturwzrbl_testmovw1strw0m 查看详情

linux驱动开发：arm汇编基础(代码片段)

文章目录Linux驱动开发：ARM汇编基础一、GUN汇编语法1.1语句结构：1.2伪操作1.3GUN函数二、ARM的寻址方式2.1立即寻址2.2寄存器寻址2.3寄存器间接寻址2.4基址变址寻址2.5多寄存器寻址2.6相对寻址2.7堆栈寻址三、Cortex-A常用汇编... 查看详情

android逆向基础之arm汇编语言知识总结(代码片段)

文章目录前言ARM32汇编1.1寄存器1.2寻址方式1.3汇编指令1.4代码识别1.5IDA示例ARM64汇编2.1寄存器2.2变址寻址方式2.3常用汇编指令2.4实例程序分析总结前言X86是英特尔Intel首先开发制造的一种微处理器体系结构的泛称，包括Intel8086... 查看详情

arm汇编基础上(代码片段)

...集处理器，其指令集的设计是定长的，也就是其汇编对应的机器码是定长的（2字节或者4字节）。那么对于定长而言，其优点就是更快的被执行，因为这样CPU取指令译码的速度相对x86的CPU会快一些，但... 查看详情

arm汇编基础基于keil创建stm32汇编程序的编写(代码片段)

文章目录一、新建项目（1）工具介绍（2）创建项目：二、配置环境（1）配置芯片（2）配置运行环境三、调试代码（这里选择使用的是仿真调试）（1）源代码（2）仿真设... 查看详情

arm开发入门与汇编基础(代码片段)

2019-12-12关键字：汇编指令基础首先ARM是一家公司，它成立于1990年。ARM公司主要是设计ARM系列的RISC处理器内核，并将这些内核授权给合作伙伴进行生产与销售。ARM公司是一家只负责设计内核而不生产芯片的公司。 ARM芯片... 查看详情

android逆向基础之arm汇编语言知识总结(代码片段)

嵌入式：arm符号定义伪操作详解(代码片段)

文章目录ARM汇编语言的伪操作、宏指令与伪指令两种编译模式的集成开发环境IDE介绍ADS/SDTIDE开发环境集成了GNU开发工具的IDE开发环境ADS编译环境下的ARM伪操作和宏指令符号定义伪操作GBLA，GBLL及GBLS语法格式使用示例LCLA，... 查看详情

嵌入式：arm符号定义伪操作详解

ARM汇编语言的伪操作、宏指令与伪指令ARM汇编语言源程序中语句一般由指令、伪操作、宏指令和伪指令组成伪操作是ARM汇编语言程序里的一些特殊指令助记符，它的作用主要是为完成汇编程序做各种准备工作，在源程序进行汇编... 查看详情

arm汇编基础上(代码片段)

arm汇编简单介绍(代码片段)

1.汇编文件说明:　　汇编文件以【.s】结尾的文件格式　　注释：多行注释/**/ ；单行注释@ 2. 符号说明：　　1）汇编指令，一条指令对应一个机器码，完成一定的功能　　2）伪指令，一条指令对应多条机器码，... 查看详情

android逆向arm汇编(使用ida解析arm架构的动态库文件|分析malloc函数的arm汇编语言)(代码片段)

文章目录一、分析malloc函数的arm汇编语言一、分析malloc函数的arm汇编语言在上一篇博客【Android逆向】arm汇编(使用IDA解析arm架构的动态库文件|使用IDA打开arm动态库文件|切换IDA中汇编代码显示样式)打开并配置了选项;分析libc.so的... 查看详情

android逆向arm汇编(使用ida解析arm架构的动态库文件|分析malloc函数的arm汇编语言)(代码片段)

arm寄存器与汇编指令详解

介绍ARM寄存器之前，先来介绍一下ARM处理的模式：用户模式(User):ARM处理器正常的程序执行状态快速中断模式(FIQ):用于高速数据传输或通道处理外部中断模式(IRQ):用于通用的中断处理管理模式(Svc):操作系统使用的保护模式... 查看详情

arm汇编(代码片段)

汇编指令和伪指令的区别汇编指令是cpu机器指令的助记符，代表这个cpu的功能。伪指令本质不是指令，只是和汇编指令写在同一个代码中，它由编译器提供，用于指导编译过程，经过编译后伪指令最终不会生... 查看详情

《嵌入式-嵌入式大杂烩》arm汇编入门(代码片段)

我们在学习ARM的时候，一般都不用看汇编启动代码，直接使用芯片厂商提供的汇编启动代码，但是要想深入了解ARM内部原理，就必须掌握一定的汇编知识。我们在前面总结了处理器架构与指令集，那么汇编和... 查看详情

arm伪指令(代码片段)

...令集中的指令，只是为了编程方便人们定义了伪指令。在汇编时这些指令将会被等效的ARM指令或arm指令的组合代替。编程时可以像其他ARM指令一样使用伪指令，区别是伪指令不像指令一样有对应的机器编码。我今天主要给大家介... 查看详情

arm汇编内存访问指令(代码片段)

一。单个寄存器操作读写内存内存访问指令格式：<opcode><cond>Rd,[Rn]　　Rn中保存的是一个内存的地址值1.内存写指令【str，strb，strh】单个寄存器　　1)【str】写4个字节ldrr0,=0x12345678@movr1,#0x40000000strr0,[r1]@将r0... 查看详情