ARM Cortex-M3 技术解析：核寄存器R1-R15介绍及使用

作为嵌入式开发领域的经典处理器内核，ARM Cortex-M3（CM3）凭借其高效能、低功耗和丰富特性，在工业控制、物联网、消费电子等领域广泛应用。而内核寄存器是我们调试代码，理解程序运行逻辑必不可少的好帮手，理解汇编是通往嵌入式高手的必经之路。下面本文从技术角度解析其核心架构与核寄存器做相关讲解。

一、内核介绍

ARM Cortex-M3是一款面向嵌入式系统的32位RISC处理器内核，采用改进型哈佛架构，通过独立指令总线（I-Code）和数据总线（D-Code）实现并行访问，同时维护统一编址的4GB线性存储空间。内核配备三级流水线（取指、译码、执行）与静态分支预测机制，结合Thumb-2指令集混合16/32位编码，在保持高代码密度（相比纯32位指令节省约30%存储空间）的同时实现单周期32位乘法等运算能力。其嵌套向量中断控制器（NVIC）支持240个中断源，硬件自动完成优先级排序与现场保护，中断响应延迟固定为12个时钟周期，中断嵌套深度无软件限制。

存储器保护单元（MPU）可划分8个独立区域，实现特权模式与用户模式的访问权限隔离，支持大小端数据格式动态切换。调试系统集成串行线/JTAG（SWJ-DP）接口，支持4个硬件断点与2个数据观察点，配合可选ETM指令追踪模块实现实时执行流记录。电源管理模块提供睡眠、深度睡眠和待机三种低功耗模式，休眠电流最低1μA，运行功耗典型值低于200μA/MHz（基于90nm工艺）。该内核通过AHB-Lite总线矩阵连接外设，支持单周期GPIO操作与位带别名访问，硬件除法器可在2-12周期内完成32位整数运算。作为首款支持非对齐内存访问的Cortex-M系列处理器，其架构平衡了实时性、能效比与开发便利性，适用于工控、IoT等实时嵌入式场景。

二、核寄存器

Cortex‐M3 处理器拥有 R0‐R15 的寄存器组。其中 R13 作为堆栈指针 SP。SP 有两个，但在同一时刻只能有一个可以看到，这也就是所谓的“banked”寄存器。如下图所示的R13寄存器，分为主堆栈指针（MSP）、进程堆栈寄指针（PSP）。

R0-R12：通用寄存器

R0‐R12 都是 32 位通用寄存器，用于数据操作。但是注意：绝大多数 16 位 Thumb 指令只能访问 R0‐R7，而 32 位 Thumb‐2 指令可以访问所有寄存器。首先在程序的调用过程中，R0-R3寄存器都存储着调用函数的传参值，下一个函数用到了几个参数，就提前将参数存储在r0-r3里面，如果超出4个参数，就将多余的参数Push进堆栈中，在进入到调用的函数里面后，在Pop出栈给其他r4-r12寄存器。

下面我们举个例子，函数我是用函数指针的形式写的，你就把他当成调用一个函数，其中ptDevice，x，y，1都是传参。我们看下面的汇编代码，将1给到r3，将y给到r2，将x给到r1，最后将ptDevice给到r0，之后执行BLX跳转指令，进入到该函数中。

Banked R13: 两个堆栈指针

Cortex‐M3 拥有两个堆栈指针，然而它们是 banked，因此任一时刻只能使用其中的一个。

主堆栈指针（MSP）：复位后缺省使用的堆栈指针，用于操作系统内核以及异常处理例程（包括中断服务例程）
进程堆栈指针（PSP）：由用户的应用程序代码使用。

如下图，在STM32 F103芯片中，我们能看到这两个SP寄存器。之后我会单独出一章讲解MSP和PSP使用的场景，这里不做细讲。

堆栈指针的最低两位永远是 0，这意味着堆栈总是 4 字节对齐的。

在 ARM 编程领域中，凡是打断程序顺序执行的事件，都被称为异常(exception)。除了外部中断外，当有指令执行了“非法操作”，或者访问被禁的内存区间，因各种错误产生的 fault，以及不可屏蔽中断发生时，都会打断程序的执行，这些情况统称为异常。在不严格的上下文中，异常与中断也可以混用。另外，程序代码也可以主动请求进入异常状态的（常用于系统调用）。

R14：连接寄存器（LR）

当呼叫一个子程序时，由 R14 存储返回地址。

不像大多数其它处理器，ARM 为了减少访问内存的次数（访问内存的操作往往要 3 个以上指令周期，带 MMU和 cache 的就更加不确定了），把返回地址直接存储在寄存器中。这样足以使很多只有 1 级子程序调用的代码无需访问内存（堆栈内存），从而提高了子程序调用的效率。如果多于 1 级，则需要把前一级的 R14 值压到堆栈里。在 ARM上编程时，应尽量只使用寄存器保存中间结果，迫不得以时才访问内存。在 RISC 处理器中，为了强调访内操作越过了处理器的界线，并且带来了对性能的不利影响，给它取了一个专业的术语：溅出。

下面我们也再看一个例子，如下图所示，在我们调用函数的时候，会将函数执行完返回下一行指令存储在R14寄存器中，当执行完该函数后，就跳转回R14寄存器，即该函数执行完的下一行代码。执行完该跳转指令后的下一行指令的地址是0x08001CA6，此时将0x08001CA6的值存储在R14寄存器中，等待函数执行完，返回。由于Cortex M使用的是Thumb指令，地址跳转的指令需要加1，即08001CA7存储在R14寄存器中。

R15：程序计数寄存器–PC

指向当前的程序地址。如果修改它的值，就能改变程序的执行流。

其实就是程序跑到了哪里，R15就执行哪里，如下图所示。

特殊功能寄存器

Cortex‐M3 还在内核水平上搭载了若干特殊功能寄存器，包括程序状态字寄存器组（PSRs）中断屏蔽寄存器组（PRIMASK, FAULTMASK, BASEPRI）控制寄存器（CONTROL）

下图我们介绍一下STM32 F103的特殊寄存器，当我们执行CMP，BLE，CBZ等等这些汇编代码时，这些代码执行完都会影响状态寄存器xPSR中的值，给后续汇编代码执行其他跳转、比较或者其他汇编指令的时候提供条件判断。

下面我们就用一张STM32F1xx系列的Cortex M3的芯片将上面的核寄存器的图片进行总结：

三、总结

Cortex-M3通过架构级优化（哈佛总线、Thumb-2指令集）与系统级增强（MPU、NVIC），在性能与功耗之间实现平衡。其完善的调试生态（Keil MDK、IAR Embedded Workbench支持）进一步降低开发门槛，成为中高端嵌入式应用的经典选择。后续的Cortex-M4/M7等系列虽在DSP/浮点性能上强化，但M3仍凭借性价比占据重要市场地位。后续我会分享更多有关嵌入式和ARM内核方面的知识，希望大家多多关注。

扩展阅读建议