本文记录了关于 MCU 内部架构及程序运行原理中 .ld 链接器脚本和 .s 启动文件的学习笔记,对理解 startup_stm32f407xx.s 和 STM32F407x_FLASH.ld 文件的内容与作用具有重要帮助!
存储映射,编译与链接
编译与链接的过程
编译和链接是将程序从高级语言转换为 MCU 可执行程序的关键步骤,主要过程如下:
编译
编译器根据 Makefile 或 CMake 文件中定义的规则,将高级语言源文件(如 .c 或 .cpp 文件)进行语法分析、优化,并生成目标文件(.o 文件)。
编译的同时会生成中间文件,如汇编代码或机器码,具体取决于编译器选项。
链接
链接器根据 LD 链接器脚本(如 STM32F407x_FLASH.ld)将多个目标文件(.o 文件)进行链接。
链接的目的是整合所有模块,解决符号的引用,生成完整的可执行文件(.elf 文件)。
格式转换
生成的 .elf 文件包含调试信息、符号表等。通过工具(如 objcopy),将其转换为 MCU 可执行格式的文件,如 .hex 或 .bin。
编译与链接涉及的文件
以下是编译和链接过程中涉及的主要文件及其作用:
源代码文件
.c 或 .cpp 文件:高级语言源代码文件,包含程序的主要逻辑。
.s 文件:汇编源代码文件,可能包括初始化、硬件相关配置等。
目标文件
.o 文件:编译器生成的中间文件,包含机器码、符号表、重定位信息等,尚未完整链接。
可执行文件
.elf 文件:链接完成后的文件,包含程序的所有信息(代码、数据、符号表、调试信息等)。
下载文件
.hex 或 .bin 文件:从 .elf 文件生成,去除了调试信息,是 MCU 可执行的程序文件。
.hex 文件:文本格式,适合通过串口烧录。
.bin 文件:二进制格式,适合通过程序烧录。
存储映射文件
.map 文件:包含程序的内存分布信息,如函数的入口地址、大小,静态变量的分配情况等。
完整汇编代码
.lst 文件:源代码和汇编代码的对照表,可用于分析程序的具体实现细节。
Makefile 脚本与 LD 链接器脚本
Makefile 脚本
作用:
- 配置编译环境,包括选择编译器、指定编译选项、链接选项、使用的库以及目标芯片的特性。
- 定义源文件和头文件的路径。
- 自动化编译流程,减少重复劳动,提高效率。
关键部分:
- 编译器选择:如 CC=arm-none-eabi-gcc。
- 编译选项:如优化等级(-O2)、目标架构(-mcpu=cortex-m4)。
- 源文件和头文件路径:SRC 和 INCLUDE 变量定义参与编译的源代码和头文件路径。
- 目标生成规则:将 .c 文件编译成 .o,再链接为 .elf 或 .bin。
示例:
LD 链接器脚本
作用:
- 定义程序段(代码段、数据段、堆、栈)在存储器中的分布。
- 指定入口点(如 Reset_Handler),指向程序的启动地址。
- 分配 MCU 的存储资源(如 Flash 和 RAM)。
关键部分:
- MEMORY:定义 MCU 的存储器布局(如 Flash 和 RAM 的起始地址及大小)。
- SECTIONS:定义代码段(text)、数据段(data)、未初始化数据段(bss)、堆和栈的分布规则。
示例:
STM32 常见 SDK 编译工具
1. Keil uVision:图形化界面操作简单,适合初学者。内置编译器和链接器,不需要手动编辑 Makefile 和 LD 文件。通过 Options 菜单设置存储器起始地址和大小等配置。
2. STM32CubeIDE/STM32CubeMX:提供图形化硬件配置工具(CubeMX),简化初始化代码生成。编译使用 GNU 工具链,需要 Makefile 和 LD 链接器脚本。可以由 IDE 自动生成 Makefile 和链接脚本,适合大部分用户。
3. Linux 环境(arm-gcc 工具链):完全手动配置,灵活性高,适合有经验的开发者。需要编写 Makefile 或使用 CMake 配置编译流程。手动编写或定制 LD 链接器脚本。
程序的段及其存储方式
1. 程序的段分类
按程序文件分段
Code 段:
- 内容:用户的程序代码。
- 存储位置:通常存放在 Flash 中。
- 特性:只读,执行时被加载到存储器。
RO_data 段:
- 内容:用户程序中的只读数据(如常量)。
- 存储位置:通常存放在 Flash 中。
- 特性:只读,不能被修改。
RW_data 段:
- 内容:用户程序中已初始化且非零的全局变量。
- 存储位置:初始化值存储在 Flash 中。程序启动时被复制到 RAM 中。
ZI_data 段:
- 内容:用户程序中已初始化为零或未初始化的全局变量。
- 存储位置:存储在 RAM 中。
- 特性:启动时自动清零。
按程序进程分段
TEXT 段:
- 内容:用户的程序代码(包含函数实现)。
- 存储位置:通常存放在 Flash 中。
- 特性:只读。
- 若常量未单独分段,常量也会包含在此段中。
DATA 段:
- 内容:已初始化的全局变量。
- 存储位置:初始化值存储在 Flash 中,程序启动后被加载到 RAM 中。
- 特性:可读写。
BSS 段:
- 内容:未初始化的全局变量和静态变量。
- 存储位置:RAM。
- 特性:程序启动时自动清零。
HEAP(堆):
- 内容:动态分配的内存(如通过 malloc 分配的内存)。
- 存储位置:RAM。
- 特性:程序运行时由用户管理(分配和释放)。
STACK(栈):
- 内容:局部变量、函数调用的参数,以及中断上下文保存的数据。
- 存储位置:RAM。
- 特性:栈的生长方向通常是从高地址向低地址。栈是由硬件和编译器自动管理的,函数调用时会自动分配和释放。
2. 关于压入堆栈的变量
编译器优化的影响:
- 编译器在编译时会优化代码逻辑,尽量减少不必要的栈空间使用。
- 例如,对于较少使用的局部变量,可能直接使用寄存器存储而不压入栈中。
常用的寄存器:
- CPU 执行代码时,主要使用内部通用寄存器(如 R0、R1、R2、R3)。
- 这些寄存器通常用于存储临时数据、函数参数或返回值。
3. 程序的段在编译和链接中的作用
编译阶段:
- 编译器将每个源文件的内容按照段划分,如代码段(.text)、只读数据段(.rodata)、已初始化数据段(.data)、未初始化数据段(.bss)等。
- 各段分别生成目标文件中的段数据。
链接阶段:
- 链接器根据链接脚本(如 .ld 文件),将不同目标文件的各段合并到指定的存储区域。
- 例如:将 .text 段合并并映射到 Flash 的指定区域。将 .data 段的初始化值保存在 Flash 中,并指定程序启动时将其复制到 RAM 中。将 .bss 段分配到 RAM,并确保启动时初始化为零。
总结
- 程序段的作用: 各段的划分和存储方式,决定了程序在存储器中的布局和运行时的行为。
- 常见段和存储位置:
段名称 | 存储内容 | 存储位置 | 特性 |
.text | 程序代码 | Flash | 只读 |
.rodata | 常量 | Flash | 只读 |
.data | 已初始化全局变量 | Flash (初始化) / RAM | 可读写 |
.bss | 未初始化全局变量 | RAM | 可读写,启动时清零 |
堆(Heap) | 动态分配的变量 | RAM | 可读写,由程序管理 |
栈(Stack) | 函数局部变量、参数等 | RAM | 可读写,自动管理 |
.s 启动文件的概念与功能
1. .s 启动文件的概念
- 作用:描述 MCU 从上电复位到运行用户 main() 函数之间的初始化行为。是用汇编语言编写的,与具体的 MCU 和 CPU 架构(如 ARM Cortex-M 系列)密切相关。
- 组成:包含中断向量表、复位处理程序(Reset_Handler)、系统初始化代码等。MCU 的厂商通常提供对应的启动文件模板。
2. .s 启动文件的功能
- 定义 Reset_Handler:
- Reset_Handler 是程序运行的起始点,由链接器脚本指定。
- 在程序启动时执行以下操作:初始化堆栈指针。将 .data 段从 Flash 复制到 RAM。清零 .bss 段。跳转到用户的 main() 函数。
- 定义中断向量表:
- 中断向量表包含异常处理函数的入口地址。
- 通常定义为一个数组,首地址为初始堆栈指针(_estack),后续为各异常和中断处理函数的入口地址。
- 定义默认中断处理函数:
- 定义 Default_Handler,用于处理未定义的中断。
- 通常为一个死循环,避免程序意外跳转。
- 配置汇编环境:
- 设置汇编环境,如定义堆栈和堆的大小。
- 定义弱函数:
- 启动文件中,中断处理函数通常被定义为弱符号,允许用户在应用程序中重写这些函数。
LD 链接器脚本与 .s 启动文件的配合
LD 脚本定义存储器布局:指定中断向量表和程序段(如 .text、.data)的位置。
启动文件初始化程序环境:配置堆栈、初始化全局变量、清零未初始化变量;跳转到 main() 函数,正式运行用户代码。