Bootloader是嵌入式系统上电后第一段执行的代码。对于功能简单的处理器,可能并没有Bootloader的概念,但对于应用处理器,有不同的启动方式,不同的存储设备(Nand flash、sd/mmc、DDR2、SRAM等),不同的操作系统等,往往需要一个Bootloader先初始化CPU和相关的硬件,建立内存空间映射,把内核或应用程序加载到相应的内存执行位置,最后调用内核或应用程序,释放CPU控制权,完成整个Bootloader的流程。笔者此处就S5PV210的Bootloader实现作一个简单的介绍。

1. Bootloader流程

Bootloader是严重依赖于具体硬件实现的,相同CPU内核架构,不同厂商生产的处理器其Bootloader都是完全不一样的,即使对于同一CPU,板载不同的硬件配置,往往都是要针对性实现其Bootloader。因此,Bootloader的功能、流程等都没有特定的要求,只要将系统的软硬件环境带到一个合适的状态,最终为操作系统内核或应用程序准备好正确的环境即可。一般对于一个Bootloader应实现两种不同的操作模式:启动加载模式和下载模式。启动加载模式就是Bootloader从设备系统的某个固态储存器中将操作系统或应用程序加载进RAM,整个过程无需用户的介入,这种模式是设备成型后Bootloader的正常工作模式。下载模式是Bootloader可以通过串口、USB或网络等通信手段从主机下载文件,并最终写入到到设备系统的某个固态储存器中,这种模式用在设备开发调试中,用于刷机升级。此处笔者从自己的角度简单介绍Bootloader实现的一般流程。

与Bootloader相关的代码文件放在System目录文件夹中,目录架构如下:

  • s5pv210.s,启动代码文件,代码执行时的入口,控制了整个Bootloader的执行流程,最终建立起c运行环境后,进入到应用程序main入口。
  • LowLevelInit.s,板级初始化代码,包括CPU时钟的初始化、DDR2内存控制器初始化、代码加载实现(sd/mmc卡启动、Nand flash启动)。
  • Coprocessor.c,协处理器相关代码,主要是CP15协处理器L1 Cache、L2 Cache、MMU内存映射、中断向量基址等操作代码。
  • NandBoot.c,实现Nand flash启动相关Nand驱动代码,实现相应Nand代码下载、Nand代码启动的接口实现。
  • Download.c,实现代码下载调试功能,支持代码直接下载内存调试运行,支持代码下载进Nand flash,支持uboot的内存下载运行调试以及Nand下载固化。
  • Exception.c,异常处理相关代码,支持中断处理的完整架构,如中断嵌套处理、中断注册、中断开启等接口实现,为系统应用架构实现。
  • Retarge.c,标准IO的底层重定向,支持c库中的标准IO函数,如标准输入、输出流重定向到串口、文件操作重定向到相应的文件系统接口实现等,为系统应用架构实现。
  • s5pv210.icf,IAR下链接文件,指定板载内存范围,代码以及RAM等布局。
    这里笔者说明一下,在建立c运行环境之前的Bootloader代码均是地址无关的,CPU上电后会加载部分的Bootloader代码到内部RAM执行,任何RAM地址这部分Bootloader均应能正确执行。Bootloader中不要尝试调用c库函数,注意在Bootloader的c代码c运行环境也是不成立的。在Bootloader中应初始化最关键的硬件环境,其它不紧要的硬件初始化或功能代码可以放到c运行环境建立后处理。

1.1. 异常向量表

ARM核在异常发生时,会从异常向量表中取得相应的异常向量地址执行,发生IRQ中断则从异常向量表0x18偏移处取得IRQ异常向量地址。异常向量表就是用来记录各个异常进入时的代码处理位置。除了Cortex-M处理器有嵌套向量中断控制器(NVIC),以下的异常向量处理对所有系列的ARM核均是成立的。

    ARM



__iar_program_start

    BLX Reset_Handler       

    LDR PC, Undef_Addr

    LDR PC, SWI_Addr

    LDR PC, PAbt_Addr

    LDR PC, DAbt_Addr

    LDR PC, Notuse_Addr

    LDR PC, IRQ_Addr

    LDR PC, FIQ_Addr

    DCD 0x55aa55aa ; 0x20位置用来判断代码的运行区域



Undef_Addr

    DCD Undef_Handler

SWI_Addr

    DCD SWI_Handler

PAbt_Addr

    DCD PAbt_Handler

DAbt_Addr

    DCD DAbt_Handler

Notuse_Addr

    DCD 0          ; Reserved Address

IRQ_Addr

    DCD IRQ_SaveContext

FIQ_Addr

    DCD FIQ_Handler

IRQ_SaveContext

; 保存中断上下文,支持中断嵌套             

    SUB LR, LR, #4 ; 计算返回地址

    STMFD SP!,{R0-R12, LR} ;所有寄存器压栈保存

    MRS R0, SPSR ; 保存中断前的CPSR(即现在的SPSR)

    STMFD   SP!, {R0} ;

    MSR CPSR_cxsf, #Mode_SYS+I_Bit ; 切换到系统模式

    STMFD   SP!, {LR} ; 压栈系统模式LR



    LDR R0, =IRQ_Handler ;系统模式下进行IRQ代码处理

    BLX R0 ; 调用中断处理函数



    LDMFD   SP!, {LR} ; 出栈系统模式LR

    MSR CPSR_cxsf, #Mode_IRQ+I_Bit ; 切换到IRQ模式                 

    LDMFD   SP!, {R0} ; 返回中断前的CPSR               

    MSR SPSR_cxsf, R0

    LDMFD  SP!, {R0-R12, PC}^ ; ^表同时从spsr恢复给cpsr



    PUBWEAK Undef_Handler

    PUBWEAK SWI_Handler

    PUBWEAK PAbt_Handler

    PUBWEAK DAbt_Handler

    PUBWEAK IRQ_Handler

    PUBWEAK FIQ_Handler

Undef_Handler

SWI_Handler

PAbt_Handler

DAbt_Handler

IRQ_Handler

FIQ_Handler

    B   .

1.2. 关看门狗

复位代码最先做的事应该是关看门狗,因为如果看门狗打开的话,在启动代码进行初始化过程中是无法喂狗的,可能造成处理器一直不停复位。

; 看门狗关闭

    LDR R0, =WT_BASE

    LDR R1, =0

    STR R1, [R0]

1.3. 关闭所有中断

启动代码未完成时,各个状态都还不是确定的,如果有中断打开并引起中断异常,可能造成代码跑飞。

; 关闭所有外设中断

    LDR R1,=0xFFFFFFFF

    LDR R0,=VIC0_BASE

    STR R1,[R0, #INT_EN_CLR_OFS]

    LDR R0,=VIC1_BASE

    STR R1,[R0, #INT_EN_CLR_OFS]

    LDR R0,=VIC2_BASE

    STR R1,[R0, #INT_EN_CLR_OFS]

    LDR R0,=VIC3_BASE

    STR R1,[R0, #INT_EN_CLR_OFS]

1.4. 初始化协处理器

ARM核可最多支持16个协处理器,其中一般内置了CP14调试通信协处理器以及CP15系统控制协处理器。在Bootloader中需要对实际的寄存器物理地址进行初始化读写,因此应初始化CP15协处理器关闭Cache、关闭MMU、设置中断向量表基址等。

; 初始化协处理器

    EXTERN Coprocessor_Init

    BLX Coprocessor_Init

1.5. 初始化系统时钟

一般来说,处理器复位后都是运行在一个较低速的时钟下,为加快启动,通常尽可能快地设置处理器的各个时钟。

; 系统时钟设置

    EXTERN      Clock_Init

    BLX Clock_Init

1.6. 初始化外部内存

除了Nor flash可以直接执行代码外,其它的代码存储器如nand flash、sd/mmc都是不能直接执行代码的。一般对于应用处理器,代码都是加载进RAM后执行。

; 外部内存控制设置

    EXTERN  ERAM_Init

    BLX ERAM_Init

    LDR SP,=SFE(CSTACK) ; RAM初始化后调整栈指针到外部RAM

1.7. 下载模式

在调试开发阶段,可以通过直接下载代码到RAM调试执行,避免重复地烧写固态存储器,加快调试开发,在确定代码OK后,再把代码下载进固态存储器(Nandflash)即可。在开发完成后,下载模式代码可注释掉。

; 检查是否进入串口下载模式,开机时按住空格键进入串口下载模式

    EXTWEAK DownloadCheck  

    BLX DownloadCheck  

1.8. 代码加载

对于代码存储在Nand flash、sd/mmc等不能直接执行代码的存储器,Bootloader是一定需要把用户代码从这些设备读入到特定的内存中执行的。而对于Nor flash可直接执行代码的存储器,通常为了提高性能,也是会把代码从Nor flash读出,在内存中执行的。

; 拷贝用户代码到RAM

    EXTERN      CopyCodeToRAM

    BLX CopyCodeToRAM

1.9. MMU内存映射

为了提高CPU的处理性能,MMU必须开启,在开启之前,需先建立相应的内存空间映射表,设置相应的内存区域访问权限等。开启MMU后,也必须同时开启L1 I/D Cache、L2 Cache、硬件分支预测功能,不然CPU的性能将极其低下,有几十倍的性能差异。

; MMU初始化

    EXTERN      MMU_Init

    BLX MMU_Init

1.10. 初始化栈

ARM核有多种工作模式,每种模式的栈是一定要分配及初始化的,这样才能在相应模式下正确地执行代码。

; 堆栈初始化

;  Enter Undefined Instruction Mode and set itsStack Pointer

    LDR R0,=SFE(UND_STACK)

    LDR R1,=Mode_UND+I_Bit+F_Bit

    MSR CPSR_c,R1

    MOV SP,R0



;  Enter Abort Mode and set its Stack Pointer

    LDR R0,=SFE(ABT_STACK)

    LDR R1,=Mode_ABT+I_Bit+F_Bit

    MSR CPSR_c,R1

    MOV SP,R0



;  Enter FIQ Mode and set its Stack Pointer

    LDR R0,=SFE(FIQ_STACK)

    LDR R1,=Mode_FIQ+I_Bit+F_Bit

    MSR CPSR_c,R1

    MOV SP,R0



;  Enter IRQ Mode and set its Stack Pointer

    LDR R0,=SFE(IRQ_STACK)

    LDR R1,=Mode_IRQ+I_Bit+F_Bit

    MSR CPSR_c,R1

    MOV SP,R0



;  Enter Supervisor Mode and set its StackPointer

    LDR R0,=SFE(SVC_STACK)

    LDR R1,=Mode_SVC+I_Bit+F_Bit

    MSR CPSR_c,R1

    MOV SP,R0



;  Enter System Mode and set its Stack Pointer

    LDR R0,=SFE(CSTACK)

    LDR R1,=Mode_SYS

    MSR CPSR_c,R1

    MOV SP,R0

1.11. 初始化c运行环境

进入c入口之前是需要初始化c环境的,如清0全局变量、静态变量区等。此处直接利用编译器的库函数cmain来完成c环境的初始化,最后才是真正的应用程序入口main函数,用绝对地址跳转到c入口cmain,Bootloader释放CPU控制权,完成整个流程。

; Initialize VFP (ifneeded).

    EXTERN __iar_init_vfp

    LDR R0,=__iar_init_vfp

    BLX R0



; Continue to ?mainfor C-level initialization.

    EXTERN  __cmain

    LDR R0,=__cmain

    BX  R0

2. 代码烧写

代码可以存储在Nand flash或sd/mmc卡中,一般先把代码烧写进sd/mmc卡中,这样无需复杂的操作以及昂贵的烧录器等。sd/mmc卡启动后通过里面的Bootloader下载功能把主机上的相应代码下载进设备的Nand flash上,之后无需再用sd/mmc卡,设置Nand flash启动,代码更新也通过Nandflash上的Bootloader下载更新即可。

sd/mmc卡启动需要专用的烧录软件SdBoot,SdBoot.exe为笔者在windows下针对三星S3C2416和S5PV210这两个平台开发的sd/mmc启动烧录工具。sd/mmc启动需要相应的代码格式以及需烧录进sd/mmc卡指定的位置,SdBoot.exe工具集代码格式转换以及sd/mmc卡烧录于一体,可以烧录S3C2416和S5PV210这两个平台下笔者编写的裸机bootloader,wince bootloader,uboot,工具简单易用。

03_简易Bootloader的实现 - 图1

图2-1 SdBoot.exe工具

3. Bootloader下载功能

Bootloader通过串口实现主机代码文件的下载,主机端代码下载需要三星专用的工具dnw.exe工具,连接好串口后,按住空格键后,目标板上电会进入Bootloader的下载模式。

03_简易Bootloader的实现 - 图2

图3-1 Bootloader下载模式

其中选项1可以基于笔者Bootloader开发的应用,下载进RAM,并直接调试运行。下载进RAM的代码均是编译器直接编译出来的代码,未经过SdBoot工具格式转换。

选项2用于uboot的调试开发,可以直接把编译好的uboot二进制代码下载进RAM,并直接调试运行。

选项3用于代码烧录进Nand flash,把通过SdBoot工具格式转换后的基于笔者Bootloader应用代码、uboot代码下载进Nand flash,之后设置Nand flash启动即可。

4. Bootloader功能

笔者的S5PV210的Bootloader设置最高的CPU主频1GHZ,MMU进行1:1内存空间线性映射,并开启L1 I/D Cache、L2 Cache、硬件分支预测功能,使CPU能达到最大的吞吐量性能。初始化内存,能够识别sd/mmc启动和Nand flash启动,自动加载应用代码到RAM位置。统一的中断管理架构、重定向底层IO操作,能够更加专注于应用的开发。

5. 附录

Bootloader.rar,Bootloader下IAR测试工程以及SdBoot工具: http://pan.baidu.com/s/18pFhs