嵌入式教程中流水灯以及程序教程中的”Hello world”都有其特殊的意义,意味着入门。笔者此处也不例外,分别以汇编、c语言在IAR下点流水灯作为S5PV210入门程序。点流水灯之前必须对芯片有基本的认识,包括其指令集、流水线等内核架构,基本的启动流程,基本的编译器开发特性等,只有这样点亮的流水灯才算实现其意义。
1. 指令集
S5PV210是Cortex-A8内核,该内核为ARMv7-A架构,支持两个最主要的指令集:32位ARM指令集以及16/32位Thumb-2指令集。ARM指令集每条指令采用32位长度,具有最高的效率,但也需要更多的代码空间,ARM指令集是向后兼容的,即ARMv7-A的处理器几乎可以直接执行ARMv4架构的ARM指令集代码(如ARM7的应用代码)。Thumb-2是Thumb的扩展指令集,在ARMv6架构前,Thumb作为16位指令集,是作为ARM指令集的子集,它是为了减小代码量而提出的,并不完整,只支持通用功能,无法脱离ARM指令集。在ARMv7架构中,Thumb-2作为必备指令集,它支持16/32混合指令模式,几乎实现了所有的ARM指令集功能,并且效率接近ARM指令集,代码密度接近Thumb指令集。Thumb-2指令集的引入意味着程序存储器可以更小,在一些Cache应用中,相同容量的指令Cache可以缓存更多的指令,提高了指令Cache命中率,间接提升了内核性能。例如,对于Cortex-M内核,更是只支持Thumb-2指令集,因此一般无特殊情况,对于ARMv7内核,也可以直接采用Thumb-2指令集。
2. 流水线
S5PV210内核Cortex-A8配置了先进的超标量体系结构管线,能够同时执行多条指令,提供超过2.0 DMIPS/MHZ,集成了32k/32k的指令/数据一级缓存以及512k的二级缓存,从而达到最快的读取速度和最大的吞吐量,使用了先进的分支预测技术,并且具有专用的NEON整形和浮点型管线进行媒体和信号处理。
Cortex-A8流水线架构基于双对称、顺序发射的13级流水线,硬件上具有I/D Cache、分支预测结构,因此指令在流水线的流入流出过程变得不明确,但仍可以通过统计分析其大概的过程。
S5PV210在上电启动后,最先执行内部BL0代码,代码只初始化并开启I Cache,其它D Cache、L2 Cache、分支预测均是关闭的,设置了CPU主频为400M,最后是跳转到用户的BL1代码。我们在BL1中的流水灯代码根据以上信息,可以设计一个较精确的软件延时函数,每次访问I Cache均会命中,每次访问D Cache均从主存读取,需要相应周期的等待延时,每次跳转均会分支预测失败,清流水线需额外13个CPU时钟。在一个实用的系统中,I/D Cache、分支预测等硬件功能必须开启,不然CPU性能大大打折扣。
3. 汇编实现
汇编代码中有两点需要注意:
1) ARMv7-A架构推荐基本用Thumb-2指令集,有相当好的效率以及较好的代码密度,BL0跳转到BL1时是ARM状态,因此BL1流水灯第一条指令为ARM指令,切换到Thumb状态后开始执行Thumb-2指令。
2) 此处避开链接器功能,不使用链接文件,编写的流水灯代码应该是位置无关的,即代码加载进任意RAM位置都是可以正确执行的。
; IO port for controlingLEDs
GPB_BASE        EQU    0xE0200040  ; GPB Base Address
GPH0_BASE   EQU      0xE0200C00       ; GPH0 Base Address
GPCON_OFS     EQU    0x00        ; Control RegisterOffset
GPDAT_OFS     EQU    0x04        ; Data Register Offset
GPB0_LED2          EQU              0     ; GPB0->LED2
GPB2_LED3          EQU              2     ; GPB2->LED3
GPB1_LED4          EQU              1     ; GPB1->LED4
GPB3_LED5          EQU              3     ; GPB3->LED5
GPH07_LED6              EQU              7     ;GPH07->LED6
GPH05_LED7              EQU              5     ;GPH05->LED7
       SECTION RESET:CODE:NOROOT(2)
       PUBLIC   __iar_program_start
       ARM
__iar_program_start
       BL   Reset
       THUMB
Reset
       BL   Gpio_Init
Loop
       LDR R0, =GPB_BASE
       LDR R1, [R0,#GPDAT_OFS]
       ORR R1, R1,#(1<<GPB0_LED2)
       STR R1, [R0, #GPDAT_OFS]; LED2 on
       LDR R7, =1000 ; delay 1s
       BL   Delay_ms
       BIC  R1, R1,#(1<<GPB0_LED2)
       STR R1, [R0, #GPDAT_OFS]
       LDR R1, [R0, #GPDAT_OFS]
       ORR R1, R1,#(1<<GPB2_LED3)
       STR R1, [R0, #GPDAT_OFS]; LED3 on
       LDR R7, =1000 ; delay 1s
       BL   Delay_ms
       BIC  R1, R1,#(1<<GPB2_LED3)
       STR R1, [R0, #GPDAT_OFS]     
       LDR  R1, [R0,#GPDAT_OFS]
       ORR R1, R1,#(1<<GPB1_LED4)
       STR R1, [R0, #GPDAT_OFS] ;LED4 on
       LDR R7, =1000 ; delay 1s
       BL   Delay_ms
       BIC  R1, R1,#(1<<GPB1_LED4)
       STR R1, [R0, #GPDAT_OFS]     
       LDR  R1, [R0,#GPDAT_OFS]
       ORR R1, R1,#(1<<GPB3_LED5)
       STR R1, [R0, #GPDAT_OFS]; LED5 on
       LDR R7, =1000 ; delay 1s
       BL   Delay_ms
       BIC  R1, R1, #(1<<GPB3_LED5)
       STR R1, [R0, #GPDAT_OFS]     
       LDR R0, =GPH0_BASE
       LDR R1, [R0, #GPDAT_OFS]
       ORR R1, R1,#(1<<GPH07_LED6)
       STR R1, [R0, #GPDAT_OFS]; LED6 on
       LDR R7, =1000 ; delay 1s
       BL   Delay_ms
       BIC  R1, R1,#(1<<GPH07_LED6)
       STR R1, [R0, #GPDAT_OFS]
       LDR R1, [R0, #GPDAT_OFS]
       ORR  R1, R1,#(1<<GPH05_LED7)
       STR R1, [R0, #GPDAT_OFS]; LED7 on
       LDR R7, =1000 ; delay 1s
       BL   Delay_ms
       BIC  R1, R1,#(1<<GPH05_LED7)
       STR R1, [R0, #GPDAT_OFS]
       B     Loop
Gpio_Init
       LDR R0, =GPB_BASE
       LDR R1, [R0, #GPCON_OFS]
       BIC  R1, R1,#(0xf<<(GPB0_LED2<<2))
       ORR  R1, R1,#(0x1<<(GPB0_LED2<<2)) ; GPB0 output led2
       STR R1, [R0, #GPCON_OFS]
       LDR R1, [R0, #GPDAT_OFS]
       BIC  R1, R1,#(1<<GPB0_LED2)
       STR R1, [R0, #GPDAT_OFS]; LED2 off
       LDR R1, [R0, #GPCON_OFS]
       BIC  R1, R1,#(0xf<<(GPB2_LED3<<2))
       ORR  R1, R1,#(0x1<<(GPB2_LED3<<2)) ; GPB2 output led3
       STR R1, [R0, #GPCON_OFS]    
       LDR R1, [R0, #GPDAT_OFS]
       BIC  R1, R1,#(1<<GPB2_LED3)
       STR R1, [R0, #GPDAT_OFS]; LED3 off  
       LDR R1, [R0, #GPCON_OFS]
       BIC  R1, R1,#(0xf<<(GPB1_LED4<<2))
       ORR  R1, R1,#(0x1<<(GPB1_LED4<<2)) ; GPB1 output led4
       STR R1, [R0, #GPCON_OFS]    
       LDR R1, [R0, #GPDAT_OFS]
       BIC  R1, R1,#(1<<GPB1_LED4)
       STR R1, [R0, #GPDAT_OFS]; LED4 off  
       LDR R1, [R0, #GPCON_OFS]
       BIC  R1, R1,#(0xf<<(GPB3_LED5<<2))
       ORR  R1, R1,#(0x1<<(GPB3_LED5<<2)) ; GPB3 output led5
       STR R1, [R0, #GPCON_OFS]           
       LDR R1, [R0, #GPDAT_OFS]
       BIC  R1, R1,#(1<<GPB3_LED5)
       STR R1, [R0, #GPDAT_OFS]; LED5 off  
       LDR R0, =GPH0_BASE
       LDR R1, [R0, #GPCON_OFS]
       BIC  R1, R1,#(0xf<<(GPH07_LED6<<2))
       ORR  R1, R1, #(0x1<<(GPH07_LED6<<2)); GPH07 output led6
       STR R1, [R0, #GPCON_OFS]           
       LDR R1, [R0, #GPDAT_OFS]
       BIC  R1, R1,#(1<<GPH07_LED6)
       STR R1, [R0, #GPDAT_OFS]; LED6 off         
       LDR R1, [R0, #GPCON_OFS]
       BIC  R1, R1,#(0xf<<(GPH05_LED7<<2))
       ORR  R1, R1,#(0x1<<(GPH05_LED7<<2)) ; GPH05 output led7
       STR R1, [R0, #GPCON_OFS]           
       LDR R1, [R0, #GPDAT_OFS]
       BIC  R1, R1,#(1<<GPH05_LED7)
       STR R1, [R0, #GPDAT_OFS]; LED7 off  
       BX   LR
; ARM CLOCK 400M
Delay_ms     
       LDR  R6, =13333 ; 延时1ms
Delay2                 
       SUBS R6, R6, #1 ; 单发射cycle 1
       ; 跳转清流水线,以下指令均只用作填充流水线
       MOV R0, R0 ; 双发射 cycle 1
       MOV R0, R0 ; 单发射 cycle 2
       MOV R0, R0 ; 单发射 cycle 3
       MOV R0, R0 ; 单发射 cycle 4
       MOV R0, R0 ; 单发射 cycle 5
       MOV R0, R0 ; 单发射 cycle 6
       MOV R0, R0 ; 单发射 cycle 7
       MOV R0, R0 ; 单发射 cycle 8
       MOV R0, R0 ; 单发射 cycle 9
       MOV R0, R0 ; 单发射 cycle 10
       MOV R0, R0 ; 单发射 cycle 11
       MOV R0, R0 ; 单发射 cycle 12
       MOV R0, R0 ; 单发射 cycle 13
       MOV R0, R0 ; 单发射 cycle 14
       MOV R0, R0 ; 单发射 cycle 15
       MOV R0, R0 ; 单发射 cycle 16
       MOV R6, R6 ; 单发射 cycle 17
       BNE  Delay2 ; 跳转会清流水线,13个ARMCLOCK,cycle 30
       SUBS R7, R7, #1
       BNE Delay_ms
       BX   LR
       END4. C实现
C代码中需要注意两点:
1) 需要汇编指令跳转到c函数,链接器默认链接.intvec段做为代码的开头,需一条跳转汇编指令链接到代码起启位置,用来跳转到c入口。
       SECTION .intvec:CODE:NOROOT(2)
       PUBLIC   __iar_program_start
       ARM
__iar_program_start
       EXTERN  main
       BLX main
       END2)c文件中不要尝试使用c库以及使用全局变量、静态变量等,因为此处避开链接器功能,不使用链接文件,编写的流水灯代码c运行环境都是BL0初始化的,是位置无关的,只有栈是有效的。
#include"stdint.h"
// IO port for controlingLEDs
#define GPB_BASE     0xE0200040  // GPB Base Address
#define GPH0_BASE   0xE0200C00 // GPH0 Base Address
#define GPCON_OFS  0x00        // Control Register Offset
#define GPDAT_OFS  0x04        // Data Register Offset
#define GPBCON_REG       (*(volatile uint32_t *)(GPB_BASE+GPCON_OFS))
#define GPBDAT_REG       (*(volatile uint32_t *)(GPB_BASE+GPDAT_OFS))
#define GPH0CON_REG  (*(volatile uint32_t *)(GPH0_BASE+GPCON_OFS))
#define GPH0DAT_REG     (*(volatile uint32_t *)(GPH0_BASE+GPDAT_OFS))
#define GPB0_LED2   0     // GPB0->LED2
#define GPB2_LED3   2     // GPB2->LED3
#define GPB1_LED4   1     // GPB1->LED4
#define GPB3_LED5   3     // GPB3->LED5
#define GPH07_LED6       7     // GPH07->LED6
#define GPH05_LED7       5     // GPH05->LED7
void Delay_ms(uint32_tCount)
{
       //延时1ms,共延时nCountms
       // Arm clock为400M,循环体每次30个Armclock
       int32_t temp1 = 13333;
       int32_t temp2 = 0;
       asm volatile (
              "Delay_ms_0:\n"
              "mov  %0,%2\n" 
              "Delay_ms_1:\n"
              "subs  %0,%0, #1\n" // 单发射 cycle 1
              // 跳转清流水线,以下指令均只用作填充流水线
              "mov %1, %1\n" // 双发射 cycle 1
              "mov %1, %1\n" // 单发射 cycle 2
              "mov %1, %1\n" // 单发射 cycle 3
              "mov %1, %1\n" // 单发射 cycle 4       
              "mov %1, %1\n" // 单发射 cycle 5       
              "mov %1, %1\n" // 单发射 cycle 6
              "mov %1, %1\n" // 单发射 cycle 7
              "mov %1, %1\n" // 单发射 cycle 8
              "mov %1, %1\n" // 单发射 cycle 9
              "mov %1, %1\n" // 单发射 cycle 10
              "mov %1, %1\n" // 单发射 cycle 11
              "mov %1, %1\n" // 单发射 cycle 12
              "mov %1, %1\n" // 单发射 cycle 13
              "mov %1, %1\n" // 单发射 cycle 14
              "mov %1, %1\n" // 单发射 cycle 15
              "mov %1, %1\n" // 单发射 cycle 16
              "mov %0, %0\n" // 单发射 cycle 17
              "bne.w Delay_ms_1\n" // 跳转会清流水线,13级流水线,cycle30
              "subs  %1,%1, #1\n"   // 调用者确保nCount不为0
              "bne.w Delay_ms_0\n"
              : "+r"(temp2), "+r"(Count):"r"(temp1): "cc"
       );    
}
void LED2(uint8_t On)
{
       if (On) {
              GPBDAT_REG |= (1<<GPB0_LED2);
       } else {
              GPBDAT_REG &= ~(1<<GPB0_LED2);
       }
}
void LED3(uint8_t On)
{
       if (On) {
              GPBDAT_REG |= (1<<GPB2_LED3);
       } else {
              GPBDAT_REG &= ~(1<<GPB2_LED3);
       }
}
void LED4(uint8_t On)
{
       if (On) {
              GPBDAT_REG |= (1<<GPB1_LED4);
       } else {
              GPBDAT_REG &= ~(1<<GPB1_LED4);
       }
}
void LED5(uint8_t On)
{
       if (On) {
              GPBDAT_REG |= (1<<GPB3_LED5);
       } else {
              GPBDAT_REG &= ~(1<<GPB3_LED5);
       }
}
void LED6(uint8_t On)
{
       if (On) {
              GPH0DAT_REG |= (1<<GPH07_LED6);
       } else {
              GPH0DAT_REG &= ~(1<<GPH07_LED6);
       }
}
void LED7(uint8_t On)
{
       if (On) {
              GPH0DAT_REG |= (1<<GPH05_LED7);
       } else {
              GPH0DAT_REG &= ~(1<<GPH05_LED7);
       }
}
void Gpio_Init(void)
{
      //GPB0 output led2, off
       GPBCON_REG = (GPBCON_REG &(~(0xf<<(GPB0_LED2<<2)))) | (0x1<<(GPB0_LED2<<2)); 
       GPBDAT_REG &= ~(1<<GPB0_LED2);
      //GPB2 output led3, off
       GPBCON_REG = (GPBCON_REG &(~(0xf<<(GPB2_LED3<<2)))) | (0x1<<(GPB2_LED3<<2)); 
       GPBDAT_REG &= ~(1<<GPB2_LED3);
      //GPB1 output led4, off
       GPBCON_REG = (GPBCON_REG &(~(0xf<<(GPB1_LED4<<2)))) | (0x1<<(GPB1_LED4<<2)); 
       GPBDAT_REG &= ~(1<<GPB1_LED4);
      //GPB3 output led5, off
       GPBCON_REG = (GPBCON_REG &(~(0xf<<(GPB3_LED5<<2)))) | (0x1<<(GPB3_LED5<<2)); 
       GPBDAT_REG &= ~(1<<GPB3_LED5);
      //GPH07 output led6, off
       GPH0CON_REG = (GPH0CON_REG &(~(0xf<<(GPH07_LED6<<2)))) |(0x1<<(GPH07_LED6<<2)); 
       GPH0DAT_REG &= ~(1<<GPH07_LED6);
      //GPH05 output led7, off
       GPH0CON_REG = (GPH0CON_REG &(~(0xf<<(GPH05_LED7<<2)))) |(0x1<<(GPH05_LED7<<2)); 
       GPH0DAT_REG &= ~(1<<GPH05_LED7);
}
void main(void)
{
       Gpio_Init();
       while (1) {    
              LED2(1);
              Delay_ms(1000);
              LED2(0);
              LED3(1);
              Delay_ms(1000);
              LED3(0);
              LED4(1);
              Delay_ms(1000);
              LED4(0);
              LED5(1);
              Delay_ms(1000);
              LED5(0);
              LED6(1);
              Delay_ms(1000);
              LED6(0);
              LED7(1);
              Delay_ms(1000);
              LED7(0);
       }
}5. 流水灯运行
编译器直接编译生成的二进制代码是不满足相应的启动格式的,需要通过SdBoot.exe生成相应的sd/mmc烧录代码,再通过SdBoot.exe把带”_1”后缀的sd/mmc烧录文件烧录进sd/mmc卡,设置目标板从sd/mmc卡启动,即可运行sd/mmc卡里面的流水灯程序。
6. 附录
IAR下S5PV210汇编流水灯工程例程以及C流水灯工程例程,SdBoot相关工具: http://pan.baidu.com/s/1c0dcSU0
