[心得] 开发 stm32f4discovery sd card boot

楼主: descent (“雄辩是银,沉默是金”)   2016-12-03 12:29:04
这个就是目前开发板很常见的 sd card booting, 以前的开发版并不是很常见到这样的功
能。终于来到这里了, 想了好久的点子能把它实现真是一件美妙的事情。现在很多开发板
都提供了从 sd 开机的功能, 例如树莓派, 比起直接操作 flash 简单很多, 但要自己实
作这功能, 就没那么容易, 从 fig 0 的金字塔图就可以看出需要很多知识, 这是集合了
之前努力所开的果实。
我在很久之前就有这想法了, 但直到在《20150117 成功大学 UniDEMO 期末联合 DEMO 计
画 ( https://goo.gl/NbZqar )》看到 mp3 player 那组的作品后, 我才对于 sd card
的读取有点想法, 这是我最难克服的部份, 没想到成大的学生在专题就把 sd card 搞定
了, 真是厉害。直到 20161119 我才完成, 从想法到实现, 应该超过两年。
为什么有这样的想法, 是因为 flash 寿命有限, 如果因为 flash 写烂了, 这块开发板就
不能用了岂不可惜, 透过 sd card boot 就可以避免这样的问题, 我再也不会去改写
flash 的 boot code 了, 让开发板生命可以持续更久。
《前一篇 - 在 sd card 上使用 fat 档案系统 ( https://goo.gl/kIEk4H )》在 linux
下的测试只能把 elf 有关程式码的部份印出, 而不能真的加载, 这是因为需要加载到
0x21000000, 而这个位址不见得在 os 环境下可以正确要到, 我曾试过 mmap, 不见得可
以得到所要的位址。
读取 elf program header 的程式码不算太难, 但得先对 elf 有略懂的理解才行, 我不
会说明这部份, 因为《一步步嵌入式操作系:ARM程的方法与 ( https://goo.gl/m961sn )
》chapter 8 里头有介绍, 我不可能写得比他还好了。这本书我已经提过很多次了, 如果
你没有, 应该想办法搞到它。
( https://goo.gl/JqhMcR )
fig 0 金字塔学习门槛
延续《前一篇 - 在 sd card 上使用 fat 档案系统 ( https://goo.gl/kIEk4H )》的努
力, 我“只要”把 elf 的内容复制到某个位址就可以了, spi_sdcard.c L970 - L1013
就是在做这样的努力。
elf_pheader.p_vaddr 就是把 elf 内容复制到的位址, 然后再透过找出 elf entry
point 就可以执行这个 elf 了。
那这个程式困难在哪里? 一样是在微小的内存, 这个 myur_168M.elf 有 68848, 128k
+ 64k ccm 总共只有 192k 的内存, 要怎么加载这个 elf 执行档而还要执行它呢?
我原本的想法是把 elf 加载到 ccm, 然后再从 ccm 位址 parse 这个 elf 并加载到
0x21000000 的位址, 但不管我怎么缩, 这个 elf 就是无法在 64k 之内。这时候只好靠
进阶程式技术了, 以分段读取的方式, 把所需要的 elf 部份加载到内存。
《一步步嵌入式操作系:ARM程的方法与 ( https://goo.gl/m961sn )》chapter 8 的程式
码是将 elf 整个读到内存, 再去 parse elf 并复制到加载位址上, 这样的方式程式比
较好写。
而分段读取的方式就不需要花费 64k ccm, 我把 ccm 的 64 k 拿来当 stack 了。这也是
为什么这个程式要先读 elf header, 再来才是 program header, 然后运用 f_seek 读出
需要的部份。fatfs 帮了大忙, 让我可以呼叫这些 api 完成这功能。否则要自己读取
fat, 计算档案在那个 cluster, 还要考虑小小的内存, 这不是简单几天就可以完成
的, 有经验的程式员马上就可以联想到其中的大工程。
所以很简单的 copy elf program body 的部份就变成 spi_sdcard.c L917 - 1010 这么
复杂了。
spi_sdcard.c
917 #if 1
918 {
919 u8 *elf_code = 0;
920
921 FIL fil; /* File object */
922 char buf[BUF_SIZE]; /* Line buffer */
923 FRESULT fr; /* FatFs return code */
924 //fr = f_open(&fil, "1.txt", FA_READ);
925 //const char *fn = "2:/MYUR_1~1.ELF";
926 //const char *fn = "0:/myur_168M.elf";
927 const char *fn = "0:/myur_168M-data-bss.elf";
928 fr = f_open(&fil, fn, FA_READ);
929 if (fr)
930 {
931 //printf("open %s fail\n", fn);
932 return (int)fr;
933 }
934
935 TCHAR* pos=0;
936 DWORD fsize = f_size (&fil);
937 //printf("fsize: %d\n", fsize);
938 int r_len = 0;
939 while (1)
940 {
941 f_read(&fil, buf, BUF_SIZE, &r_len);
942 //printf("r_len: %d\n", r_len);
943 fsize -= BUF_SIZE;
944 #if 0
945 if (fsize < BUF_SIZE)
946 print_packet(buf, fsize);
947 else
948 print_packet(buf, BUF_SIZE);
949 #endif
950 Elf32Ehdr elf_header = *((Elf32Ehdr*)buf);
951 #if 0
952 printf("sizeof Elf32Ehdr: %d\n", sizeof(Elf32Ehdr));
953 printf("sizeof Elf32Phdr: %d\n", sizeof(Elf32Phdr));
954 printf("elf_header.e_phoff: %d\n", elf_header.e_phoff);
955 #endif
956 u32 entry = elf_header.e_entry;
957 if (elf_header.e_phoff > BUF_SIZE)
958 {
959 //printf("error elf_header.e_phoff > BUF_SIZE!!\n");
960 break;
961 }
962 Elf32Phdr elf_pheader = *((Elf32Phdr*)((u8 *)buf +
elf_header.e_phoff)); // program header
963 //printf("elf_header.e_phnum: %d\n", elf_header.e_phnum);
964 for (int i=0 ; i < elf_header.e_phnum; ++i)
965 {
966 int ret;
967 //printf("p_vaddr: %#x offset: %#x size: %d\n",
elf_pheader.p_vaddr, elf_pheader.p_offset, elf_pheader.p_filesz);
968 ret = f_lseek(&fil, elf_pheader.p_offset);
969
970 u32 read_times = 1;
971 if (elf_pheader.p_filesz > BUF_SIZE)
972 {
973 #if 0
974 printf("elf_pheader.p_filesz: %d\n", elf_pheader.p_filesz);
975 printf("BUF_SIZE: %d\n", BUF_SIZE);
976 printf("elf_pheader.p_filesz > BUF_SIZE need to read %d
times.\n", read_times);
977 #endif
978 read_times = elf_pheader.p_filesz/BUF_SIZE;
979 if ( elf_pheader.p_filesz % bUF_SIZE != 0)
980 ++read_times;
981 }
982 ur_puts(USART2, "elf_pheader.p_filesz: ");
983 print_u32(elf_pheader.p_filesz);
984 ur_puts(USART2, "\r\n");
985
986 ur_puts(USART2, "read_times: ");
987 print_u32(read_times);
988 ur_puts(USART2, "\r\n");
989
990 for (int i=0 ; i < read_times; ++i)
991 {
992 u32 read_len = BUF_SIZE;
993 if (i == (read_times-1))
994 {
995 read_len = elf_pheader.p_filesz - i * BUF_SIZE;
996 }
997 f_read(&fil, buf, read_len, &r_len);
998 #if 0
999 ur_puts(USART2, "read_len: ");
1000 print_u32(read_len);
1001 ur_puts(USART2, "\r\n");
1002 #endif
1003
1004 ur_puts(USART2, "r_len: ");
1005 print_u32(r_len);
1006 ur_puts(USART2, "\r\n");
1007 s32_memcpy(elf_pheader.p_vaddr + BUF_SIZE * i, buf, r_len);
1008 ur_puts(USART2, "elf_pheader.p_vaddr + read_len * i: ");
1009 print_u32(elf_pheader.p_vaddr + BUF_SIZE * i);
1010 ur_puts(USART2, "\r\n");
1011 //printf("yy r_len: %d\n", r_len);
1012 //print_packet(buf, r_len);
1013 }
1014 (*(void(*)())entry)();
1015 ur_puts(USART2, "back to loader\r\n");
1016 while(1);
那被加载的 elf 执行档应该怎么设计呢? 我把 128k 分成 2 个 64k, 从 sd card 加载
的就从 0x20010000 往上的 64 k, 这很容易, 透过 linker script (参考
stm32.sd.ld) 就可以搞定。
0x20010000 + 64k 就是 sd card 上 elf 所能使用的位址空间, 程式一旦超过这个大
小, 就会出乱子。
stm32.sd.ld
11 MEMORY
12 {
13 FLASH (rx) : ORIGIN = 0x00000000, LENGTH = 1024K
14 SRAM (xrw) : ORIGIN = 0x20010000, LENGTH = 64K
16 }
17
18 ENTRY(mymain)
19
20 SECTIONS
21 {
22 .text :
23 {
24 KEEP(*(.isr_vector .isr_vector.*))
25 *(.text .text.*)
26 *(.rodata .rodata*)
27 _etext = .;
28 } > SRAM
29 .data : AT (_etext)
30 {
31 _data = .;
32 *(.data .data.*)
33 _edata = .;
34 } > SRAM
35 .bss(NOLOAD) :
36 {
37 _bss = .;
38 *(.bss .bss.*)
39 *(COMMON)
40 . = ALIGN(4);
41 _ebss = .;
42 } > SRAM
43 .stackarea(NOLOAD) :
44 {
45 . = ALIGN(8);
46 *(.stackarea .stackares.*)
47 . = ALIGN(8);
48 } > SRAM
49
50 . = ALIGN(4);
51 _end = .;
52 }
被加载的 elf 的 stack 就先用 loader 的吧。
再来的问题是该怎么执行这个 elf 程式呢? 有几个方法:
function call
goto
弄成一个 process
柿子挑软的吃, 我没那么大的野心, 弄成一个 process 太复杂了, 就用 function call
来搞定就好。最简单的当然是 goto, 直接跳去那里执行就好了, 也不用返回 loader 了

程式员如果有操作程式码的能力, 这是一个强力的技术, 什么是操作程式码的能力? 就是
我要让程式怎么跑, 程式就怎么跑。coroutine, setjmp/longjmp, exception handle,
stack unwind, debugger 就是有这样能力的技术或是程式。
这个功能也需要这样的能力, 我要从目前的 loader 移动到被加载的 elf, 然后还要跳回
来, 把那个 elf 当然一个新的 function, 去执行它就好了。
spi_sdcard.c L1014 那个恐怖的转型就是在做这件事情, 取出 elf 的 entry point
address, 转成 function pointer, 然后执行他, 比想像中的还要简单吧!
这比 c++ 的 exception handle 简单 100 倍以上 (我绝对没有夸张)。
list 1 是我第一次尝试, 当然也是一次就成功, 这不是幸运, 是之前的努力所结的美丽
果实。我做了相当多的验证, 证明能正常加载 elf 档案。
list 1 minicom result
1 Init complete! Hello World!
2 Init sd
3 Init sd ok
4 get cid ok
5 cid:
6 275048534430344720B0003FB4008CFB
7 oid: PH
8 pnm: SD04G
9 get csd ok
10 csd:
11 400E00325B5900001DE77F800A4000D5
12 sd_size: 7839744
13 dump sector 0:
47 total: 3900522, free: 1993300
48 from sd loaded ok
49 back
list 2 是我第二次尝试, 有什么不同呢? 我加入了 bss, data section 的测试。确认
bss, data section 的值是正确的。也更进一步改善程式, 分段将 elf program body 载
入到正确的位置。所以很不幸的没有一次就成功, 我花了一些时间完成她。
todo:
目前还无法处理有 2 个以上的 program body。
list 2. mincom result 1
1 Init complete! Hello World!
2 Init sd
3 Init sd ok
4 get cid ok
5 cid:
6 275048534430344720B0003FB4008CFB
7 oid: PH
8 pnm: SD04G
9 get csd ok
10 csd:
11 400E00325B5900001DE77F800A4000D5
12 sd_size: 7839744
47 total: 3900522, free: 1993230
48 elf_pheader.p_filesz: 640
49 read_times: 03
50 r_len: 256
51 elf_pheader.p_vaddr + read_len * i: 536936448
52 r_len: 256
53 elf_pheader.p_vaddr + read_len * i: 536936704
54 r_len: 128
55 elf_pheader.p_vaddr + read_len * i: 536936960
56 from sd loaded ok
57 12345678
58 76
59 98
60 CD
61 AB
62 back to loader
myur_168M.c 已经不再需要初始化 usart2, 因为 loader 已经做过了, 直接呼叫 usart
output function 即可。
myur_168M.c L101 - 106 是 bss section 测试, 应该是 0, 但我印出 76, 98, CD,
AB, 这是因为我改了 bss init 的值, 我用了 0xabcd9876 来初始化 bss, 确认这部份是
对的之后就改回 0 了。
myur_168M.c
1 #include "stm32f4xx_usart.h"
2 #include "stm32f4xx_rcc.h"
3 #include "stm32f4xx_gpio.h"
4
5
6 void USART_SendData(USART_TypeDef* USARTx, uint16_t Data)
7 {
8 /* Check the parameters */
9 assert_param(IS_USART_ALL_PERIPH(USARTx));
10 assert_param(IS_USART_DATA(Data));
11
12 /* Transmit Data */
13 USARTx->DR = (Data & (uint16_t)0x01FF);
14 }
15
16
17 void ur_puts(USART_TypeDef* USARTx, volatile char *s)
18 {
19 while(*s)
20 {
21 // wait until data register is empty
22 while( !(USARTx->SR & 0x00000040) );
23 USART_SendData(USARTx, *s);
24 *s++;
25 }
26 }
27
28 void init_bss()
29 {
30 extern unsigned long _bss;
31 extern unsigned long _ebss;
32 unsigned long *bss_dest;
33
34 for (bss_dest = &_bss; bss_dest < &_ebss;)
35 {
36 //*bss_dest++ = 0xabcd9876;
37 *bss_dest++ = 0x0;
38 }
39 }
40
41 char* s32_itoa(uint32_t n, char* str, int radix)
42 {
43 char digit[]="0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ";
44 char* p=str;
45 char* head=str;
46 uint8_t count=0;
47 //int radix = 10;
48
49 // if(!p || radix < 2 || radix > 36)
50 // return p;
51 if (n==0)
52 {
53 *p++='0';
54 *p++ = '0';
55 *p=0;
56 return str;
57 }
58 if (radix == 10 && n < 0)
59 {
60 *p++='-';
61 n= -n;
62 }
63
64 while(n)
65 {
66 ++count;
67 *p++=digit[n%radix];
68 //s32_put_char(*(p-1), (u8*)(0xb8000+80*2));
69 n/=radix;
70 }
71 if (count == 1)
72 *p++ = '0';
73
74 *p=0;
75 #if 1
76 for (
作者: wtchen (没有存在感的人)   2016-12-03 18:03:00
好强,只能推了!
作者: wnmin   2016-12-03 21:23:00
强 可是要怎么玩才会把flash写爆啊
作者: james732 (好人超)   2016-12-03 23:12:00

Links booklink

Contact Us: admin [ a t ] ucptt.com