拷貝時要確定兩點:
(1) stage2 的可執(zhí)行映象在固態(tài)存儲設(shè)備的存放起始地址和終止地址;
(2) RAM 空間的起始地址。
3.1.4 設(shè)置堆棧指針 sp
堆棧指針的設(shè)置是為了執(zhí)行 C 語言代碼作好準備。通常我們可以把 sp 的值設(shè)置為(stage2_end-4),也即在 3.1.2 節(jié)所安排的那個 1MB 的 RAM 空間的最頂端(堆棧向下生長)。
此外,在設(shè)置堆棧指針 sp 之前,也可以關(guān)閉 led 燈,以提示用戶我們準備跳轉(zhuǎn)到 stage2。
經(jīng)過上述這些執(zhí)行步驟后,系統(tǒng)的物理內(nèi)存布局應(yīng)該如下圖2所示。
3.1.5 跳轉(zhuǎn)到 stage2 的 C 入口點
在上述一切都就緒后,就可以跳轉(zhuǎn)到 Boot Loader 的 stage2 去執(zhí)行了。
比如,在 ARM 系統(tǒng)中,這可以通過修改 PC 寄存器為合適的地址來實現(xiàn)。
3.2 Boot Loader 的stage2
正如前面所說,stage2 的代碼通常用 C 語言來實現(xiàn),以便于實現(xiàn)更復(fù)雜的功能和取得更好的代碼可讀性和可移植性。
但是與普通 C 語言應(yīng)用程序不同的是,在編譯和鏈接boot loader 這樣的程序時,我們不能使用 glibc 庫中的任何支持函數(shù)。其原因是顯而易見的。這就給我們帶來一個問題,那就是從那里跳轉(zhuǎn)進 main() 函數(shù)呢?直接把 main() 函數(shù)的起始地址作為整個 stage2 執(zhí)行映像的入口點或許是最直接的想法。但是這樣做有兩個缺點:
1)無法通過main() 函數(shù)傳遞函數(shù)參數(shù);
2)無法處理 main() 函數(shù)返回的情況。
一種更為巧妙的方法是利用 trampoline(彈簧床)的概念。也即,用匯編語言寫一段trampoline 小程序,并將這段 trampoline 小程序來作為 stage2 可執(zhí)行映象的執(zhí)行入口點。然后我們可以在 trampoline 匯編小程序中用 CPU 跳轉(zhuǎn)指令跳入 main() 函數(shù)中去執(zhí)行;而當 main() 函數(shù)返回時,CPU 執(zhí)行路徑顯然再次回到我們的 trampoline 程序。簡而言之,這種方法的思想就是:用這段 trampoline 小程序來作為main() 函數(shù)的外部包裹(external wrapper)。
下面給出一個簡單的 trampoline 程序示例(來自blob):
.text
.globl _trampoline
_trampoline:
bl main
/* if main ever returns we just call it again */
b _trampoline
可以看出,當 main() 函數(shù)返回后,我們又用一條跳轉(zhuǎn)指令重新執(zhí)行 trampoline 程序,當然也就重新執(zhí)行 main() 函數(shù),這也就是 trampoline(彈簧床)一詞的意思所在。
3.2.1初始化本階段要使用到的硬件設(shè)備
這通常包括:
(1)初始化至少一個串口,以便和終端用戶進行 I/O 輸出信息;
(2)初始化計時器等。
在初始化這些設(shè)備之前,也可以重新把 LED 燈點亮,以表明我們已經(jīng)進入 main() 函數(shù)執(zhí)行。
設(shè)備初始化完成后,可以輸出一些打印信息,程序名字字符串、版本號等。
3.2.2 檢測系統(tǒng)的內(nèi)存映射(memory map)
所謂內(nèi)存映射就是指在整個 4GB 物理地址空間中有哪些地址范圍被分配用來尋址系統(tǒng)的RAM 單元。
比如,在 SA-1100 CPU 中,從 0xC000,0000 開始的512M地址空間被用作系統(tǒng)的 RAM 地址空間,而在 Samsung S3C44B0X CPU 中,從 0x0c00,0000 到 0x1000,0000 之間的64M地址空間被用作系統(tǒng)的 RAM 地址空間。雖然 CPU 通常預(yù)留出一大段足夠的地址空間給系統(tǒng) RAM,但是在搭建具體的嵌入式系統(tǒng)時卻不一定會實現(xiàn) CPU 預(yù)留的全部 RAM 地址空間。也就是說,具體的嵌入式系統(tǒng)往往只把 CPU 預(yù)留的全部 RAM 地址空間中的一部分映射到 RAM 單元上,而讓剩下的那部分預(yù)留 RAM 地址空間處于未使用狀態(tài)。
由于上述這個事實,因此 Boot Loader 的 stage2 必須在它想干點什么 (比如,將存儲在 flash 上的內(nèi)核映像讀到 RAM 空間中) 之前檢測整個系統(tǒng)的內(nèi)存映射情況,也即它必須知道CPU 預(yù)留的全部 RAM 地址空間中的哪些被真正映射到 RAM 地址單元,哪些是處于 “unused” 狀態(tài)的。
(1) 內(nèi)存映射的描述
可以用如下數(shù)據(jù)結(jié)構(gòu)來描述 RAM 地址空間中的一段連續(xù)(continuous)的地址范圍:
typedef struct memory_area_struct {
u32 start; /* the base address of the memory region */
u32 size; /* the byte number of the memory region */
int used;
} memory_area_t;
這段 RAM 地址空間中的連續(xù)地址范圍可以處于兩種狀態(tài)之一:
(1)used=1,則說明這段連續(xù)的地址范圍已被實現(xiàn),也即真正地被映射到 RAM 單元上。
(2)used=0,則說明這段連續(xù)的地址范圍并未被系統(tǒng)所實現(xiàn),而是處于未使用狀態(tài)。
基于上述 memory_area_t 數(shù)據(jù)結(jié)構(gòu),整個 CPU 預(yù)留的 RAM 地址空間可以用一個 memory_area_t 類型的數(shù)組來表示,如下所示:
memory_area_t memory_map[NUM_MEM_AREAS] = {
[0 。.. (NUM_MEM_AREAS - 1)] = {
.start = 0,
.size = 0,
.used = 0
},
};
(2) 內(nèi)存映射的檢測
下面我們給出一個可用來檢測整個 RAM 地址空間內(nèi)存映射情況的簡單而有效的算法:
/* 數(shù)組初始化 */
for(i = 0; i < NUM_MEM_AREAS; i++)
memory_map[i].used = 0;
/* first write a 0 to all memory locations */
for(addr = MEM_START; addr < MEM_END; addr += PAGE_SIZE)
* (u32 *)addr = 0;
for(i = 0, addr = MEM_START; addr < MEM_END; addr += PAGE_SIZE) {
/*
* 檢測從基地址 MEM_START+i*PAGE_SIZE 開始,大小為
* PAGE_SIZE 的地址空間是否是有效的RAM地址空間。
*/
調(diào)用3.1.2節(jié)中的算法test_mempage();
if ( current memory page isnot a valid ram page) {
/* no RAM here */
if(memory_map[i].used )
i++;
continue;
}
/*
* 當前頁已經(jīng)是一個被映射到 RAM 的有效地址范圍
* 但是還要看看當前頁是否只是 4GB 地址空間中某個地址頁的別名?
*/
if(* (u32 *)addr != 0) { /* alias? */
/* 這個內(nèi)存頁是 4GB 地址空間中某個地址頁的別名 */
if ( memory_map[i].used )
i++;
continue;
}
/*
* 當前頁已經(jīng)是一個被映射到 RAM 的有效地址范圍
* 而且它也不是4GB 地址空間中某個地址頁的別名。
*/
if (memory_map[i].used == 0) {
memory_map[i].start = addr;
memory_map[i].size = PAGE_SIZE;
memory_map[i].used = 1;
} else {
memory_map[i].size += PAGE_SIZE;
}
} /* end of for (…) */
在用上述算法檢測完系統(tǒng)的內(nèi)存映射情況后,Boot Loader 也可以將內(nèi)存映射的詳細信息打印到串口。
評論