FreeBSD操作系统的boot2阶段
也许你想知道,为什么boot2是在boot0之后,而不是在boot1之后。事实上,也有一个512字节的文件boot1存放在目录/boot里,那是用来从一张软盘引导系统的。从软盘引导时,boot1起着boot0对硬盘引导相同的作用:它找到boot2并运行之。你可能已经看到有一文件/boot/mbr。这是boot0的简化版本。mbr中的代码不会显示菜单让用户选择,而只是简单的引导被标志的分区。
实现boot2的代码存放在目录sys/boot/i386/boot2/里,对应的可执行文件在/boot里。在/boot里的文件boot0和boot2不会在引导过程中使用,只有boot0cfg这样的工具才会使用它们。boot0的内容应在MBR中才能生效。boot2位于可引导的FreeBSD分区的开始。这些位置不受文件系统控制,所以它们不可用ls之类的命令查看。
boot2的主要任务是装载文件/boot/loader,那是引导过程的第三阶段。在boot2中的代码不能使用诸如open()和read()之类的例程函数,因为内核还没有被加载。而应当扫描硬盘,读取文件系统结构,找到文件/boot/loader,用BIOS的功能将它读入内存,然后从其入口点开始执行之。
除此之外,boot2还可提示用户进行选择,loader可以从其它磁盘、系统单元、分区装载。
boot2 的二进制代码用特殊的方式产生:
sys/boot/i386/boot2/Makefile
boot2: boot2.ldr boot2.bin ${BTX}/btx/btx
btxld -v -E ${ORG2} -f bin -b ${BTX}/btx/btx -l boot2.ldr
-o boot2.ld -P 1 boot2.bin
这个Makefile片断表明btxld(8)被用来链接二进制代码。BTX表示引导扩展器(BooT eXtender)是给程序(称为客户(client))提供保护模式环境、并与客户程序相链接的一段代码。所以boot2是一个BTX客户,使用BTX提供的服务。
工具btxld是链接器,它将两个二进制代码链接在一起。btxld(8)和ld(1)的区别是ld通常将两个目标文件链接成一个动态链接库或可执行文件,而btxld则将一个目标文件与BTX链接起来,产生适合于放在分区首部的二进制代码,以实现系统引导。
boot0执行跳转至BTX的入口点。然后,BTX将处理器切换至保护模式,并准备一个简单的环境,然后调用客户。这个环境包括:
虚拟8086模式。这意味着BTX是虚拟8086的监视程序。实模式指令,如pushf, popf, cli, sti, if,均可被客户调用。
建立中断描述符表(Interrupt Descriptor Table, IDT),使得所有的硬件中断可被缺省的BIOS程序处理。建立中断0x30,这是系统调用关口。
两个系统调用exec和 exit的定义如下:
sys/boot/i386/btx/lib/btxsys.s:
.set INT_SYS,0x30
# 中断号
#
# System call: exit
#
__exit:
xorl %eax,%eax
# BTX系统调用0x0
int $INT_SYS
#
#
# System call: exec
#
__exec:
movl $0x1,%eax
# BTX系统调用0x1
int $INT_SYS
#
BTX建立全局描述符表(Global Descriptor Table, GDT):
sys/boot/i386/btx/btx/btx.s:
gdt:
.word 0x0,0x0,0x0,0x0
# 以空为入口
.word 0xffff,0x0,0x9a00,0xcf
# SEL_SCODE
.word 0xffff,0x0,0x9200,0xcf
# SEL_SDATA
.word 0xffff,0x0,0x9a00,0x0 # SEL_RCODE
.word 0xffff,0x0,0x9200,0x0 # SEL_RDATA
.word 0xffff,MEM_USR,0xfa00,0xcf# SEL_UCODE
.word 0xffff,MEM_USR,0xf200,0xcf# SEL_UDATA
.word _TSSLM,MEM_TSS,0x8900,0x0 # SEL_TSS
客户的代码和数据始于地址MEM_USR(0xa000),选择符(selector) SEL_UCODE指向客户的数据段。选择符 SEL_UCODE 拥有第3级描述符权限(Descriptor Privilege Level, DPL),这是最低级权限。但是INT 0x30 指令的处理程序存储于另一个段里,这个段的选择符SEL_SCODE (supervisor code)由有着管理级权限。正如代码建立IDT(中断描述符表)时进行的操作那样:
mov $SEL_SCODE,%dh
# 段选择符
init.2:
shr %bx
# 是否处理这个中断?
jnc init.3
# 否
mov %ax,(%di)
# 设置处理程序偏移量
mov %dh,0x2(%di)
# 设置处理程序选择符
mov %dl,0x5(%di)
# 设置 P:DPL:type
add $0x4,%ax
# 下一个中断处理程序
所以,当客户调用 __exec()时,代码将被以最高权限执行。这使得内核可以修改保护模式数据结构,如分页表(page tables)、全局描述符表(GDT)、中断描述符表(IDT)等。
boot2 定义了一个重要的数据结构:struct bootinfo。这个结构由 boot2 初始化,然后被转送到loader,之后又被转入内核。这个结构的部分项目由boot2设定,其余的由loader设定。这个结构中的信息包括内核文件名、BIOS提供的硬盘柱面/磁头/扇区数目信息、BIOS提供的引导设备的驱动器编号,可用的物理内存大小,envp指针(环境指针)等。定义如下:
/usr/include/machine/bootinfo.h
struct bootinfo {
u_int32_t
bi_version;
u_int32_t
bi_kernelname;
/* 用一个字节表示 * */
u_int32_t
bi_nfs_diskless;
/* struct nfs_diskless * */
/* 以上为常备项 */
#define bi_endcommon
bi_n_bios_used
u_int32_t
bi_n_bios_used;
u_int32_t
bi_bios_geom[N_BIOS_GEOM];
u_int32_t
bi_size;
u_int8_t
bi_memsizes_valid;
u_int8_t
bi_bios_dev;
/* 引导设备的BIOS单元编号 */
u_int8_t
bi_pad[2];
u_int32_t
bi_basemem;
u_int32_t
bi_extmem;
u_int32_t
bi_symtab;
/* struct symtab * */
u_int32_t
bi_esymtab;
/* struct symtab * */
/* 以下项目仅高级bootloader提供 */
u_int32_t
bi_kernend;
/* 内核空间末端 */
u_int32_t
bi_envp;
/* 环境 */
u_int32_t
bi_modulep;
/* 预装载的模块 */
};
boot2 进入一个循环等待用户输入,然后调用load()。如果用户不做任何输入,循环将在一段时间后结束,load() 将会装载缺省文件(/boot/loader)。函数 ino_t lookup(char *filename)和int xfsread(ino_t inode, void *buf, size_t nbyte) 用来将文件内容读入内存。/boot/loader是一个ELF格式二进制文件,不过它的头部被换成了a.out格式中的struct exec结构。load()扫描loader的ELF头部,装载/boot/loader至内存,然后跳转至入口执行之:
sys/boot/i386/boot2/boot2.c:
__exec((caddr_t)addr, RB_BOOTINFO | (opts & RBX_MASK),
MAKEBOOTDEV(dev_maj[dsk.type], 0, dsk.slice, dsk.unit, dsk.part),
0, 0, 0, VTOP(&bootinfo));