Unix中内核调度实体KSE和线程实现的步骤
Unix实际是一种比较老的系统了,在Unix之后的操作系统的发展已经不明显,虽然在操作系统理论上的进步也不少,但真正比较大而且应用于实际中的却并不是很多。微内核理论可以算是一个比较实用的发展,虽然理论上微内核各个方面都有优势,但也并不是万用灵药,传统内核也有自己的优势,尤其是近些年来,内核模块化的发展,使得传统内核也吸收了微内核的一些优点,反过来,Windows NT/2000的微内核,内核中包含了更多的东西,其实际大小不一定要比Unix小。另一个非常有实际意义的操作系统发展是引入了线程概念,这也是一个目前非常基础的概念。它也是一个非常有用的功能,能在同一个数据空间中完成多任务的并行处理,这样帮助程序员完成多任务处理,但又不必考虑复杂的进程之间的通信问题。
在 Unix中,是使用的进程概念来区分不同的独立计算任务,进程具有独立的上下文空间、独立数据空间等等特性,这样进程就可以很容易的独立执行,内核就可以根据优先级在进程之间进行切换,因此进程也就是最基本的内核调度实体。但是,由于计算任务的复杂性,很多任务需要使用多个进程完成,而且这些进程之间需要交换数据。为了解决这个问题,Unix中又设计了多种进程间的通信方式,称为IPC,例如管道、共享内存、套接字等等,这些内容本身就可以独立使用一本专门的书籍来描述了。
因此对于一些比较复杂的程序,就形成了一个怪圈,为了隔离计算任务,设计了进程的概念,为了进程之间能够共享数据,又设计了多种 IPC通信方式。因此,人们就希望能设计一种能够独立执行,但没有独立数据空间的轻量级进程的概念,这就是线程。
明显的,线程对于复杂系统来讲非常有意义,因为不再需要复杂的 IPC通信方式维护进程之间的数据交换,同时多个线程也可以独立、并行的执行。目前,很多数据库系统、Java应用程序都需要线程支持。但是由于Unix系统本身并不存在线程这个概念,那么在Unix下引入线程就有两种比较直接的方式。
第一种方式是不在内核中实现线程,而在用户程序本身中实现线程,这实际是对线程的一种模拟,线程之间的切换和调度是在用户的进程内部进行的,这种方式就被称为用户空间的线程。这种线程的好处是实现非常简单,而且性能也非常好,因为线程之间的切换都在用户进程内部进行,切换开销比较小。 FreeBSD下缺省就使用这种线程模式。
它的缺点也很明显,首先就是不能充分利用高端服务器系统的 SMP多处理器的优点,因为一个进程只能由一个处理器处理,第二点由于用户空间线程是在用户空间切换,某个线程遇到一个需要阻塞的系统调用而就会造成整个进程被阻塞,因而其他线程也被阻塞,这中情况实际在线程的概念中是不允许的,但实际实现中很难被百分之百避免。
第二种实现方式是通过修改进程的实现方式来完成,可以使用不完全的进程创建方式创建共享数据空间的进程,在 Linux下这种系统调用为clone(),而在FreeBSD下它为rfork()。这种方式是Linux的基本线程处理方式,FreeBSD下可以使用linuxthread的兼容库来实现这种线程。
用进程的方式实现的线程,能够利用多处理器的优点,也能达到共享数据的目的,但它的线程切换开销实际是和进程是一样的,需要内核参与因而开销较大。而且线程实际上是进程,在很多方面还存在问题,例如不同线程的进程标识号不一致,多线程程序的执行优先级要比单线程的要高,线程之间的同步需要比较大的开销等等,因而也不能算理想的线程实现。
因而,虽然 FreeBSD下有两种不同的线程实现,但它们各自都有优缺点,这就造成了多线程应用系统在FreeBSD下的表现不尽人意的现状。
在线程方面做得比较好的操作系统有 Windows NT/2000和SUN Solaris,对于Windows NT/2000,它们本身就是以线程为基础进行任务调度的,性能较好比较正常。SUN Solaris的线程实现则提供了另一个很好的参考平台,在Solaris中,事实上是混用了用户空间的线程和进程基础的线程的,使用多个进程运行更多的线程,因此可以综合利用多处理器的优点和在进程内部切换线程的优点。
因此, FreeBSD 5.0中就希望既能利用用户空间的线程切换开销小的优点,又能利用内核线程支持多处理器的优点。FreeBSD 5.0在这个方向走的更远,就是将系统内核的最基本的调度实体从进程改变为线程。简单的讲,FreeBSD 5.0进程中的多个线程按照系统的处理器数量在内核中分为相应数量的组,可以分别在多个处理器上执行,这样就可以充分发挥多处理器的优势。而线程之间的切换是由用户空间来调度的,但用户空间的线程调度程序可以和内核交互,例如当一个线程阻塞的时候,内核将通知线程调度程序启动另一个线程,而内核进行进程调度的时候,就直接针对线程组切换到正确的线程。
虽然原理上并不复杂,但实现起来相当困难,最基本的一点就是需要将内核调度的实体从原先的进程改变为线程,这样内核调度的时候就可以直接切换到线程队列中的正确线程,而不是首先切换到进程,再在进程内切换到线程。这一点工作就需要将原本很多针对进程的内核设计进行改变,例如内核代码中所有涉及进程控制块 PCB的地方都需要改动,因为系统不再使用进程控制块PCB来执行任务调度,而是使用线程控制块TCB来作为最基本的调度实体。
因此,当这个工作真正完成, FreeBSD就将成为一个真正的内核级别支持多线程的系统。