天方夜谭VCL:多态



天方夜谭VCL: 多态
虫虫

我们中国人崇拜龙，所谓“龙生九种，九种各别”。哪九种？《西游记》里西海龙王对孙悟空说：“第一个小黄龙，见居淮渎；第二个小骊龙，见住济渎；第三个青背龙，占了江渎；第四个赤髯龙，镇守河渎；第五个徒劳龙，与佛祖司钟；第六个稳兽龙，与神官镇脊；第七个敬仲龙，与玉帝守擎天华表；第八个蜃龙，在大家兄处砥据太岳。此乃第九个鼍龙，因年幼无甚执事，自旧年才着他居黑水河养性，待成名，别迁调用，谁知他不遵吾旨，冲撞大圣也。”（注：鼍龙是文雅的说法，民间叫法是猪婆龙，也就是扬子鳄。）如果您冲着这九位说一声“Let’s go”，那场面可壮观了，有天上飞的，有水里游的，也有地上爬的。同样是“go”，“go”的具体形式却各不相同，这正是多态“一个接口，多种实现”的典型例子。 
多态的实现方法很多，其中C++直接支持的方式有：通过关键字virtual提供虚函数进行迟后联编，以及通过模板（template）实现静态多态性，它们都各有用武之地。我们比较熟悉的是虚函数，这是建构类层次的重要手段，我们也已经分析过虚函数的原理[1]。然而在有些情况下，虚函数的性能并不是最优，故VCL还提供了一种动态（dynamic）函数，用法和虚函数一模一样，只要把virtual换成DYNAMIC就可以了。VCL的帮助文件里说，动态函数跟虚拟函数相比，空间效率占优，时间效率不行，真的吗？其实现原理又是如何呢？我们又应该如何权衡这两者的使用呢？我们将从一个相当一般的角度来讨论这些问题。 
虚函数的苦恼
如下类层次来自一个图形绘制程序的一部分。为了方便管理，界面与具体的图形设计分离。各种图形以动态连接库的方式提供，作为插件的形式。这样可以在不重新编译主程序的情况，增加或减少各种图形。 

图1　Shape类层次 
最初Shape的声明是 
class Shape {
private:
	int x0, y0;
protected:
        Shape();
        virtual ~Shape();
public:
	int x() const;
	int y() const;
        virtual void draw(void *) = 0;
        virtual int move(int, int);
};
后来因为功能扩充，添加了两个虚函数。 class Shape {
private:
	int x0, y0;
protected:
        Shape();
        virtual ~Shape();
public:
	int x() const;
	int y() const;
	virtual int move(int, int);
        virtual void draw(void *) = 0;
        virtual void save(void *) const = 0;
        virtual void load(void *) = 0;
};
后来又作过一些修改，又添加了若干虚函数。问题就在于，虚函数一但增加，虚拟函数表VFT就会发生变化，这时候，主程序就必须重新编译。更糟糕的是，一旦版本升级，派生自不同版本Shape的图形绝对不可以混用[2]。所以我们可以看到硬盘里充斥着mfc20.dll、mfc40.dll、mfc42.dll……却一个也不能删除，这就是MFC升级所带来的DLL垃圾。怎么办？ 
初步解决
我在网上问过这样的问题，得到的答复主要有： 

用COM； 
预先多写一些无用的虚函数，留出扩充空间。 
其实上面的方法都能很好地解决这个问题。但是推广看来，也有一定局限性。COM不适合解决类层次过深的情况，预留的空间则是不折不扣的“鸡肋”。 
追根究底，这个局限性是因为父类和子类的虚拟函数表VFT之间过强的关联性：子类的VFT的前面一部分必须与父类相同。而当父类和子类不在同一个DLL或EXE中的时候，这个要求是很难满足的。父类一旦改变，子类如果不重新编译，就将导致错误。解决的方法，当然就是取消父类和子类VFT之间的关联性。我设计了一个很笨的解决办法，但可以取消这个关联性，使虚函数保证始终只有2个。 
#define Dynamic // Dynamic什么都不是，只是好看一点

struct point
{
	int x, y;
};

class dispatch_error{};

class Shape {
private:
	int x0, y0;
protected:
        Shape();
        virtual ~Shape();
	virtual void dispatch(int id, void* in, void* out);
	// in和out是函数的输入输出参数，id是每个函数唯一的标记符号，即代号
	// 实际运用中，id不一定是整数，也可以是128位UUID，或者字符串等等
public:
	int x() const;
	int y() const;
	Dynamic int move(int dx, int dy)
	{
		int r;
		point p = {dx, dy};
		dispatch(-1, &p, &r);
		return r;
	}
        Dynamic void draw(void *hdc)		{dispatch(-2, hdc, 0);}
        Dynamic void save(void* o) const	{dispatch(-3, o, 0);}
        Dynamic void load(void* i)		{dispatch(-4, i, 0);}
};

void Shape::dispatch(int id, void* in, void* out)
{
        switch(id)
        {
                case -1:
                        ...
                case -2:
                        ...
		...
                default:
                        throw(dispatch_error()); // 若函数不存在则抛出异常
        }
}
如果子类Triangle要改写Shape::draw，那么只需要 void Triangle::dispatch(int id, void* in, void* out)
{
        switch(id)
        {
                ...
                case -2:	// 改写Shape::draw
                        ...
		...
                default:
                        Shape::dispatch(id, in, out); //函数不存在则向父类找
        }
}
这样的“Dynamic函数”就解决了前面的问题，只有析构和dispatch这两个虚函数。父类和子类的VFT之间没有关联性，可以自由改动而不会互相影响。 
评头论足
我们来对这种解决方案作了评价：的确解决了虚函数的问题，但是也付出了不小的代价：时间效率和可读性，由此也决定了该方案的应用面不广，一般用于 

虚函数很少或几乎不需改写的情况。这样有助于减少VFT的大小。至于运行速度则没有什么提高，毕竟VFT的访问速度是常数级[vcl_chong.htm#33" name=3>3]； 
父类需要经常更新而子类不方便同步更新，对效率要求又不高的情况。一般的应用程序都可以使用。 
从模式（Patterns）的角度来看，这种方法是典型的职责链（Chain of Responsibility）模式[4]：调用请求从最低层子类开始一层层往上传递，直到被处理或者最后抛出异常。这种模式运用非常广泛，比如VCL消息映射[5]和COM中IDispatch接口[6]，与上述解决方案的形式都非常相似。 
这个解决方案还可以作进一步的完善，以更好地适用于单根结构的框架。比如单根结构的类库，如MFC和VCL，通过RTTI可以找到唯一的父类，那么可以分离数据（函数代号和指针）和代码（调配部分），以简化结构。解决的方法就是典型的表格驱动，有不少书[7，8]都用此来优化COM中IUnkown接口的QueryInte易做图ce。我们引入类DMT来储存函数的代号和指针。 
#include 
using namespace std;

class DMT {
        char* const ptr;
        const DMT* const parent;
public:
        DMT(const DMT* const, const int, ...);
        ~DMT() {delete []ptr;}
        short size() const  {return *(short*)ptr;}
        const void* find(int) const;
};


图2　类DMT图解 
需要特别注意的是DMT::ptr所分配的空间。在32位系统上，对于n个“Dynamic函数”，需要sizeof(short)字节储存n（红色部分），sizeof(void*)*n字节储存函数代号（黄色部分），以及sizeof(void*)*n字节储存函数指针（蓝色部分），一共是sizeof(short) + 2*n*sizeof(void*)字节。子类和父类的DMT可以通过链表形式连接起来。下面我们看看DMT::find和DMT::DMT的实现。 
const void* DMT::find(int i) const
{
	const int* begin = (int*)(ptr + sizeof(short)), *p;
	for(p = begin; p < begin + size(); ++p)
		if(*(int*)p == i)
			return *(void**)(p+ size());
			// 找到对应的函数代号后，向前跳DMT::size()则是相应的函数指针
	return (parent)? parent->find(i): 0;
}

DMT::DMT(const DMT* const p, const int n, ...)
	: parent(p), ptr(new char[sizeof(short)+2*n*sizeof(void*)])
					// ptr分配的空间大小如前所述
{
	int* i = (int*)(ptr + 2), c;
	*(short*)ptr = n;		// 往头sizeof(short)字节写入n（红色部分）

	va_list ap;
	va_start(ap, n);

	for(c = 0; c < n; ++c)		// 往黄色部分写入函数代号
		*(i++) = va_arg(ap, int);

	typedef void (DMT::*temp_type)();
	temp_type temp;

	for(c = 0; c < n; ++c)		// 往蓝色部分写入函数指针
	{
		temp = va_arg(ap, temp_type);
		*(i++) = *(int*)&temp;
	}

	va_end(ap);
}
下面我们在Shape类层次中应用DMT类。 class Shape {
private:
补充：软件开发 , Delphi ,