C#类型基础
引言
本文之初的目的是讲述设计模式中的 Prototype(原型)模式,但是如果想较清楚地弄明白这个模式,需要了解对象克隆(Object Clone),Clone其实也就是对象复制。复制又分为了浅度复制(Shallow Copy)和深度复制(Deep Copy),浅度复制 和 深度复制又是以 如何复制引用类型成员来划分的。由此又引出了 引用类型和 值类型,以及相关的对象判等、装箱、拆箱等基础知识。
于是易做图脆新起一篇,从最基础的类型开始自底向上写起了。我仅仅想将对于这个主题的理解表述出来,一是总结和复习,二是交流经验,或许有地方我理解的有偏差,希望指正。如果前面基础的内容对你来说过于简单,可以跳跃阅读。
值类型 和 引用类型
我们先简单回顾一下C#中的类型系统。C# 中的类型一共分为两类,一类是值类型(Value Type),一类是引用类型(Reference Type)。值类型 和 引用类型是以它们在计算机内存中是如何被分配的来划分的。值类型包括 结构和枚举,引用类型包括类、接口、委托 等。还有一种特殊的值类型,称为简单类型(Simple Type),比如 byte,int等,这些简单类型实际上是FCL类库类型的别名,比如声明一个int类型,实际上是声明一个System.Int32结构类型。因此,在Int32类型中定义的操作,都可以应用在int类型上,比如 “123.Equals(2)”。
所有的 值类型 都隐式地继承自 System.ValueType类型(注意System.ValueType本身是一个类类型),System.ValueType和所有的引用类型都继承自 System.Object基类。你不能显示地让结构继承一个类,因为C#不支持多重继承,而结构已经隐式继承自ValueType。
NOTE:堆栈(stack)是一种后进先出的数据结构,在内存中,变量会被分配在堆栈上来进行操作。堆(heap)是用于为类型实例(对象)分配空间的内存区域,在堆上创建一个对象,会将对象的地址传给堆栈上的变量(反过来叫变量指向此对象,或者变量引用此对象)。
1.值类型
当声明一个值类型的变量(Variable)的时候,变量本身包含了值类型的全部字段,该变量会被分配在线程堆栈(Thread Stack)上。
假如我们有这样一个值类型,它代表了直线上的一点:
public struct ValPoint {
public int x;
public ValPoint(int x) {
this.x = x;
}
}
当我们在程序中写下这样的一条变量的声明语句时:
ValPoint vPoint1;
实际产生的效果是声明了vPoint1变量,变量本身包含了值类型的所有字段(即你想要的所有数据)。
NOTE:如果观察MSIL代码,会发现此时变量还没有被压到栈上,因为.maxstack(最高栈数) 为0。并且没有看到入栈的指令,这说明只有对变量进行操作,才会进行入栈。
因为变量已经包含了值类型的所有字段,所以,此时你已经可以对它进行操作了(对变量进行操作,实际上是一系列的入栈、出栈操作)。
vPoint1.x = 10;
Console.WriteLine(vPoint.x); // 输出 10
NOTE:如果vPoint1是一个引用类型(比如class),在运行时会抛出NullReferenceException异常。因为vPoint是一个值类型,不存在引用,所以永远也不会抛出NullReferenceException。
如果你不对vPoint.x进行赋值,直接写Console.WriteLine(vPoint.x),则会出现编译错误:使用了未赋值的局部变量。产生这个错误是因为.Net的一个约束:所有的元素使用前都必须初始化。比如这样的语句也会引发这个错误:
int i;
Console.WriteLine(i);
解决这个问题我们可以通过这样一种方式:编译器隐式地会为结构类型创建了无参数构造函数。在这个构造函数中会对结构成员进行初始化,所有的值类型成员被赋予0或相当于0的值(针对Char类型),所有的引用类型被赋予null值。(因此,Struct类型不可以自行声明无参数的构造函数)。所以,我们可以通过隐式声明的构造函数去创建一个ValPoint类型变量:
ValPoint vPoint1 = new ValPoint();
Console.WriteLine(vPoint.x); // 输出为0
我们将上面代码第一句的表达式由“=”分隔拆成两部分来看:
左边 ValPoint vPoint1,在堆栈上创建一个ValPoint类型的变量vPoint,结构的所有成员均未赋值。在进行new ValPoint()之前,将vPoint压到栈上。
右边new ValPoint(),new 操作符不会分配内存,它仅仅调用ValPoint结构的默认构造函数,根据构造函数去初始化vPoint结构的所有字段。
注意上面这句,new 操作符不会分配内存,仅仅调用ValPoint结构的默认构造函数去初始化vPoint的所有字段。那如果我这样做,又如何解释呢?
Console.WriteLine((new ValPoint()).x); // 正常,输出为0
在这种情况下,会创建一个临时变量,然后使用结构的默认构造函数对此临时变量进行初始化。我知道我这样很没有说服力,所以我们来看下MS IL代码,为了节省篇幅,我只节选了部分:
.locals init ([0] valuetype Prototype.ValPoint CS$0$0000) // 声明临时变量
IL_0000: nop
IL_0001: ldloca.s CS$0$0000 // 将临时变量压栈
IL_0003: initobj Prototype.ValPoint // 初始化此变量
而对于 ValPoint vPoint = new ValPoint(); 这种情况,其 MSIL代码是:
.locals init ([0] valuetype Prototype.ValPoint vPoint) // 声明vPoint
IL_0000: nop
IL_0001: ldloca.s vPoint // 将vPoint压栈
IL_0003: initobj Prototype.ValPoint // 使用initobj初始化此变量
那么当我们使用自定义的构造函数时,ValPoint vPoint = new ValPoint(10),又会怎么样呢?通过下面的代码我们可以看出,实际上会使用call指令(instruction)调用我们自定义的构造函数,并传递10到参数列表中。
.locals init ([0] valuetype Prototype.ValPoint vPoint)
IL_0000: nop
IL_0001: ldloca.s vPoint // 将 vPoint 压栈
IL_0003: ldc.i4.s 10 // 将 10 压栈
// 调用构造函数,传递参数
IL_0005: call instance void Prototype.ValPoint::.ctor(int32)
对于上面的MSIL代码不清楚不要紧,有的时候知道结果就已经够用了。关于MSIL代码,有空了我会为大家翻译一些好的文章。
2.引用类型
当声明一个引用类型变量的时候,该引用类型的变量会被分配到堆栈上,这个变量将用于保存位于堆上的该引用类型的实例的内存地址,变量本身不包含对象的数据。此时,如果仅仅声明这样一个变量,由于在堆上还没有创建类型的实例,因此,变量值为null,意思是不指向任何类型实例(堆上的对象)。对于变量的类型声明,用于限制此变量可以保存的类型。
如果我们有一个这样的类,它依然代表直线上的一点:
public class RefPoint {
public int x;
public RefPoint(int x) {
this.x = x;
}
public RefPoint() {}
}
当我们仅仅写下一条声明语句:
RefPoint rPoint1;
它的效果就向下图一样,仅仅在堆栈上创建一个不包含任何数据,也不指向任何对象(不包含创建再堆上的对象的地址)的变量。
而当我们使用new操作符时:
rPoint1= new RefPoint(1);
会发生这样的事:
在应用程序堆(Heap)上创建一个引用类型(Type)的实例(Instance)或者叫对象(Object),并为它分配内存地址。
自动传递该实例的引用给构造函数。(正因为如此,你才可以在构造函数中使用this来访问这个实例。)
调用该类型的构造函数。
返回该实例的引用(内存地址),赋值给rPoint变量。
3.关于简单类型
很多文章和书籍中在讲述这类问题的时候,总是喜欢用一个int类型作为值类型 和一个Object类型 作为引用类型来作说明。本文中将采用自定义的一个 结构 和 类 分别作值类型和引用类型的说明。这是因为简单类型(比如int)有一些CLR实现了的行为,这些行为会让我们对一些操作产生误解。
举个例子,如果我们想比较两个int类型是否相等,我们会通常这样:
int i = 3;
int j = 3;
if(i==j) Console.WriteLine("i equals to j");
但是,对于自定义的值类型,比如结构,就不能用 “==”来判断它们是否相等,而需要在变量上使用Equals()方法来完成。
再举个例子,大家知道string是一个引用类型,而我们比较它们是否相等,通常会这样做:
string a = "123456"; string b = "123456";
if(a == b) Console.WriteLine("a Equals to b");
实际上,在后面我们就会看到,当使用“==”对引用类型变量进行比较的时候,比较的是它们是否指向的堆上同一个对象。而上面a、b指向的显然是不同的对象,只是对象包含的值相同,所以可见,对于string类型,CLR对它们的比较实际上比较的是值,而不是引用。
为了避免上面这些引起的混淆,在对象判等部分将采用自定义的结构和类来分别说明。
装箱 和 拆箱
这部分内容可深可浅,本文只简要地作一个回顾。简单来说,装箱 就是 将一个值类型转换成等值的引用类型。它的过程分为这样几步:
在堆上为新生成的对象(该对象包含数据,对象本身没有名称)分配内存。
将 堆栈上 值类型变量的值拷贝到 堆上的对象 中。
将堆上创建的对象的地址返回给引用类型变量(从程序员角度看,这个变量的名称就好像堆上对象的名称一样)。
当我们运行这样的代码时:
int i = 1;
Object boxed = i;
Console.WriteLine(&
补充:软件开发 , C# ,