C++从零开始(六)何谓语句
前面已经说过程序就是方法的描述,而方法的描述无外乎就是动作加动作的宾语,而这里的动作在C++中就是通过语句来表现的,而动作的宾语,也就是能够易做图作的资源,但非常可惜地C++语言本身只支持一种资源——内存。由于电脑实际可以操作不止内存这一种资源,导致C++语言实际并不能作为底层硬件程序的编写语言(即使是C语言也不能),不过各编译器厂商都提供了自己的嵌入式汇编语句功能(也可能没提供或提供其它的附加语法以使得可以操作硬件),对于VC,通过使用__asm语句即可实现在C++代码中加入汇编代码来操作其他类型的硬件资源。对于此语句,本系列不做说明。语句就是动作,C++易做图有两种语句:单句和复合语句。复合语句是用一对大括号括起来,以在需要的地方同时放入多条单句,如:{ long a = 10; a += 34; }。而单句都是以“;”结尾的,但也可能由于在末尾要插入单句的地方用复合语句代替了而用“}”结尾,如:if( a ) { a--; a++; }。应注意大括号后就不用再写“;”了,因为其不是单句。
方法就是怎么做,而怎么做就是在什么样的情况下以什么样的顺序做什么样的动作。因为C++中能操作的资源只有内存,故动作也就很简单的只是关于内存内容的运算和赋值取值等,也就是前面说过的表达式。而对于“什么样的顺序”,C++强行规定只能从上朝下,从左朝右来执行单句或复合语句(不要和前面关于表达式的计算顺序搞混了,那只是在一个单句中的规则)。而最后对于“什么样的情况”,即进行条件的判断。为了不同情况下能执行不同的代码,C++定义了跳转语句来实现,其是基于CPU的运行规则来实现的,下面先来看CPU是如何执行机器代码的。
机器代码的运行方式
前面已经说过,C++中的所有代码到最后都要变成CPU能够认识的机器代码,而机器代码由于是方法的描述也就包含了动作和动作的宾语(也可能不带宾语),即机器指令和内存地址或其他硬件资源的标识,并且全部都是用二进制数表示的。很正常,这些代表机器代码的二进制数出于效率的考虑在执行时要放到内存中(实际也可以放在硬盘或其他存储设备中),则很正常地每个机器指令都能有一个地址和其相对应。
CPU内带一种功能和内存一样的用于暂时记录二进制数的硬件,称作寄存器,其读取速度较内存要快很多,但大小就小许多了。为了加快读取速度,寄存器被去掉了寻址电路进而一个寄存器只能存放1个32位的二进制数(对于32位电脑)。而CPU就使用其中的一个寄存器来记录当前欲运行的机器指令的位置,在此称它为指令寄存器。
CPU运行时,就取出指令寄存器的值,进而找到相应的内存,读取1个字节的内容,查看此8位二进制数对应的机器指令是什么,进而做相应的动作。由于不同的指令可能有不同数量的参数(即前面说的动作的宾语)需要,如乘法指令要两个参数以将它们乘起来,而取反操作只需要一个参数的参与。并且两个8位二进制数的乘法和两个16位二进制数的乘法也不相同,故不同的指令带不同的参数而形成的机器代码的长度可能不同。每次CPU执行完某条机器代码后,就将指令寄存器的内容加上此机器代码的长度以使指令寄存器指向下一条机器代码,进而重复上面的过程以实现程序的运行(这只是简单地说明,实际由于各种技术的加入,如高速缓冲等,实际的运行过程要比这复杂得多)。
语句的分类
在C++中,语句总共有6种:声明语句、定义语句、表达式语句、指令语句、预编译语句和注释语句。其中的声明语句下篇说明,预编译语句将在另文中说明,而定义语句就是前面已经见过的定义变量,后面还将说明定义函数、结构等。表达式语句则就是一个表达式直接接一个“;”,如:34;、a = 34;等,以依靠操作符的计算功能的定义而生成相应的关于内存值操作的代码。注释语句就是用于注释代码的语句,即写来给人看的,不是给编译器看的。最后的指令语句就是含有下面所述关键字的语句,即它们的用处不是操作内存,而是实现前面说的“什么样的情况”。
这里的声明语句、预编译语句和注释语句都不会转换成机器代码,即这三种语句不是为了操作电脑,而是其他用途,以后将详述。而定义语句也不一定会生成机器代码,只有表达式语句和指令语句一定会生成代码(不考虑编译器的优化功能)。
还应注意可以写空语句,即;或{},它们不会生成任何代码,其作用仅仅只是为了保证语法上的正确,后面将看到这一点。下面说明注释语句和指令语句——跳转语句、判断语句和循环语句(实际不止这些,由于异常和模板技术的引入而增加了一些语句,将分别在说明异常和模板时说明)。
注释语句——//、/**/
注释,即用于解释的标注,即一些文字信息,用以向看源代码的人解释这段代码什么意思,因为人的认知空间和电脑的完全不同,这在以后说明如何编程时会具体讨论。要书写一段话用以注释,用“/*”和“*/”将这段话括起来,如下:
long a = 1;
a += 1; /* a放的是人的个数,让人的个数加一 */
b *= a; /* b放的是人均花费,得到总的花费 */
上面就分别针对a += 1;和b *= a;写了两条注释语句以说明各自的语义(因为只要会C++都知道它们是一个变量的自增一和另一个变量的自乘a,但不知道意义)。上面的麻烦之处就是需要写“/*”和“*/”,有点麻烦,故C++又提供了另一种注释语句——“//”:
long a = 1;
a += 1; // a放的是人的个数,让人的个数加一
b *= a; // b放的是人均花费,得到总的花费
上面和前面等效,其中的“//”表示从它开始,这一行后面的所有字符均看成注释,编译器将不予理会,即
long a = 1; a += 1; // a放的是人的个数,让人的个数加一 b *= a;
其中的b *= a;将不会被编译,因为前面的“//”已经告诉编译器,从“//”开始,这一行后面的所有字符均是注释,故编译器不会编译b *= a;。但如果
long a = 1; a += 1; /* a放的是人的个数,让人的个数加一 */ b *= a;
这样编译器依旧会编译b *= a;,因为“/*”和“*/”括起来的才是注释。
应该注意注释语句并不是语句,其不以“;”结束,其只是另一种语法以提供注释功能,就好象以后将要说明的预编译语句一样,都不是语句,都不以“;”结束,既不是单句也不是复合语句,只是出于习惯的原因依旧将它们称作语句。
跳转语句——goto
前面已经说明,源代码(在此指用C++编写的代码)中的语句依次地转变成用长度不同的二进制数表示的机器代码,然后顺序放在内存中(这种说法不准确)。如下面这段代码:
long a = 1; // 假设长度为5字节,地址为3000
a += 1; // 则其地址为3005,假设长度为4字节
b *= a; // 则其地址为3009,假设长度为6字节
上面的3000、3005和3009就表示上面3条语句在内存中的位置,而所谓的跳转语句,也就是将上面的3000、3005等语句的地址放到前面提过的指令寄存器中以使得CPU开始从给定的位置执行以表现出执行顺序的改变。因此,就必须有一种手段来表现语句的地址,C++对此给出了标号(Label)。
写一标识符,后接“:”即建立了一映射,将此标识符和其所在位置的地址绑定了起来,如下:
long a = 1; // 假设长度为5字节,地址为3000
P1:
a += 1; // 则其地址为3005,假设长度为4字节
P2:
b *= a; // 则其地址为3009,假设长度为6字节
goto P2;
上面的P1和P2就是标号,其值分别为3005和3009,而最后的goto就是跳转语句,其格式为goto <标号>;。此语句非常简单,先通过“:”定义了一个标号,然后在编写goto时使用不同的标号就能跳到不同的位置。
应该注意上面故意让P1和P2定义时独占一行,其实也可以不用,即:
long a = 1;
P1: a += 1;
P2: b *= a;
goto P2;
因此看起来“P1:”和“P2:”好象是单独的一条定义语句,应该注意,准确地说它们应该是语句修饰符,作用是定义标号,并不是语句,即这样是错误的:
long a = 1;
P1: {
a += 1;
P2: b *= a;
P3:
} goto P2;
上面的P3:将报错,因为其没有修饰任何语句。还应注意其中的P1仍然是3005,即“{}”仅仅只是其复合的作用,实际并不产生代码进而不影响语句的地址。
判断语句——if else、switch
if else 前面说过了,为了实现“什么样的情况”做“什么样的动作”,故C++非常正常地提供了条件判断语句以实现条件的不同而执行不同的代码。if else的格式为:
if(<数字>)<语句1>else<语句2> 或者 if(<数字>)<语句1>
long a = 0, b = 1;
P1:
a++;
b *= a;
if( a < 10 )
goto P1;
long c = b;
上面的代码就表示只有当a的值小于10时,才跳转到P1以重复执行,最后的效果就是c的值为10的阶乘。
上面的<数字>表示可以在“if”后的括号中放一数字,即表达式,而当此数字的值非零时,即逻辑真,程序跳
补充:软件开发 , C++ ,