处理器读并解释存储在存储器中的指令
此刻,hello.c源程序已经被编译系统翻译成了可执行目标文件hello,并存放在磁盘上,也就是电脑上的某个文件夹下面。要想运行该文件,可以将他的文件名输入到被称为外壳(shell)的应用程序中,也就是终端,即Windows的cmd中
shell是一个命令行解释器,它输出一个提示符,等待你输入一个命令行。然后执行这个命令。如果该命令行的第一个单词不是一个内置的外壳命令,那么外壳就会假设这是一个可执行文件的名字,它将加载并运行这个文件。 所以在此例中,外壳将加载并运行hello程序。然后等待程序终止。hello程序在屏幕上输出它的信息,然后终止。外壳随后输出一个提示符,等待下一个输入的命令行。
1 系统的硬件组成
为了理解运行hello程序时发生了什么,我们需要了解一个典型系统的硬件组织
-
总线
贯穿整个系统的一组电子管道,称作总线,它携带信息字节并负责在各个部件间传递。通常总线被设计成传送定长的字节快,也就是字(word)。字中的字节数(即字长)是一个基本的系统参数,在各个系统中的情况都不相同。 现在机器字长有的是4个字节(4个字节 * 每个字节8位 = 32位),有的是8个字节(8个字节 * 每个字节8位 = 64位),为了讨论方便,假设字长4个字节,并且总线每次只传送一个字。
-
I/O设备
输入/输出(I/O)设备是系统与外部世界的联系通道,我们的示例系统包括4个I/O设备:作为用户输入的键盘和鼠标,作为用户输出的显示器,以及用于长期存储数据和程序的磁盘驱动器(磁盘),最初,可执行程序hello就存放在磁盘上。
每个I/O设备都通过一个控制器或适配器与I/O总线相连。控制器和适配器之间的区别主要在于它们的封装方式。控制器是置于I/O设备本身的或者系统的主印制电路板(主板)上的芯片组,而适配器则是一块插在主板插槽上的卡。 无论如何,他们的功能都是在I/O总线和I/O设备之间传递信息。 -
主存
主存是一个临时存储设备, 在处理器执行程序时,用来存放程序和程序处理的数据。从物理上来说,主存是由一组动态随机存取存储器(DRAM)芯片组成的。从逻辑上来说,存储器是一个线性的字节数组,每个字节都有其唯一的地址(即数组索引),这些地址从0开始。 一般来说,组成程序的每条机器指令都由不同数量的字节组成。与C程序变量相对应的数据项的大小是根据类型变化的。例如,32位机器上,short类型的数据需要2个字节,int、float、long类型需要4个字节,double类型需要8个字节。 -
处理器
中央处理单元(CPU),简称处理器,是解释(或执行)存储在主存中指令的引擎。处理器的核心是一个字长的存储设备(寄存器),称为程序计数器(PC)。 在任何时刻,PC都指向主存中的某条机器语言指令(即含有该条指令的地址)
从系统通电开始,直到系统断电,处理器一直在不断地执行程序计数器指向的指令,再更新程序计数器,使其指向下一条指令。处理器看上去是按照一个非常简单的指令执行模型来操作的。这个模型是由指令集结构决定的。在这个模型中,指令按照严格的顺序执行,而执行一条指令包含一系列的步骤。处理器从程序计数器(PC)指向的存储器处读取指令,解释指令中的位,执行该指令指示的简单操作,然后更新PC,使其指向下一条指令,而这条指令并不一定与存储器中刚刚执行的指令相邻。
指令指示的简单操作并不多,大多都比较复杂,而且操作是围绕着主存、寄存器未见(register file)和算术/逻辑单元(ALU)进行的。寄存器文件是一个小的存储设备,有一些1字长的寄存器组成,每个寄存器都有唯一的名字。 ALU计算新的数据和地址值,下面列举一些简单操作的例子,CPU在指令的要求下可能会执行以下操作:
处理器看上去只是它的指令集结构的简单实现,但是实际上现代处理器使用了非常复杂的机制来加速程序的执行。因此,我们可以这样区分处理器的指令集结构和微体系结构:指令集结构描述的是每条机器代码指令的效果;而微体系结构描述的是处理器实际上是如何实现的。
2 运行hello程序
前面简单描述了系统的硬件组成和操作,现在开始介绍当我们运行示例程序时到底发生了什么。
- 初始时,外壳程序(shell)执行它的指令,等待我们输入一个命令。当我们在键盘上输入字符串"./hello"后,外壳程序将字符逐一读入寄存器,再把它存放到存储器中。(注意,这一步与hello这个程序文件无关,读入寄存器和存放到主存中的是"./hello"这个字符串)
- 当我们在键盘上敲回车键时,外壳程序就知道我们已经结束了命令的输入,然后外壳执行一系列指令来加载可执行的hello文件,将hello目标文件中的代码和数据从磁盘复制到主存。数据包括最终会被输出的字符串”Hello, world“。
- 一旦目标文件hello中的代码和数据被加载到主存,处理器就开始执行hello程序的main程序中的机器语言指令。这些指令将”Hello, world\n“字符串中的字节从主存复制到寄存器文件,再从寄存器文件中复制到显示器设备,最终显示在屏幕上。
总的来说就是,我们在终端一边输入字符,终端一边将这些字符读入寄存器然后放到主存中,等到我们在键盘上敲回车键时,外壳程序就知道我们已经完成了命令的输入,然后外壳就执行一系列的指令来确定我们输入的是个啥,如果确定这东西不是一个内置的外壳命令,那么外壳程序就会假设这是一个可执行文件,然后就会将目标文件中的代码和数据从磁盘复制到主存,一旦被加载到主存,处理器就开始执行程序main中的机器语言指令,把需要显示到屏幕的数据从主存复制到寄存器文件,再从寄存器文件中复制到显示设备,最终显示到屏幕上。
深入理解计算机系统笔记: