可执行文件运行的底层原理

处理器读并解释存储在存储器中的指令

此刻,hello.c源程序已经被编译系统翻译成了可执行目标文件hello,并存放在磁盘上,也就是电脑上的某个文件夹下面。要想运行该文件,可以将他的文件名输入到被称为外壳(shell)的应用程序中,也就是终端,即Windows的cmd中
运行可执行文件
shell是一个命令行解释器,它输出一个提示符,等待你输入一个命令行。然后执行这个命令。如果该命令行的第一个单词不是一个内置的外壳命令,那么外壳就会假设这是一个可执行文件的名字,它将加载并运行这个文件。 所以在此例中,外壳将加载并运行hello程序。然后等待程序终止。hello程序在屏幕上输出它的信息,然后终止。外壳随后输出一个提示符,等待下一个输入的命令行。

1 系统的硬件组成

为了理解运行hello程序时发生了什么,我们需要了解一个典型系统的硬件组织
一个典型系统的硬件组成

  1. 总线
    贯穿整个系统的一组电子管道,称作总线,它携带信息字节并负责在各个部件间传递。通常总线被设计成传送定长的字节快,也就是字(word)。字中的字节数(即字长)是一个基本的系统参数,在各个系统中的情况都不相同。 现在机器字长有的是4个字节(4个字节 * 每个字节8位 = 32位),有的是8个字节(8个字节 * 每个字节8位 = 64位),为了讨论方便,假设字长4个字节,并且总线每次只传送一个字。
    字和字长

  2. I/O设备
    输入/输出(I/O)设备是系统与外部世界的联系通道,我们的示例系统包括4个I/O设备:作为用户输入的键盘和鼠标,作为用户输出的显示器,以及用于长期存储数据和程序的磁盘驱动器(磁盘),最初,可执行程序hello就存放在磁盘上。
    每个I/O设备都通过一个控制器或适配器与I/O总线相连。控制器和适配器之间的区别主要在于它们的封装方式。控制器是置于I/O设备本身的或者系统的主印制电路板(主板)上的芯片组,而适配器则是一块插在主板插槽上的卡。 无论如何,他们的功能都是在I/O总线和I/O设备之间传递信息。

  3. 主存
    主存是一个临时存储设备, 在处理器执行程序时,用来存放程序和程序处理的数据。从物理上来说,主存是由一组动态随机存取存储器(DRAM)芯片组成的。从逻辑上来说,存储器是一个线性的字节数组,每个字节都有其唯一的地址(即数组索引),这些地址从0开始。 一般来说,组成程序的每条机器指令都由不同数量的字节组成。与C程序变量相对应的数据项的大小是根据类型变化的。例如,32位机器上,short类型的数据需要2个字节,int、float、long类型需要4个字节,double类型需要8个字节。

  4. 处理器
    中央处理单元(CPU),简称处理器,是解释(或执行)存储在主存中指令的引擎。处理器的核心是一个字长的存储设备(寄存器),称为程序计数器(PC)。 在任何时刻,PC都指向主存中的某条机器语言指令(即含有该条指令的地址)
    从系统通电开始,直到系统断电,处理器一直在不断地执行程序计数器指向的指令,再更新程序计数器,使其指向下一条指令。处理器看上去是按照一个非常简单的指令执行模型来操作的。这个模型是由指令集结构决定的。在这个模型中,指令按照严格的顺序执行,而执行一条指令包含一系列的步骤。处理器从程序计数器(PC)指向的存储器处读取指令,解释指令中的位,执行该指令指示的简单操作,然后更新PC,使其指向下一条指令,而这条指令并不一定与存储器中刚刚执行的指令相邻。
    指令指示的简单操作并不多,大多都比较复杂,而且操作是围绕着主存、寄存器未见(register file)和算术/逻辑单元(ALU)进行的。寄存器文件是一个小的存储设备,有一些1字长的寄存器组成,每个寄存器都有唯一的名字。 ALU计算新的数据和地址值,下面列举一些简单操作的例子,CPU在指令的要求下可能会执行以下操作:
    CPU执行的操作
    处理器看上去只是它的指令集结构的简单实现,但是实际上现代处理器使用了非常复杂的机制来加速程序的执行。因此,我们可以这样区分处理器的指令集结构和微体系结构:指令集结构描述的是每条机器代码指令的效果;而微体系结构描述的是处理器实际上是如何实现的。

2 运行hello程序

前面简单描述了系统的硬件组成和操作,现在开始介绍当我们运行示例程序时到底发生了什么。

  1. 初始时,外壳程序(shell)执行它的指令,等待我们输入一个命令。当我们在键盘上输入字符串"./hello"后,外壳程序将字符逐一读入寄存器,再把它存放到存储器中。(注意,这一步与hello这个程序文件无关,读入寄存器和存放到主存中的是"./hello"这个字符串)
    shell执行指令
  2. 当我们在键盘上敲回车键时,外壳程序就知道我们已经结束了命令的输入,然后外壳执行一系列指令来加载可执行的hello文件,将hello目标文件中的代码和数据从磁盘复制到主存。数据包括最终会被输出的字符串”Hello, world“。
    将代码和数据从磁盘复制到主存
  3. 一旦目标文件hello中的代码和数据被加载到主存,处理器就开始执行hello程序的main程序中的机器语言指令。这些指令将”Hello, world\n“字符串中的字节从主存复制到寄存器文件,再从寄存器文件中复制到显示器设备,最终显示在屏幕上。
    加载到主存

总的来说就是,我们在终端一边输入字符,终端一边将这些字符读入寄存器然后放到主存中,等到我们在键盘上敲回车键时,外壳程序就知道我们已经完成了命令的输入,然后外壳就执行一系列的指令来确定我们输入的是个啥,如果确定这东西不是一个内置的外壳命令,那么外壳程序就会假设这是一个可执行文件,然后就会将目标文件中的代码和数据从磁盘复制到主存,一旦被加载到主存,处理器就开始执行程序main中的机器语言指令,把需要显示到屏幕的数据从主存复制到寄存器文件,再从寄存器文件中复制到显示设备,最终显示到屏幕上。

深入理解计算机系统笔记:

  1. 计算机中信息的表示
  2. 计算机中信息的表示和处理
  3. 程序从源代码到可执行文件的整个过程
  4. 可执行文件运行的底层原理
  5. 操作系统对程序提供服务的方法
  6. 网络通信
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值