Java程序从源代码到执行的整个过程:
1. Java 编译器阶段
- 输入:Java 源代码文件(如
xxx.java
)。 - 步骤:
- 词法分析:将源代码分解成一个个“词”(Token),如关键字、标识符、运算符等。
- 语法分析:检查这些“词”是否符合Java语言的语法规则,并生成抽象语法树(AST)。
- 语义分析:对抽象语法树进行进一步分析,确保代码逻辑正确,例如变量声明、类型匹配等。
- 字节码生成器:将经过验证的抽象语法树转换为字节码文件(如
xxx.class
)。
2. Java 虚拟机(JVM)阶段
- 类加载器:负责将字节码文件加载到内存中,并进行必要的验证和准备。
- 字节码校验器:对加载的字节码进行校验,确保其安全性和正确性。
- 翻译字节码(解释执行):逐条解释执行字节码指令。这是JVM的基本执行方式。
- JIT编译器(编译执行):对于频繁执行的热点代码,JIT编译器会将其编译成机器码,以提高执行效率。
3. 操作系统
- JVM在操作系统上运行,操作系统提供底层硬件资源的支持。
总结
Java程序的执行过程可以分为两个主要阶段:
- 编译阶段:通过Java编译器将源代码文件编译成字节码文件。
- 运行阶段:通过Java虚拟机加载、校验并执行字节码文件,其中可能涉及解释执行和即时编译优化。
这个过程确保了Java程序的跨平台特性和高效执行。
Java虚拟机(JVM)整体架构:
1. 类加载子系统(Class Loader Subsystem)
- 功能:负责将字节码文件(
.class
文件)加载到内存中,并进行验证、准备和解析等操作。 - 步骤:
- Loading(加载):从不同来源(如本地文件系统、网络等)加载类文件。
- Linking(链接):
- Verify(验证):确保加载的类文件符合Java语言规范,没有安全问题。
- Prepare(准备):为类的静态变量分配内存并设置初始值。
- Resolve(解析):将符号引用转换为直接引用。
- Initialization(初始化):执行类的静态初始化代码块和静态变量的赋值。
2. 运行时数据区(Runtime Data Areas)
- 方法区(Method Area):存储已加载的类信息、常量池、静态变量等。
- 堆(Heap):用于存放对象实例及数组。
- 栈区(Stack Area):每个线程都有一个私有的栈区,包含多个栈帧(Stack Frame),用于存储局部变量、操作数栈、动态链接等信息。
- PC寄存器(PC Registers):记录当前线程所执行的字节码指令的地址。
- 本地方法栈(Native Method Stack):与Java栈类似,但用于支持本地方法的执行。
3. 执行引擎(Execution Engine)
- 解释器(Interpreter):逐条解释执行字节码指令。
- 即时编译器(JIT Compiler):
- 中间代码生成(Intermediate Code Generation):将字节码转换为中间代码。
- 代码优化(Code Optimization):对中间代码进行优化。
- 目标代码生成(Target Code Generation):将优化后的中间代码转换为机器码。
- 垃圾收集(Garbage Collection):自动管理内存,回收不再使用的对象所占用的内存空间。
4. 本地方法接口和本地方法库
- 本地方法接口(Native Method Interface):允许Java代码调用非Java语言编写的函数或方法。
- 本地方法库(Native Method Library):包含了这些非Java函数的具体实现。
总结
Java虚拟机通过类加载子系统将字节码文件加载到内存中,并经过验证、准备和解析等步骤后进行初始化。
运行时数据区提供了必要的内存结构来支持程序的执行,而执行引擎则负责解释或编译执行字节码指令。
此外,本地方法接口和本地方法库使得Java程序能够调用非Java语言编写的函数,从而扩展了Java的应用范围。