早期(编译期)优化
概述
Java语言的“编译期”是一段“不确定的操作过程,它可能是指一个前段编译器把*.java文件转变成*.class文件的过程;也可能是指虚拟机的后端运行期编译器(JIT编译器)把字节码转变成机器码的过程,还可能是指使用静态提前编译器(AOT编译器,Ahead Of Time Compiler)直接把*.java文件编译成本地机器代码的过程
-
前段编译器:Sun的Javac、 Eclipse JDT中的增量式编译器(ECJ)
-
JIT编译器:HotSpot VM的C1、C2编译器
-
AOT编译器:GUN Compiler for the Java(GCJ)、Excelsior JET
这三类过程中最符合大家对Java程序编译认知的应该是第一类,“编译期”和“编译器”都仅限于第一类编译过程。虚拟机设计团队把对性能的优化集中到了后端的即时编译器中,这样可以让那些不是由Javac产生的Class文件也同样享受到编译器优化所带来的好处
分析源码是了解一项技术实现内幕的最有效手段。
Javac的源码与调试:从Sun JavaC的代码来看,编译观察大致可以分为三个过程,分别是:
-
解析与填充符号表过程
-
插入式注解处理器的注解处理过程
-
分析与字节码生成过程
解析与填充符号表
解析步骤包括了经典程序编译原理中的词法分析和语法分析两个过程
词法、语法分析:
词法分析:是将源代码的字符流转变为标记(Token)集合,单个字符是程序编写过程的最小元素,而标记是编译过程的最小元素。
语法分析:是根据Token序列来构造抽象语法树的过程,抽象语法书(AST, Abstract Syntax Tree)是一种用来描述程序代码语法结构的树形表示方式,语法树的每一个节点都代表着程序代码中的一个语法结构,例如包、类型、修饰符、运算符、接口、返回值甚至连代码注释都可以是一个语法结构
经过这个步骤之后,编译器就基本不会再对源码文件进行操作了。后续的操作都建立在抽象语法树之上
填充符号表:完成了语法分析和词法分析之后,下一步就是填充符号表的过程。符号表是由一组符合地址和符号信息构成的表格,可以把它想象成哈希表中K-V值对的形式(实际上符号表不一定是哈希表实现,可以是有序符号表、树状符号表和栈结构符号表)。符号表中所登记的信息在编译的不同阶段都要用到。在语义分析中,符号表所登记的内容将用于语法检查和产生中间代码。在目标代码生成阶段,当对符号名进行地址分配时,符号表是地址分配的依据。
注解处理器:注解与普通的Java代码一样,是在运行期间发挥作用的。在JDK1.6中实现了JSR-269规范,提供了一组插入式注解处理器的标准API在编译期间对注解进行处理,我们可以把它看做是一组编译器的插件,在这些插件里面,可以读取、修改、添加抽象语法树中的任意元素。如果这些插件在处理注解期间对语法数进行了修改,那么编译器将回到解析及填充符号表的过程重新处理,直到所有的插入式注解处理器都没有再对语法树进行修改为止。
有了编译器注解处理的标准API后,我们的代码才有可能干涉编译器的行为,由于语法树中的任意元素,甚至包括代码注释都可以在插件中访问到,所以通过插入式注解处理器实现的插件在功能上有很大的发挥空间。只要有足够的创意,程序员可以使用插入式注解处理器来实现许多原本只能在编码中完成的事情
语义分析与字节码生成
语法分析之后,编译器获得了程序代码的抽象语法树表示,语法树能表示一个结构正确的源程序的抽象,但无法保证源程序是符合逻辑的。而语义分析主要任务是对结构上正确的源程序进行上下文有关性质的审查,如进行类型审查。
是否合乎语义逻辑必须限定在具体的语言与具体的上下文环境之中才有意义。
标注检查:Javac的编译过程中,语义分析过程分为标注检查和数据及控制流分析两个步骤。
标注检查:检查的内容包括诸如变量使用前是否已被声明、变量与赋值之间的数据类型是否能够匹配,等待。还有一个重要的动作称为常量折叠。
数据及控制流分析:数据及控制流分析是对程序上下文逻辑更进一步的验证,它可以检查出诸如程序局部变量在使用前是否有赋值、方法的每条路径是否都有返回值、是否所有的受查异常都被正确处理了等问题。编译时期的数据及控制流分析与类加载时的数据及控制流分析的目的基本上是一致的,但校验范围有所区别,有一些校验项只有在编译器或运行期才能进行
解语法糖:语法糖,也称为糖衣语法,指在计算机语言中添加的某种语法,这种语法对语言的功能并唯有影响,但是更方便程序员使用。通常来说使用语法糖能够增加程序可读行,从而减少代码出错的机会
Java在现代编程语言之中属于“低糖语言”,尤其是JDK1.5之前的版本,“低糖”语法也是Java语言被怀疑已经“落后”的一个表面理由。Java中最常用的语法糖主要是前面提到过的泛型、变长参数、自动装箱拆箱,等待,虚拟机运行时不支持这些语法,它们在编译阶段被还原回简单的基础语法结构,这个过程就称为解语法糖。
字节码生成:是javac编译过程的最后一个阶段,字节码生成阶段不仅仅是把前面各个步骤所生成的信息转化为字节码写到磁盘中,编译器还进行了少量的代码添加和转换工作。
例如前面章节中多次提到的实例构造器<init>()方法和类构造器<clinit>()方法就是在这个阶段被添加到语法树之中的,这两个构造器的产生过程实际上是一个代码收敛的过程,编译器会把语句块、变量初始化、调用父类的实例构造器等操作收敛到<init>()和<clinit>方法中。
代码替换工作用于优化程序的实现逻辑,如把字符串的加操作代替为StingBuffer或StringBuilder的append()操作。
Java语法糖的味道
几乎各种语言或多或少都提供过一些语法糖来方便程序员的代码开发,这些语法糖虽然不会提供实质性的功能改进,但是它们或能提高效率,或能提升语法的严谨性,或能减少编码出错的机会。不过也有一种关掉人文语法糖并不一定都有益的,大量添加和使用含糖的语法容易让程序产生依赖,无法看清语法糖的糖衣背后程序代码的真实面目
语法糖是编译器实现的一些“小把戏”。
泛型与类型擦除:泛型,它的本质是参数化类型的应用,也就是说所操作的数据类型被指定为一个参数。这种参数类型可以用在类、接口和方法的创建中,分别称为泛型类、泛型接口和泛型方法。
C#和java中的泛型技术是有区别的,C#中实现称为类型膨胀,基于这种方法实现的泛型被称为真实泛型
Java语言中的泛型则不一样,它只在程序源码中存在,在编译后的字节码文件中,就已经被替换为原来的原生类型了,并且在相应的地方插入了强制转型代码。所以说泛型技术实际上是Java语言的一颗语法糖,Java语言中的泛型实现方法称为类型擦除,基于这种方法实现的泛型称为伪泛型
自动装箱、拆箱与遍历循环
条件编译
一套编程语言中编译子系统的优劣,很大程度上决定了程序运行性能的好坏和编码效率的高低,尤其在java语言中,运行期即时编译与虚拟机执行子系统非常紧密地相互依赖并配合运作。了解JDK如何编译和优化代码,有助于我们写出适合JDK自优化的程序
转载请注明:学时网 » 深入理解java虚拟机(八)