虚拟机类加载机制
类加载的时机
类的生命周期包括:加载、验证、准备、解析、初始化、使用和卸载7个阶段。其中验证、准备、解析三个部分统称为连接。
加载、验证、准备、初始化和卸载这五个阶段顺序是确定的,类加载过程必须按这个顺序开始,但是不一定按顺序完成,他们通常是相互交叉混合地进行的。
什么时候开始加载类?
虚拟机规范严格规定了有且只有5种情况必须立即对类进行初始化:
- 遇到new、getstatic、putstatic或invokestatic这4条字节码指令时。(遇到new关键字、读取或设置一个类的静态字段(被final修饰、已在编译期把结果放入常量池的静态字段除外)、调用一个类的静态方法)
- 使用java.lang.reflect包的方法对类进行反射调用的时候。
- 初始化一个类,父类没被初始化,需要先初始化其父类。一个接口初始化时不会要求其父类已经初始化,只有调用到父类接口的时候才会初始化。
- 当虚拟启动时,指定的执行主类(main())
- 当使用JDK1.7的动态语言支持时
除此以外所有引用类的方式都不会触发初始化(会触发加载,不一定会触发初始化,如数组类的组件类型会被加载,但不会被初始化),被称为被动引用。
1 | package org.fenixsoft.classloading; |
1 |
|
1 | package org.fenixsoft.classloading; |
类加载的过程
加载
非数组类的加载过程:
- 通过一个类的全限定名来获取定义此类的二进制流。
- 将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构
- 在内存中生成一个代表这个类的class对象,作为方法区这个类的各种数据访问入口。
数组类本身不是通过类加载器创建,它是由java虚拟机直接创建的。一个数组类创建的过程遵循以下规则:
- 如果数组的组件类型是引用类型,会去加载这个这个组件类型,数组类C将在加载该组件类型的类加载器的类名称空间上被标识(一个类必须与类加载器一起确定唯一性)。
- 如果不是引用类型(如int[]),Java虚拟机将会吧数组C标记为与引导类加载器关联
- 数组类的可见性与他的组件类型的可见性一直,如果不是引用类型,默认public。
加载阶段和连接阶段的部分内容是交叉进行的,开始时间仍然保持先后顺序
验证
验证是连接阶段的第一步,主要是为了确保Class文件中的字节流包含的信息符合当前虚拟机的要求,不会危害虚拟机的安全。
准备
准备阶段是正式为类变量分配内存并设置类变量初始值的阶段,类变量用的内存都在方法区中进行分配。
1 | public static int vaule = 123; |
变量value在准备阶段过后初始值为0,不是123,因为这时候尚未执行任何java方法。通常情况下初始值是零值,如果类字段属性表中存在ConstantValue属性(即用final修饰),那在准备阶段value会被初始化成指定的值。
1 | public static final int vaule = 123; |
解析
解析阶段是虚拟机将常量池内的符号引用替换为直接引用的过程。
- 符号引用:符号引用是一组以符号来描述所引用的目标,符号可以是任何形式的字面量,只要使用时能无歧义地定位到目标即可。(各个虚拟机的内存布局可以不同,但是他们能接受的符号引用必须都是一致的,因为符号引用的字面量形式明确定义在Java虚拟机规范的Class文件中)
- 直接引用:直接应用可以是直接指向目标的指针、相对偏移量或是一个能间接定位到目标的句柄。
初始化
类初始化阶段是类加载过程中的最后一步,到了初始化阶段才真正开始执行类中定义的java程序代码。
初始化阶段是执行类的构造器
- <clinit>()是由编译器自动收集类中的所有类变量的赋值动作和静态语句块中的语句合并产生的,编译器收集的顺序是由语句在源文件中出现的顺序决定的,静态语句块中只能访问到定义在静态语句块之前的变量,定义在它之后的变量,可以在静态语句块中赋值,但是不能访问。
1 | public class Test { |
- 虚拟机保证父类的<clinit>()方法先执行且执行完毕,才执行子类。
- 父类定义的静态语句块优与子类。
- <clinit>()对类或者接口来说不是必须的,没有对变量的赋值操作,编译器可以不生成此方法。
- 接口中不能使用静态语句块,但仍然有变量的初始化赋值操作,还是会生成<clinit>()方法。
- 虚拟机会保证一个类的<clinit>()方法再多线程环境中被正确的加锁、同步。多线程环境下只有一个线程回去执行<clinit>()方法,其他线程会被阻塞。
类加载器
对于任意一个类,都需要由它的类加载器和这个类的本身来确定在虚拟机中的唯一性,即每个类加载器都有一个独立的类名称空间。
双亲委派模型
从Java虚拟机角度来说,只有两种不同的类加载器:
- 启动类加载器(Bootstrap ClassLoader),由C++语言实现,是虚拟机的一部分
- 其他类加载器,有java语言实现,独立于虚拟机外部。
java提供三种系统类加载器:
- 启动类加载器(Bootstrap ClassLoader):负责将
/lib路径下的核心类库或-Xbootclasspath参数指定的路径下的jar包加载到内存中,注意必由于虚拟机是按照文件名识别加载jar包的,如rt.jar,如果文件名不被虚拟机识别,即使把jar包丢到lib目录下也是没有作用的。 - 扩展类加载器(Extension ClassLoader):它负责加载
/lib/ext目录下或者由系统变量-Djava.ext.dir指定位路径中的类库,开发者可以直接使用标准扩展类加载器。 - 应用程序类加载器(Application ClassLoader):也称系统类加载器, 由sun.misc.Launcher$AppClassLoader实现。它负责加载系统类路径java -classpath或-D java.class.path 指定路径下的类库,一般情况下该类加载是程序中默认的类加载器,通过ClassLoader#getSystemClassLoader()方法可以获取到该类加载器。

双亲委派模型要求除了顶层的启动类加载器以外,其余的类加载器都应当有自己的父类加载器。这里的类加载器之间的父子关系不用继承的方式实现,而是通过组合的方式来复用父类加载器的代码。
双亲委派模型的工作过程:一个类加载器收到了类加载的请求,它首先不会自己加载这个类,而是把这个请求委派给父类加载器去完成,每一个层次的类加载器都是如此,因此所有的加载请求最终都是传送到顶层的启动类加载器中,只有当父类加载器反馈自己无法完成这个加载请求(它的搜索范围中没有找到所需的类)时,子加载器才会尝试去自己加载。
为什么用双亲委派模型:可以保证Object类在程序中都是同一个类,如果没有双亲委派模型,自己写了一个Object类,放在ClassPath中,那么java类体系中最基础的行为也就无法保证。
破坏双亲委派模型
双亲委派模型不是一个强制性的约束模型,主要出现3次较大规模的被破坏情况
- 双亲委派模型是JDK1.2之后被引入的,之前已经存在了loadClass()方法,为了向前兼容,新增了findClass()方法。
- 第二次是由于自身的缺陷被破坏。JNDI是java的标准服务,他需要调用独立厂商实现并部署在应用程序的ClassPath下的JDNI接口提供者(SPI Service Provider Interface)的代码,但是启动类不认识这些代码。为了解决这个问题,引入了线程上下文类加载器。这个类加载器可以通过java.lang.Thread类的setContextClassLoaser()方法进行设置,如果创建线程时还未设置,它将会从父线程中继承一个,如果在应用程序的全局范围内都没有设置过的话,那这个类加载器默认就是应用程序类加载器。JNDI服务使用这个线程上下文类加载器去加载所需要的SPI代码,也就是父类加载器请求子类加载器去完成类加载的动作,这种行为实际上就是打通了双亲委派模型的层次结构来逆向使用类加载器,实际上已经违背了双亲委派模型的一般性原则,但这也是无可奈何的事情。Java中所有涉及SPI的加载动作基本上都采用这种方式,例如JNDI、JDBC、JCE、JAXB和JBI等。
- 第三次破坏是因为追求程序的动态性导致的,如代码热替换、热部署。
Java9的类加载机制
扩展类加载器(Extension Class Loader)被平台类加载器(Platform Class Loader)取代。
平台类加载器和应用程序类加载器都不再派生自URLClassLoader,如果有程序直接依赖了这种继承关系,或者依赖了URLClassLoader类的特定方法,代码很可能在JDK9及更高版本的JDK中崩溃!!