【BATJ面试必会】Jvm 虚拟机篇

<!-- GFM-TOC -->html

<!-- GFM-TOC -->github

1、运行时数据区域

<div align="center"> <img src="pics/83e9c5ed-35a1-41fd-b0dd-ce571969b5f3_200.png" width="500px"> </div>
web

程序计数器

记录正在执行的虚拟机字节码指令的地址(若是正在执行的是本地方法则为空)。面试

Java 虚拟机栈

每一个 Java 方法在执行的同时会建立一个栈帧用于存储局部变量表、操做数栈、常量池引用等信息。从方法调用直至执行完成的过程,就对应着一个栈帧在 Java 虚拟机栈中入栈和出栈的过程。算法

<div align="center"> <img src="pics/ff5b89ac-798e-4fbc-b0ce-da2fc2358570.jpg"/> </div>
apache

能够经过 -Xss 这个虚拟机参数来指定每一个线程的 Java 虚拟机栈内存大小:

java -Xss512M HackTheJava

该区域可能抛出如下异常:

  • 当线程请求的栈深度超过最大值,会抛出 StackOverflowError 异常;
  • 栈进行动态扩展时若是没法申请到足够内存,会抛出 OutOfMemoryError 异常。

本地方法栈

本地方法栈与 Java 虚拟机栈相似,它们之间的区别只不过是本地方法栈为本地方法服务。

本地方法通常是用其它语言(C、C++ 或汇编语言等)编写的,而且被编译为基于本机硬件和操做系统的程序,对待这些方法须要特别处理。

<div align="center"> <img src="pics/1_2001550547261811.png"/> </div>

全部对象都在这里分配内存,是垃圾收集的主要区域("GC 堆")。

现代的垃圾收集器基本都是采用分代收集算法,其主要的思想是针对不一样类型的对象采起不一样的垃圾回收算法。能够将堆分红两块:

  • 新生代(Young Generation)
  • 老年代(Old Generation)

堆不须要连续内存,而且能够动态增长其内存,增长失败会抛出 OutOfMemoryError 异常。

能够经过 -Xms 和 -Xmx 这两个虚拟机参数来指定一个程序的堆内存大小,第一个参数设置初始值,第二个参数设置最大值。

java -Xms1M -Xmx2M HackTheJava

方法区

用于存放已被加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。

和堆同样不须要连续的内存,而且能够动态扩展,动态扩展失败同样会抛出 OutOfMemoryError 异常。

对这块区域进行垃圾回收的主要目标是对常量池的回收和对类的卸载,可是通常比较难实现。

HotSpot 虚拟机把它当成永久代来进行垃圾回收。但很难肯定永久代的大小,由于它受到不少因素影响,而且每次 Full GC 以后永久代的大小都会改变,因此常常会抛出 OutOfMemoryError 异常。为了更容易管理方法区,从 JDK 1.8 开始,移除永久代,并把方法区移至元空间,它位于本地内存中,而不是虚拟机内存中。

运行时常量池

运行时常量池是方法区的一部分。

Class 文件中的常量池(编译器生成的字面量和符号引用)会在类加载后被放入这个区域。

除了在编译期生成的常量,还容许动态生成,例如 String 类的 intern()。

直接内存

在 JDK 1.4 中新引入了 NIO 类,它可使用 Native 函数库直接分配堆外内存,而后经过 Java 堆里的 DirectByteBuffer 对象做为这块内存的引用进行操做。这样能在一些场景中显著提升性能,由于避免了在堆内存和堆外内存来回拷贝数据。

2、垃圾收集

垃圾收集主要是针对堆和方法区进行。程序计数器、虚拟机栈和本地方法栈这三个区域属于线程私有的,只存在于线程的生命周期内,线程结束以后就会消失,所以不须要对这三个区域进行垃圾回收。

判断一个对象是否可被回收

1. 引用计数算法

为对象添加一个引用计数器,当对象增长一个引用时计数器加 1,引用失效时计数器减 1。引用计数为 0 的对象可被回收。

在两个对象出现循环引用的状况下,此时引用计数器永远不为 0,致使没法对它们进行回收。正是由于循环引用的存在,所以 Java 虚拟机不使用引用计数算法。

public class Test {

    public Object instance = null;

    public static void main(String[] args) {
        Test a = new Test();
        Test b = new Test();
        a.instance = b;
        b.instance = a;
    }
}

2. 可达性分析算法

以 GC Roots 为起始点进行搜索,可达的对象都是存活的,不可达的对象可被回收。

Java 虚拟机使用该算法来判断对象是否可被回收,GC Roots 通常包含如下内容:

  • 虚拟机栈中局部变量表中引用的对象
  • 本地方法栈中 JNI 中引用的对象
  • 方法区中类静态属性引用的对象
  • 方法区中的常量引用的对象

<div align="center"> <img src="pics/6dd28bfc-6ef7-47cb-af50-a681ebc1bbaa.png"/> </div>

3. 方法区的回收

由于方法区主要存放永久代对象,而永久代对象的回收率比新生代低不少,因此在方法区上进行回收性价比不高。

主要是对常量池的回收和对类的卸载。

为了不内存溢出,在大量使用反射和动态代理的场景都须要虚拟机具有类卸载功能。

类的卸载条件不少,须要知足如下三个条件,而且知足了条件也不必定会被卸载:

  • 该类全部的实例都已经被回收,此时堆中不存在该类的任何实例。
  • 加载该类的 ClassLoader 已经被回收。
  • 该类对应的 Class 对象没有在任何地方被引用,也就没法在任何地方经过反射访问该类方法。

4. finalize()

相似 C++ 的析构函数,用于关闭外部资源。可是 try-finally 等方式能够作得更好,而且该方法运行代价很高,不肯定性大,没法保证各个对象的调用顺序,所以最好不要使用。

当一个对象可被回收时,若是须要执行该对象的 finalize() 方法,那么就有可能在该方法中让对象从新被引用,从而实现自救。自救只能进行一次,若是回收的对象以前调用了 finalize() 方法自救,后面回收时不会再调用该方法。

引用类型

不管是经过引用计数算法判断对象的引用数量,仍是经过可达性分析算法判断对象是否可达,断定对象是否可被回收都与引用有关。

Java 提供了四种强度不一样的引用类型。

1. 强引用

被强引用关联的对象不会被回收。

使用 new 一个新对象的方式来建立强引用。

Object obj = new Object();

2. 软引用

被软引用关联的对象只有在内存不够的状况下才会被回收。

使用 SoftReference 类来建立软引用。

Object obj = new Object();
SoftReference<Object> sf = new SoftReference<Object>(obj);
obj = null;  // 使对象只被软引用关联

3. 弱引用

被弱引用关联的对象必定会被回收,也就是说它只能存活到下一次垃圾回收发生以前。

使用 WeakReference 类来建立弱引用。

Object obj = new Object();
WeakReference<Object> wf = new WeakReference<Object>(obj);
obj = null;

4. 虚引用

又称为幽灵引用或者幻影引用,一个对象是否有虚引用的存在,不会对其生存时间形成影响,也没法经过虚引用获得一个对象。

为一个对象设置虚引用的惟一目的是能在这个对象被回收时收到一个系统通知。

使用 PhantomReference 来建立虚引用。

Object obj = new Object();
PhantomReference<Object> pf = new PhantomReference<Object>(obj);
obj = null;

垃圾收集算法

1. 标记 - 清除

<div align="center"> <img src="pics/3_2001550547558008.png"/> </div>

标记要回收的对象,而后清除。

不足:

  • 标记和清除过程效率都不高;
  • 会产生大量不连续的内存碎片,致使没法给大对象分配内存。

2. 标记 - 整理

<div align="center"> <img src="pics/2_2001550547456403.png"/> </div>

让全部存活的对象都向一端移动,而后直接清理掉端边界之外的内存。

3. 复制

<div align="center"> <img src="pics/4_2001550547640585.png"/> </div>

将内存划分为大小相等的两块,每次只使用其中一块,当这一块内存用完了就将还存活的对象复制到另外一块上面,而后再把使用过的内存空间进行一次清理。

主要不足是只使用了内存的一半。

如今的商业虚拟机都采用这种收集算法回收新生代,可是并非划分为大小相等的两块,而是一块较大的 Eden 空间和两块较小的 Survivor 空间,每次使用 Eden 和其中一块 Survivor。在回收时,将 Eden 和 Survivor 中还存活着的对象所有复制到另外一块 Survivor 上,最后清理 Eden 和使用过的那一块 Survivor。

HotSpot 虚拟机的 Eden 和 Survivor 大小比例默认为 8:1,保证了内存的利用率达到 90%。若是每次回收有多于 10% 的对象存活,那么一块 Survivor 就不够用了,此时须要依赖于老年代进行空间分配担保,也就是借用老年代的空间存储放不下的对象。

4. 分代收集

如今的商业虚拟机采用分代收集算法,它根据对象存活周期将内存划分为几块,不一样块采用适当的收集算法。

通常将堆分为新生代和老年代。

  • 新生代使用:复制算法
  • 老年代使用:标记 - 清除 或者 标记 - 整理 算法

垃圾收集器

<div align="center"> <img src="pics/c625baa0-dde6-449e-93df-c3a67f2f430f.jpg" width=""/> </div>

以上是 HotSpot 虚拟机中的 7 个垃圾收集器,连线表示垃圾收集器能够配合使用。

  • 单线程与多线程:单线程指的是垃圾收集器只使用一个线程,而多线程使用多个线程;
  • 串行与并行:串行指的是垃圾收集器与用户程序交替执行,这意味着在执行垃圾收集的时候须要停顿用户程序;并行指的是垃圾收集器和用户程序同时执行。除了 CMS 和 G1 以外,其它垃圾收集器都是以串行的方式执行。

1. Serial 收集器

<div align="center"> <img src="pics/22fda4ae-4dd5-489d-ab10-9ebfdad22ae0.jpg" width=""/> </div>

Serial 翻译为串行,也就是说它以串行的方式执行。

它是单线程的收集器,只会使用一个线程进行垃圾收集工做。

它的优势是简单高效,在单个 CPU 环境下,因为没有线程交互的开销,所以拥有最高的单线程收集效率。

它是 Client 场景下的默认新生代收集器,由于在该场景下内存通常来讲不会很大。它收集一两百兆垃圾的停顿时间能够控制在一百多毫秒之内,只要不是太频繁,这点停顿时间是能够接受的。

2. ParNew 收集器

<div align="center"> <img src="pics/81538cd5-1bcf-4e31-86e5-e198df1e013b.jpg" width=""/> </div>

它是 Serial 收集器的多线程版本。

它是 Server 场景下默认的新生代收集器,除了性能缘由外,主要是由于除了 Serial 收集器,只有它能与 CMS 收集器配合使用。

3. Parallel Scavenge 收集器

与 ParNew 同样是多线程收集器。

其它收集器目标是尽量缩短垃圾收集时用户线程的停顿时间,而它的目标是达到一个可控制的吞吐量,所以它被称为“吞吐量优先”收集器。这里的吞吐量指 CPU 用于运行用户程序的时间占总时间的比值。

停顿时间越短就越适合须要与用户交互的程序,良好的响应速度能提高用户体验。而高吞吐量则能够高效率地利用 CPU 时间,尽快完成程序的运算任务,适合在后台运算而不须要太多交互的任务。

缩短停顿时间是以牺牲吞吐量和新生代空间来换取的:新生代空间变小,垃圾回收变得频繁,致使吞吐量降低。

能够经过一个开关参数打开 GC 自适应的调节策略(GC Ergonomics),就不须要手工指定新生代的大小(-Xmn)、Eden 和 Survivor 区的比例、晋升老年代对象年龄等细节参数了。虚拟机会根据当前系统的运行状况收集性能监控信息,动态调整这些参数以提供最合适的停顿时间或者最大的吞吐量。

4. Serial Old 收集器

<div align="center"> <img src="pics/08f32fd3-f736-4a67-81ca-295b2a7972f2.jpg" width=""/> </div>

是 Serial 收集器的老年代版本,也是给 Client 场景下的虚拟机使用。若是用在 Server 场景下,它有两大用途:

  • 在 JDK 1.5 以及以前版本(Parallel Old 诞生之前)中与 Parallel Scavenge 收集器搭配使用。
  • 做为 CMS 收集器的后备预案,在并发收集发生 Concurrent Mode Failure 时使用。

5. Parallel Old 收集器

<div align="center"> <img src="pics/278fe431-af88-4a95-a895-9c3b80117de3.jpg" width=""/> </div>

是 Parallel Scavenge 收集器的老年代版本。

在注重吞吐量以及 CPU 资源敏感的场合,均可以优先考虑 Parallel Scavenge 加 Parallel Old 收集器。

6. CMS 收集器

<div align="center"> <img src="pics/62e77997-6957-4b68-8d12-bfd609bb2c68.jpg" width=""/> </div>

CMS(Concurrent Mark Sweep),Mark Sweep 指的是标记 - 清除算法。

分为如下四个流程:

  • 初始标记:仅仅只是标记一下 GC Roots 能直接关联到的对象,速度很快,须要停顿。
  • 并发标记:进行 GC Roots Tracing 的过程,它在整个回收过程当中耗时最长,不须要停顿。
  • 从新标记:为了修正并发标记期间因用户程序继续运做而致使标记产生变更的那一部分对象的标记记录,须要停顿。
  • 并发清除:不须要停顿。

在整个过程当中耗时最长的并发标记和并发清除过程当中,收集器线程均可以与用户线程一块儿工做,不须要进行停顿。

具备如下缺点:

  • 吞吐量低:低停顿时间是以牺牲吞吐量为代价的,致使 CPU 利用率不够高。
  • 没法处理浮动垃圾,可能出现 Concurrent Mode Failure。浮动垃圾是指并发清除阶段因为用户线程继续运行而产生的垃圾,这部分垃圾只能到下一次 GC 时才能进行回收。因为浮动垃圾的存在,所以须要预留出一部份内存,意味着 CMS 收集不能像其它收集器那样等待老年代快满的时候再回收。若是预留的内存不够存放浮动垃圾,就会出现 Concurrent Mode Failure,这时虚拟机将临时启用 Serial Old 来替代 CMS。
  • 标记 - 清除算法致使的空间碎片,每每出现老年代空间剩余,但没法找到足够大连续空间来分配当前对象,不得不提早触发一次 Full GC。

7. G1 收集器

G1(Garbage-First),它是一款面向服务端应用的垃圾收集器,在多 CPU 和大内存的场景下有很好的性能。HotSpot 开发团队赋予它的使命是将来能够替换掉 CMS 收集器。

堆被分为新生代和老年代,其它收集器进行收集的范围都是整个新生代或者老年代,而 G1 能够直接对新生代和老年代一块儿回收。

<div align="center"> <img src="pics/4cf711a8-7ab2-4152-b85c-d5c226733807.png" width="600"/> </div>

G1 把堆划分红多个大小相等的独立区域(Region),新生代和老年代再也不物理隔离。

<div align="center"> <img src="pics/9bbddeeb-e939-41f0-8e8e-2b1a0aa7e0a7.png" width="600"/> </div>

经过引入 Region 的概念,从而将原来的一整块内存空间划分红多个的小空间,使得每一个小空间能够单独进行垃圾回收。这种划分方法带来了很大的灵活性,使得可预测的停顿时间模型成为可能。经过记录每一个 Region 垃圾回收时间以及回收所得到的空间(这两个值是经过过去回收的经验得到),并维护一个优先列表,每次根据容许的收集时间,优先回收价值最大的 Region。

每一个 Region 都有一个 Remembered Set,用来记录该 Region 对象的引用对象所在的 Region。经过使用 Remembered Set,在作可达性分析的时候就能够避免全堆扫描。

<div align="center"> <img src="pics/f99ee771-c56f-47fb-9148-c0036695b5fe.jpg" width=""/> </div>

若是不计算维护 Remembered Set 的操做,G1 收集器的运做大体可划分为如下几个步骤:

  • 初始标记
  • 并发标记
  • 最终标记:为了修正在并发标记期间因用户程序继续运做而致使标记产生变更的那一部分标记记录,虚拟机将这段时间对象变化记录在线程的 Remembered Set Logs 里面,最终标记阶段须要把 Remembered Set Logs 的数据合并到 Remembered Set 中。这阶段须要停顿线程,可是可并行执行。
  • 筛选回收:首先对各个 Region 中的回收价值和成本进行排序,根据用户所指望的 GC 停顿时间来制定回收计划。此阶段其实也能够作到与用户程序一块儿并发执行,可是由于只回收一部分 Region,时间是用户可控制的,并且停顿用户线程将大幅度提升收集效率。

具有以下特色:

  • 空间整合:总体来看是基于“标记 - 整理”算法实现的收集器,从局部(两个 Region 之间)上来看是基于“复制”算法实现的,这意味着运行期间不会产生内存空间碎片。
  • 可预测的停顿:能让使用者明确指定在一个长度为 M 毫秒的时间片断内,消耗在 GC 上的时间不得超过 N 毫秒。

3、内存分配与回收策略

Minor GC 和 Full GC

  • Minor GC:回收新生代上,由于新生代对象存活时间很短,所以 Minor GC 会频繁执行,执行的速度通常也会比较快。
  • Full GC:回收老年代和新生代,老年代对象其存活时间长,所以 Full GC 不多执行,执行速度会比 Minor GC 慢不少。

内存分配策略

1. 对象优先在 Eden 分配

大多数状况下,对象在新生代 Eden 区分配,当 Eden 区空间不够时,发起 Minor GC。

2. 大对象直接进入老年代

大对象是指须要连续内存空间的对象,最典型的大对象是那种很长的字符串以及数组。

常常出现大对象会提早触发垃圾收集以获取足够的连续空间分配给大对象。

-XX:PretenureSizeThreshold,大于此值的对象直接在老年代分配,避免在 Eden 区和 Survivor 区之间的大量内存复制。

3. 长期存活的对象进入老年代

为对象定义年龄计数器,对象在 Eden 出生并通过 Minor GC 依然存活,将移动到 Survivor 中,年龄就增长 1 岁,增长到必定年龄则移动到老年代中。

-XX:MaxTenuringThreshold 用来定义年龄的阈值。

4. 动态对象年龄断定

虚拟机并非永远地要求对象的年龄必须达到 MaxTenuringThreshold 才能晋升老年代,若是在 Survivor 中相同年龄全部对象大小的总和大于 Survivor 空间的一半,则年龄大于或等于该年龄的对象能够直接进入老年代,无需等到 MaxTenuringThreshold 中要求的年龄。

5. 空间分配担保

在发生 Minor GC 以前,虚拟机先检查老年代最大可用的连续空间是否大于新生代全部对象总空间,若是条件成立的话,那么 Minor GC 能够确认是安全的。

若是不成立的话虚拟机会查看 HandlePromotionFailure 设置值是否容许担保失败,若是容许那么就会继续检查老年代最大可用的连续空间是否大于历次晋升到老年代对象的平均大小,若是大于,将尝试着进行一次 Minor GC;若是小于,或者 HandlePromotionFailure 设置不容许冒险,那么就要进行一次 Full GC。

Full GC 的触发条件

对于 Minor GC,其触发条件很是简单,当 Eden 空间满时,就将触发一次 Minor GC。而 Full GC 则相对复杂,有如下条件:

1. 调用 System.gc()

只是建议虚拟机执行 Full GC,可是虚拟机不必定真正去执行。不建议使用这种方式,而是让虚拟机管理内存。

2. 老年代空间不足

老年代空间不足的常见场景为前文所讲的大对象直接进入老年代、长期存活的对象进入老年代等。

为了不以上缘由引发的 Full GC,应当尽可能不要建立过大的对象以及数组。除此以外,能够经过 -Xmn 虚拟机参数调大新生代的大小,让对象尽可能在新生代被回收掉,不进入老年代。还能够经过 -XX:MaxTenuringThreshold 调大对象进入老年代的年龄,让对象在新生代多存活一段时间。

3. 空间分配担保失败

使用复制算法的 Minor GC 须要老年代的内存空间做担保,若是担保失败会执行一次 Full GC。具体内容请参考上面的第五小节。

4. JDK 1.7 及之前的永久代空间不足

在 JDK 1.7 及之前,HotSpot 虚拟机中的方法区是用永久代实现的,永久代中存放的为一些 Class 的信息、常量、静态变量等数据。

当系统中要加载的类、反射的类和调用的方法较多时,永久代可能会被占满,在未配置为采用 CMS GC 的状况下也会执行 Full GC。若是通过 Full GC 仍然回收不了,那么虚拟机会抛出 java.lang.OutOfMemoryError。

为避免以上缘由引发的 Full GC,可采用的方法为增大永久代空间或转为使用 CMS GC。

5. Concurrent Mode Failure

执行 CMS GC 的过程当中同时有对象要放入老年代,而此时老年代空间不足(多是 GC 过程当中浮动垃圾过多致使暂时性的空间不足),便会报 Concurrent Mode Failure 错误,并触发 Full GC。

4、类加载机制

类是在运行期间第一次使用时动态加载的,而不是一次性加载。由于若是一次性加载,那么会占用不少的内存。

类的生命周期

<div align="center"> <img src="pics/303873db-0d11-4683-a43c-f319b7aef2b6.jpg"/> </div>

包括如下 7 个阶段:

  • 加载(Loading)
  • 验证(Verification)
  • 准备(Preparation)
  • 解析(Resolution)
  • 初始化(Initialization)
  • 使用(Using)
  • 卸载(Unloading)

类加载过程

包含了加载、验证、准备、解析和初始化这 5 个阶段。

1. 加载

加载是类加载的一个阶段,注意不要混淆。

加载过程完成如下三件事:

  • 经过类的彻底限定名称获取定义该类的二进制字节流。
  • 将该字节流表示的静态存储结构转换为方法区的运行时存储结构。
  • 在内存中生成一个表明该类的 Class 对象,做为方法区中该类各类数据的访问入口。

其中二进制字节流能够从如下方式中获取:

  • 从 ZIP 包读取,成为 JAR、EAR、WAR 格式的基础。
  • 从网络中获取,最典型的应用是 Applet。
  • 运行时计算生成,例如动态代理技术,在 java.lang.reflect.Proxy 使用 ProxyGenerator.generateProxyClass 的代理类的二进制字节流。
  • 由其余文件生成,例如由 JSP 文件生成对应的 Class 类。

2. 验证

确保 Class 文件的字节流中包含的信息符合当前虚拟机的要求,而且不会危害虚拟机自身的安全。

3. 准备

类变量是被 static 修饰的变量,准备阶段为类变量分配内存并设置初始值,使用的是方法区的内存。

实例变量不会在这阶段分配内存,它会在对象实例化时随着对象一块儿被分配在堆中。应该注意到,实例化不是类加载的一个过程,类加载发生在全部实例化操做以前,而且类加载只进行一次,实例化能够进行屡次。

初始值通常为 0 值,例以下面的类变量 value 被初始化为 0 而不是 123。

public static int value = 123;

若是类变量是常量,那么它将初始化为表达式所定义的值而不是 0。例以下面的常量 value 被初始化为 123 而不是 0。

public static final int value = 123;

4. 解析

将常量池的符号引用替换为直接引用的过程。

其中解析过程在某些状况下能够在初始化阶段以后再开始,这是为了支持 Java 的动态绑定。

<div data="补充为何能够支持动态绑定 --> <--"></div>

5. 初始化

<div data="modify -->"></div>

初始化阶段才真正开始执行类中定义的 Java 程序代码。初始化阶段是虚拟机执行类构造器 <clinit>() 方法的过程。在准备阶段,类变量已经赋过一次系统要求的初始值,而在初始化阶段,根据程序员经过程序制定的主观计划去初始化类变量和其它资源。

在准备阶段,已经为类变量分配了系统所需的初始值,而且在初始化阶段,根据程序员经过程序进行的主观计划来初始化类变量和其余资源。

<clinit>() 是由编译器自动收集类中全部类变量的赋值动做和静态语句块中的语句合并产生的,编译器收集的顺序由语句在源文件中出现的顺序决定。特别注意的是,静态语句块只能访问到定义在它以前的类变量,定义在它以后的类变量只能赋值,不能访问。例如如下代码:

public class Test {
    static {
        i = 0;                // 给变量赋值能够正常编译经过
        System.out.print(i);  // 这句编译器会提示“非法向前引用”
    }
    static int i = 1;
}

因为父类的 <clinit>() 方法先执行,也就意味着父类中定义的静态语句块的执行要优先于子类。例如如下代码:

static class Parent {
    public static int A = 1;
    static {
        A = 2;
    }
}

static class Sub extends Parent {
    public static int B = A;
}

public static void main(String[] args) {
     System.out.println(Sub.B);  // 2
}

接口中不可使用静态语句块,但仍然有类变量初始化的赋值操做,所以接口与类同样都会生成 <clinit>() 方法。但接口与类不一样的是,执行接口的 <clinit>() 方法不须要先执行父接口的 <clinit>() 方法。只有当父接口中定义的变量使用时,父接口才会初始化。另外,接口的实现类在初始化时也同样不会执行接口的 <clinit>() 方法。

虚拟机会保证一个类的 <clinit>() 方法在多线程环境下被正确的加锁和同步,若是多个线程同时初始化一个类,只会有一个线程执行这个类的 <clinit>() 方法,其它线程都会阻塞等待,直到活动线程执行 <clinit>() 方法完毕。若是在一个类的 <clinit>() 方法中有耗时的操做,就可能形成多个线程阻塞,在实际过程当中此种阻塞很隐蔽。

类初始化时机

1. 主动引用

虚拟机规范中并无强制约束什么时候进行加载,可是规范严格规定了有且只有下列五种状况必须对类进行初始化(加载、验证、准备都会随之发生):

  • 遇到 new、getstatic、putstatic、invokestatic 这四条字节码指令时,若是类没有进行过初始化,则必须先触发其初始化。最多见的生成这 4 条指令的场景是:使用 new 关键字实例化对象的时候;读取或设置一个类的静态字段(被 final 修饰、已在编译期把结果放入常量池的静态字段除外)的时候;以及调用一个类的静态方法的时候。
  • 使用 java.lang.reflect 包的方法对类进行反射调用的时候,若是类没有进行初始化,则须要先触发其初始化。
  • 当初始化一个类的时候,若是发现其父类尚未进行过初始化,则须要先触发其父类的初始化。
  • 当虚拟机启动时,用户须要指定一个要执行的主类(包含 main() 方法的那个类),虚拟机会先初始化这个主类;
  • 当使用 JDK 1.7 的动态语言支持时,若是一个 java.lang.invoke.MethodHandle 实例最后的解析结果为 REF_getStatic, REF_putStatic, REF_invokeStatic 的方法句柄,而且这个方法句柄所对应的类没有进行过初始化,则须要先触发其初始化;

2. 被动引用

以上 5 种场景中的行为称为对一个类进行主动引用。除此以外,全部引用类的方式都不会触发初始化,称为被动引用。被动引用的常见例子包括:

  • 经过子类引用父类的静态字段,不会致使子类初始化。
System.out.println(SubClass.value);  // value 字段在 SuperClass 中定义
  • 经过数组定义来引用类,不会触发此类的初始化。该过程会对数组类进行初始化,数组类是一个由虚拟机自动生成的、直接继承自 Object 的子类,其中包含了数组的属性和方法。
SuperClass[] sca = new SuperClass[10];
  • 常量在编译阶段会存入调用类的常量池中,本质上并无直接引用到定义常量的类,所以不会触发定义常量的类的初始化。
System.out.println(ConstClass.HELLOWORLD);

类与类加载器

两个类相等,须要类自己相等,而且使用同一个类加载器进行加载。这是由于每个类加载器都拥有一个独立的类名称空间。

这里的相等,包括类的 Class 对象的 equals() 方法、isAssignableFrom() 方法、isInstance() 方法的返回结果为 true,也包括使用 instanceof 关键字作对象所属关系断定结果为 true。

类加载器分类

从 Java 虚拟机的角度来说,只存在如下两种不一样的类加载器:

  • 启动类加载器(Bootstrap ClassLoader),使用 C++ 实现,是虚拟机自身的一部分;
  • 全部其它类的加载器,使用 Java 实现,独立于虚拟机,继承自抽象类 java.lang.ClassLoader。

从 Java 开发人员的角度看,类加载器能够划分得更细致一些:

  • 启动类加载器(Bootstrap ClassLoader)此类加载器负责将存放在 <JRE_HOME>lib 目录中的,或者被 -Xbootclasspath 参数所指定的路径中的,而且是虚拟机识别的(仅按照文件名识别,如 rt.jar,名字不符合的类库即便放在 lib 目录中也不会被加载)类库加载到虚拟机内存中。启动类加载器没法被 Java 程序直接引用,用户在编写自定义类加载器时,若是须要把加载请求委派给启动类加载器,直接使用 null 代替便可。
  • 扩展类加载器(Extension ClassLoader)这个类加载器是由 ExtClassLoader(sun.misc.Launcher$ExtClassLoader)实现的。它负责将 <JAVA_HOME>/lib/ext 或者被 java.ext.dir 系统变量所指定路径中的全部类库加载到内存中,开发者能够直接使用扩展类加载器。
  • 应用程序类加载器(Application ClassLoader)这个类加载器是由 AppClassLoader(sun.misc.Launcher$AppClassLoader)实现的。因为这个类加载器是 ClassLoader 中的 getSystemClassLoader() 方法的返回值,所以通常称为系统类加载器。它负责加载用户类路径(ClassPath)上所指定的类库,开发者能够直接使用这个类加载器,若是应用程序中没有自定义过本身的类加载器,通常状况下这个就是程序中默认的类加载器。

<div data="modify <--"></div>

双亲委派模型

应用程序是由三种类加载器互相配合从而实现类加载,除此以外还能够加入本身定义的类加载器。

下图展现了类加载器之间的层次关系,称为双亲委派模型(Parents Delegation Model)。该模型要求除了顶层的启动类加载器外,其它的类加载器都要有本身的父类加载器。类加载器之间的父子关系通常经过组合关系(Composition)来实现,而不是继承关系(Inheritance)。

<div align="center"> <img src="pics/805812fa-6ab5-4b8f-a0aa-3bdcadaa829d.png"/> </div>

1. 工做过程

一个类加载器首先将类加载请求转发到父类加载器,只有当父类加载器没法完成时才尝试本身加载。

2. 好处

使得 Java 类随着它的类加载器一块儿具备一种带有优先级的层次关系,从而使得基础类获得统一。

例如 java.lang.Object 存放在 rt.jar 中,若是编写另一个 java.lang.Object 并放到 ClassPath 中,程序能够编译经过。因为双亲委派模型的存在,因此在 rt.jar 中的 Object 比在 ClassPath 中的 Object 优先级更高,这是由于 rt.jar 中的 Object 使用的是启动类加载器,而 ClassPath 中的 Object 使用的是应用程序类加载器。rt.jar 中的 Object 优先级更高,那么程序中全部的 Object 都是这个 Object。

3. 实现

如下是抽象类 java.lang.ClassLoader 的代码片断,其中的 loadClass() 方法运行过程以下:先检查类是否已经加载过,若是没有则让父类加载器去加载。当父类加载器加载失败时抛出 ClassNotFoundException,此时尝试本身去加载。

public abstract class ClassLoader {
    // The parent class loader for delegation
    private final ClassLoader parent;

    public Class<?> loadClass(String name) throws ClassNotFoundException {
        return loadClass(name, false);
    }

    protected Class<?> loadClass(String name, boolean resolve) throws ClassNotFoundException {
        synchronized (getClassLoadingLock(name)) {
            // First, check if the class has already been loaded
            Class<?> c = findLoadedClass(name);
            if (c == null) {
                try {
                    if (parent != null) {
                        c = parent.loadClass(name, false);
                    } else {
                        c = findBootstrapClassOrNull(name);
                    }
                } catch (ClassNotFoundException e) {
                    // ClassNotFoundException thrown if class not found
                    // from the non-null parent class loader
                }

                if (c == null) {
                    // If still not found, then invoke findClass in order
                    // to find the class.
                    c = findClass(name);
                }
            }
            if (resolve) {
                resolveClass(c);
            }
            return c;
        }
    }

    protected Class<?> findClass(String name) throws ClassNotFoundException {
        throw new ClassNotFoundException(name);
    }
}

自定义类加载器实现

FileSystemClassLoader 是自定义类加载器,继承自 java.lang.ClassLoader,用于加载文件系统上的类。它首先根据类的全名在文件系统上查找类的字节代码文件(.class 文件),而后读取该文件内容,最后经过 defineClass() 方法来把这些字节代码转换成 java.lang.Class 类的实例。

java.lang.ClassLoader 的 loadClass() 实现了双亲委派模型的逻辑,自定义类加载器通常不去重写它,可是须要重写 findClass() 方法。

public class FileSystemClassLoader extends ClassLoader {

    private String rootDir;

    public FileSystemClassLoader(String rootDir) {
        this.rootDir = rootDir;
    }

    protected Class<?> findClass(String name) throws ClassNotFoundException {
        byte[] classData = getClassData(name);
        if (classData == null) {
            throw new ClassNotFoundException();
        } else {
            return defineClass(name, classData, 0, classData.length);
        }
    }

    private byte[] getClassData(String className) {
        String path = classNameToPath(className);
        try {
            InputStream ins = new FileInputStream(path);
            ByteArrayOutputStream baos = new ByteArrayOutputStream();
            int bufferSize = 4096;
            byte[] buffer = new byte[bufferSize];
            int bytesNumRead;
            while ((bytesNumRead = ins.read(buffer)) != -1) {
                baos.write(buffer, 0, bytesNumRead);
            }
            return baos.toByteArray();
        } catch (IOException e) {
            e.printStackTrace();
        }
        return null;
    }

    private String classNameToPath(String className) {
        return rootDir + File.separatorChar
                + className.replace('.', File.separatorChar) + ".class";
    }
}

参考资料

Getting Started with the G1 Garbage Collector

以为文章不错的欢迎关注个人WX公众号: 程序员乔戈里
我是 百度后台开发工程师,哈工大计算机本硕,专一分享技术干货/编程资源/求职面试/成长感悟等,关注送3000G编程资源,免费下载CSDN资源。