阅读 98

JVM-运行时数据区、类加载、GC详解

前言:

Java 虚拟机是 Java 平台的基石。它是技术的组成部分,负责其硬件和操作系统的独立性、编译代码的小尺寸以及保护用户免受恶意程序侵害的能力。  该篇文章详细讲述JVM各个模块。


学习概览图:

image

运行时数据区

Java虚拟机定义了在程序执行期间使用的各种运行时数据区域。其中一些数据区域是在Java虚拟机启动时创建的,只有在Java虚拟机退出时才会被销毁。其他数据区域是每个线程的(线程私有)。每线程数据区域在线程创建时创建,在线程退出时销毁。

程序计数器
image 程序计数器是JVM运行时数据区中一块较小的内存空间,可以看作是当前线程所执行的字节码的行号指示器。(java -c xxx.class)命令

总结:

   1. 它是一块很小的内存空间,几乎可以忽略不计。且唯一一个在 JVM 规范中没有规定任何 OutOfMemoryError 情况的区域。

   2. 每个线程都有它自己的程序计数器,是线程私有的,生命周期与线程的生命周期一致。

   3. 程序计数器记录的是 JVM 字节码指令地址,如果是执行 native 方法,则是未指定值,程序控制流的指示器,分支、循环、跳转、异常处理、线程恢复等基础功能都需要依赖这个计数器来完成。

   4.字节码解释器工作时就是通过改变这个计数器的值来选取下一条需要执行的字节码指令。


虚拟机栈
image Java线程执行方法的内存模型,一个线程对应一个栈,每个方法在执行的同时都会创建一个栈帧(用于存储局部变量表,操作数栈,动态链接,方法出口等信息)不存在垃圾回收问题,只要线程一结束该栈就释放,生命周期和线程一致。

1.内部结构 栈帧(Stack Frame)

   1.1 局部变量表 栈上保存的本地变量

   1.2 操作数栈  参考上图的压栈和出栈

   1.3 动态链接 执行当前方法运行时常数池的引用 多态时指向子类

   1.4 方法返回地址 方法出口的地址

   1.5 其它附加信息

2.虚拟机栈详解 image 3. 异常  JVM对该区域规范了两种异常

   3.1 线程请求的栈深度大于虚拟机栈所允许的深度,将抛出StackOverFlowError异常

   3.2 若虚拟机栈可动态扩展,当无法申请到足够内存空间时将抛出OutOfMemoryError。

   3.3 参数-Xss来设置线程的最大栈空间,栈的大小直接决定了函数调用的最大可达深度



image 虚拟机启动时创建,用于存放对象实例,几乎所有的对象(包含常量池)都在堆上分配内存,当对象无法再该空间申请到内存时将抛出OutOfMemoryError异常。同时也是垃圾收集器管理的主要区域。可通过 -Xmx –Xms 参数来分别指定最大堆和最小堆。

新生区 类诞生、成长、消亡的区域,一个类在这里产生,应用,最后被垃圾回收器收集,结束生命。 新生区分为两部分: 伊甸区(Eden space)和幸存者区(Survivor pace) ,所有的类都是在伊甸区被new出来的。幸存区有两个: 0区(Survivor 0 space)和1区(Survivor 1 space)。当伊甸园的空间用完时,程序又需要创建对象,JVM的垃圾回收器将对伊甸园区进行垃圾回收(Minor GC),将伊甸园区中的不再被其他对象所引用的对象进行销毁。然后将伊甸园中的剩余对象移动到幸存 0区。若幸存 0区也满了,再对该区进行垃圾回收,然后移动到1区。

老年区

新生区经过多次GC仍然存活的对象移动到老年区。若老年区也满了,那么这个时候将产生MajorGC(FullGC),进行老年区的内存清理。若老年区执行了Full GC之后发现依然无法进行对象的保存,就会产生OOM异常“OutOfMemoryError”。

元数据区

元数据区取代了永久代(jdk1.8以前),本质和永久代类似,都是对JVM规范中方法区的实现,区别在于元数据区并不在虚拟机中,而是使用本地物理内存,永久代在虚拟机中,永久代逻辑结构上属于堆,但是物理上不属于堆,堆大小=新生代+老年代。元数据区也有可能发生OutOfMemory异常。

元数据区的动态扩展: 默认–XX:MetaspaceSize值为21MB的高水位线。一旦触及则Full GC将被触发并卸载没有用的类(类对应的类加载器不再存活),然后高水位线将会重置。新的高水位线的值取决于GC后释放的元空间。如果释放的空间少,这个高水位线则上升。如果释放空间过多,则高水位线下降。

移除永久代是为融合HotSpot JVM与 JRockit VM而做出的努力,因为JRockit没有永久代,不需要配置永久代。


方法区

类的所有字段和方法字节码,以及一些特殊方法如构造函数,接口代码也在此定义。简单说,所有定义的方法的信息都保存在该区域,静态变量+常量+类信息(构造方法/接口定义)+运行时常量池都存在方法区中,虽然Java虚拟机规范把方法区描述为堆的一个逻辑部分,但是它却有一个别名叫做 Non-Heap(非堆),目的应该是与 Java 堆区分开来。

解惑方法区、永生代、元数据区 方法区(method area)是JVM 规范中定义的一个概念,用于存储类信息、常量池、静态变量、JIT编译后的代码等数据,并没有规定如何去实现它,不同的厂商有不同的实现。而永久代(PermGen)是 Hotspot 虚拟机特有的概念, Java8 的时候又被元空间取代了,永久代和元空间都可以理解为方法区的落地实现。

jdk升级中方法区的变化

  1.Jdk1.6及之前: 有永久代, 常量池在方法区

  2.Jdk1.7:       有永久代,但已经逐步“去永久代”,常量池在堆

  3.Jdk1.8及之后: 无永久代,常量池在元空间


本地方法栈

登记native方法,在Execution Engine执行时加载本地方法库

什么地方用到

1.与 Java 环境外交互:有时 Java 应用需要与 Java外面的环境交互,这就是本地方法存在的原因。

2.与操作系统交互:JVM 支持 Java 语言本身和运行时库,但是有时仍需要依赖一些底层系统的支持。通过本地方法,我们可以实现用 Java 与实现了 jre 的底层系统交互, JVM 的一些部分就是 C语言写的。


栈+堆+方法区的交互关系

image   1.HotSpot是使用指针的方式来访问对象

  2.Java堆中会存放访问类元数据的地址

  3.reference存储的就直接是对象的地址


类加载

image 类加载:类加载器将class文件加载到虚拟机的内存

  1. 加载:在硬盘上查找并通过IO读入字节码文件

  2. 连接:执行校验、准备、解析(可选)步骤

  3. 校验:校验字节码文件的正确性

  4. 准备:给类的静态变量分配内存,并赋予默认值

  5. 解析:类装载器装入类所引用的其他所有类

  6. 初始化:对类的静态变量初始化为指定的值,执行静态代码块


类加载器种类

   启动类加载器: 负责加载JRE的核心类库,如jre目标下的rt.jar,charsets.jar等

   扩展类加载器: 负责加载JRE扩展目录ext中JAR类包

   系统类加载器: 负责加载ClassPath路径下的类包

   用户自定义加载器: 负责加载用户自定义路径下的类包

   public static void main(String[] args) {         System.out.println(ClassLoader.getSystemClassLoader().getClass().getName());         // 输出 sun.misc.Launcher$AppClassLoader         System.out.println(ClassLoader.getSystemClassLoader().getParent().getClass().getName());         // 输出 sun.misc.Launcher$ExtClassLoader         System.out.println(ClassLoader.getSystemClassLoader().getParent().getParent());         // 输出 null 原因 BootstrapLoader(引导类加载器)是用C语言实现的,找不到一个确定的返回父Loader的方式,于是就返回null。     } 复制代码


类加载机制

image

全盘负责委托机制: 当一个ClassLoader加载一个类时,除非显示的使用另一个ClassLoader,该类所依赖和引用的类也由这个ClassLoader载入。

双亲委派机制: 指先委托父类加载器寻找目标类,在找不到的情况下在自己的路径中查找并载入目标类。

双亲委派模式优势 沙箱安全机制:自己写的String.class类不会被加载,这样便可以防止核心API库被随意篡改 避免类的重复加载:当父亲已经加载了该类时,就没有必要子ClassLoader再   加载一次。

动态加载类 JVM对class文件是按需加载(运行期间动态加载),非一次性加载。

类加载方式:

  1. 命令行启动应用时候由JVM初始化加载。

  2. 通过Class.forName()方法动态加载。

  3. 通过ClassLoader.loadClass()方法动态加载。


GC

1. 什么是GC

称为垃圾回收,是对内存管理的一种功能,用于释放无效对象并回收内存。

2. 如何判断是否可以回收

引用计数法: 给对象添加一个引用计数器,当对象增加一个引用时计数器加 1,引用失效时计数器减 1。引用计数为 0 的对象可被回收。两个对象出现循环引用的情况下,此时引用计数器永远不为 0,导致无法对它们进行回收。正因为循环引用的存在,因此 Java 虚拟机不使用引用计数算法。

可达性分析: 通过 GC Roots 作为起始点进行搜索,能够到达到的对象都是存活的,不可达的对象可被回收。   GC Roots:  本地方法栈中引用的对象、方法区中类静态属性引用的对象、方法区中的常量引用的对象、虚拟机栈中引用的对象。

3. 垃圾回收算法

Mark-Sweep: 标记清除。将存活的对象进行标记,然后清理掉未被标记的对象。最大的问题是空间碎片(清除垃圾之后剩下不连续的内存空间)。

Copying: 复制算法。将内存划分为大小相等的两块,每次只使用其中一块,当这一块内存用完了就将还存活的对象复制到另一块上面,然后再把使用过的内存空间进行一次清理。对于短命对象来说有用,否则需要复制大量的对象,效率低。如Java的新生代堆空间中就是使用了它(survivor空间的from和to区)。

Mark-Compact: 标记整理。让所有存活的对象都向一端移动,然后直接清理掉端边界以外的内存。对于老年对象来说有用,无需复制,不会产生内存碎片。

4. 分代收集、单线程多线程并行串行收集

分代收集 由于对象的存活周期不同的特性,所以现在商用虚拟机一般采用分代收集算法, 不同的块用不同算法(新生代、老年代)。
1. 新生代使用: 复制算法。
2. 老年代使用: 标记 - 清除 或者 标记 - 整理 算法。

单线程多线程并行串行  为了平衡垃圾收集时的指标,使用多线程或者单线程运行
1. 单线程与多线程:单线程指的是垃圾收集器只使用一个线程进行收集,而多线程使用多个线程。
2. 串行与并行: 串行指的是垃圾收集器与用户程序交替执行,这意味着在执行垃圾收集的时候需要停顿用户程序;并形指的是垃圾收集器和用户程序同时执行。除了 CMS 和 G1 之外,其它垃圾收集器都是以串行的方式执行。

5. 垃圾收集器 (HotSpot虚拟机) 收集器之间是可以进行配合使用

image

Serial 收集器: 单线程的收集器。

ParNew 收集器: Serial 收集器的多线程版本 默认开启的线程数量与 CPU 数量相同,可以使用 -XX:ParallelGCThreads 参数来设置线程数。

Parallel Scavenge 收集器: 多线程收集器 主要关注点是GC是尽可能的减少用户线程停顿时间 。

Serial Old 收集器:  Serial 收集器的老年代版本  针对老年代;采用"标记-整理"算法(还有压缩,Mark-Sweep-Compact);单线程收集。
Parallel Old 收集器: Parallel Scavenge收集器的老年代版本 针对老年代;采用"标记-整理"算法;多线程收集。

CMS 收集器: 并发低停顿收集器 针对老年代;基于"标记-清除"算法(不进行压缩操作,产生内存碎片);  以获取最短回收停顿时间为目标;并发收集、低停顿;需要更多的内存。

G1 收集器: JDK7-u4才推出商用的收集器 在多CPU 和大内存的场景下有很好的性能 G1 可以直接对新生代和老年代一起回收。


作者:后端技术杂谈
链接:https://juejin.cn/post/7027005466286751780


文章分类
代码人生
版权声明:本站是系统测试站点,无实际运营。本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 XXXXXXo@163.com 举报,一经查实,本站将立刻删除。
相关推荐