百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT知识 > 正文

Java11 的 G1 垃圾收集器

liuian 2025-04-27 14:44 31 浏览

大家好,我是【运维开发故事公众号】的 Java 程序员老郑。JVM 是我们从事 Java 项目和开发都需要具备的非常底层的基础知识。


首先我先抛出以下几个问题:

  1. 很多服务需要过一段时间重启一次,如果不重启系统就会越来越慢?

  2. 突然一个中间件挂了一段时间过后,但是一些不相关的服务越来越卡,后面 OOM?

  3. 上线一个功能过后,CPU 就飙升到 100%,但是服务还是正常运行?

  4. 服务的某一个 CPU 出现有规律的,周期性的尖刺该如何解决?


作为 5 年以上工作经验的技术人员,或多或少在系统维护,系统保障,系统调优遇到过上面的这几个场景,你可能是通过重启,调整一些 jvm 参数解决,如果大家需要深入的探究找到问题的原因,可以耐心看看下文我对 G1 的一些总结。

本文讲哪些东西?

  1. 堆布局(以 Region 为基础划分:新生代(Eden 区、Survivor 区)、年老代、Humongous 区域)
  2. 垃圾收集周期
  3. GC 运作过程:初始标记、并发标记、最终标记、筛选回收
  4. GC 类型:Minor GC、Full GC 、Mixed GC
  5. CSet (年轻代需要收集的 Region 集合就是 CSet)
  6. 跨代引用
  7. 停顿预测模型
  8. GC 日志分析

G1 内存堆布局

G1 的英文全称是 Garbagge First,是一个有分代,按照 Region 的方式进行内存布局的垃圾收集器。上图,我将一些 Region 标明了 H,它代表Humongous,这表示这些 Region 存储的是巨大对象(humongous object,H-obj),即大小大于等于 region 一半的对象。H-obj 有如下几个特征:

  • H-obj 直接分配到了old gen,防止了反复拷贝移动。
  • H-obj 在 global concurrent marking 阶段的 cleanup 和 full GC阶段回收。
  • 在分配 H-obj 之前先检查是否超过 initiating heap occupancy percent 和 the marking threshold, 如果超过的话,就启动 global concurrent marking,为的是提早回收,防止 evacuation failures 和 full GC。

GC 类型

  1. Young GC,垃圾收集范围:年轻代区域 + 大对象区
  2. Mixed GC,垃圾收集范围:年轻代区域 + 老年区 + 大对象区
  3. Full GC,垃圾收集范围:年轻代区域 + 老年区 + 大对象区 + 元空间

Collection Set (收集区域)

Collection Set 就是我们垃圾收集器的一个区域,在不同的垃圾回收阶段,会有不同的区域。

  • Young GC, 垃圾收集区域包括:年轻代区域 + 大对象区
  • Mixed GC, 垃圾收集区域包括:年轻代区域 + 老年区 + 大对象区

跨代引用

Young GC 主要是清理,新生代中的对象,我们知道整个堆空间包括老年代,新生代,我们在 Young GC 过程中会去找 GCRoots 然后判断对象是是否可达, 如果不可达,如果可达就标记。如果对于老年代中引用新生代的对象,我们如果要找出来就就需要对老年代进行全扫描,这样是不太现实的。所以 G1 通过记忆集的形式记录了老年代对新生代的引用。具体在 G1 中通过 CarTable 来实现记忆集。

RSet(记忆集)

记录了其它 Region 中的对象到 Region 的引用。RSet 的价值在于使得垃圾回收不需要扫描整个堆,能够快速定位到真正引用它的堆对象地址。ReSet 本身就是一个 Hash 表,存储在新生代的每个 Region 中。但是存储需要消耗空间,多的能达到百分之 20。因此G1对内存的空间要求较高(小空间没资本玩),空间越大性能越彪悍。

CardTable (卡表)

由于新生代GC时,需要扫描整个old区,效率非常低。所以old区就是用卡表的方式进行一次逻辑分区。一般一页卡表的大小是2的n次幂。每一个区域也是用Key,Value结构进行记录。每一区域记录为Key不重复,Value则记录这片区域的老年代对象与新生代对象是否存在引用关系,存在则标记为1,否则为0。记录完毕后把value为1的key作为ReSet的key进行记录,并且ReSet的value存储引用,从而提高跨代引用的查询效率。

停顿预测模型

所有的预测都是基于历史的拟合,HotSpot使用了基于方差与标准差的技术。参考:
https://sdww2348115.github.io/jvm/g1/PausePredictionModel

G1 垃圾收集周期

图片来源 Oracle 官网

G1 有两个阶段,它会在这两个阶段往返,分别是 Young-only,Space Reclamation.

  1. Young-only 包含一系列的操作,如果长期存活的对象会逐渐转移到 Old gen
  2. Space Reclamation G1 会递进地回收 Old gen 的空间,同时也处理 Young region

图是来自 Oracle 上对 GC 周期的描述,实心圆都表示一次 GC 停顿

  • 蓝色 Young-only
  • 黄色 标记过程的停顿
  • 红色 Mixed GC 停顿

在几次 GC 后,Old gen 的对象占有比超过了
InitiatingHeapOccupancyPercent (简称为IHOP,默认值为45,这个值是启动并发标记的阈值,当老年代使用内存占用堆内存的45%启动并发标记。如果该区域过大,可能会导致mixed gc跟不上内存分配的速度从而导致full gc ),gc 就会进入并发标记准备 (Concurrent Mark)。

  • G1 在每一次 Young 回收中都会查找活对象 (有引用的对象)
  • G1 在 old region 并发查找存活对象
    • 是 Concurrent Marking
    • 可能花费很长时间
    • 不会停止 Java 应用
  • G1 没有活对象的引用信息是不能进行垃圾回收的
    • Mixed GC 依赖 Concurrent Mark

回到 Full GC,从上面简单分析得出,Full GC 发生是没有足够的 free region,如果堆是足够大的,Mixed gc 没有回收足够的 old region,或者 concurrent mark 没法及时完成,都可能会导致 full gc。

GC 日志分析

下面是网上找的一个 GC 日志案例,解析如下(配合 G1 垃圾收集周期结合来看):

[gc,start ] GC(44265) Pause Young (Normal) (G1 Evacuation Pause)
[gc,task ] GC(44265) Using 13 workers of 13 for evacuation
[gc,phases ] GC(44265) Pre Evacuate Collection Set: 0.1ms
[gc,phases ] GC(44265) Evacuate Collection Set: 101.8ms
[gc,phases ] GC(44265) Post Evacuate Collection Set: 3.2ms
[gc,phases ] GC(44265) Other: 2.7ms
[gc,heap ] GC(44265) Eden regions: 1850->0(1851)
[gc,heap ] GC(44265) Survivor regions: 70->69(240)
[gc,heap ] GC(44265) Old regions: 766->768
[gc,heap ] GC(44265) Humongous regions: 20->19
[gc,metaspace ] GC(44265) Metaspace: 193280K->193280K(1230848K)
[gc ] GC(44265) Pause Young (Normal) (G1 Evacuation Pause) 21642M->6843M(25600M) 107.561ms
[gc,cpu ] GC(44265) User=1.31s Sys=0.00s Real=0.11s

[gc,start ] GC(44266) Pause Young (Normal) (G1 Evacuation Pause)
[gc,task ] GC(44266) Using 13 workers of 13 for evacuation
[gc,phases ] GC(44266) Pre Evacuate Collection Set: 0.1ms
[gc,phases ] GC(44266) Evacuate Collection Set: 99.8ms
[gc,phases ] GC(44266) Post Evacuate Collection Set: 3.3ms
[gc,phases ] GC(44266) Other: 2.7ms
[gc,heap ] GC(44266) Eden regions: 1851->0(1854)
[gc,heap ] GC(44266) Survivor regions: 69->66(240)
[gc,heap ] GC(44266) Old regions: 768->772
[gc,heap ] GC(44266) Humongous regions: 20->19
[gc,metaspace ] GC(44266) Metaspace: 193280K->193280K(1230848K)
[gc ] GC(44266) Pause Young (Normal) (G1 Evacuation Pause) 21659M->6848M(25600M) 105.713ms
[gc,cpu ] GC(44266) User=1.29s Sys=0.01s Real=0.10s

[gc,start ] GC(44267) Pause Young (Normal) (G1 Evacuation Pause)
[gc,task ] GC(44267) Using 13 workers of 13 for evacuation
[gc,phases ] GC(44267) Pre Evacuate Collection Set: 0.1ms //初始标记,查找 gc root
[gc,phases ] GC(44267) Evacuate Collection Set: 89.8ms //并发标记
[gc,phases ] GC(44267) Post Evacuate Collection Set: 3.5ms //清理工作
[gc,phases ] GC(44267) Other: 2.7ms
[gc,heap ] GC(44267) Eden regions: 1854->0(1856)
[gc,heap ] GC(44267) Survivor regions: 66->64(240)
[gc,heap ] GC(44267) Old regions: 772->775
[gc,heap ] GC(44267) Humongous regions: 20->19
[gc,metaspace ] GC(44267) Metaspace: 193280K->193280K(1230848K)
[gc ] GC(44267) Pause Young (Normal) (G1 Evacuation Pause) 21688M->6859M(25600M) 95.891ms
[gc,cpu ] GC(44267) User=1.16s Sys=0.00s Real=0.10s

[gc,start ] GC(44268) Pause Young (Normal) (G1 Evacuation Pause) // Young GC
[gc,task ] GC(44268) Using 13 workers of 13 for evacuation
[gc,phases ] GC(44268) Pre Evacuate Collection Set: 0.1ms
[gc,phases ] GC(44268) Evacuate Collection Set: 100.5ms
[gc,phases ] GC(44268) Post Evacuate Collection Set: 3.8ms
[gc,phases ] GC(44268) Other: 2.8ms
[gc,heap ] GC(44268) Eden regions: 1856->0(1855)
[gc,heap ] GC(44268) Survivor regions: 64->65(240)
[gc,heap ] GC(44268) Old regions: 775->777
[gc,heap ] GC(44268) Humongous regions: 20->19
[gc,metaspace ] GC(44268) Metaspace: 193280K->193280K(1230848K)
[gc ] GC(44268) Pause Young (Normal) (G1 Evacuation Pause) 21715M->6876M(25600M) 107.037ms
[gc,cpu ] GC(44268) User=1.30s Sys=0.00s Real=0.11s

[gc,start ] GC(44269) Pause Young (Concurrent Start) (G1 Humongous Allocation) // 并发阶段
[gc,task ] GC(44269) Using 13 workers of 13 for evacuation
[gc,phases ] GC(44269) Pre Evacuate Collection Set: 0.6ms
[gc,phases ] GC(44269) Evacuate Collection Set: 90.9ms
[gc,phases ] GC(44269) Post Evacuate Collection Set: 3.2ms
[gc,phases ] GC(44269) Other: 2.9ms
[gc,heap ] GC(44269) Eden regions: 1519->0(1855)
[gc,heap ] GC(44269) Survivor regions: 65->65(240)
[gc,heap ] GC(44269) Old regions: 777->777
[gc,heap ] GC(44269) Humongous regions: 19->19
[gc,metaspace ] GC(44269) Metaspace: 193280K->193280K(1230848K)
[gc ] GC(44269) Pause Young (Concurrent Start) (G1 Humongous Allocation) 19024M->6883M(25600M) 97.391ms
[gc,cpu ] GC(44269) User=1.16s Sys=0.01s Real=0.10s

[gc ] GC(44270) Concurrent Cycle // 完成 clearup
[gc,marking ] GC(44270) Concurrent Clear Claimed Marks
[gc,marking ] GC(44270) Concurrent Clear Claimed Marks 0.562ms
[gc,marking ] GC(44270) Concurrent Scan Root Regions
[gc,marking ] GC(44270) Concurrent Scan Root Regions 719.931ms
[gc,marking ] GC(44270) Concurrent Mark (280799.914s)
[gc,marking ] GC(44270) Concurrent Mark From Roots
[gc,task ] GC(44270) Using 3 workers of 3 for marking
[gc,marking ] GC(44270) Concurrent Mark From Roots 2268.905ms
[gc,marking ] GC(44270) Concurrent Preclean
[gc,marking ] GC(44270) Concurrent Preclean 3.078ms
[gc,marking ] GC(44270) Concurrent Mark (280799.914s, 280802.186s) 2272.068ms
[gc,start ] GC(44270) Pause Remark
[gc,stringtable] GC(44270) Cleaned string and symbol table, strings: 87967 processed, 92 removed, symbols: 442773 processed, 13 removed
[gc ] GC(44270) Pause Remark 13740M->13740M(25600M) 32.599ms
[gc,cpu ] GC(44270) User=0.29s Sys=0.00s Real=0.04s
[gc,marking ] GC(44270) Concurrent Rebuild Remembered Sets //重构记忆集
[gc,marking ] GC(44270) Concurrent Rebuild Remembered Sets 1906.792ms
[gc,start ] GC(44270) Pause Cleanup
[gc ] GC(44270) Pause Cleanup 18019M->18019M(25600M) 0.782ms
[gc,cpu ] GC(44270) User=0.00s Sys=0.01s Real=0.00s
[gc,marking ] GC(44270) Concurrent Cleanup for Next Mark
[gc,marking ] GC(44270) Concurrent Cleanup for Next Mark 25.530ms
[gc ] GC(44270) Concurrent Cycle 4963.833ms

[gc,start ] GC(44271) Pause Young (Prepare Mixed) (G1 Evacuation Pause) // Space Reclamation 阶段了,多个 Mixed GC 会进行
[gc,task ] GC(44271) Using 13 workers of 13 for evacuation
[gc,phases ] GC(44271) Pre Evacuate Collection Set: 0.1ms
[gc,phases ] GC(44271) Evacuate Collection Set: 102.6ms
[gc,phases ] GC(44271) Post Evacuate Collection Set: 3.7ms
[gc,phases ] GC(44271) Other: 3.9ms
[gc,heap ] GC(44271) Eden regions: 1855->0(98)
[gc,heap ] GC(44271) Survivor regions: 65->62(240)
[gc,heap ] GC(44271) Old regions: 777->778
[gc,heap ] GC(44271) Humongous regions: 21->19
[gc,metaspace ] GC(44271) Metaspace: 193271K->193271K(1230848K)
[gc ] GC(44271) Pause Young (Prepare Mixed) (G1 Evacuation Pause) 21739M->6869M(25600M) 110.034ms
[gc,cpu ] GC(44271) User=1.32s Sys=0.01s Real=0.10s

[gc,start ] GC(44272) Pause Young (Mixed) (G1 Evacuation Pause)
[gc,task ] GC(44272) Using 13 workers of 13 for evacuation
[gc,phases ] GC(44272) Pre Evacuate Collection Set: 0.4ms
[gc,phases ] GC(44272) Evacuate Collection Set: 150.8ms
[gc,phases ] GC(44272) Post Evacuate Collection Set: 3.2ms
[gc,phases ] GC(44272) Other: 2.3ms
[gc,heap ] GC(44272) Eden regions: 98->0(149)
[gc,heap ] GC(44272) Survivor regions: 62->11(20)
[gc,heap ] GC(44272) Old regions: 778->547
[gc,heap ] GC(44272) Humongous regions: 19->19
[gc,metaspace ] GC(44272) Metaspace: 193271K->193271K(1230848K)
[gc ] GC(44272) Pause Young (Mixed) (G1 Evacuation Pause) 7653M->4605M(25600M) 156.486ms
[gc,cpu ] GC(44272) User=1.95s Sys=0.01s Real=0.15s
[gc,start ] GC(44273) Pause Young (Mixed) (G1 Evacuation Pause)
[gc,task ] GC(44273) Using 13 workers of 13 for evacuation
[gc,phases ] GC(44273) Pre Evacuate Collection Set: 0.2ms
[gc,phases ] GC(44273) Evacuate Collection Set: 122.9ms
[gc,phases ] GC(44273) Post Evacuate Collection Set: 2.0ms
[gc,phases ] GC(44273) Other: 3.1ms
[gc,heap ] GC(44273) Eden regions: 149->0(1900)
[gc,heap ] GC(44273) Survivor regions: 11->20(20)
[gc,heap ] GC(44273) Old regions: 547->520
[gc,heap ] GC(44273) Humongous regions: 19->19
[gc,metaspace ] GC(44273) Metaspace: 193271K->193271K(1230848K)
[gc ] GC(44273) Pause Young (Mixed) (G1 Evacuation Pause) 5797M->4468M(25600M) 128.036ms
[gc,cpu ] GC(44273) User=1.57s Sys=0.01s Real=0.12s

上面是连续几次 GC 的日志,可以对照着 GC 周期来看。

  • GC (44265) 是一次普通的 Young GC里面信息有各种 Region 的变化

这里简单说一下 humongous 对象的处理,humongous 对象在 G1 中是被特殊对待的,G1 只决定它们是否生存,回收他们占用的空间,从不会移动它们。

  • Young-Only 阶段,humongous regions 可能会被回收
  • Space-Reclamation,humongous regions 可能会被回收
  • GC (44269) 开始进入并发阶段
  • GC (44270) 完成了 Cleanup,紧接着一个 Prepare Mixed GC (44271) 的垃圾收集,对应周期虚线右边的蓝实心圆
  • GC (44272) 之后就是 Space Reclamation 阶段了,多个 Mixed GC 会进行

JVM 性能监控工具

我们可以通过以下几种工具辅助分析 JVM 性能瓶颈:

综合组件:

  • VisualVM
  • Glowroot
  • https://arthas.aliyun.com/

thread dump 分析:

  • https://fastthread.io/

gc 日志分析:

  • https://gceasy.io/gc-index.jsp

heap dump 分析:

  • https://www.ibm.com/support/pages/ibm-heapanalyzer
  • https://projects.eclipse.org/projects/tools.mat

参考资料

【GC 停顿预测模型】

  1. http://www.narihiro.info/g1gc-impl-book/scheduling.html
  2. https://sdww2348115.github.io/jvm/g1/PausePredictionModel

【垃圾收集器执行过程】

  1. https://bugs.openjdk.org/browse/JDK-8295118
  2. https://my.oschina.net/u/4273516/blog/4550072

【跨代引用】

  1. https://blog.csdn.net/weixin_47184173/article/details/113627337

【空闲时自动将Java堆内存返回给操作系统】

  1. https://openjdk.org/jeps/346

【其他】

  1. https://docs.oracle.com/javacomponents/jmc-5-4/jfr-runtime-guide/comline.htm#JFRUH197
  2. https://www.redhat.com/en/blog/part-1-introduction-g1-garbage-collector
  3. https://blog.csdn.net/qq_16500963/article/details/132133125
  4. http://cs.williams.edu/~dbarowy/cs334s18/assets/p37-detlefs.pdf
  5. https://tech.meituan.com/2016/09/23/g1.html
  6. https://hllvm-group.iteye.com/group/topic/44381


最后,求关注。如果你还想看更多优质原创文章,欢迎关注我们的公众号「运维开发故事」。


如果我的文章对你有所帮助,还请帮忙一下,你的支持会激励我输出更高质量的文章,非常感谢!


你还可以把我的公众号设为「星标」,这样当公众号文章更新时,你会在第一时间收到推送消息,避免错过我的文章更新。




我是 老郑,《运维开发故事》公众号团队中的一员,Java 程序员,10 余年 Java 互联网项目开发经验,擅长高并发、低延迟分布式交易系统研发。这里不仅有硬核的技术干货,还有我们对技术的思考和感悟,

相关推荐

使用Assembly打包和部署Spring Boot工程

SpringBoot项目的2种部署方式目前来说,SpringBoot项目有如下2种常见的部署方式一种是使用docker容器去部署。将SpringBoot的应用构建成一个docke...

java高级用法之:调用本地方法的利器JNA

简介JAVA是可以调用本地方法的,官方提供的调用方式叫做JNI,全称叫做javanativeinterface。要想使用JNI,我们需要在JAVA代码中定义native方法,然后通过javah命令...

Linux中如何通过Shell脚本来控制Spring Boot的Jar包启停服务?

SpringBoot项目在为开发者带来方便的同时,也带来了一个新的问题就是Jar包如何启动?在一般情况下我们都是采用了最为经典的java-jar命令来进行启动。然后通过ps命令找到对应的应用线程通...

牛逼!自己手写一个热加载(人民币手写符号一个横还是两个横)

热加载:在不停止程序运行的情况下,对类(对象)的动态替换JavaClassLoader简述Java中的类从被加载到内存中到卸载出内存为止,一共经历了七个阶段:加载、验证、准备、解析、初始化、使用、...

java 错误: 找不到或无法加载主类?看看怎么解决吧!

问题扫述:项目名称调整,由原来的com.mp.qms.report.biz调整为com.mp.busicen.mec.qms.report.biz后。项目在IDEA直接运行,但打包部署到服务器...

如何将 Spring Boot 工程打包成独立的可执行 JAR 包

导语:通过将SpringBoot项目打包成独立的可执行JAR包,可以方便地在任何支持Java环境的机器上运行项目。本文将详细介绍如何通过Maven构建插件将SpringBoot...

class 增量发包改造为 jar 包方式发布

大纲class增量发包介绍项目目录结构介绍jar包方式发布落地方案class增量发包介绍当前项目的迭代修复都是通过class增量包来发版本的将改动的代码class增量打包,如下图cla...

Jar启动和IDE里启动Sprintboot的区别

想聊明白这个问题,需要补充一些前提条件,比如Fatjar、类加载机制等1、Fatjar我们在开发业务程序的时候,经常需要引用第三方的jar包,最终程序开发完成之后,通过打包程序,会把自己的代码和三...

Java 20年,以后将往哪儿走?(java还能流行多久)

在今年的Java20周年的庆祝大会中,JavaOne2015的中心议题是“Java的20年”。甲骨文公司Java平台软件开发部的副总裁GeorgesSaab的主题演讲就将关注点放在了java...

Spring Boot Jar 包秒变 Docker 镜像实现多环境部署

你是否在互联网大厂后端开发工作中,遇到过这样的困扰?当完成一个SpringBoot项目开发,准备将Jar包部署到不同环境时,却发现各个环境依赖不同、配置复杂,部署过程繁琐又容易出错,不仅耗费...

从0开始,让你的Spring Boot项目跑在Linux服务器

1搭建Linux服务器1.1购买阿里云服务器或安装虚拟机这里建议是CentOS7.X或CentOS8.X,当然其他的Linux如deepin、Ubuntu也可以,只是软件环境的安装包和安装方式...

【技术】Maven 上传第三方jar包到私服

通过nexus后台上传私服以NexusRepositoryManagerOSS2.14.5-02为例。登录nexus后台。定义Maven坐标Maven坐标有两种方式:1.自定义参数;2....

JVM参数、main方法的args参数使用

一、前言我们知道JVM参数分为自定义参数、JVM系统参数,Javamain方法的参数。今天就谈谈怎么使用吧。二、查看jvm参数定义自定义参数我们打开cmd窗口,输入java,就能看到自定义参数的格式...

Maven项目如何发布jar包到Nexus私服

Maven项目发布jar包到Nexus私服在编码过程中,有些通用的代码模块,有时候我们不想通过复制粘贴来粗暴地复用。因为这样不仅体现不了变化,也不利于统一管理。这里我们使用mavendeploy的方...

干货丨Hadoop安装步骤!详解各目录内容及作用

Hadoop是Apache基金会面向全球开源的产品之一,任何用户都可以从ApacheHadoop官网下载使用。今天,播妞将以编写时较为稳定的Hadoop2.7.4版本为例,详细讲解Hadoop的安...