百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT知识 > 正文

JVM调优,快速定位服务CPU过高,有理论配合实战,还不快收藏?

liuian 2025-04-27 14:44 52 浏览

JVM调优 | 快速定位服务CPU过高(理论)

在生产环境中,有时会遇到一些CPU占用过高,一直下不去的场景。出现这种情况,可能会导致服务对外中断,服务器超负荷运行影响硬件寿命。这篇文章从实践出发,一步一步地分析如何使用 topjstack 命令快速定位问题代码位置。

一、top命令

top (table of processes) is a task manager program, found in many Unix-like operating systems, that displays information about CPU and memory utilization.

维基百科 解释到,top (进程表)是一个任务管理器程序,可以在许多类 unix 操作系统中找到,它显示有关 CPU 和内存使用情况的信息。

同时,top命令是Linux下常用的性能分析工具,能够实时显示系统中各个进程的资源占用状况,类似于Windows的任务管理器。比较准确的说,top命令提供了实时的对系统处理器的状态监视.它将显示系统中CPU最“敏感”的任务列表.该命令可以按 CPU使用内存使用执行时间 对任务进行排序。

上图是一个 Centos 7 系统,执行top命令后瞬时的展示信息。

  • 第一行描述系统的信息,包括开机时间、用户登录、CPU整体负载
  • 第二行描述任务总体执行情况,即各类进程占比情况
  • 第三行描述CPU总体信息,比如空闲占比等
  • 第四行描述物理内存占比情况
  • 第五行描述交换区占比情况
  • 动态的列表描述的详细进程各项信息,比如 PID 进程ID, %CPU 进程占用CPU的使用率, TIME+ 该进程启动后占用的总的CPU时间,即占用CPU使用时间的累加值。

一般linux系统会自带top命令,还有另外一个命令行工具 htop ,有时需要自行安装,它与传统的 top 命令功能一样,但它有更加强大的功能及能显示更多的信息。

二、 jstack命令

jstack prints Java stack traces of Java threads for a given Java process or core file or a remote debug server。

oracle官网 解释到,Jstack 打印给定 Java 进程或核心文件或远程调试服务器的 Java 线程的 Java 堆栈跟踪。

对于每个 Java 框架,使用jstack指令将打印完整的类名、方法名、“ bci”(字节码索引)和行号(如果可用)。使用-m 选项,jstack 将打印所有线程的 Java 和本机帧以及“ pc”(程序计数器)。

用法很简单,如下图。

一般说,我们会先使用 jps 命令显示当前所有java进程pid的命令。

$jps

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(
img-XZxLXjOe-1628255428026)(
https://upload-images.jianshu.io/upload_images/26464854-8cd522cd811debd3.png?
imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)]

然后再执行对执行进程ID 执行 jstack。

$ jstack 15673

如果明确自己的Java进程ID,当然直接使用 jstack指令即可。

三、实战

3.1 实战之前准备

先写一个简单的榨干CPU的例子 CpuDryOutExample.java ,内容相当的easy,就是在无中断条件的循环语句中,不断地执行打印内容操作。

写个例子

public class CpuDryOutExample {

    public static void dryOut() {
        while (true) {
            System.out.println("dry out utilization rate of cpu");
            //do something
        }
    }

    public static void main(String[] args) {
        CpuDryOutExample.dryOut();
    }
}

编译

$javac CpuDryOutExample.java

输出 CpuDryOutExample.class ,注意最好去掉java文件里面的package,否则编译过程中很有可能会报找不到main方法,当然你编译时特殊处理也行。

运行

CpuDryOutExample.class 上传到 Centos 7 服务器上,该服务器已经预先配置好了Java运行环境(JRE),然后执行下面命令运行程序。

$java CpuDryOutExample

此时屏幕疯狂输入 dry out utilization rate

3.2 定位问题

定位的核心是三个步骤

  • 找到CPU占用率比较高的进程ID
  • 在指定进程ID的进程中寻找进程CPU占用率比较高的线程ID
  • 通过线程ID去搜索打印出的进程堆栈日志,定位到具体的问题

找到CPU占用率比较高的进程ID

在终端上输入 top 命令

$top

可以明显的看出PID为9573的进程CPU占用率最高,我们使用 htop 命令会更加直观一点。

查看进程里面线程运行的信息

我们都知道线程是处理器任务调度和执行的基本单位,一个进程下是是包含多个线程。进程粒度还是过大,不便于我们定位到具体的代码位置,我们需要找到具体是哪个线程过度使用CPU。

我们还是使用 top 命令。

//-H 显示线程信息,-p指定pid jstack 线程ID 
#$top -Hp 9573

图上可以真正的看出,使CPU使用率暴涨的罪魁祸首是线程 9574。当然使用 htop 我们也能很快的定位到具体线程。

分析过滤定位问题

因为线程ID在堆栈日志中是以16进制呈现,我们先进行进制转换。

$printf %s 9574

然后打印堆栈日志到临时文件1.txt

# 注意是进程ID
$jstack 9573 > 1.txt

然后在文件中搜索线程所在位置

//在文件中搜索过滤并打印30条数据
$cat 1.txt | grep -A 30 2566

可以清楚的看到,红框位置就是具体问题代码。

四、总结

除了使用 top/htop + jstack 命令的方式,我们也可以使用 JMC 快速定位CPU占用率过高的问题,虽然 JMC 确实比前者更加简单高效,但是只能使用JMX实现远程连接,如果部署的服务没有启用JMX是用不上这个工具。

那么回到问题的根源,什么场景会导致CPU占用率过高呢?

序列化和反序列(使用合理的类库)

正则表达式(回溯导致,避免回溯)

频繁GC,GC线程频发执行垃圾回收算法(降低GC频率)

频繁 的线程上下文切换(降低切换的频率,根据业务合理建立线程池)

无限while循环(尽量有限循环,即设置中断条件,让循环执行的慢一点,即 Thead.yield

频繁创建新对象(合理使用单例)

原文链接:
https://blog.51cto.com/u_15477630/5051043?utm_source=tuicool&utm_medium=referral

相关推荐

eino v0.4.5版本深度解析:接口类型处理优化与错误机制全面升级

近日,eino框架发布了v0.4.5版本,该版本在错误处理、类型安全、流处理机制以及代理配置注释等方面进行了多项优化与修复。本次更新共包含6个提交,涉及10个文件的修改,由2位贡献者共同完成。本文将详...

SpringBoot异常处理_springboot异常注解

在SpringBoot中,异常处理是构建健壮、可维护Web应用的关键部分。良好的异常处理机制可以统一返回格式、提升用户体验、便于调试和监控。以下是SpringBoot中处理异常的完整指...

Jenkins运维之路(Jenkins流水线改造Day02-1-容器项目)

这回对线上容器服务器的流水线进行了一定的改造来满足目前线上的需求,还是会将所有的自动化脚本都放置到代码库中统一管理,我感觉一章不一定写的完,所以先给标题加了个-1,话不多说开干1.本次流水线的流程设计...

告别宕机!零基础搭建服务器监控告警系统!小白也能学会!

前言本文将带你从零开始,一步步搭建一个完整的服务器指标监控与邮件告警系统,使用的技术栈均为业界主流、稳定可靠的开源工具:Prometheus:云原生时代的监控王者,擅长指标采集与告警规则定义Node_...

httprunner实战接口测试笔记,拿走不谢

每天进步一点点,关注我们哦,每天分享测试技术文章本文章出自【码同学软件测试】码同学公众号:自动化软件测试码同学抖音号:小码哥聊软件测试01开始安装跟创建项目pipinstallhttprunne...

基于JMeter的性能压测平台实现_jmeter压测方案

这篇文章已经是两年前写的,短短两年时间,JMeter开源应用技术的发展已经是翻天覆地,最初由github开源项目zyanycall/stressTestPlatform形成的这款测试工具也开始慢...

12K+ Star!新一代的开源持续测试工具!

大家好,我是Java陈序员。在企业软件研发的持续交付流程中,测试环节往往是影响效率的关键瓶颈,用例管理混乱、接口调试复杂、团队协作不畅、与DevOps流程脱节等问题都能影响软件交付。今天,给大家...

Spring Boot3 中分库分表之后如何合并查询

在当今互联网应用飞速发展的时代,数据量呈爆发式增长。对于互联网软件开发人员而言,如何高效管理和查询海量数据成为了一项关键挑战。分库分表技术应运而生,它能有效缓解单库单表数据量过大带来的性能瓶颈。而在...

离线在docker镜像方式部署ragflow0.17.2

经常项目上会出现不能连外网的情况,要怎么使用ragflow镜像部署呢,这里提供详细的步骤。1、下载基础镜像根据docker-compose-base.yml及docker-compose.yml中的i...

看,教你手写一个最简单的SpringBoot Starter

何为Starter?想必大家都使用过SpringBoot,在SpringBoot项目中,使用最多的无非就是各种各样的Starter了。那何为Starter呢?你可以理解为一个可拔插式...

《群星stellaris》军事基地跳出怎么办?解决方法一览

《群星stellaris》军事基地跳出情况有些小伙伴出现过这种情况,究竟该怎么解决呢?玩家“gmjdadk”分享的自己的解决方法,看看能不能解决。我用英文原版、德语、法语和俄语四个版本对比了一下,结果...

数据开发工具dbt手拉手教程-03.定义数据源模型

本章节介绍在dbt项目中,如何定义数据源模型。定义并引入数据源通过Extract和Load方式加载到仓库中的数据,可以使用dbt中的sources组件进行定义和描述。通过在dbt中将这些数据集(表)声...

docker compose 常用命令手册_docker-compose init

以下是DockerCompose常用命令手册,按生命周期管理、服务运维、构建配置、扩缩容、调试工具分类,附带参数解析、示例和关键说明,覆盖多容器编排核心场景:一、生命周期管理(核心命令...

RagFlow与DeepSeek R1本地知识库搭建详细步骤及代码实现

一、环境准备硬件要求独立显卡(建议NVIDIAGPU,8GB显存以上)内存16GB以上,推荐32GB(处理大规模文档时更高效)SSD硬盘(加速文档解析与检索)软件安装bash#必装组件Docker...

Docker Compose 配置更新指南_docker-compose配置

高效管理容器配置变更的最佳实践方法重启范围保留数据卷适用场景docker-composeup-d变更的服务常规配置更新--force-recreate指定/所有服务强制重建down→up流程...