如何使用 Prometheus 监控 Linux 服务器性能
liuian 2025-09-18 22:48 22 浏览
使用 Prometheus 监控 Linux 服务器性能 是一套强大且灵活的解决方案,可以帮助你实时监控服务器的 CPU、内存、磁盘、网络等性能指标。以下是从安装到配置的完整指南,包括如何使用 Prometheus 和 Node Exporter 进行监控。
1. Prometheus 和 Node Exporter 简介
- Prometheus:
- 一个开源的监控工具,用于收集和存储时间序列数据(如服务器性能)。
- 提供强大的查询语言(PromQL)以及内置的警报功能。
- Node Exporter:
- 一个 Prometheus 的官方导出器,用于收集 Linux 系统的性能指标,如 CPU 使用率、内存使用、磁盘 I/O、网络等。
- 运行在每个需要监控的 Linux 服务器上。
2. 环境准备
在安装和配置之前,请确保以下条件满足:
- Linux 服务器: 一台用于安装 Prometheus 的服务器(监控主机)。 一台或多台需要被监控的 Linux 服务器。
- Root 权限:安装过程中需要 root 或 sudo 权限。
- 网络连通性:监控主机需能访问被监控服务器的指定端口(默认 9100)。
3. 安装和配置步骤
3.1 安装 Prometheus(监控主机)
步骤 1:下载 Prometheus
- 前往 Prometheus 官方下载页面:https://prometheus.io/download/。
- 或使用以下命令下载最新版本(以 v2.47.0 为例):
- bash
- 复制
- wget https://github.com/prometheus/prometheus/releases/download/v2.47.0/prometheus-2.47.0.linux-amd64.tar.gz
步骤 2:解压 Prometheus
bash
复制
tar -xvzf prometheus-2.47.0.linux-amd64.tar.gz
cd prometheus-2.47.0.linux-amd64
步骤 3:运行 Prometheus
- 使用默认配置启动 Prometheus:
- bash
- 复制
- ./prometheus --config.file=prometheus.yml
- 默认 Prometheus 会监听在 http://<监控主机IP>:9090。
3.2 安装 Node Exporter(被监控服务器)
步骤 1:下载 Node Exporter
- 前往 Node Exporter 官方页面:https://prometheus.io/download/。
- 或使用以下命令下载最新版本(以 v1.6.1 为例):
- bash
- 复制
- wget https://github.com/prometheus/node_exporter/releases/download/v1.6.1/node_exporter-1.6.1.linux-amd64.tar.gz
步骤 2:解压并运行
bash
复制
tar -xvzf node_exporter-1.6.1.linux-amd64.tar.gz
cd node_exporter-1.6.1.linux-amd64
./node_exporter
- 默认 Node Exporter 会监听在 http://<服务器IP>:9100。
步骤 3:设置为系统服务(可选,确保自动启动)
- 创建 Systemd 服务文件:
- bash
- 复制
- sudo nano /etc/systemd/system/node_exporter.service
- 添加以下内容:
- ini
- 复制
- [Unit] Description=Node Exporter After=network.target [Service] User=nobody ExecStart=/path/to/node_exporter [Install] WantedBy=default.target
- 替换 /path/to/node_exporter 为 Node Exporter 的实际路径。
- 启用并启动服务:
- bash
- 复制
- sudo systemctl daemon-reload sudo systemctl enable node_exporter sudo systemctl start node_exporter
3.3 配置 Prometheus
步骤 1:修改 Prometheus 配置文件
- 编辑 prometheus.yml 文件:
- bash
- 复制
- nano prometheus.yml
- 添加被监控服务器节点信息:
- yaml
- 复制
- scrape_configs: - job_name: 'node_exporter' static_configs: - targets: - '<被监控服务器IP>:9100' - '<其他被监控服务器IP>:9100'
- 示例:
- yaml
- 复制
- scrape_configs: - job_name: 'node_exporter' static_configs: - targets: - '192.168.1.101:9100' - '192.168.1.102:9100'
步骤 2:重启 Prometheus
bash
复制
./prometheus --config.file=prometheus.yml
3.4 验证安装
- 检查 Prometheus 状态:
- 打开浏览器,访问 http://<Prometheus主机IP>:9090。
- 在页面顶部输入查询 up,查看 Node Exporter 是否已成功连接。
- 检查指标数据:
- 在 Prometheus 的查询界面输入以下指标: node_cpu_seconds_total:查看 CPU 使用情况。 node_memory_MemAvailable_bytes:查看可用内存。 node_network_transmit_bytes_total:查看网络传输数据。
4. 配置 Grafana 可视化(可选)
4.1 安装 Grafana
- 下载并安装 Grafana:
- bash
- 复制
- sudo apt-get install -y grafana # Debian/Ubuntu sudo yum install -y grafana # CentOS/RHEL
- 启动服务:
- bash
- 复制
- sudo systemctl start grafana-server sudo systemctl enable grafana-server
- 默认访问地址:http://<服务器IP>:3000(默认账户:admin/admin)。
4.2 配置 Prometheus 数据源
- 登录 Grafana。
- 在左侧菜单中选择 Configuration > Data Sources。
- 添加一个新的数据源,选择 Prometheus,并配置 URL 为 http://<Prometheus主机IP>:9090。
4.3 使用现成的 Grafana Dashboard
- 前往 Grafana Dashboard 共享库。
- 搜索并下载 Node Exporter Full Dashboard(常用 ID:1860)。
- 在 Grafana 导入该 Dashboard,并选择 Prometheus 数据源。
5. Prometheus 监控的关键指标
以下是 Prometheus 监控 Linux 服务器时常用的指标:
指标 | 用途 |
node_cpu_seconds_total | CPU 使用率(以秒为单位)。 |
node_memory_MemAvailable_bytes | 可用内存总量(字节)。 |
node_memory_MemTotal_bytes | 系统总内存(字节)。 |
node_filesystem_avail_bytes | 磁盘可用空间(字节)。 |
node_network_transmit_bytes_total | 网络发送的总字节数。 |
node_network_receive_bytes_total | 网络接收的总字节数。 |
node_load1 | 过去 1 分钟的系统平均负载。 |
6. 警报配置(可选)
Prometheus 支持通过 Alertmanager 配置警报。以下是简单的警报配置示例:
- 在 prometheus.yml 中添加警报规则:
- yaml
- 复制
- rule_files: - "alert.rules"
- 创建 alert.rules 文件:
- yaml
- 复制
- groups: - name: example_alerts rules: - alert: HighCPUUsage expr: avg(rate(node_cpu_seconds_total[1m])) > 0.9 for: 1m labels: severity: warning annotations: description: "CPU usage is above 90% for the past 1 minute."
- 重启 Prometheus。
7. 总结
通过 Prometheus 和 Node Exporter,你可以轻松实现对 Linux 服务器性能的全面监控。以下是关键步骤:
- 安装 Prometheus 并配置监控主机。
- 在每台被监控服务器上安装 Node Exporter。
- 配置 Prometheus 采集指标数据,并通过 PromQL 查询关键性能指标。
- (可选)结合 Grafana 实现数据可视化和警报。
这种监控方案灵活、可靠且开源,非常适合企业和个人使用。
相关推荐
-
- 打印机驱动一直安装失败(打印机驱动一直安装失败怎么办)
-
打印机驱动程序安装失败需要对电脑进行其他设置,详细步骤如下:1,在电脑桌面上找到【计算机】并用鼠标右击。2,右击后在出现的选项中找到【管理】选项并点击打开。3,接下里会进入到计算机控制台界面,在这里要根据自己的电脑选择64位或者32位,选择...
-
2026-01-14 12:55 liuian
- ctrl加谁是截图(ctrl和什么键可以截图)
-
第一种:Ctrl+PrScrn使用这个组合键截屏,获得的是整个屏幕的图片第二种:Alt+PrScrn这个组合键截屏,获得的结果是当前窗口的图片第三种:打开qq,使用快捷键Ctrl+...
- 技嘉主板bios设置启动顺序(技嘉主板bios设置启动顺序怎么设置)
-
启动顺序设置方法如下:1、重启电脑连续按[DEL]键进入BIOS设置,按DEL进入BIOS设置。2、按键盘方向键右键切换到BOOT选项,将windows10功能设置为"其它操作系统"...
-
- 目前台式电脑主机怎么选(台式主机选择)
-
每个人对电脑的性需要不同,因此根据自己家的家庭需要,选择合适的电脑即可。以下简单说明:1,双核处理器+2G内存+集成显卡+机械硬盘。性能满足上网、看电影、聊天、办公、玩象棋之类的小游戏。价格在2000以内可以买到;2,四核处理器+4G内存+...
-
2026-01-14 12:05 liuian
- 台式电脑如何用u盘重装系统(台式电脑如何用u盘重装系统应用)
-
1、重启电脑并进入BIOS;2、在BIOS中设置启动顺序,优先从U盘启动;3、从U盘启动,进入安装界面;4、选择安装语言、时区和键盘设置;5、选择安装方式,一般选择“清除整个硬盘并安装”;6、配置分区...
-
- stop0x0000007b蓝屏(stop0X0000007b蓝屏,修改注册表)
-
步骤/方式1将电脑送到当地的维修店步骤/方式2然后将师傅维修一下蓝屏的问题当电脑启动蓝屏出现错误代码0x0000007b时,首先我们将电脑重启,在开机时不停按启动热键进入到bios设置页面,进入页面后找到“IntegratedPeriphe...
-
2026-01-14 11:21 liuian
- 怎样设置默认打印机(打印机设置彩色打印在哪里设置)
-
步骤如下:1.单击Windows“开始”菜单,指向“设置”,单击“打印机”,打开“打印机”窗口。2.右键单击打印机图标,系统弹出快速菜单,单击其中的“设为默认值”。如果“打印机”窗口没有当前使用的打印...
- 机械硬盘坏了能修吗(机械硬盘损坏可以修复吗)
-
硬盘修复是很多人都可能会面临的难关。硬盘是计算机上最重要的组成部分,是计算机上的数据存储设备,因此一旦硬盘发生故障,用户很可能会丢失所有数据。况且硬盘是机械设备,有一定的使用寿命,长时间使用出现故障...
- win7正版怎么下载(我告诉你怎么下载win7)
-
如题,题主想在红警之家下载红警,很简单,可以用迅雷下载软件下载,下载以后用解压软件解压就行了,但是红警这款软件在winxp系统下,是最理想的,7系统下面会出现闪退的情况。下载很容易的,闪退的时候,设置...
- 电脑关机脚本bat命令(win10关机bat脚本)
-
bat关机命令需要使用文本文档。使用文本文档制作bat关机命令步骤如下所示:1、在电脑桌面空白处点击鼠标右键。2、在鼠标右键菜单中,选择新建文本文档。3、点击打开文本文档。4、在新建文本文档中输入关机...
- fat32格式是什么意思(u盘fAT32格式是什么意思)
-
是一种分区格式。这种格式使用32位文件分配表,大大提高了磁盘的管理能力,打破了每个分区只有4GB的FAT16限制。对于使用FAT32文件系统的每个逻辑盘内部空间又可划分为三部分,依次是引导区(BOO...
-
- 手机系统更新软件(手机系统更新软件不更新会怎样)
-
第一步:打开苹果手机的设置,点击“通用”选项进入。第二步:选择“软件更新”选项进入第三步:在软件更新界面,如果有新的更新,点击“下载并安装”即可!应用商店里一键更新。在手机软件里,为了更新最新版本可以进软件商店里面找一下,更新点一下,然后它...
-
2026-01-14 09:37 liuian
- 联想小新如何重装系统(联想小新重装系统怎么操作)
-
联想小新重装系统,方法∶在关机状态下,按下电脑的一键恢复按钮(需确保笔记本屏盖在打开状态)。首先找到按键孔,用针对准插孔,捅一下,电脑启动,进入启动选择界面,选择systemrecovery,按回车...
- 一周热门
-
-
飞牛OS入门安装遇到问题,如何解决?
-
如何在 iPhone 和 Android 上恢复已删除的抖音消息
-
Boost高性能并发无锁队列指南:boost::lockfree::queue
-
大模型手册: 保姆级用CherryStudio知识库
-
用什么工具在Win中查看8G大的log文件?
-
如何在 Windows 10 或 11 上通过命令行安装 Node.js 和 NPM
-
威联通NAS安装阿里云盘WebDAV服务并添加到Infuse
-
Trae IDE 如何与 GitHub 无缝对接?
-
idea插件之maven search(工欲善其事,必先利其器)
-
如何修改图片拍摄日期?快速修改图片拍摄日期的6种方法
-
- 最近发表
- 标签列表
-
- python判断字典是否为空 (50)
- crontab每周一执行 (48)
- aes和des区别 (43)
- bash脚本和shell脚本的区别 (35)
- canvas库 (33)
- dataframe筛选满足条件的行 (35)
- gitlab日志 (33)
- lua xpcall (36)
- blob转json (33)
- python判断是否在列表中 (34)
- python html转pdf (36)
- 安装指定版本npm (37)
- idea搜索jar包内容 (33)
- css鼠标悬停出现隐藏的文字 (34)
- linux nacos启动命令 (33)
- gitlab 日志 (36)
- adb pull (37)
- python判断元素在不在列表里 (34)
- python 字典删除元素 (34)
- vscode切换git分支 (35)
- python bytes转16进制 (35)
- grep前后几行 (34)
- hashmap转list (35)
- c++ 字符串查找 (35)
- mysql刷新权限 (34)
