如何在 Kubernetes HPA 中使用自定义指标实现自动扩缩容
liuian 2025-01-13 15:32 30 浏览
如何在 Kubernetes HPA 中使用自定义指标实现自动扩缩容
Kubernetes 的 Horizontal Pod Autoscaler(HPA)不仅支持基于 CPU 和内存的自动扩缩容,还支持基于自定义指标的自动扩缩容。自定义指标可以是应用的业务指标,例如每秒请求数(QPS)、消息队列长度、数据库连接数等。通过自定义指标,HPA 可以更灵活地根据业务需求调整 Pod 的副本数。
本文将详细介绍如何在 Kubernetes 中配置和使用自定义指标的 HPA,并结合 Prometheus 和 Prometheus Adapter 实现自定义指标的自动扩缩容。
1. 自定义指标的工作原理
HPA 的自定义指标功能依赖于 Kubernetes 的 Custom Metrics API。Custom Metrics API 允许用户将自定义指标暴露给 Kubernetes,HPA 可以通过这些指标动态调整 Pod 的副本数。
1.1 核心组件
- Prometheus:用于收集和存储自定义指标。
- Prometheus Adapter:将 Prometheus 的指标暴露给 Kubernetes 的 Custom Metrics API。
HPA:根据自定义指标调整 Pod 的副本数。
1.2 工作流程
- Prometheus 收集应用的业务指标(如 QPS)。
- Prometheus Adapter 从 Prometheus 中读取指标,并通过 Custom Metrics API 暴露给 Kubernetes。
- HPA 从 Custom Metrics API 获取指标值,并根据目标值调整 Pod 的副本数。
2. 前提条件
在配置自定义指标的 HPA 之前,请确保您的 Kubernetes 集群满足以下条件:
- 安装 Prometheus
- 使用 Helm 或手动部署 Prometheus。
- 确保 Prometheus 能够收集应用的业务指标。
- 安装 Prometheus Adapter
Prometheus Adapter 是连接 Prometheus 和 Kubernetes Custom Metrics API 的桥梁。
使用以下命令安装 Prometheus Adapter:
kubectl apply -f https://github.com/kubernetes-sigs/prometheus-adapter/releases/latest/download/components.yaml
配置资源请求
HPA 需要 Pod 配置资源请求(requests),例如 CPU 和内存。如果未配置资源请求,HPA 将无法正常工作。
3. 配置自定义指标的 HPA
3.1 部署示例应用
首先,我们部署一个示例应用,并确保 Prometheus 能够收集该应用的指标。以下是一个简单的 Nginx Deployment 示例:
apiVersion: apps/v1
kind: Deployment
metadata:
name: nginx-deployment
spec:
replicas: 2
selector:
matchLabels:
app: nginx
template:
metadata:
labels:
app: nginx
spec:
containers:
- name: nginx
image: nginx:1.14.2
resources:
requests:
cpu: "200m"
memory: "128Mi"
使用以下命令创建 Deployment:
kubectl apply -f nginx-deployment.yaml
3.2 配置 Prometheus Adapter
Prometheus Adapter 需要配置规则,以将 Prometheus 的指标暴露给 Kubernetes。以下是一个示例配置:
rules:
- seriesQuery: 'http_requests_total{namespace!="",pod!=""}'
resources:
overrides:
namespace: {resource: "namespace"}
pod: {resource: "pod"}
name:
matches: "^(.*)_total"
as: "${1}_per_second"
metricsQuery: 'sum(rate(<<.Series>>{<<.LabelMatchers>>}[2m])) by (<<.GroupBy>>)'
- seriesQuery:查询 Prometheus 中的指标。
- resources:将 Prometheus 的标签映射到 Kubernetes 资源。
- name:将 Prometheus 的指标名称转换为 Kubernetes 可识别的名称。
- metricsQuery:定义如何计算指标值。
kubectl apply -f prometheus-adapter-config.yaml
3.3 创建基于自定义指标的 HPA
以下是一个基于自定义指标(每秒请求数)的 HPA 示例:
apiVersion: autoscaling/v2
kind: HorizontalPodAutoscaler
metadata:
name: custom-metric-hpa
spec:
scaleTargetRef:
apiVersion: apps/v1
kind: Deployment
name: nginx-deployment
minReplicas: 2
maxReplicas: 10
metrics:
- type: Pods
pods:
metric:
name: http_requests_per_second
target:
type: AverageValue
averageValue: 100
- metric.name:自定义指标的名称(与 Prometheus Adapter 配置中的名称一致)。
- target.type:指标的目标类型,可以是 AverageValue 或 Value。
- target.averageValue:目标值,表示每个 Pod 的平均指标值。
使用以下命令创建 HPA:
kubectl apply -f custom-metric-hpa.yaml
3.4 验证 HPA
创建 HPA 后,可以通过以下命令查看 HPA 的状态:
kubectl get hpa
输出示例:
NAME REFERENCE TARGETS MINPODS MAXPODS REPLICAS AGE
custom-metric-hpa Deployment/nginx-deployment 100/100 2 10 2 1m
- TARGETS:当前指标值与目标值的比率。
- REPLICAS:当前的 Pod 副本数。
4. 测试自定义指标的 HPA
4.1 增加负载
使用 kubectl run 创建一个临时的 Pod 来模拟负载:
kubectl run -i --tty load-generator --image=busybox --restart=Never -- /bin/sh -c "while true; do wget -q -O- http://nginx-deployment; done"
4.2 观察 HPA 变化
通过以下命令观察 HPA 的变化:
kubectl get hpa -w
当每秒请求数超过目标值(100)时,HPA 会自动增加 Pod 的副本数。
4.3 减少负载
停止负载生成 Pod:
kubectl delete pod load-generator
当负载降低后,HPA 会自动减少 Pod 的副本数。
5. 最佳实践
5.1 合理选择自定义指标
- 选择与业务需求密切相关的指标,例如 QPS、队列长度等。
- 避免选择过于频繁变化的指标,以免导致频繁扩缩容。
5.2 配置冷却时间
- 通过调整 HPA 的冷却时间,避免频繁扩缩容。
- 扩容冷却时间默认 3 分钟,缩容冷却时间默认 5 分钟。
5.3 监控 HPA 行为
- 使用 Prometheus 和 Grafana 监控 HPA 的行为,确保其按预期工作。
- 定期检查 HPA 的状态和日志,及时发现和解决问题。
6. 总结
通过自定义指标的 HPA,Kubernetes 可以根据业务需求动态调整 Pod 的副本数,从而实现更灵活的自动扩缩容。本文介绍了如何配置基于自定义指标的 HPA,并结合 Prometheus 和 Prometheus Adapter 实现自定义指标的自动扩缩容。
相关推荐
- Python生态下的微服务框架FastAPI
-
FastAPI是什么FastAPI是一个用于构建API的web框架,使用Python并基于标准的Python类型提示。与flask相比有什么优势高性能:得益于uvloop,可达到与...
- SpringBoot:如何解决跨域问题,详细方案和示例代码
-
跨域问题在前端开发中经常会遇到,特别是在使用SpringBoot框架进行后端开发时。解决跨域问题的方法有很多,我将为你提供一种详细的方案,包含示例代码。首先,让我们了解一下什么是跨域问题。跨域是指在...
- 使用Nginx轻松搞定跨域问题_使用nginx轻松搞定跨域问题的方法
-
跨域问题(Cross-OriginResourceSharing,简称CORS)是由浏览器的同源策略引起的。同源策略指的是浏览器限制来自不同源(协议、域名、端口)的JavaScript对资源的...
- spring boot过滤器与拦截器的区别
-
有小伙伴使用springboot开发多年,但是对于过滤器和拦截器的主要区别依然傻傻分不清。今天就对这两个概念做一个全面的盘点。定义与作用范围过滤器(Filter):过滤器是一种可以动态地拦截、处理和...
- nginx如何配置跨域_nginx配置跨域访问
-
要在Nginx中配置跨域,可以使用add_header指令来添加Access-Control-Allow-*头信息,如下所示:location/api{if($reques...
- 解决跨域问题的8种方法,含网关、Nginx和SpringBoot~
-
跨域问题是浏览器为了保护用户的信息安全,实施了同源策略(Same-OriginPolicy),即只允许页面请求同源(相同协议、域名和端口)的资源,当JavaScript发起的请求跨越了同源策略,...
- 图解CORS_图解数学
-
CORS的全称是Cross-originresourcesharing,中文名称是跨域资源共享,是一种让受限资源能够被其他域名的页面访问的一种机制。下图描述了CORS机制。一、源(Orig...
- CORS 幕后实际工作原理_cors的工作原理
-
跨域资源共享(CORS)是Web浏览器实施的一项重要安全机制,用于保护用户免受潜在恶意脚本的攻击。然而,这也是开发人员(尤其是Web开发新手)感到沮丧的常见原因。小编在此将向大家解释它存在...
- 群晖无法拉取Docker镜像?最稳定的方法:搭建自己的加速服务!
-
因为未知的原因,国内的各大DockerHub镜像服务器无法使用,导致在使用群晖时无法拉取镜像构建容器。网上大部分的镜像加速服务都是通过Cloudflare(CF)搭建的,为什么都选它呢?因为...
- Sa-Token v1.42.0 发布,新增 API Key、TOTP 验证码等能力
-
Sa-Token是一款免费、开源的轻量级Java权限认证框架,主要解决:登录认证、权限认证、单点登录、OAuth2.0、微服务网关鉴权等一系列权限相关问题。目前最新版本v1.42.0已...
- NGINX常规CORS错误解决方案_nginx配置cors
-
CORS错误CORS(Cross-OriginResourceSharing,跨源资源共享)是一种机制,它使用额外的HTTP头部来告诉浏览器允许一个网页运行的脚本从不同于它自身来源的服务器上请求资...
- Spring Boot跨域问题终极解决方案:3种方案彻底告别CORS错误
-
引言"接口调不通?前端同事又双叒叕在吼跨域了!""明明Postman能通,浏览器却报OPTIONS403?""生产环境跨域配置突然失效,凌晨3点被夺命连环Ca...
- SpringBoot 项目处理跨域的四种技巧
-
上周帮一家公司优化代码时,顺手把跨域的问题解决了,这篇文章,我们聊聊SpringBoot项目处理跨域的四种技巧。1什么是跨域我们先看下一个典型的网站的地址:同源是指:协议、域名、端口号完全相...
- Spring Cloud入门看这一篇就够了_spring cloud使用教程
-
SpringCloud微服务架构演进单体架构垂直拆分分布式SOA面向服务架构微服务架构服务调用方式:RPC,早期的webservice,现在热门的dubbo,都是RPC的典型代表HTTP,HttpCl...
- 前端程序员:如何用javascript开发一款在线IDE?
-
前言3年前在AWSre:Invent大会上AWS宣布推出Cloud9,用于在云端编写、运行和调试代码,它可以直接运行在浏览器中,也就是传说中的WebIDE。3年后的今天随着国内云计算的发...
- 一周热门
-
-
【验证码逆向专栏】vaptcha 手势验证码逆向分析
-
Python实现人事自动打卡,再也不会被批评
-
Psutil + Flask + Pyecharts + Bootstrap 开发动态可视化系统监控
-
一个解决支持HTML/CSS/JS网页转PDF(高质量)的终极解决方案
-
再见Swagger UI 国人开源了一款超好用的 API 文档生成框架,真香
-
网页转成pdf文件的经验分享 网页转成pdf文件的经验分享怎么弄
-
C++ std::vector 简介
-
飞牛OS入门安装遇到问题,如何解决?
-
系统C盘清理:微信PC端文件清理,扩大C盘可用空间步骤
-
10款高性能NAS丨双十一必看,轻松搞定虚拟机、Docker、软路由
-
- 最近发表
- 标签列表
-
- python判断字典是否为空 (50)
- crontab每周一执行 (48)
- aes和des区别 (43)
- bash脚本和shell脚本的区别 (35)
- canvas库 (33)
- dataframe筛选满足条件的行 (35)
- gitlab日志 (33)
- lua xpcall (36)
- blob转json (33)
- python判断是否在列表中 (34)
- python html转pdf (36)
- 安装指定版本npm (37)
- idea搜索jar包内容 (33)
- css鼠标悬停出现隐藏的文字 (34)
- linux nacos启动命令 (33)
- gitlab 日志 (36)
- adb pull (37)
- python判断元素在不在列表里 (34)
- python 字典删除元素 (34)
- vscode切换git分支 (35)
- python bytes转16进制 (35)
- grep前后几行 (34)
- hashmap转list (35)
- c++ 字符串查找 (35)
- mysql刷新权限 (34)