百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT知识 > 正文

如何在 Kubernetes HPA 中使用自定义指标实现自动扩缩容

liuian 2025-01-13 15:32 30 浏览

如何在 Kubernetes HPA 中使用自定义指标实现自动扩缩容

Kubernetes 的 Horizontal Pod Autoscaler(HPA)不仅支持基于 CPU 和内存的自动扩缩容,还支持基于自定义指标的自动扩缩容。自定义指标可以是应用的业务指标,例如每秒请求数(QPS)、消息队列长度、数据库连接数等。通过自定义指标,HPA 可以更灵活地根据业务需求调整 Pod 的副本数。


本文将详细介绍如何在 Kubernetes 中配置和使用自定义指标的 HPA,并结合 Prometheus 和 Prometheus Adapter 实现自定义指标的自动扩缩容。

1. 自定义指标的工作原理

HPA 的自定义指标功能依赖于 Kubernetes 的 Custom Metrics API。Custom Metrics API 允许用户将自定义指标暴露给 Kubernetes,HPA 可以通过这些指标动态调整 Pod 的副本数。

1.1 核心组件

  • Prometheus:用于收集和存储自定义指标。
  • Prometheus Adapter:将 Prometheus 的指标暴露给 Kubernetes 的 Custom Metrics API。

HPA:根据自定义指标调整 Pod 的副本数。

1.2 工作流程

  1. Prometheus 收集应用的业务指标(如 QPS)。
  2. Prometheus Adapter 从 Prometheus 中读取指标,并通过 Custom Metrics API 暴露给 Kubernetes。
  3. HPA 从 Custom Metrics API 获取指标值,并根据目标值调整 Pod 的副本数。

2. 前提条件

在配置自定义指标的 HPA 之前,请确保您的 Kubernetes 集群满足以下条件:

  1. 安装 Prometheus
  2. 使用 Helm 或手动部署 Prometheus。
  3. 确保 Prometheus 能够收集应用的业务指标。
  4. 安装 Prometheus Adapter

Prometheus Adapter 是连接 Prometheus 和 Kubernetes Custom Metrics API 的桥梁。

使用以下命令安装 Prometheus Adapter:

kubectl apply -f https://github.com/kubernetes-sigs/prometheus-adapter/releases/latest/download/components.yaml

配置资源请求

HPA 需要 Pod 配置资源请求(requests),例如 CPU 和内存。如果未配置资源请求,HPA 将无法正常工作。

3. 配置自定义指标的 HPA

3.1 部署示例应用

首先,我们部署一个示例应用,并确保 Prometheus 能够收集该应用的指标。以下是一个简单的 Nginx Deployment 示例:

apiVersion: apps/v1
kind: Deployment
metadata:
  name: nginx-deployment
spec:
  replicas: 2
  selector:
    matchLabels:
      app: nginx
  template:
    metadata:
      labels:
        app: nginx
    spec:
      containers:
      - name: nginx
        image: nginx:1.14.2
        resources:
          requests:
            cpu: "200m"
            memory: "128Mi"

使用以下命令创建 Deployment:

kubectl apply -f nginx-deployment.yaml

3.2 配置 Prometheus Adapter

Prometheus Adapter 需要配置规则,以将 Prometheus 的指标暴露给 Kubernetes。以下是一个示例配置:

rules:
  - seriesQuery: 'http_requests_total{namespace!="",pod!=""}'
    resources:
      overrides:
        namespace: {resource: "namespace"}
        pod: {resource: "pod"}
    name:
      matches: "^(.*)_total"
      as: "${1}_per_second"
    metricsQuery: 'sum(rate(<<.Series>>{<<.LabelMatchers>>}[2m])) by (<<.GroupBy>>)'
  • seriesQuery:查询 Prometheus 中的指标。
  • resources:将 Prometheus 的标签映射到 Kubernetes 资源。
  • name:将 Prometheus 的指标名称转换为 Kubernetes 可识别的名称。
  • metricsQuery:定义如何计算指标值。
kubectl apply -f prometheus-adapter-config.yaml

3.3 创建基于自定义指标的 HPA

以下是一个基于自定义指标(每秒请求数)的 HPA 示例:

apiVersion: autoscaling/v2
kind: HorizontalPodAutoscaler
metadata:
  name: custom-metric-hpa
spec:
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: nginx-deployment
  minReplicas: 2
  maxReplicas: 10
  metrics:
  - type: Pods
    pods:
      metric:
        name: http_requests_per_second
      target:
        type: AverageValue
        averageValue: 100
  • metric.name:自定义指标的名称(与 Prometheus Adapter 配置中的名称一致)。
  • target.type:指标的目标类型,可以是 AverageValue 或 Value。
  • target.averageValue:目标值,表示每个 Pod 的平均指标值。

使用以下命令创建 HPA:

kubectl apply -f custom-metric-hpa.yaml

3.4 验证 HPA

创建 HPA 后,可以通过以下命令查看 HPA 的状态:

kubectl get hpa

输出示例:

NAME               REFERENCE                     TARGETS       MINPODS   MAXPODS   REPLICAS   AGE
custom-metric-hpa  Deployment/nginx-deployment   100/100       2         10        2          1m
  • TARGETS:当前指标值与目标值的比率。
  • REPLICAS:当前的 Pod 副本数。

4. 测试自定义指标的 HPA

4.1 增加负载

使用 kubectl run 创建一个临时的 Pod 来模拟负载:


kubectl run -i --tty load-generator --image=busybox --restart=Never -- /bin/sh -c "while true; do wget -q -O- http://nginx-deployment; done"

4.2 观察 HPA 变化

通过以下命令观察 HPA 的变化:

kubectl get hpa -w

当每秒请求数超过目标值(100)时,HPA 会自动增加 Pod 的副本数。

4.3 减少负载

停止负载生成 Pod:

kubectl delete pod load-generator

当负载降低后,HPA 会自动减少 Pod 的副本数。

5. 最佳实践

5.1 合理选择自定义指标

  • 选择与业务需求密切相关的指标,例如 QPS、队列长度等。
  • 避免选择过于频繁变化的指标,以免导致频繁扩缩容。

5.2 配置冷却时间

  • 通过调整 HPA 的冷却时间,避免频繁扩缩容。
  • 扩容冷却时间默认 3 分钟,缩容冷却时间默认 5 分钟。

5.3 监控 HPA 行为

  • 使用 Prometheus 和 Grafana 监控 HPA 的行为,确保其按预期工作。
  • 定期检查 HPA 的状态和日志,及时发现和解决问题。

6. 总结

通过自定义指标的 HPA,Kubernetes 可以根据业务需求动态调整 Pod 的副本数,从而实现更灵活的自动扩缩容。本文介绍了如何配置基于自定义指标的 HPA,并结合 Prometheus 和 Prometheus Adapter 实现自定义指标的自动扩缩容。

相关推荐

Python生态下的微服务框架FastAPI

FastAPI是什么FastAPI是一个用于构建API的web框架,使用Python并基于标准的Python类型提示。与flask相比有什么优势高性能:得益于uvloop,可达到与...

SpringBoot:如何解决跨域问题,详细方案和示例代码

跨域问题在前端开发中经常会遇到,特别是在使用SpringBoot框架进行后端开发时。解决跨域问题的方法有很多,我将为你提供一种详细的方案,包含示例代码。首先,让我们了解一下什么是跨域问题。跨域是指在...

使用Nginx轻松搞定跨域问题_使用nginx轻松搞定跨域问题的方法

跨域问题(Cross-OriginResourceSharing,简称CORS)是由浏览器的同源策略引起的。同源策略指的是浏览器限制来自不同源(协议、域名、端口)的JavaScript对资源的...

spring boot过滤器与拦截器的区别

有小伙伴使用springboot开发多年,但是对于过滤器和拦截器的主要区别依然傻傻分不清。今天就对这两个概念做一个全面的盘点。定义与作用范围过滤器(Filter):过滤器是一种可以动态地拦截、处理和...

nginx如何配置跨域_nginx配置跨域访问

要在Nginx中配置跨域,可以使用add_header指令来添加Access-Control-Allow-*头信息,如下所示:location/api{if($reques...

解决跨域问题的8种方法,含网关、Nginx和SpringBoot~

跨域问题是浏览器为了保护用户的信息安全,实施了同源策略(Same-OriginPolicy),即只允许页面请求同源(相同协议、域名和端口)的资源,当JavaScript发起的请求跨越了同源策略,...

图解CORS_图解数学

CORS的全称是Cross-originresourcesharing,中文名称是跨域资源共享,是一种让受限资源能够被其他域名的页面访问的一种机制。下图描述了CORS机制。一、源(Orig...

CORS 幕后实际工作原理_cors的工作原理

跨域资源共享(CORS)是Web浏览器实施的一项重要安全机制,用于保护用户免受潜在恶意脚本的攻击。然而,这也是开发人员(尤其是Web开发新手)感到沮丧的常见原因。小编在此将向大家解释它存在...

群晖无法拉取Docker镜像?最稳定的方法:搭建自己的加速服务!

因为未知的原因,国内的各大DockerHub镜像服务器无法使用,导致在使用群晖时无法拉取镜像构建容器。网上大部分的镜像加速服务都是通过Cloudflare(CF)搭建的,为什么都选它呢?因为...

Sa-Token v1.42.0 发布,新增 API Key、TOTP 验证码等能力

Sa-Token是一款免费、开源的轻量级Java权限认证框架,主要解决:登录认证、权限认证、单点登录、OAuth2.0、微服务网关鉴权等一系列权限相关问题。目前最新版本v1.42.0已...

NGINX常规CORS错误解决方案_nginx配置cors

CORS错误CORS(Cross-OriginResourceSharing,跨源资源共享)是一种机制,它使用额外的HTTP头部来告诉浏览器允许一个网页运行的脚本从不同于它自身来源的服务器上请求资...

Spring Boot跨域问题终极解决方案:3种方案彻底告别CORS错误

引言"接口调不通?前端同事又双叒叕在吼跨域了!""明明Postman能通,浏览器却报OPTIONS403?""生产环境跨域配置突然失效,凌晨3点被夺命连环Ca...

SpringBoot 项目处理跨域的四种技巧

上周帮一家公司优化代码时,顺手把跨域的问题解决了,这篇文章,我们聊聊SpringBoot项目处理跨域的四种技巧。1什么是跨域我们先看下一个典型的网站的地址:同源是指:协议、域名、端口号完全相...

Spring Cloud入门看这一篇就够了_spring cloud使用教程

SpringCloud微服务架构演进单体架构垂直拆分分布式SOA面向服务架构微服务架构服务调用方式:RPC,早期的webservice,现在热门的dubbo,都是RPC的典型代表HTTP,HttpCl...

前端程序员:如何用javascript开发一款在线IDE?

前言3年前在AWSre:Invent大会上AWS宣布推出Cloud9,用于在云端编写、运行和调试代码,它可以直接运行在浏览器中,也就是传说中的WebIDE。3年后的今天随着国内云计算的发...