本文作者：丁辉

Pod水平自动缩放

基础配置准备

确保 Metrics Server 已安装

检查 metrics-server 是否运行

1	kubectl get pods -n kube-system \| grep metrics-server

如果没有，可以安装它（如果是标准的 Kubernetes 集群）

1	kubectl apply -f https://github.com/kubernetes-sigs/metrics-server/releases/latest/download/components.yaml

确保 Pod 已设置资源请求

Pod配置资源请求

介绍

自动伸缩（HPA）的计算是基于 requests 的，而不是 limits

详细解释

HPA 使用的计算公式是：

使用率(Utilization)= Pod 当前实际使用量 ÷ Pod 的 requests 值
绝对值(AverageValue) = 所有 Pod 的实际 CPU 使用量总和 ÷ Pod 数量

使用条件介绍

✅ 类型：AverageValue（绝对值）
✅ 目标：所有 Pod 平均使用 80m CPU
✅ 特点：不依赖 requests 设置
⚠️ 注意：如果 Pod 的 requests 设置变化，可能需要调整这个值
🔄 对比：如果改为 Utilization: 80%，则目标是 CPU 使用量达到 requests.cpu 的 80%

选择建议：

如果 Pod 的 requests.cpu 稳定且合理 → 使用 Utilization
如果 requests 经常变化或设置不合理 → 使用 AverageValue
两者可以互相转换：averageValue = requests.cpu × (utilization/100)

创建 HPA

基础命令格式对比表

参数/命令部分	基础命令	说明
命令结构	`kubectl autoscale`	创建或更新HPA
目标资源	`deployment/nginx-deployment`	要自动扩缩容的Deployment
最小副本数	`--min=3`	最少保持的Pod数量
最大副本数	`--max=6`	最多允许的Pod数量
CPU阈值	`--cpu=80`	CPU使用率目标值
内存阈值	`--memory=75`	内存使用率目标值

命令创建(默认使用AverageValue算计)

绝对值 50m

1	kubectl autoscale deployment/nginx-deployment --min=1 --max=3 --cpu=50 --memory=50

绝对值50Mi

1	kubectl autoscale deployment/nginx-deployment --min=1 --max=3 --memory=50

Yaml 创建(使用Utilization)

CPU 80%
内存 75%

编辑 Yaml

1	vi nginx-deployment-hpa-utilization.yaml

内容如下

apiVersion: autoscaling/v2
kind: HorizontalPodAutoscaler
metadata:
  name: nginx-deployment
spec:
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: nginx-deployment
  minReplicas: 1
  maxReplicas: 3
  metrics:
  - type: Resource
    resource:
      name: cpu
      target:
        type: Utilization
        averageUtilization: 80
  - type: Resource
    resource:
      name: memory
      target:
        type: Utilization
        averageUtilization: 75

部署

1	kubectl apply -f nginx-deployment-hpa-utilization.yaml

Yaml 创建(使用AverageValue)

CPU 绝对值 50m
内存绝对值50Mi

编辑 Yaml

1	vi nginx-deployment-hpa-averagevalue.yaml

内容如下

apiVersion: autoscaling/v2
kind: HorizontalPodAutoscaler
metadata:
  name: nginx-deployment
spec:
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: nginx-deployment
  minReplicas: 1
  maxReplicas: 3
  metrics:
  - type: Resource
    resource:
      name: cpu
      target:
        type: AverageValue
        averageValue: 50m
  - type: Resource
    resource:
      name: memory
      target:
        type: AverageValue
        averageValue: 50Mi

部署

1	kubectl apply -f nginx-deployment-hpa-averagevalue.yaml

验证 HPA

创建后，可以检查 HPA 状态：

查看 HPA
1
kubectl get hpa
详细查看
1
kubectl describe hpa nginx-deployment
查看当前 CPU 使用率
1
kubectl top pods

增加负载验证

模拟负载

1	kubectl run -i --tty load-generator --rm --image=busybox:1.28 --restart=Never -- /bin/sh -c "while sleep 0.01; do wget -q -O- http://nginx-deployment; done"

观察

1	kubectl get hpa nginx-deployment --watch

其他类型

根据每个 Pod 每秒处理的数据包数量来扩缩容

具体解释：

监控指标：packets-per-second（每秒数据包数）
目标值：每个 Pod 平均每秒处理 1000 个数据包（1k = 1000）
扩缩逻辑：
- 如果所有 Pod 的平均值超过 1000 个包/秒 → 增加 Pod 数量
- 如果所有 Pod 的平均值低于 1000 个包/秒 → 减少 Pod 数量

编辑 Yaml

1	vi nginx-deployment-hpa-pod.yaml

内容如下

apiVersion: autoscaling/v2
kind: HorizontalPodAutoscaler
metadata:
  name: nginx-deployment
spec:
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: nginx-deployment
  minReplicas: 1
  maxReplicas: 3
  metrics:
  - type: Pods
    pods:
      metric:
        name: packets-per-second
      target:
        type: AverageValue
        averageValue: 1k

部署

1	kubectl apply -f nginx-deployment-hpa-pod.yaml

根据 Ingress 的每秒请求数来扩缩容后端应用

具体解释：

监控对象：名为 main-route 的 Ingress
监控指标：requests-per-second（Ingress 每秒处理的请求数）
目标值：整个 Ingress 每秒处理 2000 个请求（2k = 2000）
扩缩逻辑：
- 如果这个 Ingress 的请求数超过 2000 请求/秒 → 增加后端 Pod 数量
- 如果这个 Ingress 的请求数低于 2000 请求/秒 → 减少后端 Pod 数量

编辑 Yaml

1	vi nginx-deployment-hpa-object.yaml

内容如下

apiVersion: autoscaling/v2
kind: HorizontalPodAutoscaler
metadata:
  name: nginx-deployment
spec:
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: nginx-deployment
  minReplicas: 1
  maxReplicas: 3
  metrics:
  - type: Object
    object:
      metric:
        name: requests-per-second
      describedObject:
        apiVersion: networking.k8s.io/v1
        kind: Ingress
        name: main-route  # 但监控的是这个 Ingress 的流量
      target:
        type: Value
        value: 2k  # 整个 Ingress 的目标：2000 请求/秒

部署

1	kubectl apply -f nginx-deployment-hpa-object.yaml

根据带 GET 标签的 HTTP 请求指标来扩缩容

具体解释：

监控对象：某个 Kubernetes 资源（如 Ingress、Service 等）
监控指标：http_requests（HTTP 请求总数或速率）
指标筛选：只选择带有 verb: GET 标签的指标
目标值：需要在其他地方指定（这里没有显示完整的 target 部分）

编辑 Yaml

1	vi nginx-deployment-hpa-object-api.yaml

内容如下

apiVersion: autoscaling/v2
kind: HorizontalPodAutoscaler
metadata:
  name: api-hpa
spec:
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: api-server
  minReplicas: 2
  maxReplicas: 10
  metrics:
  - type: Object
    object:
      describedObject:
        apiVersion: v1
        kind: Service
        name: api-service
      metric:
        name: http_requests
        selector:
          matchLabels:
            verb: GET  # 只监控 GET 请求
            path: "/api/v1/users"  # 可以进一步指定路径
            status: "200"  # 还可以按状态码筛选
      target:
        type: AverageValue
        averageValue: 500  # 目标：每秒 500 个 GET 请求

部署

1	kubectl apply -f nginx-deployment-hpa-object-api.yaml

根据外部消息队列中的任务数量来扩缩容

具体解释：

监控来源：外部系统（不是 Kubernetes 内部）
监控指标：queue_messages_ready（队列中待处理的消息数量）
队列筛选：只监控名为 worker_tasks 的队列
目标值：保持队列中大约有 30 个待处理消息
扩缩逻辑：
- 如果队列消息 超过 30 个 → 增加 Worker Pod 数量
- 如果队列消息 低于 30 个 → 减少 Worker Pod 数量

编辑 Yaml

1	vi nginx-deployment-hpa-object-worker.yaml

内容如下

apiVersion: autoscaling/v2
kind: HorizontalPodAutoscaler
metadata:
  name: worker-hpa
spec:
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: task-worker  # 处理队列任务的 Worker 应用
  minReplicas: 1
  maxReplicas: 20
  metrics:
  - type: External
    external:
      metric:
        name: queue_messages_ready  # 队列中"就绪"的消息数
        selector:
          matchLabels:
            queue: "worker_tasks"  # 只监控这个特定队列
            # 还可以按其他标签筛选，如：
            # vhost: "production"
            # exchange: "orders"
      target:
        type: AverageValue
        averageValue: 30  # 目标：保持队列中有30个待处理消息

部署

1	kubectl apply -f nginx-deployment-hpa-object-worker.yaml

Pod水平自动缩放

Pod水平自动缩放

基础配置准备

介绍

使用条件介绍

创建 HPA

命令创建(默认使用AverageValue算计)

Yaml 创建(使用Utilization)

Yaml 创建(使用AverageValue)

验证 HPA

增加负载验证

其他类型

根据每个 Pod 每秒处理的数据包数量来扩缩容

根据 Ingress 的每秒请求数来扩缩容后端应用

根据带 GET 标签的 HTTP 请求指标来扩缩容

根据外部消息队列中的任务数量来扩缩容

其他文章

Deployment的使用

Pod配置资源请求