k8s Pod的自动水平伸缩（HPA）

网友投稿 253 2022-09-12

k8s Pod的自动水平伸缩（HPA）

我们知道，当访问量或资源需求过高时，使用：kubectl scale命令可以实现对pod的快速伸缩功能但是我们平时工作中我们并不能提前预知访问量有多少，资源需求多少。这就很麻烦了，总不能为了需求总是把pod设置为最多状态，这样太浪费资源；也不能当请求量上来以后再去伸缩pod，这样会有好多请求不成功。 k8s既然是云原生时代的产品，当然得有智能，自动这些特性。所以现在引入一个新的概念： HPA（Horizontal Pod Autoscaler ） pod的自动水平伸缩有了HPA，我们就不用为上面的问题而烦恼，HPA会帮我们自动完成pod的扩缩容。当资源需求过高时，会自动创建出pod副本；当资源需求低时，会自动收缩pod副本数。注意：首先必须确保集群中已经安装metrics-server的组件，否则无法获取集群内资源数据，无法进行以下操作。原理：通过集群内的资源监控系统（metrics-server），来获取集群中资源的使用状态。根据CPU、内存、以及用户自定义的资源指标数据的使用量或连接数为参考依据，来制定一个临界点，一旦超出这个点，HPA就会自动创建出pod副本。版本：通过kubectl api-versions可以看到，目前有3个版本： autoscaling/v1 #只支持通过cpu为参考依据，来改变pod副本数autoscaling/v2beta1 #支持通过cpu、内存、连接数以及用户自定义的资源指标数据为参考依据。autoscaling/v2beta2 #同上，小的变动查询： 1 kubectl explain hpa ##默认查询到的是autoscaling/v1版本 2 3 kubectl explain hpa --api-version=autoscaling/v2beta1 ##如果使用其他版本，可以使用--api-version指明版本部署HPA：哪个资源最多几个最少几个通过什么判断伸缩例如：我有个deployment叫myapp现在只有一个副本数，最多只能8个副本数，当pod的cpu平均利用率超过百分之50或内存平均值超过百分之50时，pod将自动增加副本数以提供服务。 SVC、Deployment资源清单： 1 apiVersion: v1 2 kind: Service 3 metadata: 4 name: svc-hpa 5 namespace: default 6 spec: 7 selector: 8 app: myapp 9 type: NodePort ##注意这里是NodePort，下面压力测试要用到。 10 ports: 11 - name: http 12 port: 80 13 --- 14 apiVersion: apps/v1 15 kind: Deployment 16 metadata: 17 name: myapp 18 namespace: default 19 spec: 20 replicas: 1 21 selector: 22 matchLabels: 23 app: myapp 24 template: 25 metadata: 26 name: myapp-demo 27 namespace: default 28 labels: 29 app: myapp 30 spec: 31 containers: 32 - name: myapp 33 image: ikubernetes/myapp:v1 34 imagePullPolicy: IfNotPresent 35 ports: 36 - name: http 37 containerPort: 80 38 resources: 39 requests: 40 cpu: 50m 41 memory: 50Mi 42 limits: 43 cpu: 50m 44 memory: 50Mi HPA资源清单如下： 1 apiVersion: autoscaling/v2beta1 2 kind: HorizontalPodAutoscaler 3 metadata: 4 name: myapp-hpa-v2 5 namespace: default 6 spec: 7 minReplicas: 1 ##至少1个副本 8 maxReplicas: 8 ##最多8个副本 9 scaleTargetRef: 10 apiVersion: apps/v1 11 kind: Deployment 12 name: myapp 13 metrics: 14 - type: Resource 15 resource: 16 name: cpu 17 targetAverageUtilization: 50 ##注意此时是根据使用率，也可以根据使用量：targetAverageValue 18 - type: Resource 19 resource: 20 name: memory 21 targetAverageUtilization: 50 ##注意此时是根据使用率，也可以根据使用量：targetAverageValue 使用ab工具模拟压力测试： 1 ab -c 1000 -n 5000000 http://192.168.1.103:31727/index.html 等待数分钟后，查看hpa及pod数量： 1 [root@K8s-master ~]# kubectl get hpa 2 NAME REFERENCE TARGETS MINPODS MAXPODS REPLICAS AGE 3 myapp-hpa-v2 Deployment/myapp 5%/50%, 72%/50% 1 8 2 44m 4 [root@K8s-master ~]# kubectl get pods 5 NAME READY STATUS RESTARTS AGE 6 myapp-558db64459-pwzsd 1/1 Running 0 16m 7 myapp-558db64459-x9c4k 1/1 Running 0 23s

标签：工具

暂时没有评论，来抢沙发吧~

k8s Pod的自动水平伸缩（HPA）

linux cpu占用率如何看

宝塔数据库如何清理缓存

oracle怎么创建存储过程

推荐文章

api接口有哪几种分类及功能

什么是API接口?API接口简单介绍

短信API接口概述，短信API接口的优势

7款快递物流的物流查询API工具，物流快递查询API接口怎么对接？

企业四要素: 了解企业经营成功的关键

什么是语音验证码?,语音验证码平台有哪些

全国工商查询系统怎么查企业名录

哪些平台提供实名认证的接口？

PHP如何调用API接口?

如何使用百度天气预报API接口?

最近发表

热评文章

数据接口api（数据接口API开发平台）

数据开放接口api（数据服务api开发）

Python爬虫教程：爬取酷狗音乐（python爬取

hbuilder怎么更改字体大小和颜色

直播平台api接口 - 构建卓越的直播平台

实时股票数据api接口（股票实时行情api接口）