metrics-server 是一个采集集群中指标的组件,类似于 cadvisor,在 v1.8 版本中引入,官方将其作为 heapster 的替代者,metric-server 属于 core metrics(核心指标),提供 API metrics.k8s.io,仅可以查看 node、pod 当前 CPU/Memory/Storage 的资源使用情况,也支持通过 Metrics API 的形式获取,以此数据提供给 Dashboard、HPA、scheduler 等使用。
一、开启 API Aggregation
由于 metrics-server 需要暴露 API,但 k8s 的 API 要统一管理,如何将 apiserver 的请求转发给 metrics-server ,解决方案就是使用 kube-aggregator ,所以在部署 metrics-server 之前,需要在 kube-apiserver 中开启 API Aggregation,即增加以下配置:
1 | --proxy-client-cert-file=/etc/kubernetes/certs/proxy.crt |
如果kube-proxy没有在Master上面运行,还需要配置
1 | --enable-aggregator-routing=true |
kube-aggregator 的详细设计文档请参考:configure-aggregation-layer
二、部署 metrics-server
1、获取配置文件
1 | $ git clone https://github.com/kubernetes/kubernetes |
2、修改 metrics-server 配置参数
修改 resource-reader.yaml
文件:
1 | rules: |
修改 metrics-server-deployment.yaml
文件:
1 |
|
3、部署
1 | kubectl apply -f . |
metrics-server 的资源占用量会随着集群中的 Pod 数量的不断增长而不断上升,因此需要 addon-resizer 垂直扩缩 metrics-server。addon-resizer 依据集群中节点的数量线性地扩展 metrics-server,以保证其能够有能力提供完整的metrics API 服务,具体参考:addon-resizer。
所需要的镜像可以在 k8s-system-images 中下载。
检查是否部署成功:
1 | $ kubectl get apiservices | grep metrics |
三、metrics-server 的使用
由于采集数据间隔为1分钟,等待数分钟后查看数据:
1 | $ kubectl top node |
Metrics-server 可用 API 列表如下:
http://127.0.0.1:8001/apis/metrics.k8s.io/v1beta1/nodes
http://127.0.0.1:8001/apis/metrics.k8s.io/v1beta1/nodes/<node-name>
http://127.0.0.1:8001/apis/metrics.k8s.io/v1beta1/pods
http://127.0.0.1:8001/apis/metrics.k8s.io/v1beta1/namespace/<namespace-name>/pods/<pod-name>
由于 k8s 在 v1.10 后废弃了 8080 端口,可以通过代理或者使用认证的方式访问这些 API:1
2$ kubectl proxy
$ curl http://127.0.0.1:8001/apis/metrics.k8s.io/v1beta1/nodes
也可以直接通过 kubectl 命令来访问这些 API,比如:1
2
3
4$ kubectl get --raw /apis/metrics.k8s.io/v1beta1/nodes
$ kubectl get --raw /apis/metrics.k8s.io/v1beta1/pods
$ kubectl get --raw /apis/metrics.k8s.io/v1beta1/nodes/<node-name>
$ kubectl get --raw /apis/metrics.k8s.io/v1beta1/namespace/<namespace-name>/pods/<pod-name>