prometheus指南:采集k8s的原理和高可用存储实践

项目地址

项目说明

这是一个免费的prometheus底层原理课程(固然是精简版的)node

主要介绍两大块内容,这也是你们常见的问题git

  • prometheus采集k8s的原理
  • prometheus的高可用存储怎么作

付费全方位教程

若是想进一线互联网大厂从事监控运维/开发的工做(冲击35k+的月薪)github

须要更全面的了解Prometheus底层原理,并有高可用实战项⽬经验。api

能够购买下面的付费课程,架构

  1. 学完这个课程,你能够能够搭建以下架构哦
    image
  2. 门课目标用户收益运维

    • 一线运维人员:学习使用、熟悉配置、掌握调优、升职加薪分布式

      • 能够从头至尾熟悉prometheus、各类exporter、alertmanager、grafana、m3db、loki等组件的使用配置
      • 熟悉主流exporter(中间件、存储)的告警表达式配置
      • 同时能掌握相关组件调优的经验
    • 运维开发人员:学习高性能原理,可助⼒斩获⼤⼚监控运维开发offeride

      • 从源码级别了解prometheus高性能的设计方案
      • 掌握二次开发相关组件的能力
      • 了解分布式系统高可用改造方案

准备工做

在k8s中部署prometheus

kubectl apply -f prome_k8s_all_pod/kube-stats-metrics
kubectl apply -f prome_k8s_all_pod/

在k8s中部署grafana

kubectl apply -f grafana/

k8s关注指标分析

k8s中组件复杂,咱们主要专一的无外乎四大块指标:容器基础资源指标、k8s资源指标、k8s服务组件指标、部署在pod中业务埋点指标性能

指标类型 采集源 应用举例 发现类型 grafana截图
容器基础资源指标 kubelet 内置cadvisor metrics接口 查看容器cpu、mem利用率等 k8s_sd node级别直接访问node_ip image
k8s资源指标 kube-stats-metrics (简称ksm) 具体能够看
看pod状态如pod waiting状态的缘由
数个数如:查看node pod按namespace分布状况
经过coredns访问域名 image
k8s服务组件指标 服务组件 metrics接口 查看apiserver 、scheduler、etc、coredns请求延迟等 k8s_sd endpoint级别 image
部署在pod中业务埋点指标 pod 的metrics接口 依据业务指标场景 k8s_sd pod级别,访问pod ip的metricspath