K8S集群故障排查思路 场景1:测试人员: 说30080端口无法访问,运维同学快点解决下。。 场景2:开发同学: Pod部署不成功,一直报错镜像拉取出错。。 场景3:系统运维: Pod一直处于Peding如何解决? 场景4:容器已经处于Runing状态,但是外部依旧无法访问? 场景5:Ingress创建成功,但是访问报错404?咋解决呢? 场景6:…
1 介绍 prometheus是由谷歌研发的一款开源的监控软件,它通过安装在远程机器上的exporter,通过HTTP协议从远程的机器收集数据并存储在本地的时序数据库上 同时Prometheus后端用 golang语言开发,前端是 Grafana Prometheus为了支持各种中间件以及第三方的监控提供了exporter,大家可以把它理解成监控适…
1 minio集群部署 docker network create pub-network cat docker-compose.yml services: minio1: image: minio/minio volumes: - m1_data:/data networks: - pub-network ports: - "9000:…
1 Grafana的多租户管理 2 Grafana的数据存储优化 1.安装grafna 略,见视频。 2.Grafana主要参数说明 [root@prometheus-server31 ~]# vim /etc/grafana/grafana.ini ... [paths] data = /var/lib/grafana # 指定Grafana的数…
1 概述 <font color="#d83931">etcd是分布式系统中最关键数据的分布式可靠键值存储数据库</font>,重点是: 简单:定义明确、面向用户的API(gRPC) 安全:自动TLS,可选客户端证书身份验证 快速:以每秒10000次写入为基准 可靠:使用Raft正确分布 etcd是用Go…
1 Alertmanager安装及子路由配置 ***** - Alertmanager环境部署 1.什么是altermanager Alertmanager是一款开源的告警工具包,可以和Prometheus集成。 2.下载Alertmanager wget https://github.com/prometheus/alertmanager/rel…
所谓的服务发现指的是Prometheus server发现监控目标的一种方式。 服务发现可以分为静态配置和动态配置两种发现策略。 静态配置: 每次修改Prometheus的配置文件都需要热加载或重启Prometheus服务。 动态配置: 一次配置后,可以基于该动态配置实现自动发现监控目标,在这个过程中无需重启或热加载Prometheus服务。 1 …
以Nginx的为例,当任意一个Nginx挂掉,其处理的逻辑是相同的,即仅需重新创建一个Pod副本即可,这类服务我们称之为无状态服务。 以MySQL主从同步为例,master,slave两个库任意一个库挂掉,其处理逻辑是不相同的,这类服务我们称之为有状态服务。 有状态服务面临的难题: (1)启动/停止顺序; (2)pod实例的数据是独立存储; (3)…
Kubernetes 的 Deployment 是一种用于管理无状态应用的控制器,它确保指定数量的 Pod 副本始终处于运行状态,并且可以方便地进行应用的更新和回滚。<font color="#9bbb59">大部分都是用deployment发布业务服务</font>。 <font color=&q…
在 Kubernetes 中,控制器(Controller)是用于管理资源对象的生命周期和状态的组件。控制器通过与 Kubernetes API 服务器交互,确保资源对象的实际状态与期望状态一致。以下是 Kubernetes 中常见的控制器及其功能介绍。 ReplicationController 了解 [[RC]] ReplicaSet 了解 […