1. 前言
  2. 开源组件
  3. 1. Kubernetes (k8s)
    ❱
    1. 1.1. 安装
      ❱
      1. 1.1.1. Kubeadm 安装 k8s1.28.1
      2. 1.1.2. Dashboard
    2. 1.2. 资源
      ❱
      1. 1.2.1. Cronjob 使用
      2. 1.2.2. Probe 使用
      3. 1.2.3. ConfigMap 使用
    3. 1.3. 故障排查
      ❱
      1. 1.3.1. Kubelet PLEG
      2. 1.3.2. podman 容器数据软链
    4. 1.4. 优化
      ❱
      1. 1.4.1. Kubelet 资源限制
      2. 1.4.2. LimitRange
      3. 1.4.3. RBAC 汇总
        ❱
        1. 1.4.3.1. 交互式生成 kubeconfig 文件
        2. 1.4.3.2. 合并多个 kubeconfig 文件
        3. 1.4.3.3. API 接口创建
    5. 1.5. 存储
      ❱
      1. 1.5.1. nfs
    6. 1.6. API
    7. 1.7. LeaderWorkSet
      ❱
      1. 1.7.1. lws
  4. 2. K3s (轻量型 k8s)
    ❱
    1. 2.1. 安装
  5. 3. ClusterPedia
    ❱
    1. 3.1. ClusterPedia 安装步骤
    2. 3.2. ClusterPedia 对接 k8s
  6. 4. Prometheus
    ❱
    1. 4.1. vmetrics+prometheus 安装
    2. 4.2. 配置
    3. 4.3. 使用
      ❱
      1. 4.3.1. 常用函数
      2. 4.3.2. 标签自定义配置
      3. 4.3.3. Grafana 模版变量
    4. 4.4. 故障排查
      ❱
      1. 4.4.1. kubelet Job 丢失
    5. 4.5. AI 生成
      ❱
      1. 4.5.1. deepseek-r1
      2. 4.5.2. chatgpt
  7. 5. Elastic
  8. 6. Skywalking
    ❱
    1. 6.1. 安装
  9. 7. NeuVector
    ❱
    1. 7.1. 安装
  10. 8. Gitlab
    ❱
    1. 8.1. 安装
    2. 8.2. Git 克隆 master 分支后将修改推送 dev 分支
  11. 9. Helm
    ❱
    1. 9.1. helm 使用
  12. 10. Harbor
    ❱
    1. 10.1. docker 安装
    2. 10.2. k8s 安装
    3. 10.3. docker 融合镜像
  13. 11. Image-syncer 使用
  14. CICD
  15. 12. Jenkins 学习
    ❱
    1. 12.1. 通过 Github 自动构建镜像(CI)
    2. 12.2. Nexus
  16. 自动化运维工具
  17. 13. Ansible
    ❱
    1. 13.1. Ansible 使用
  18. 操作系统
  19. 14. Linux
    ❱
    1. 14.1. 性能分析
      ❱
      1. 14.1.1. 上下文切换
      2. 14.1.2. 负载分析
    2. 14.2. 系统配置
      ❱
      1. 14.2.1. bonding
      2. 14.2.2. fs_quota
    3. 14.3. Chrony 时钟同步
      ❱
      1. 14.3.1. chrony
    4. 14.4. DNS
    5. 14.5. 命令手册
      ❱
      1. 14.5.1. Echo 自定义输出
      2. 14.5.2. Json 文本处理
      3. 14.5.3. 查找大文件
      4. 14.5.4. Iptables 使用
      5. 14.5.5. Tcpdump 使用
    6. 14.6. Shell
      ❱
      1. 14.6.1. 条件判断
      2. 14.6.2. 特殊变量
      3. 14.6.3. 统计文件数及目录大小
    7. 14.7. 窥探容器
      ❱
      1. 14.7.1. 自定义容器路由
      2. 14.7.2. 通过 Pid 查找 ContainerID
      3. 14.7.3. tc 模拟网络延迟
    8. 14.8. 故障排查
      ❱
      1. 14.8.1. 断电导致系统启动失败
  20. 语言
  21. 15. Python
    ❱
    1. 15.1. 控制语句
    2. 15.2. 读写文件
    3. 15.3. 包使用
      ❱
      1. 15.3.1. DockerSDK 使用
      2. 15.3.2. Request 使用
    4. 15.4. 配置管理
      ❱
      1. 15.4.1. 获取环境变量
      2. 15.4.2. 读取配置文件
    5. 15.5. Flask
      ❱
      1. 15.5.1. 镜像同步
        ❱
        1. 15.5.1.1. 设计文档
        2. 15.5.1.2. 流程图
        3. 15.5.1.3. 接口文档
        4. 15.5.1.4. 测试文档
        5. 15.5.1.5. 构建部署文档

TroubleShooting 事件记录

Prometheus Targets 中 Job 丢失

  • kubelet Job 丢失