Files
user-system/docs/runbooks
long-agent 54a73e66f4 docs: add runbooks and Kubernetes Helm Chart
Add 6 runbook documents:
- 服务启动 (Service Startup)
- 服务停止 (Service Shutdown)
- 配置更新 (Configuration Update)
- 日志分析 (Log Analysis)
- 备份恢复 (Backup & Recovery)
- 安全事件 (Security Incident)

Add Kubernetes Helm Chart:
- Chart.yaml, values.yaml
- Deployment with health checks
- Ingress with TLS support
- PVC for data persistence
- PDB for high availability
- HPA for autoscaling
- ServiceAccount configuration

Add cron-backup.conf for automated backup scheduling.
2026-04-11 22:57:31 +08:00
..

Runbooks 目录

本文档包含用户管理系统的运维 Runbook标准操作手册

目录结构

Runbook 用途 优先级
01-service-startup.md 服务启动 🔴 必须
02-service-shutdown.md 服务停止 🔴 必须
03-backup-restore.md 备份恢复 🔴 必须
04-log-analysis.md 日志分析 🔴 必须
05-config-update.md 配置更新 🟠 重要
06-security-incident.md 安全事件响应 🔴 必须
07-incident-response.md 事件响应 🟠 重要

使用说明

阅读顺序建议

  1. 新部署:先阅读 01-service-startup.md
  2. 日常维护:阅读 02-service-shutdown.md
  3. 故障处理:阅读 04-log-analysis.md
  4. 数据恢复:阅读 03-backup-restore.md

快速参考

操作 命令
启动服务 docker compose up -d
停止服务 docker compose stop
查看日志 docker compose logs -f
执行备份 ./scripts/backup/backup.sh
恢复数据 ./scripts/backup/backup.sh --restore

紧急联系人

角色 姓名 电话 邮箱
运维负责人 [填写] [填写] [填写]
技术支持 [填写] [填写] [填写]
开发团队 [填写] [填写] [填写]

培训要求

所有运维人员应熟悉:

  1. 服务启动和停止流程
  2. 备份和恢复操作
  3. 日志分析方法
  4. 常见故障排查

文档更新

  • 每次重大变更后更新相关 Runbook
  • 每年至少审查一次所有 Runbook
  • 发现问题立即更新

最后更新2026-04-08新增 05-07 Runbook