Files
user-system/docs/runbooks/02-服务停止.md
long-agent 54a73e66f4 docs: add runbooks and Kubernetes Helm Chart
Add 6 runbook documents:
- 服务启动 (Service Startup)
- 服务停止 (Service Shutdown)
- 配置更新 (Configuration Update)
- 日志分析 (Log Analysis)
- 备份恢复 (Backup & Recovery)
- 安全事件 (Security Incident)

Add Kubernetes Helm Chart:
- Chart.yaml, values.yaml
- Deployment with health checks
- Ingress with TLS support
- PVC for data persistence
- PDB for high availability
- HPA for autoscaling
- ServiceAccount configuration

Add cron-backup.conf for automated backup scheduling.
2026-04-11 22:57:31 +08:00

1.8 KiB
Raw Blame History

服务停止 Runbook

用途: 正常维护停止服务或紧急停止服务

适用场景: 系统维护、配置更新、紧急故障处理


正常停止(维护场景)

1. 通知用户(可选)

如果需要停机维护,提前通知:

# 检查当前在线用户数(通过日志估算)
docker-compose logs --since=5m app | grep -c "POST /api/v1/auth/login"

2. 优雅停止服务

# 发送停止信号(会等待现有请求处理完成)
docker-compose stop

# 或直接 down不会等待
docker-compose down

3. 确认停止

# 确认没有运行的容器
docker-compose ps

# 确认端口已释放
netstat -tlnp | grep 8080

紧急停止(故障场景)

当服务出现严重问题时,需要紧急停止:

1. 立即停止

# 强制停止所有容器
docker-compose kill

# 如果 docker-compose 无响应,直接 kill
docker kill $(docker ps -q -f name=user-management)

2. 确认资源释放

# 确认容器已停止
docker ps -a | grep user-management

# 确认端口已释放
netstat -tlnp | grep 8080

3. 记录故障现场

# 保存故障时的日志
docker-compose logs > logs/emergency_$(date +%Y%m%d_%H%M%S).log

# 保存当前数据库状态
cp data/user_management.db data/user_management_emergency_$(date +%Y%m%d_%H%M%S).db

停止后的检查

停止服务后,确认以下内容:

  • 所有容器已停止
  • 端口 8080 已释放
  • 日志已保存
  • 数据库文件完整
  • 无残留进程

相关文档


维护日期: 2026-04-11 下次审查: 每月检查一次