ai-ops/test/perf/PERF_ENV.md

# AI-Ops 性能压测环境规格

## 压测目标

| 场景 | 并发用户 | 目标 P95 | 目标 P99 | 失败率门槛 |
|------|----------|----------|----------|------------|
| 首页加载 | 50 | < 2s | < 3s | < 1% |
| 指标下钻 | 20 | < 3s | < 5s | < 1% |
| 告警触发到通知 | - | < 30s | < 60s | < 0.1% |

## 环境规格

| 组件 | 规格 | 说明 |
|------|------|------|
| AI-Ops API Server | 2 vCPU / 4GB 内存 | 与生产目标一致 |
| PostgreSQL | 2 vCPU / 4GB 内存 / SSD | 含 10 万条审计日志基准数据 |
| Redis | 1 vCPU / 2GB 内存 | 用于告警抑制缓存 |
| Prometheus | 独立实例 | 采集 10 个指标、15s 间隔 |

## 压测方法

1. **首页加载**：`k6 run test/perf/dashboard_k6.js`
2. **下钻查询**：`k6 run test/perf/drilldown_k6.js`
3. **告警延迟**：通过 Go 单测 `alert_latency_test.go` 测量触发到通知的延迟

## P99 计算方法

使用 k6 默认统计方法：在压测期间（10s 滑动窗口）内的所有请求响应时间排序后取 99% 分位数。

## 通过标准

- P95 达标且失败率 < 1% → 通过
- P95 超标但 P99 达标 → CONDITIONAL_APPROVED（需性能优化）
- P99 超标 → 阻止进入下一阶段