35 lines
1.2 KiB
Markdown
35 lines
1.2 KiB
Markdown
# AI-Ops 性能压测环境规格
|
||
|
||
## 压测目标
|
||
|
||
| 场景 | 并发用户 | 目标 P95 | 目标 P99 | 失败率门槛 |
|
||
|------|----------|----------|----------|------------|
|
||
| 首页加载 | 50 | < 2s | < 3s | < 1% |
|
||
| 指标下钻 | 20 | < 3s | < 5s | < 1% |
|
||
| 告警触发到通知 | - | < 30s | < 60s | < 0.1% |
|
||
|
||
## 环境规格
|
||
|
||
| 组件 | 规格 | 说明 |
|
||
|------|------|------|
|
||
| AI-Ops API Server | 2 vCPU / 4GB 内存 | 与生产目标一致 |
|
||
| PostgreSQL | 2 vCPU / 4GB 内存 / SSD | 含 10 万条审计日志基准数据 |
|
||
| Redis | 1 vCPU / 2GB 内存 | 用于告警抑制缓存 |
|
||
| Prometheus | 独立实例 | 采集 10 个指标、15s 间隔 |
|
||
|
||
## 压测方法
|
||
|
||
1. **首页加载**:`k6 run test/perf/dashboard_k6.js`
|
||
2. **下钻查询**:`k6 run test/perf/drilldown_k6.js`
|
||
3. **告警延迟**:通过 Go 单测 `alert_latency_test.go` 测量触发到通知的延迟
|
||
|
||
## P99 计算方法
|
||
|
||
使用 k6 默认统计方法:在压测期间(10s 滑动窗口)内的所有请求响应时间排序后取 99% 分位数。
|
||
|
||
## 通过标准
|
||
|
||
- P95 达标且失败率 < 1% → 通过
|
||
- P95 超标但 P99 达标 → CONDITIONAL_APPROVED(需性能优化)
|
||
- P99 超标 → 阻止进入下一阶段
|