# AI-Customer-Service 测试策略 > 版本:v1.0 | 状态:初稿 --- ## 1. 测试目标 | 目标 | 指标 | 验证方式 | |------|------|---------| | 功能正确性 | 所有 AC 通过率 100% | 每个 AC 至少 1 正向 + 1 负向测试用例 | | 性能达标 | 首次响应 <10s,意图识别 <2s,检索 <200ms | 负载测试 + 峰值测试 | | 安全性 | 无越权、无数据泄露、无审计缺失 | 渗透测试 + 审计追溯 + 红队测试 | | 容灾能力 | 单机故障不影响服务,LLM 故障时有兑底 | 混淆工程测试 | ## 2. 测试层级 ``` ├── 单元测试 (Unit Test) │ ├── 渠道适配器解析/发送 │ ├── 意图识别逻辑 │ ├── 会话状态机 │ ├── 转人工判断逻辑 │ └── 权限控制逻辑 │ ├── 集成测试 (Integration Test) │ ├── 数据库交互(会话、消息、工单) │ ├── Redis 缓存交互(上下文、频率限制) │ ├── LLM Client Mock 测试 │ ├── 向量数据库检索测试 │ └── 外部只读 API Mock 测试 │ ├── E2E 测试 (End-to-End Test) │ ├── 多渠道消息流程 │ ├── 多轮对话与上下文保持 │ ├── 转人工整条链路 │ └── 运营后台流程 │ └── 安全测试 (Security Test) ├── Prompt Injection 防护 ├── 越权访问 ├── 数据隔离(跨用户查询) └── 红队模拟攻击 ``` ## 3. 测试工具 | 层级 | 工具 | 说明 | |------|------|------| | 单元测试 | Go testing + testify + mockery | 覆盖率门槛 domain ≥ 70%、service/handler ≥ 80% | | 数据库测试 | testcontainers-go (PostgreSQL) | 独立容器 | | 缓存测试 | miniredis | | | HTTP 测试 | httptest + net/http | | | LLM Mock | 自定义 Mock Server | 模拟 OpenAI / 阿里云响应 | | E2E 测试 | 自定义 Go E2E 框架 | 启动完整服务 | | 安全测试 | 自定义红队脚本 | 模拟 Prompt Injection 等攻击 | ## 4. 测试环境 | 环境 | 用途 | 数据 | |------|------|------| | 本地开发 | 单元 + 快速集成 | 测试数据生成 | | CI | 自动化单元 + 集成 | 测试数据生成 | | 测试环境 | E2E + 性能 + 安全 | 模拟生产数据(脱敏) | | 生产前 | 灾备测试 | 生产数据副本 | | 生产环境 | 灰度监控 | 真实数据 | ## 5. 测试数据管理 - 知识库条目使用 `test/fixtures/kb/` 下的 Markdown 文件管理。 - 测试用例自洁,启动前加载固定数据集,结束后清理。 - 多语言/多渠道测试数据分离管理。 ## 6. 特殊测试要求 - **意图识别测试**:必须覆盖所有意图类别,特别是敏感意图(退款/封禁/安全)必须强制转人工。 - **安全测试**:必须模拟 Prompt Injection 、越权查询、跨用户数据访问等场景。 - **性能测试**:必须模拟 100 QPS 峰值场景下的系统表现。 - **容灾测试**:必须模拟主备 LLM 均故障时的兑底回复行为。