20 KiB
20 KiB
商用 LLM 通用转发网关竞品全景调研(功能清单 + 商业模型 + 技术优劣)
- 版本:v1.0(可评审版)
- 日期:2026-03-16
- 阶段定位:产品与市场阶段(非技术实现设计)
- 适用对象:产品负责人、商业负责人、技术管理层、投融资材料准备
0. 阶段声明
本文档用于回答“是否值得做、怎么切入、先做什么”三类问题。
本阶段不展开数据库、服务拆分、接口实现细节;仅输出:
- 竞品功能清单与覆盖差异
- 竞品商业模型与定价逻辑
- 技术能力优劣(平台成熟度层面)
- 我方可执行的产品切入与机会空白
1. 研究边界与方法
1.1 目标产品定义
目标产品是“商用 LLM 通用转发网关”,核心能力是:
- 多模型统一接入(OpenAI 兼容/原生协议)
- 路由与回退(成本、延迟、可用性、多策略)
- 治理与风控(预算、配额、权限、审计)
- 可观测与经营(成本看板、告警、账单、归因)
1.2 样本分层
本次样本分三层:
- 商业化 AI 网关(直接竞争):OpenRouter、Portkey、Cloudflare AI Gateway、Helicone、Kong AI Gateway
- 开源网关(价格天花板竞争):LiteLLM OSS、One-API、New-API、Sub2API
- 云厂商平台(替代竞争):AWS Bedrock、Google Vertex AI、Azure AI
1.3 信息来源原则
- 优先官方文档、官方定价页、官方仓库/官方 API
- 对无法完全核验的字段,标注“公开信息未完全披露”
- 开源热度采用 GitHub 官方 API(2026-03-16 当天采集)
2. 竞品分层与定位地图
| 层级 | 代表产品 | 主要购买方 | 主要卖点 | 主要短板/风险 |
|---|---|---|---|---|
| 商业 AI 网关 | OpenRouter / Portkey / Cloudflare / Helicone / Kong | AI 团队、平台团队、企业采购 | 快速上线、平台化治理、SLA/支持 | 价格与锁定、功能边界受平台约束 |
| 开源网关 | LiteLLM OSS / One-API / New-API / Sub2API | 成本敏感团队、DevOps 能力团队 | 零 license、可控可改、上线快 | 运维/合规/SLA 自担 |
| 云厂商替代 | Bedrock / Vertex / Azure AI | 已重度上云企业 | 合规与采购便利、生态整合 | 跨云治理弱、迁移成本高 |
3. 核心竞品标准化卡片(商业 + 开源)
3.1 OpenRouter
- 定位:多模型聚合与交易型路由平台,强调“统一 API + 提升可用性”。
- 目标客户:独立开发者、中小团队、需要快速接入多模型的产品团队。
- 关键能力:
- 提供 provider routing(排序、fallback、参数兼容约束)
- 支持按价格/延迟/吞吐路由偏好
- 支持 BYOK 与数据策略控制字段
- 商业模型:
- 推理价格按上游透传
- 充值时收取平台费(FAQ 公布 5.5%,最低 0.8 美元)
- BYOK 超阈值后按比例收取服务费
- 优势:模型覆盖广、接入速度快、路由能力产品化强。
- 短板:企业私有化与深度合规能力相对有限,采购链路偏“开发者自助”。
3.2 Portkey
- 定位:AI Gateway + Guardrails + Observability 一体化生产平台。
- 目标客户:中大型 AI 团队、强调治理与生产稳定性的组织。
- 关键能力:
- 配置化路由(负载、回退、可组合策略)
- 观测、告警、策略控制、治理能力并列提供
- 强调组织级运营能力(跨项目管理)
- 商业模型:
- 公开套餐化(官网展示免费/成长/企业路径)
- 企业合同与支持服务并行
- 常见模式为平台订阅 + 用量增长
- 优势:功能面完整,偏“生产控制台”而非单纯转发器。
- 短板:对小团队可能偏重,学习和治理配置复杂度高于轻量网关。
3.3 Cloudflare AI Gateway
- 定位:依托 Cloudflare 网络边缘能力的 AI 网关与观测层。
- 目标客户:已使用 Cloudflare 的开发团队与企业平台团队。
- 关键能力:
- OpenAI 兼容统一端点
- 日志、缓存、限流、重试与回退
- 动态路由(条件、比例、预算限制、版本管理)
- 商业模型:
- 核心功能免费(文档明确)
- 持久日志与 Logpush 基于配额/计划计费
- 企业版价格走客户经理/合同
- 优势:边缘网络与全球可用性、与现有 Cloudflare 体系集成紧密。
- 短板:跨云中立能力虽有,但企业常会被其生态绑定。
3.4 Helicone
- 定位:LLM 观测与成本优化平台,内含网关能力。
- 目标客户:先监控再治理的成长型 AI 团队。
- 关键能力:
- 请求级追踪、分析、评估
- 网关能力(缓存、限流、fallback 等)
- 注重成本可视化与运营闭环
- 商业模型:
- 公开分层:Hobby 免费、Pro/Team/Enterprise
- 座席 + 用量计费并行
- 企业版提供 SSO、私有化、合同能力
- 优势:观测产品成熟、上手快、性价比高。
- 短板:在“企业级治理深度”上通常弱于重平台化网关。
3.5 Kong AI Gateway
- 定位:从 API Gateway 领军平台延展至 AI 流量治理与安全。
- 目标客户:大型企业、已有 API 平台治理基础的组织。
- 关键能力:
- Universal API(多模型统一接入)
- AI 插件体系(安全、治理、路由、观测、RAG 注入)
- 企业级身份、审计、控制面整合
- 商业模型:
- 平台订阅(Konnect Plus/Enterprise)
- AI 能力作为 add-on 或模型代理配额收费
- 企业合同主导
- 优势:企业采购成熟、治理与安全体系完整、组织落地能力强。
- 短板:成本和引入门槛较高,中小团队早期采用摩擦大。
3.6 LiteLLM OSS / Enterprise
- 定位:开发者友好的多模型统一 SDK + Proxy(OpenAI 兼容)。
- 目标客户:平台工程团队、希望自建网关的组织。
- 关键能力:
- 多 provider 统一调用与代理
- 虚拟 Key、预算、团队治理、回退与负载
- 企业版补充 SSO/SCIM/JWT/支持服务
- 商业模型:
- OSS 免费(MIT)
- Enterprise 合同收费(SaaS 或自管)
- 优势:生态活跃、扩展快、可作为自建底座。
- 短板:OSS 到企业级落地仍需工程投入,复杂场景需要二次治理。
3.7 One-API(开源)
- 定位:经典 API 聚合与二次分发系统。
- 目标客户:预算敏感、追求快速上线的团队。
- 关键能力:
- 多模型统一入口
- 基础分发与额度管理
- 部署简单、社区基础大
- 商业模型:开源为主(MIT)。
- 优势:部署快、学习成本低。
- 短板:高级调度、企业治理、可观测深度相对有限。
3.8 New-API(开源)
- 定位:高活跃多协议聚合平台,强调 OpenAI/Claude/Gemini 兼容。
- 目标客户:需要多协议快速接入的中小团队。
- 关键能力:
- 协议覆盖广
- 预扣/结算计费链路、重试与通道治理
- 高迭代发布节奏
- 商业模型:开源为主,AGPLv3。
- 优势:功能覆盖广、更新频繁。
- 短板:AGPL 合规约束对闭源商用影响显著。
3.9 Sub2API(开源,高增长)
- 定位:面向订阅配额分发的 AI API Gateway。
- 目标客户:对成本非常敏感、希望快速中转的团队。
- 关键能力:
- 多账户/多 key/精细计费
- 调度策略较深(会话粘性 + 负载)
- 运营控制面完整度在开源项目中较强
- 商业模型:开源(MIT),以社区传播驱动。
- 优势:增长快、调度与运营字段较完整。
- 短板:企业合规、条款风险、商业支持体系需自担。
4. 竞品功能清单(54 项)
说明:以下为“商用 LLM 网关”功能全景清单,按产品能力域分组。建议你们把它作为 PRD 功能池与版本裁剪基线。
4.1 接入与协议(A01-A10)
| ID | 功能项 | 业务价值 |
|---|---|---|
| A01 | OpenAI 兼容接口 | 降低迁移成本 |
| A02 | 原生协议透传(Anthropic/Gemini 等) | 覆盖更多场景 |
| A03 | 多模型统一模型目录 | 减少模型选择成本 |
| A04 | 多 provider 凭证管理 | 支持多供应商并行 |
| A05 | BYOK(自带上游 Key) | 满足企业合规与成本控制 |
| A06 | 统一 SDK/客户端 | 降低接入复杂度 |
| A07 | 流式输出兼容 | 保障交互体验 |
| A08 | 多模态接口支持(图像/音频) | 拓展业务边界 |
| A09 | 批处理接口 | 降本增效 |
| A10 | 模型能力标签(上下文、工具调用、响应格式) | 提高路由准确率 |
4.2 路由与弹性(R01-R10)
| ID | 功能项 | 业务价值 |
|---|---|---|
| R01 | 基础负载均衡 | 提升吞吐稳定性 |
| R02 | 主备回退链 | 提升可用性 |
| R03 | 重试策略(指数退避) | 降低瞬时失败 |
| R04 | 会话粘性路由 | 保障上下文连续性 |
| R05 | 按成本排序路由 | 降低单位调用成本 |
| R06 | 按延迟排序路由 | 优化用户体验 |
| R07 | 按吞吐排序路由 | 优化批量任务效率 |
| R08 | 条件路由(用户分层/场景) | 精细化运营 |
| R09 | 灰度/比例路由(A/B) | 降低模型切换风险 |
| R10 | 熔断与自动恢复 | 避免故障扩散 |
4.3 治理与安全(G01-G10)
| ID | 功能项 | 业务价值 |
|---|---|---|
| G01 | 多租户隔离 | 支持企业组织结构 |
| G02 | RBAC 权限模型 | 降低误操作风险 |
| G03 | API Key 生命周期管理 | 保障密钥安全 |
| G04 | SSO/OIDC/SAML | 企业集成必备 |
| G05 | 审计日志 | 满足审计与追责 |
| G06 | 敏感信息脱敏/PII 处理 | 合规要求 |
| G07 | 模型白名单/黑名单 | 规范调用范围 |
| G08 | 提示词防护/内容安全 | 降低安全与品牌风险 |
| G09 | 区域与数据边界策略 | 满足数据驻留要求 |
| G10 | 策略版本与回滚 | 降低配置变更风险 |
4.4 成本与计费(C01-C08)
| ID | 功能项 | 业务价值 |
|---|---|---|
| C01 | 请求级 token 成本核算 | 精准经营 |
| C02 | 预扣-结算-退款链路 | 账实一致 |
| C03 | 预算(租户/团队/key) | 防止失控消费 |
| C04 | 配额周期管理(日/周/月) | 可运营化控制 |
| C05 | 成本归因(项目/用户/功能) | ROI 分析 |
| C06 | 成本告警(阈值/异常) | 及时止损 |
| C07 | 成本优化建议(模型替代) | 持续降本 |
| C08 | 发票/账单导出 | 财务对账 |
4.5 可观测与运维(O01-O08)
| ID | 功能项 | 业务价值 |
|---|---|---|
| O01 | 请求日志检索 | 故障排查 |
| O02 | 成功率/延迟监控 | SLA 管理 |
| O03 | 模型级性能对比 | 路由优化 |
| O04 | Trace 级链路追踪 | 定位瓶颈 |
| O05 | 自定义标签/元数据 | 业务分析 |
| O06 | 告警中心(邮件/IM/Webhook) | 快速响应 |
| O07 | 仪表盘与运营看板 | 管理层可视化 |
| O08 | 长期日志归档与检索 | 审计与复盘 |
4.6 生态与交付(E01-E08)
| ID | 功能项 | 业务价值 |
|---|---|---|
| E01 | SaaS 部署 | 快速上线 |
| E02 | 私有化部署 | 满足合规 |
| E03 | 混合部署 | 平衡灵活与安全 |
| E04 | Terraform/声明式配置 | 平台工程标准化 |
| E05 | Webhook/事件订阅 | 与业务系统联动 |
| E06 | 插件机制 | 可扩展能力 |
| E07 | SIEM/Observability 集成 | 融合企业工具链 |
| E08 | 商业支持与 SLA | 降低生产风险 |
5. 关键能力覆盖矩阵(P0 级 20 项)
说明:✅=公开明确支持,◐=部分/需组合实现,-=未见公开明确说明。
| 功能 | OpenRouter | Portkey | Cloudflare | Helicone | Kong | LiteLLM OSS | One-API | New-API | Sub2API |
|---|---|---|---|---|---|---|---|---|---|
| OpenAI 兼容接口 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| 多 provider 路由 | ✅ | ✅ | ✅ | ◐ | ✅ | ✅ | ◐ | ✅ | ✅ |
| 自动 fallback | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ◐ | ✅ | ✅ |
| 负载均衡 | ◐ | ✅ | ✅ | ◐ | ✅ | ✅ | ◐ | ✅ | ✅ |
| BYOK | ✅ | ✅ | ✅ | ◐ | ✅ | ✅ | ◐ | ◐ | ◐ |
| 缓存 | ◐ | ✅ | ✅ | ✅ | ✅ | ✅ | ◐ | ◐ | ◐ |
| 限流 | ◐ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| 预算管理 | ◐ | ✅ | ✅(动态路由预算节点) | ◐ | ✅ | ✅ | ◐ | ✅ | ✅ |
| 成本看板 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ◐ | ✅ | ✅ |
| 组织/团队管理 | ◐ | ✅ | ◐ | ✅ | ✅ | ✅ | ◐ | ✅ | ✅ |
| SSO/SAML/OIDC | 企业版 | 企业版 | Cloudflare 体系 | 企业版 | 企业版 | 企业版 | - | - | - |
| 审计日志 | ◐ | ✅ | ✅ | ✅ | ✅ | 企业版 | - | ◐ | ◐ |
| 可观测追踪 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ◐ | ✅ | ✅ |
| 灰度/比例路由 | ◐ | ✅ | ✅ | ◐ | ✅ | ◐ | - | ◐ | ◐ |
| 数据策略/隐私控制 | ✅ | ✅ | ✅ | ✅ | ✅ | ◐ | - | ◐ | ◐ |
| 策略可组合 | ◐ | ✅ | ✅ | ◐ | ✅ | ◐ | - | ◐ | ◐ |
| 私有化部署 | - | 可选 | - | 企业版 | ✅ | ✅ | ✅ | ✅ | ✅ |
| 插件/扩展能力 | ◐ | ◐ | ◐ | ◐ | ✅ | ✅ | ◐ | ✅ | ✅ |
| 企业 SLA 支持 | 企业版 | ✅ | ✅ | ✅ | ✅ | 企业版 | - | - | - |
| 合规能力(SOC2/HIPAA 等) | ◐ | 企业版 | Cloudflare 体系 | Team/Enterprise 提供 | 企业版 | 企业版 | - | - | - |
6. 商业模型矩阵(重点)
6.1 模型类型
| 商业模型 | 代表玩家 | 收费逻辑 | 对客户吸引点 | 对我方的启示 |
|---|---|---|---|---|
| 推理透传 + 平台费 | OpenRouter | 模型价透传,充值/服务费 | 成本透明、上手快 | 可作为“低摩擦入口”模型 |
| 订阅 + 用量 | Helicone、Portkey(常见) | 基础套餐 + 请求/存储/事件增量 | 可预测支出 + 可扩展 | 适合 SaaS 中腰部客户 |
| 平台订阅 + AI Add-on | Kong | 基础平台 + AI 模块附加 | 企业治理统一采购 | 高客单价但销售周期长 |
| 云生态捆绑计费 | Cloudflare | 计划配额 + 增量特性计费 | 与现有云资源整合 | 强生态对抗靠跨云中立 |
| 开源免费 + 企业授权 | LiteLLM | OSS 免费,企业版收费 | 先试后买、开发者友好 | 建议采用双轮驱动策略 |
| 开源自建 | One-API/New-API/Sub2API | license 免费,运维自担 | 最低软件成本 | 迫使商用版必须提供“非代码价值” |
6.2 定价指标(行业常见)
- 按请求量(requests)
- 按日志事件/存储量(logs/events/storage)
- 按模型代理数(model proxy)
- 按组织/座席(org/seats)
- 按账单量或平台分润(billing volume/fee)
- 按企业功能包(SSO/审计/私有化/SLA)
6.3 商业模型优劣
| 模式 | 优点 | 缺点 | 适配阶段 |
|---|---|---|---|
| 纯加价分润 | 规则简单、现金流快 | 同质化强、被价格战击穿 | 不建议作为主模式 |
| 纯订阅 | 收入稳定、可预测 | 初期成交门槛高 | 中后期可强化 |
| 混合(BYOK + 订阅 + 企业年约) | 可兼顾增长与利润 | 产品和销售复杂度更高 | 建议主路径 |
7. 技术优劣(平台成熟度视角)
评分范围:1(弱)-5(强),用于商业判断,不代表代码质量绝对值。
| 维度 | OpenRouter | Portkey | Cloudflare | Helicone | Kong | LiteLLM | One-API | New-API | Sub2API |
|---|---|---|---|---|---|---|---|---|---|
| 接入广度 | 5 | 5 | 4 | 4 | 5 | 5 | 4 | 5 | 4 |
| 路由策略深度 | 5 | 5 | 4 | 3 | 5 | 4 | 3 | 4 | 4 |
| 成本治理能力 | 4 | 5 | 4 | 4 | 4 | 4 | 3 | 4 | 4 |
| 企业治理能力 | 3 | 5 | 4 | 4 | 5 | 4 | 2 | 3 | 3 |
| 可观测成熟度 | 4 | 5 | 4 | 5 | 5 | 4 | 2 | 4 | 4 |
| 部署灵活性 | 2 | 4 | 2 | 4 | 5 | 5 | 5 | 5 | 5 |
| 合规与采购友好 | 3 | 4 | 5 | 4 | 5 | 4 | 2 | 2 | 2 |
| 生态与渠道能力 | 4 | 4 | 5 | 3 | 5 | 4 | 3 | 3 | 3 |
关键观察
- 商业化赛道中,Portkey/Kong 更偏“企业治理平台”;OpenRouter 更偏“交易聚合路由”。
- Cloudflare 的边缘与平台集成强,但跨云中立价值是其薄弱环节。
- Helicone 在观测与运营视角强,适合作为“先观测后治理”的切入。
- 开源赛道在“基础能力”上已足够成熟,商业产品必须强化治理、合规、SLA、组织协同价值。
8. 开源项目运营信号(GitHub 官方 API)
采样时间:2026-03-16。
| 项目 | Star | Fork | License | 最近推送 | 备注 |
|---|---|---|---|---|---|
| LiteLLM | 39,228 | 6,434 | MIT(仓库 API 显示 NOASSERTION,仓库内 LICENSE 为 MIT) | 2026-03-16 | 社区与生态最强 |
| One-API | 30,599 | 5,838 | MIT | 2026-01-09 | 中文社区影响力大 |
| New-API | 21,019 | 4,067 | AGPLv3 | 2026-03-16 | 高活跃,高合规约束 |
| Sub2API | 5,915 | 894 | MIT | 2026-03-16 | 增长快,运营导向明显 |
9. 机会空白(可用于你们产品定位)
9.1 市场尚未被充分满足的需求
- 多租户 FinOps 自动化:不仅展示成本,还要自动给出路由降本建议并可回放验证。
- 业务语义路由:按“场景目标(准确率/速度/预算)”驱动路由,而非仅按模型名。
- 财务对账闭环:预算、账单、团队归因、异常追责一体化。
- 合规策略模板:按行业(金融/医疗/出海)提供可落地策略包。
- “开源友好 + 企业可升级”:让技术团队先低成本接入,再平滑升级到企业治理版。
9.2 建议定位语(可选)
“不是另一个 API 转发器,而是企业 AI 成本与治理控制面。”
10. 对你项目的可执行结论
- 基础接入和转发能力不是壁垒,必须用“治理 + FinOps + 合规”打差异化。
- 商业模型建议从第一天就采用混合:
- 自助版(BYOK + 免费额度)
- 增长版(订阅 + 用量)
- 企业版(年约 + 私有化 + SLA)
- 首发版本不要追“模型最多”,而要追“企业采购可解释价值”:
- 成本可控
- 风险可控
- 责任可追溯
11. 下一轮补充调研(建议 2 周内)
- 客户访谈:
- 10 家中型 AI 团队(技术负责人)
- 5 家企业安全/合规负责人
- 商务访谈:
- 5 位有采购权的 IT/平台负责人
- 定价调研:
- 做一轮 Van Westendorp(100+ 样本)
- 验证“按组织 + 按请求 + 企业功能包”接受度
- 竞品实测:
- 选 3 家商业网关做 2 周试运行
- 对比接入时长、治理能力、成本可解释性
12. 参考来源(官方优先)
- OpenRouter Provider Routing: https://openrouter.ai/docs/features/provider-routing
- OpenRouter FAQ(费用与 BYOK): https://openrouter.ai/docs/faq
- Portkey 官网: https://portkey.ai/
- Portkey Fallbacks: https://docs.portkey.ai/docs/product/ai-gateway/fallbacks
- Portkey Load Balancing: https://docs.portkey.ai/docs/product/ai-gateway/load-balancing
- Cloudflare AI Gateway 概览: https://developers.cloudflare.com/ai-gateway/
- Cloudflare Unified API: https://developers.cloudflare.com/ai-gateway/usage/chat-completion/
- Cloudflare Dynamic Routing: https://developers.cloudflare.com/ai-gateway/features/dynamic-routing/
- Cloudflare Pricing: https://developers.cloudflare.com/ai-gateway/reference/pricing/
- Helicone Pricing: https://www.helicone.ai/pricing
- Kong AI Gateway 产品页: https://konghq.com/products/kong-ai-gateway
- Kong AI Gateway 文档: https://developer.konghq.com/ai-gateway/
- Kong AI Proxy 插件: https://docs.konghq.com/hub/kong-inc/ai-proxy/
- Kong Pricing: https://konghq.com/pricing
- LiteLLM 官网: https://www.litellm.ai/
- LiteLLM Enterprise: https://www.litellm.ai/enterprise
- LiteLLM Virtual Keys: https://docs.litellm.ai/docs/proxy/virtual_keys
- GitHub API - one-api: https://api.github.com/repos/songquanpeng/one-api
- GitHub API - new-api: https://api.github.com/repos/QuantumNous/new-api
- GitHub API - litellm: https://api.github.com/repos/BerriAI/litellm
- GitHub API - sub2api: https://api.github.com/repos/Wei-Shaw/sub2api