Files
supply-intelligence/prd/competitor-analysis.md
2026-05-07 10:16:46 +08:00

7.5 KiB
Raw Blame History

Supply-Intelligence 供应链智能增强 — 竞品分析报告

1. 竞品范围

竞品 项目地址 技术栈 相关能力
LiteLLM berriai/litellm Python/FastAPI 模型定价数据库、自动路由、新模型告警、部署冷却、容灾切换
Sub2API Wei-Shaw/sub2api Go/Gin/Ent 模型定价镜像、代理管理、账号/订阅管理、用量统计、公告系统
NewAPI / OneAPI Calcium-Ion/new-api Go/Gin/GORM 渠道管理、模型配置、上游状态监控

2. 核心能力对标

2.1 模型定价与供应商数据库

LiteLLM Model Prices Database

LiteLLM 维护了行业内最完整的模型定价数据库 model_prices_and_context_window_backup.json

关键特征:

  • 覆盖 100+ 供应商、1000+ 模型
  • 每个模型包含input_cost_per_token, output_cost_per_token, context_window, max_tokens, supports_vision, supports_function_calling 等
  • 支持分层定价tiered_pricing如 >128k tokens 时使用不同单价
  • 支持批量定价batch pricing
  • 支持音频 token 定价
  • 支持自定义成本覆盖

更新机制:

  • 主数据库内置在代码中,通过版本发布更新
  • 支持远程拉取更新(可配置镜像源)
  • Sub2API 就是从 LiteLLM 上游镜像此文件

Sub2API Pricing Service

Sub2API 的定价服务是被动消费型的(从上游获取):

关键设计:

  • 远程拉取 LiteLLM 镜像 model_prices_and_context_window.json
  • 本地 fallback 文件缓存
  • SHA256 hash 验证更新
  • 模型家族回退算法:未知模型按命名规则回退到已知模型
    • 例如gpt-5.3 未知 → 回退到 gpt-5.1
    • 例如claude-unknown → 回退到 claude-sonnet
  • 动态价格字段优先级配置

缺陷:

  • 被动获取,无主动发现新模型能力
  • 无模型质量探针(仅依赖定价数据)
  • 无自动测试和准入检查

2.2 供应商/渠道管理

Sub2API Proxy & Account Management

Sub2API 提供了完整的上游管理能力:

代理管理 (Proxy schema):

type Proxy struct {
    name     string   // 代理名称
    protocol string   // 协议
    host     string   // 主机
    port     int      // 端口
    username string   // 用户名(可选)
    password string   // 密码(可选)
    status   string   // active / inactive
}

账号管理 (Account schema):

  • 支持多个上游供应商
  • 每个账号关联一个代理Proxy
  • 支持账号分组AccountGroup
  • 软删除机制

用量统计 (UsageLog):

  • 详细记录每次请求的模型、token数、成本、时间戳
  • UsageCleanupTask: 定期清理过期用量数据

NewAPI/OneAPI 渠道管理

  • 支持多个上游渠道配置
  • 渠道状态监控(可用/不可用)
  • 支持渠道优先级和权重
  • 支持渠道购买次数限制

2.3 自动路由与容灾

LiteLLM Router & Auto-Router

LiteLLM 的路由系统是其核心竞争力:

路由策略:

  • lowest_latency: 选择响应最快的部署
  • lowest_cost: 选择成本最低的部署
  • lowest_tpm_rpm: TPM/RPM 最低
  • least_busy: 负载最低
  • auto_router: 语义路由(基于请求内容匹配最适模型)
  • budget_limiter: 按 key/team 限制预算

容灾机制:

  • Cooldown: 连续失败的部署自动进入 cooldown暂时从路由池移除
  • Fallback: 主模型失败时自动切换到备用模型
  • Retries: 可配置重试次数和策略

新模型告警 (new_model_added):

  • 当新模型上线时发送 Slack 告警
  • 但仅限于通知,无结构化的准入测试流程

2.4 用户与订阅管理

Sub2API 用户体系

  • User: 基础用户信息
  • UserSubscription: 订阅计划、配额、到期时间
  • UserAttributeDefinition / UserAttributeValue: 用户自定义属性
  • PromoCode / RedeemCode: 营销代码系统
  • SecuritySecret: 安全凭证管理

3. 差距分析(我们的机会)

能力维度 竞品现状 我们的机会
模型发现 LiteLLM 被动维护定价库Sub2API 被动镜像 主动全网扫描发现新模型(爬取供应商 API、HN、Twitter、官方文档
准入测试 竞品均不具备 自动化准入测试流程,含功能、性能、成本、安全等维度
质量探针 LiteLLM 仅有基础 cooldown无深度探针 多维度品质探针:连通性、配额、延迟、错误率、响应质量
自动注册 竞品均不支持 自动在供应商后台注册账号、申请 API Key
账号生命周期 Sub2API 有基础账号管理,无自动更新 自动轮换密钥、检测过期、自动补充账号
供应商健康大盘 Sub2API 有用量统计,无综合健康视图 统一供应商健康大盘,实时可视化
模型比价 LiteLLM 有定价库,但无比价能力 同类模型多供应商价格对比,智能推荐最优供应商
运营工作台 竞品均为散点式管理 统一运营工作台,支持干预操作(暂停、强制切换、测试触发)
模型下线预测 LiteLLM 有新模型告警,但无下线预测 基于用量趋势和供应商动态预测模型下线
自动化闭环 竞品均为人工配置 发现 → 测试 → 准入 → 上线 → 监控 → 下线 全自动化

4. 对产品规划的影响

强化方向

  1. 模型定价数据库参考 LiteLLM

    • 维护标准化的模型定价数据库,支持 input/output cost、context window、功能支持等字段
    • 支持远程更新和本地 fallback
    • 支持模型家族回退
  2. 供应商账号管理参考 Sub2API

    • 代理Proxy管理协议、主机、端口、状态
    • 账号分组AccountGroup
    • 软删除机制
    • 安全凭证管理
  3. 用量统计参考 Sub2API

    • 详细 UsageLog 记录
    • 定期清理机制
    • 用户-订阅-用量关联
  4. 路由策略参考 LiteLLM

    • 多种路由策略latency、cost、load、semantic
    • 容灾切换机制
    • 部署冷却

新增差异化能力

  1. 主动全网模型发现:竞品均为被动维护,我们应主动扫描
  2. 自动准入测试:竞品不具备,是核心差异化
  3. 自动账号注册:竞品不支持,是核心差异化
  4. 智能推荐:基于价格、质量、位置的供应商推荐
  5. 预测性分析:模型下线预测、供应商变动预测

5. 对技术规划的影响

应引入的设计模式

设计模式 来源 应用场景
Model Prices Database LiteLLM 模型定价数据库,支持远程更新和本地 fallback
SHA256 Hash 验证 Sub2API 定价数据更新的完整性验证
模型家族回退 Sub2API 未知模型的智能回退
Proxy + Account 关联 Sub2API 上游代理与账号的关联管理
UsageLog + CleanupTask Sub2API 用量记录与定期清理
路由策略抽象 LiteLLM 支持多种路由策略的插件化设计
Cooldown + Fallback LiteLLM 故障部署的自动处理

技术避坑

  1. 不重复造轮子: 定价数据库可以直接复用 LiteLLM 的开源数据,不需要自己维护
  2. 发现与测试解耦: 模型发现和准入测试应该解耦,支持独立触发和组合触发
  3. 注册模块的可扩展性: 每个供应商的注册流程不同,需要抽象接口 + 具体实现
  4. 测试隔离: 准入测试不得影响生产环境,必须使用独立账号或模拟环境