Files
llm-intelligence/PRD.md
2026-05-13 14:42:45 +08:00

16 KiB
Raw Permalink Blame History

LLM Intelligence Hub — 产品需求文档 v0.3

文档版本v0.3 日期2026-05-09 负责人宰相AI 辅助) 状态Phase 1 已冻结,执行中(采集器/数据库/日报已落地)


一、产品概述

1.1 背景

大模型市场竞争格局2026年5月最新

  • 国内第一梯队DeepSeek V3.2 / V4-FlashRMB最低价+ Kimi K2.6首个超越GPT-5.4的开源模型)+ Qwen3.6(开源最强)+ GLM-5.1(综合)
  • 海外第一梯队xAI Grok 4.1 Fast$0.20/M史上最便宜前沿模型+ Claude Opus 4.6降价67%至$5/$25+ GPT-5系列
  • 云平台阿里云、腾讯云、百度云、华为云、火山引擎字节等国内平台AWS Bedrock、Azure OpenAI、Google Cloud 等海外平台
  • 中转聚合硅基流动SiliconFlow、OpenRouter、Together AI、Groq、Cloudflare Workers AI 等

核心痛点

  1. 模型信息极度分散——定价页、API 文档、公告分布在几十个平台
  2. 区域价格差异大——同一模型在中国区和国际区价格可能完全不同
  3. 免费政策不透明——免费额度、限流规则、区域限制缺乏统一汇总
  4. 中转平台价格战激烈——硅基流动、OpenRouter 等价格差异显著
  5. 信息更新滞后——人工维护成本高,无法实时追踪快速变化的定价

1.2 目标

建立一个覆盖全球的 LLM 情报数据库,持续追踪:

  • 模型商:基础模型能力、版本迭代、发布动态
  • 运营商/云平台:各区域定价、计费模式、免费额度
  • 中转站:聚合 API 价格、对接稳定性、服务质量

最终输出每日自动生成可视化报告Web 页面),支持历史对比和趋势分析。

1.3 成功指标

指标 目标值Phase 1
模型商覆盖率 国内外 20+ 主流厂商
运营商覆盖 30+ 云平台/中转站
模型总量 500+ 模型条目
更新频率 每日增量同步
报告生成 每日 08:00 自动触发
中文界面 100% 汉化

二、Phase 1 范围

范围

  • 聚焦模型定价数据:采集 → 存储 → 报告三条链路落地
  • 单条链路覆盖OpenRouter采集器、PostgreSQL存储、Markdown 日报(报告输出到 reports/daily/
  • Explorer 页面:模型表格,支持筛选、排序、免费标记
  • Dashboard 占位图:价格趋势示意(数据来自日报生成命令可重放)

非目标

  • 多租户、用户登录、权限系统
  • 图表组件库(用占位图替代)
  • 邮件/飞书/...推送
  • 多数据源并行采集Phase 2 才扩展 OpenRouter/Together/Groq 等)

验收标准

  1. scripts/fetch_openrouter.go 存在且可单独运行,抓取结果写入 PostgreSQL
  2. db/migrations/*.sql 落地三张表models、model_prices、report_runs
  3. 日报生成命令运行后在 reports/daily/ 目录产出 Markdown 文件

三、数据模型设计

2.1 核心实体

LLM Intelligence Hub
│
├── ModelProvider模型商
│   ├── name名称: "OpenAI" / "百度" / "DeepSeek"
│   ├── country国籍: "US" / "CN" / "EU"
│   ├── website: 官网
│   ├── founded: 成立时间
│   └── models[] → Model下属模型列表
│
├── Model模型
│   ├── id: 全局唯一标识
│   ├── provider_id → ModelProvider
│   ├── name: "GPT-4o" / "ERNIE-4.0" / "Qwen-72B"
│   ├── version: 版本号(如 "2025-12"
│   ├── modality模态: text / vision / audio / video / code
│   ├── context_length: 上下文窗口tokens
│   ├── capabilities[]: ["function_calling", "json_mode", "vision"]
│   ├── release_date: 发布时间
│   ├── status: active / deprecated / discontinued
│   └── parent_model父模型: 用于区分 Turbo/Lite 等变体
│
├── Operator运营商/云平台)
│   ├── name: "阿里云" / "AWS" / "硅基流动"
│   ├── type: "cloud"(云厂商)/ "reseller"(中转)/ "official"(官方直销)
│   ├── country: 运营主体国籍
│   ├── website: 控制台地址
│   ├── api_endpoint: API 地址
│   ├── auth_type: "api_key" / "oauth" / "STS"
│   └── region_pricing[] → RegionPricing各区域定价
│
├── RegionPricing区域定价
│   ├── id
│   ├── operator_id → Operator
│   ├── model_id → Model哪个模型在此平台有售
│   ├── region: "CN" / "US" / "EU" / "GLOBAL"
│   ├── currency: "CNY" / "USD" / "EUR"
│   ├── input_price_per_mtok: 输入价格(元/百万 Token
│   ├── output_price_per_mtok: 输出价格
│   ├── free_tier免费层: 描述免费额度
│   ├── free_limitations[]: ["每日限100次", "仅限国内IP"]
│   ├── rate_limit: 限流规则
│   ├── last_updated: 最后更新
│   └── source_url: 价格页/文档链接
│
├── PricingChange价格变动记录
│   ├── id
│   ├── model_id → Model
│   ├── operator_id → Operator
│   ├── region
│   ├── old_price / new_price
│   ├── change_date
│   └── change_type: increase / decrease / new_model / discontinued
│
└── DailyReport每日报告
    ├── id
    ├── report_date
    ├── new_models[]: 今日新上线模型
    ├── price_changes[]: 价格变动
    ├── free_policy_changes[]: 免费政策变更
    ├── top_recommendations{}: 场景推荐
    └── html_content: Web 报告内容

2.2 数据来源映射

数据类型 主要来源 获取方式
海外模型商 OpenRouter API371 模型) API 自动同步
国内模型商 各厂商开放平台ERNIE/Qwen/Hunyuan/Doubao 等) 官方 API / 文档解析
云平台定价 AWS/Azure/阿里云/腾讯云/华为云定价页 官方 API / 正则解析
中转站定价 OpenRouter / SiliconFlow / Together AI / Groq API 同步
免费政策 各平台开发者文档 文档解析 + 人工补充
区域差异 各云平台区域定价页 多区域页面对比

四、功能需求

3.1 数据采集层Must Have

F1多源数据采集

  • OpenRouter API371+ 海外模型,实时同步(定价/上下文/能力)
  • 国内厂商 API:百度 Qianfan、阿里 DashScope、腾讯混元、字节火山引擎、DeepSeek、智谱 BigModel
  • 中转平台:硅基流动 API、OpenRouter API国内节点、Together AI
  • 更新策略:每日 08:00 全量同步 + 变更触发增量更新
  • 错误处理:采集失败写入日志,保留上次成功数据,标记"数据待核实"

F2模型基础信息库

  • 模型名称、版本、发布商、发布时间
  • 模态(文字/图片/音频/视频/代码)
  • 上下文窗口、Capabilitiesfunction calling / JSON mode / Vision
  • 模型状态active / deprecated / discontinued

F3定价数据库

  • 按运营商 × 模型 × 区域存储完整定价
  • 支持货币自动换算USD/CNY/EUR
  • 保留历史价格,支持趋势查看
  • 标注价格数据质量(官方 / 推测 / 已过期)

F4免费政策库

  • 各平台免费模型列表
  • 免费额度(每日/每月请求次数、Token 上限)
  • 限流规则QPS、并发、冷却时间
  • 区域限制(仅某地区可用、仅某用户类型可用)
  • 特殊情况(限时免费、活动到期时间)

3.2 应用层Must Have

F5每日自动报告生成

  • 触发:每日 08:00 cron
  • 内容
    1. 今日新上线 / 更新的模型
    2. 价格变动提醒(>5% 变动高亮)
    3. 免费政策变更
    4. 场景推荐 TOP 10编码/写作/推理/免费/低成本)
    5. 成本优化建议(同能力更低价格选项)
  • 格式HTML Web 页面(内网可访问)+ PDF 导出
  • 分发:支持推送至钉钉群/飞书群/Email

F6搜索与筛选

  • 筛选:厂商 / 模态 / 场景 / 价格区间 / 上下文长度 / 免费/付费
  • 搜索:模型名、厂商名、特性关键词
  • 视图:卡片视图 / 表格视图 / 趋势图

F7成本计算器

  • 输入Token 数量(输入/输出分开)
  • 输出:各平台/运营商成本对比排行榜
  • 支持按月用量估算

3.3 进阶功能Should Have

F8价格变动告警

  • 触发条件:价格变动 > 10%(可配置)
  • 通知方式:钉钉/飞书/Email 推送
  • 白名单:用户关注特定模型/平台

F9模型评测聚合

  • MMLU / HumanEval / GSM8K / MATH / LiveCodeBench 等基准分
  • 按场景排名(编码/推理/写作/免费)

F10API 接口

  • JSON API 供 AI Agent 查询最优模型
  • MCP Server 供 OpenClaw/Claude Code 等集成

五、覆盖范围

4.1 模型商(目标 20+

国内厂商(目标 12 家2026-05 实际定价)

厂商 代表模型 输入 CNY/MT 输出 CNY/MT 最新动态
DeepSeek V3.2 / V4-Flash / R1 ¥0.14-0.27 ¥0.028-0.135 V4-Flash全球最便宜1M context
阿里 Qwen3-VL-32B / 8B ¥0.18-0.20 ¥0.60-0.68 Qwen3.6 开源性能逼近闭源
Moonshot Kimi K2.6 / K2.5 ¥0.23-0.95 ¥0.07-0.16 K2.6 超越 GPT-5.4SWE-Bench Pro
智谱 GLM-5.1 / GLM-4.7 ¥0.42-1.40 ¥0.11-0.26 GLM-5.1 编码能力接近 Opus 4.6
MiniMax M2.5 ¥0.30 ¥0.03 多模态+语音API 性价比极高
字节 Doubao / Step-3.5-Flash ¥0.10+ Step-3.5 Flash 约 GPT-4o 的 1/25 价格
百度 ERNIE-4.5-300B ¥0.28 ¥1.10 老牌旗舰,搜索集成
腾讯 Hunyuan-A13B ¥0.14 ¥0.57 腾讯系生态集成
华为 Pangu-4 / 3 企业定价 企业定价 政务/国企客户多
讯飞 Spark-4.0 企业定价 企业定价 语音交互强
零一万物 Yi-Large 企业定价 企业定价 开源 Yi 系列
昆仑万维 Skywork-13B 企业定价 企业定价 开源系列

海外厂商(目标 10 家)

厂商 代表模型 API 平台
OpenAI GPT-4o / GPT-4.5 / o3 / o4 platform.openai.com
Anthropic Claude 3.5 Sonnet / Claude 4 console.anthropic.com
Google Gemini 2.0 / Gemini 1.5 ai.google.dev
Meta Llama 4 / Llama 3.3 (via Azure/单独部署)
xAI Grok-3 / Grok-4 x.ai
Mistral Mistral Large / Codestral mistral.ai
Cohere Command R+ / Command Cohere
Perplexity Sonar (Pro/Rtel) perplexity.ai
Amazon Claude/Gemini/Llama (on Bedrock) AWS Bedrock
Microsoft GPT-4 (on Azure) Azure OpenAI

4.2 运营商/云平台(目标 30+

国内云厂商8 家)

平台 网址 主力模型
阿里云 aliyun.com Qwen / 通义全系
腾讯云 cloud.tencent.com Hunyuan 全系
百度智能云 cloud.baidu.com ERNIE 全系
华为云 huaweicloud.com Pangu 全系
火山引擎 volcengine.com Doubao 全系
京东云 jdcloud.com 言犀(自研)
电信天翼云 ctyun.cn (接入第三方模型)
移动云 cmcc.cn (接入第三方模型)

国内中转/聚合5 家)

平台 网址 特色
硅基流动 siliconflow.cn 国内最便宜中转之一
OpenAI 中转 openai-sg.com 等 直连/新加坡节点
DeepSeek 中转 多家 国内访问 DeepSeek
Azure 中转 多家 绕过 Azure 限制
Claude 中转 多家 国内访问 Claude

海外云厂商6 家)

平台 网址 主力模型
AWS Bedrock aws.amazon.com/bedrock Claude/Gemini/Llama/Titan
Azure OpenAI azure.microsoft.com GPT-4/GPT-4o
Google Cloud cloud.google.com Gemini/PaLM
Cloudflare Workers AI developers.cloudflare.com/workers-ai Llama/Gemma 等
Oracle Cloud AI oracle.com/cloud Llama/Mistral
IBM watsonx ibm.com/watsonx Granite/Maestro

海外中转聚合8 家)

平台 网址 特色
OpenRouter openrouter.ai 371+ 模型ELO 排行,免费模型多
Together AI together.ai 开源模型为主
Groq console.groq.com 高速推理Llama/Mixtral
Replicate replicate.com 镜像部署,方便
Anyscale anyscale.com Ray serving
Fireworks AI fireworks.ai 高速开源模型
Lepton AI lepton.ai 按需计费
Perplexity API perplexity.ai Sonar 模型专属

六、竞品对比

维度 OpenRouter AgentDeals 硅基流动 Artificial Analysis LLM Intelligence Hub
模型数量 371+ 19+ 50+ 不明 500+
实时数据 API 月更 API 定期 每日
CNY 定价
USD 定价 部分
国内厂商 有限 有限 12家
免费政策 标记 详细 基础 详细追踪
性能评测 聚合
告警通知
每日报告
中文界面
Web 界面 付费
MCP Server

七、里程碑

Phase 时间 目标 关键交付
Phase 1 2026-Q2 MVP 上线 采集+存储+日报+Explorer
Phase 2 2026-Q3 多数据源+告警 国内厂商采集+推送+趋势图
Phase 3 2026-Q4 商业化 订阅付费+API+MCP Server

八、术语表

术语 定义
MTok Million Tokens百万 Token
Reseller 中转聚合平台如硅基流动、OpenRouter
ELO 模型质量评分系统OpenRouter 采用)
Context Length 上下文窗口长度tokens
Free Tier 免费额度层
Capability 模型能力(如 vision、function calling

九、参考链接

8.1 数据来源

  • OpenRouter API Docs: https://openrouter.ai/docs
  • 硅基流动定价: https://siliconflow.cn/pricing
  • AgentDeals.dev: https://agentdeals.dev
  • Artificial Analysis: https://artificialanalysis.ai

8.2 厂商开放平台

  • OpenAI: https://platform.openai.com/pricing
  • Anthropic: https://console.anthropic.com
  • 百度 ERNIE: https://qianfan.llm.yundun.cn/
  • 阿里 DashScope: https://help.aliyun.com/zh/dashscope/
  • DeepSeek: https://platform.deepseek.com/

8.3 数据字典(核心字段)

字段 类型 说明 示例
provider_name string 模型商名称 "OpenAI" / "百度"
model_name string 模型名称 "GPT-4o" / "ERNIE-4.0"
operator_name string 运营商名称 "AWS Bedrock" / "硅基流动"
region string 区域代码 "CN" / "US" / "GLOBAL"
currency string 货币 "USD" / "CNY"
input_price float 输入价格(/MTok 2.5
output_price float 输出价格(/MTok 10.0
free_tier text 免费额度描述 "每日100次每次不超过4000 tokens"
context_length int 上下文窗口 128000
capabilities array 能力列表 ["vision","function_calling"]

十一、数据质量与血缘

六、数据质量与血缘

  • 数据校验规则价格不能为负、context_length 不能超过 10M、currency 必须为 CNY/USD/EUR 之一
  • 数据新鲜度指标:每条记录标注 retrieved_at,超过 24h 标记为 stale
  • 数据血缘追踪:每条价格记录记录来源 API URL、采集批次号、采集器版本
  • 质量分级official官方API/ inferred推导/ unverified未验证/ stale过期
  • 自动清洗:采集失败时保留上次成功数据,标记 "data_stale_until_next_run"
  • 质量报告:每日报告包含数据质量摘要(覆盖率/新鲜度/异常数)