LLM Intelligence Hub — 产品需求文档 v0.3
文档版本:v0.3
日期:2026-05-09
负责人:宰相(AI 辅助)
状态:Phase 1 已冻结,执行中(采集器/数据库/日报已落地)
一、产品概述
1.1 背景
大模型市场竞争格局(2026年5月最新):
- 国内第一梯队:DeepSeek V3.2 / V4-Flash(RMB最低价)+ Kimi K2.6(首个超越GPT-5.4的开源模型)+ Qwen3.6(开源最强)+ GLM-5.1(综合)
- 海外第一梯队:xAI Grok 4.1 Fast($0.20/M,史上最便宜前沿模型)+ Claude Opus 4.6(降价67%至$5/$25)+ GPT-5系列
- 云平台:阿里云、腾讯云、百度云、华为云、火山引擎(字节)等国内平台;AWS Bedrock、Azure OpenAI、Google Cloud 等海外平台
- 中转聚合:硅基流动(SiliconFlow)、OpenRouter、Together AI、Groq、Cloudflare Workers AI 等
核心痛点:
- 模型信息极度分散——定价页、API 文档、公告分布在几十个平台
- 区域价格差异大——同一模型在中国区和国际区价格可能完全不同
- 免费政策不透明——免费额度、限流规则、区域限制缺乏统一汇总
- 中转平台价格战激烈——硅基流动、OpenRouter 等价格差异显著
- 信息更新滞后——人工维护成本高,无法实时追踪快速变化的定价
1.2 目标
建立一个覆盖全球的 LLM 情报数据库,持续追踪:
- 模型商:基础模型能力、版本迭代、发布动态
- 运营商/云平台:各区域定价、计费模式、免费额度
- 中转站:聚合 API 价格、对接稳定性、服务质量
最终输出:每日自动生成可视化报告(Web 页面),支持历史对比和趋势分析。
1.3 成功指标
| 指标 |
目标值(Phase 1) |
| 模型商覆盖率 |
国内外 20+ 主流厂商 |
| 运营商覆盖 |
30+ 云平台/中转站 |
| 模型总量 |
500+ 模型条目 |
| 更新频率 |
每日增量同步 |
| 报告生成 |
每日 08:00 自动触发 |
| 中文界面 |
100% 汉化 |
二、Phase 1 范围
范围
- 聚焦模型定价数据:采集 → 存储 → 报告三条链路落地
- 单条链路覆盖:OpenRouter(采集器)、PostgreSQL(存储)、Markdown 日报(报告输出到 reports/daily/)
- Explorer 页面:模型表格,支持筛选、排序、免费标记
- Dashboard 占位图:价格趋势示意(数据来自日报生成命令可重放)
非目标
- ❌ 多租户、用户登录、权限系统
- ❌ 图表组件库(用占位图替代)
- ❌ 邮件/飞书/...推送
- ❌ 多数据源并行采集(Phase 2 才扩展 OpenRouter/Together/Groq 等)
验收标准
- scripts/fetch_openrouter.go 存在且可单独运行,抓取结果写入 PostgreSQL
- db/migrations/*.sql 落地三张表:models、model_prices、report_runs
- 日报生成命令运行后在 reports/daily/ 目录产出 Markdown 文件
三、数据模型设计
2.1 核心实体
2.2 数据来源映射
| 数据类型 |
主要来源 |
获取方式 |
| 海外模型商 |
OpenRouter API(371 模型) |
API 自动同步 |
| 国内模型商 |
各厂商开放平台(ERNIE/Qwen/Hunyuan/Doubao 等) |
官方 API / 文档解析 |
| 云平台定价 |
AWS/Azure/阿里云/腾讯云/华为云定价页 |
官方 API / 正则解析 |
| 中转站定价 |
OpenRouter / SiliconFlow / Together AI / Groq |
API 同步 |
| 免费政策 |
各平台开发者文档 |
文档解析 + 人工补充 |
| 区域差异 |
各云平台区域定价页 |
多区域页面对比 |
四、功能需求
3.1 数据采集层(Must Have)
F1:多源数据采集
- OpenRouter API:371+ 海外模型,实时同步(定价/上下文/能力)
- 国内厂商 API:百度 Qianfan、阿里 DashScope、腾讯混元、字节火山引擎、DeepSeek、智谱 BigModel
- 中转平台:硅基流动 API、OpenRouter API(国内节点)、Together AI
- 更新策略:每日 08:00 全量同步 + 变更触发增量更新
- 错误处理:采集失败写入日志,保留上次成功数据,标记"数据待核实"
F2:模型基础信息库
- 模型名称、版本、发布商、发布时间
- 模态(文字/图片/音频/视频/代码)
- 上下文窗口、Capabilities(function calling / JSON mode / Vision)
- 模型状态(active / deprecated / discontinued)
F3:定价数据库
- 按运营商 × 模型 × 区域存储完整定价
- 支持货币自动换算(USD/CNY/EUR)
- 保留历史价格,支持趋势查看
- 标注价格数据质量(官方 / 推测 / 已过期)
F4:免费政策库
- 各平台免费模型列表
- 免费额度(每日/每月请求次数、Token 上限)
- 限流规则(QPS、并发、冷却时间)
- 区域限制(仅某地区可用、仅某用户类型可用)
- 特殊情况(限时免费、活动到期时间)
3.2 应用层(Must Have)
F5:每日自动报告生成
- 触发:每日 08:00 cron
- 内容:
- 今日新上线 / 更新的模型
- 价格变动提醒(>5% 变动高亮)
- 免费政策变更
- 场景推荐 TOP 10(编码/写作/推理/免费/低成本)
- 成本优化建议(同能力更低价格选项)
- 格式:HTML Web 页面(内网可访问)+ PDF 导出
- 分发:支持推送至钉钉群/飞书群/Email
F6:搜索与筛选
- 筛选:厂商 / 模态 / 场景 / 价格区间 / 上下文长度 / 免费/付费
- 搜索:模型名、厂商名、特性关键词
- 视图:卡片视图 / 表格视图 / 趋势图
F7:成本计算器
- 输入:Token 数量(输入/输出分开)
- 输出:各平台/运营商成本对比排行榜
- 支持按月用量估算
3.3 进阶功能(Should Have)
F8:价格变动告警
- 触发条件:价格变动 > 10%(可配置)
- 通知方式:钉钉/飞书/Email 推送
- 白名单:用户关注特定模型/平台
F9:模型评测聚合
- MMLU / HumanEval / GSM8K / MATH / LiveCodeBench 等基准分
- 按场景排名(编码/推理/写作/免费)
F10:API 接口
- JSON API 供 AI Agent 查询最优模型
- MCP Server 供 OpenClaw/Claude Code 等集成
五、覆盖范围
4.1 模型商(目标 20+)
国内厂商(目标 12 家,2026-05 实际定价)
| 厂商 |
代表模型 |
输入 CNY/MT |
输出 CNY/MT |
最新动态 |
| DeepSeek |
V3.2 / V4-Flash / R1 |
¥0.14-0.27 |
¥0.028-0.135 |
V4-Flash:全球最便宜1M context |
| 阿里 |
Qwen3-VL-32B / 8B |
¥0.18-0.20 |
¥0.60-0.68 |
Qwen3.6 开源性能逼近闭源 |
| Moonshot |
Kimi K2.6 / K2.5 |
¥0.23-0.95 |
¥0.07-0.16 |
K2.6 超越 GPT-5.4(SWE-Bench Pro) |
| 智谱 |
GLM-5.1 / GLM-4.7 |
¥0.42-1.40 |
¥0.11-0.26 |
GLM-5.1 编码能力接近 Opus 4.6 |
| MiniMax |
M2.5 |
¥0.30 |
¥0.03 |
多模态+语音,API 性价比极高 |
| 字节 |
Doubao / Step-3.5-Flash |
¥0.10+ |
— |
Step-3.5 Flash 约 GPT-4o 的 1/25 价格 |
| 百度 |
ERNIE-4.5-300B |
¥0.28 |
¥1.10 |
老牌旗舰,搜索集成 |
| 腾讯 |
Hunyuan-A13B |
¥0.14 |
¥0.57 |
腾讯系生态集成 |
| 华为 |
Pangu-4 / 3 |
企业定价 |
企业定价 |
政务/国企客户多 |
| 讯飞 |
Spark-4.0 |
企业定价 |
企业定价 |
语音交互强 |
| 零一万物 |
Yi-Large |
企业定价 |
企业定价 |
开源 Yi 系列 |
| 昆仑万维 |
Skywork-13B |
企业定价 |
企业定价 |
开源系列 |
海外厂商(目标 10 家)
| 厂商 |
代表模型 |
API 平台 |
| OpenAI |
GPT-4o / GPT-4.5 / o3 / o4 |
platform.openai.com |
| Anthropic |
Claude 3.5 Sonnet / Claude 4 |
console.anthropic.com |
| Google |
Gemini 2.0 / Gemini 1.5 |
ai.google.dev |
| Meta |
Llama 4 / Llama 3.3 |
(via Azure/单独部署) |
| xAI |
Grok-3 / Grok-4 |
x.ai |
| Mistral |
Mistral Large / Codestral |
mistral.ai |
| Cohere |
Command R+ / Command |
Cohere |
| Perplexity |
Sonar (Pro/Rtel) |
perplexity.ai |
| Amazon |
Claude/Gemini/Llama (on Bedrock) |
AWS Bedrock |
| Microsoft |
GPT-4 (on Azure) |
Azure OpenAI |
4.2 运营商/云平台(目标 30+)
国内云厂商(8 家)
| 平台 |
网址 |
主力模型 |
| 阿里云 |
aliyun.com |
Qwen / 通义全系 |
| 腾讯云 |
cloud.tencent.com |
Hunyuan 全系 |
| 百度智能云 |
cloud.baidu.com |
ERNIE 全系 |
| 华为云 |
huaweicloud.com |
Pangu 全系 |
| 火山引擎 |
volcengine.com |
Doubao 全系 |
| 京东云 |
jdcloud.com |
言犀(自研) |
| 电信天翼云 |
ctyun.cn |
(接入第三方模型) |
| 移动云 |
cmcc.cn |
(接入第三方模型) |
国内中转/聚合(5 家)
| 平台 |
网址 |
特色 |
| 硅基流动 |
siliconflow.cn |
国内最便宜中转之一 |
| OpenAI 中转 |
openai-sg.com 等 |
直连/新加坡节点 |
| DeepSeek 中转 |
多家 |
国内访问 DeepSeek |
| Azure 中转 |
多家 |
绕过 Azure 限制 |
| Claude 中转 |
多家 |
国内访问 Claude |
海外云厂商(6 家)
| 平台 |
网址 |
主力模型 |
| AWS Bedrock |
aws.amazon.com/bedrock |
Claude/Gemini/Llama/Titan |
| Azure OpenAI |
azure.microsoft.com |
GPT-4/GPT-4o |
| Google Cloud |
cloud.google.com |
Gemini/PaLM |
| Cloudflare Workers AI |
developers.cloudflare.com/workers-ai |
Llama/Gemma 等 |
| Oracle Cloud AI |
oracle.com/cloud |
Llama/Mistral |
| IBM watsonx |
ibm.com/watsonx |
Granite/Maestro |
海外中转聚合(8 家)
| 平台 |
网址 |
特色 |
| OpenRouter |
openrouter.ai |
371+ 模型,ELO 排行,免费模型多 |
| Together AI |
together.ai |
开源模型为主 |
| Groq |
console.groq.com |
高速推理(Llama/Mixtral) |
| Replicate |
replicate.com |
镜像部署,方便 |
| Anyscale |
anyscale.com |
Ray serving |
| Fireworks AI |
fireworks.ai |
高速开源模型 |
| Lepton AI |
lepton.ai |
按需计费 |
| Perplexity API |
perplexity.ai |
Sonar 模型专属 |
六、竞品对比
| 维度 |
OpenRouter |
AgentDeals |
硅基流动 |
Artificial Analysis |
LLM Intelligence Hub |
| 模型数量 |
371+ |
19+ |
50+ |
不明 |
500+ |
| 实时数据 |
✅ API |
✅ 月更 |
✅ API |
定期 |
✅ 每日 |
| CNY 定价 |
❌ |
❌ |
✅ |
❌ |
✅ |
| USD 定价 |
✅ |
✅ |
部分 |
✅ |
✅ |
| 国内厂商 |
有限 |
有限 |
✅全 |
❌ |
✅ 12家 |
| 免费政策 |
✅ 标记 |
✅ 详细 |
✅ |
✅ 基础 |
✅ 详细追踪 |
| 性能评测 |
❌ |
❌ |
❌ |
✅ |
✅ 聚合 |
| 告警通知 |
❌ |
❌ |
❌ |
❌ |
✅ |
| 每日报告 |
❌ |
❌ |
❌ |
❌ |
✅ |
| 中文界面 |
❌ |
❌ |
✅ |
❌ |
✅ |
| Web 界面 |
✅ |
✅ |
✅ |
✅付费 |
✅ |
| MCP Server |
❌ |
❌ |
❌ |
❌ |
✅ |
七、里程碑
| Phase |
时间 |
目标 |
关键交付 |
| Phase 1 |
2026-Q2 |
MVP 上线 |
采集+存储+日报+Explorer |
| Phase 2 |
2026-Q3 |
多数据源+告警 |
国内厂商采集+推送+趋势图 |
| Phase 3 |
2026-Q4 |
商业化 |
订阅付费+API+MCP Server |
八、术语表
| 术语 |
定义 |
| MTok |
Million Tokens,百万 Token |
| Reseller |
中转聚合平台(如硅基流动、OpenRouter) |
| ELO |
模型质量评分系统(OpenRouter 采用) |
| Context Length |
上下文窗口长度(tokens) |
| Free Tier |
免费额度层 |
| Capability |
模型能力(如 vision、function calling) |
九、参考链接
8.1 数据来源
- OpenRouter API Docs:
https://openrouter.ai/docs
- 硅基流动定价:
https://siliconflow.cn/pricing
- AgentDeals.dev:
https://agentdeals.dev
- Artificial Analysis:
https://artificialanalysis.ai
8.2 厂商开放平台
- OpenAI:
https://platform.openai.com/pricing
- Anthropic:
https://console.anthropic.com
- 百度 ERNIE:
https://qianfan.llm.yundun.cn/
- 阿里 DashScope:
https://help.aliyun.com/zh/dashscope/
- DeepSeek:
https://platform.deepseek.com/
8.3 数据字典(核心字段)
| 字段 |
类型 |
说明 |
示例 |
| provider_name |
string |
模型商名称 |
"OpenAI" / "百度" |
| model_name |
string |
模型名称 |
"GPT-4o" / "ERNIE-4.0" |
| operator_name |
string |
运营商名称 |
"AWS Bedrock" / "硅基流动" |
| region |
string |
区域代码 |
"CN" / "US" / "GLOBAL" |
| currency |
string |
货币 |
"USD" / "CNY" |
| input_price |
float |
输入价格(/MTok) |
2.5 |
| output_price |
float |
输出价格(/MTok) |
10.0 |
| free_tier |
text |
免费额度描述 |
"每日100次,每次不超过4000 tokens" |
| context_length |
int |
上下文窗口 |
128000 |
| capabilities |
array |
能力列表 |
["vision","function_calling"] |
十一、数据质量与血缘
六、数据质量与血缘
- 数据校验规则:价格不能为负、context_length 不能超过 10M、currency 必须为 CNY/USD/EUR 之一
- 数据新鲜度指标:每条记录标注
retrieved_at,超过 24h 标记为 stale
- 数据血缘追踪:每条价格记录记录来源 API URL、采集批次号、采集器版本
- 质量分级:official(官方API)/ inferred(推导)/ unverified(未验证)/ stale(过期)
- 自动清洗:采集失败时保留上次成功数据,标记 "data_stale_until_next_run"
- 质量报告:每日报告包含数据质量摘要(覆盖率/新鲜度/异常数)