niuniu/llm-intelligence

Fork 1

Files

phamnazage-jpg 77e6610fd2

CI / test (push) Has been cancelled

Details

chore: prepare repository for publishing

2026-05-13 14:42:45 +08:00

16 KiB

Raw Blame History

LLM Intelligence Hub — 产品需求文档 v0.3

文档版本：v0.3 日期：2026-05-09 负责人：宰相（AI 辅助）状态：Phase 1 已冻结，执行中（采集器/数据库/日报已落地）

一、产品概述

1.1 背景

大模型市场竞争格局（2026年5月最新）：

国内第一梯队：DeepSeek V3.2 / V4-Flash（RMB最低价）+ Kimi K2.6（首个超越GPT-5.4的开源模型）+ Qwen3.6（开源最强）+ GLM-5.1（综合）
海外第一梯队：xAI Grok 4.1 Fast（$0.20/M，史上最便宜前沿模型）+ Claude Opus 4.6（降价67%至$5/$25）+ GPT-5系列
云平台：阿里云、腾讯云、百度云、华为云、火山引擎（字节）等国内平台；AWS Bedrock、Azure OpenAI、Google Cloud 等海外平台
中转聚合：硅基流动（SiliconFlow）、OpenRouter、Together AI、Groq、Cloudflare Workers AI 等

核心痛点：

模型信息极度分散——定价页、API 文档、公告分布在几十个平台
区域价格差异大——同一模型在中国区和国际区价格可能完全不同
免费政策不透明——免费额度、限流规则、区域限制缺乏统一汇总
中转平台价格战激烈——硅基流动、OpenRouter 等价格差异显著
信息更新滞后——人工维护成本高，无法实时追踪快速变化的定价

1.2 目标

建立一个覆盖全球的 LLM 情报数据库，持续追踪：

模型商：基础模型能力、版本迭代、发布动态
运营商/云平台：各区域定价、计费模式、免费额度
中转站：聚合 API 价格、对接稳定性、服务质量

最终输出：每日自动生成可视化报告（Web 页面），支持历史对比和趋势分析。

1.3 成功指标

指标	目标值（Phase 1）
模型商覆盖率	国内外 20+ 主流厂商
运营商覆盖	30+ 云平台/中转站
模型总量	500+ 模型条目
更新频率	每日增量同步
报告生成	每日 08:00 自动触发
中文界面	100% 汉化

二、Phase 1 范围

范围

聚焦模型定价数据：采集 → 存储 → 报告三条链路落地
单条链路覆盖：OpenRouter（采集器）、PostgreSQL（存储）、Markdown 日报（报告输出到 reports/daily/）
Explorer 页面：模型表格，支持筛选、排序、免费标记
Dashboard 占位图：价格趋势示意（数据来自日报生成命令可重放）

非目标

❌ 多租户、用户登录、权限系统
❌ 图表组件库（用占位图替代）
❌ 邮件/飞书/...推送
❌ 多数据源并行采集（Phase 2 才扩展 OpenRouter/Together/Groq 等）

验收标准

scripts/fetch_openrouter.go 存在且可单独运行，抓取结果写入 PostgreSQL
db/migrations/*.sql 落地三张表：models、model_prices、report_runs
日报生成命令运行后在 reports/daily/ 目录产出 Markdown 文件

三、数据模型设计

2.1 核心实体

LLM Intelligence Hub
│
├── ModelProvider（模型商）
│   ├── name（名称）: "OpenAI" / "百度" / "DeepSeek"
│   ├── country（国籍）: "US" / "CN" / "EU"
│   ├── website: 官网
│   ├── founded: 成立时间
│   └── models[] → Model（下属模型列表）
│
├── Model（模型）
│   ├── id: 全局唯一标识
│   ├── provider_id → ModelProvider
│   ├── name: "GPT-4o" / "ERNIE-4.0" / "Qwen-72B"
│   ├── version: 版本号（如 "2025-12"）
│   ├── modality（模态）: text / vision / audio / video / code
│   ├── context_length: 上下文窗口（tokens）
│   ├── capabilities[]: ["function_calling", "json_mode", "vision"]
│   ├── release_date: 发布时间
│   ├── status: active / deprecated / discontinued
│   └── parent_model（父模型）: 用于区分 Turbo/Lite 等变体
│
├── Operator（运营商/云平台）
│   ├── name: "阿里云" / "AWS" / "硅基流动"
│   ├── type: "cloud"（云厂商）/ "reseller"（中转）/ "official"（官方直销）
│   ├── country: 运营主体国籍
│   ├── website: 控制台地址
│   ├── api_endpoint: API 地址
│   ├── auth_type: "api_key" / "oauth" / "STS"
│   └── region_pricing[] → RegionPricing（各区域定价）
│
├── RegionPricing（区域定价）
│   ├── id
│   ├── operator_id → Operator
│   ├── model_id → Model（哪个模型在此平台有售）
│   ├── region: "CN" / "US" / "EU" / "GLOBAL"
│   ├── currency: "CNY" / "USD" / "EUR"
│   ├── input_price_per_mtok: 输入价格（元/百万 Token）
│   ├── output_price_per_mtok: 输出价格
│   ├── free_tier（免费层）: 描述免费额度
│   ├── free_limitations[]: ["每日限100次", "仅限国内IP"]
│   ├── rate_limit: 限流规则
│   ├── last_updated: 最后更新
│   └── source_url: 价格页/文档链接
│
├── PricingChange（价格变动记录）
│   ├── id
│   ├── model_id → Model
│   ├── operator_id → Operator
│   ├── region
│   ├── old_price / new_price
│   ├── change_date
│   └── change_type: increase / decrease / new_model / discontinued
│
└── DailyReport（每日报告）
    ├── id
    ├── report_date
    ├── new_models[]: 今日新上线模型
    ├── price_changes[]: 价格变动
    ├── free_policy_changes[]: 免费政策变更
    ├── top_recommendations{}: 场景推荐
    └── html_content: Web 报告内容

2.2 数据来源映射

数据类型	主要来源	获取方式
海外模型商	OpenRouter API（371 模型）	API 自动同步
国内模型商	各厂商开放平台（ERNIE/Qwen/Hunyuan/Doubao 等）	官方 API / 文档解析
云平台定价	AWS/Azure/阿里云/腾讯云/华为云定价页	官方 API / 正则解析
中转站定价	OpenRouter / SiliconFlow / Together AI / Groq	API 同步
免费政策	各平台开发者文档	文档解析 + 人工补充
区域差异	各云平台区域定价页	多区域页面对比

四、功能需求

3.1 数据采集层（Must Have）

F1：多源数据采集

OpenRouter API：371+ 海外模型，实时同步（定价/上下文/能力）
国内厂商 API：百度 Qianfan、阿里 DashScope、腾讯混元、字节火山引擎、DeepSeek、智谱 BigModel
中转平台：硅基流动 API、OpenRouter API（国内节点）、Together AI
更新策略：每日 08:00 全量同步 + 变更触发增量更新
错误处理：采集失败写入日志，保留上次成功数据，标记"数据待核实"

F2：模型基础信息库

模型名称、版本、发布商、发布时间
模态（文字/图片/音频/视频/代码）
上下文窗口、Capabilities（function calling / JSON mode / Vision）
模型状态（active / deprecated / discontinued）

F3：定价数据库

按运营商 × 模型 × 区域存储完整定价
支持货币自动换算（USD/CNY/EUR）
保留历史价格，支持趋势查看
标注价格数据质量（官方 / 推测 / 已过期）

F4：免费政策库

各平台免费模型列表
免费额度（每日/每月请求次数、Token 上限）
限流规则（QPS、并发、冷却时间）
区域限制（仅某地区可用、仅某用户类型可用）
特殊情况（限时免费、活动到期时间）

3.2 应用层（Must Have）

F5：每日自动报告生成

触发：每日 08:00 cron
内容：
1. 今日新上线 / 更新的模型
2. 价格变动提醒（>5% 变动高亮）
3. 免费政策变更
4. 场景推荐 TOP 10（编码/写作/推理/免费/低成本）
5. 成本优化建议（同能力更低价格选项）
格式：HTML Web 页面（内网可访问）+ PDF 导出
分发：支持推送至钉钉群/飞书群/Email

F6：搜索与筛选

筛选：厂商 / 模态 / 场景 / 价格区间 / 上下文长度 / 免费/付费
搜索：模型名、厂商名、特性关键词
视图：卡片视图 / 表格视图 / 趋势图

F7：成本计算器

输入：Token 数量（输入/输出分开）
输出：各平台/运营商成本对比排行榜
支持按月用量估算

3.3 进阶功能（Should Have）

F8：价格变动告警

触发条件：价格变动 > 10%（可配置）
通知方式：钉钉/飞书/Email 推送
白名单：用户关注特定模型/平台

F9：模型评测聚合

MMLU / HumanEval / GSM8K / MATH / LiveCodeBench 等基准分
按场景排名（编码/推理/写作/免费）

F10：API 接口

JSON API 供 AI Agent 查询最优模型
MCP Server 供 OpenClaw/Claude Code 等集成

五、覆盖范围

4.1 模型商（目标 20+）

国内厂商（目标 12 家，2026-05 实际定价）

厂商	代表模型	输入 CNY/MT	输出 CNY/MT	最新动态
DeepSeek	V3.2 / V4-Flash / R1	¥0.14-0.27	¥0.028-0.135	V4-Flash：全球最便宜1M context
阿里	Qwen3-VL-32B / 8B	¥0.18-0.20	¥0.60-0.68	Qwen3.6 开源性能逼近闭源
Moonshot	Kimi K2.6 / K2.5	¥0.23-0.95	¥0.07-0.16	K2.6 超越 GPT-5.4（SWE-Bench Pro）
智谱	GLM-5.1 / GLM-4.7	¥0.42-1.40	¥0.11-0.26	GLM-5.1 编码能力接近 Opus 4.6
MiniMax	M2.5	¥0.30	¥0.03	多模态+语音，API 性价比极高
字节	Doubao / Step-3.5-Flash	¥0.10+	—	Step-3.5 Flash 约 GPT-4o 的 1/25 价格
百度	ERNIE-4.5-300B	¥0.28	¥1.10	老牌旗舰，搜索集成
腾讯	Hunyuan-A13B	¥0.14	¥0.57	腾讯系生态集成
华为	Pangu-4 / 3	企业定价	企业定价	政务/国企客户多
讯飞	Spark-4.0	企业定价	企业定价	语音交互强
零一万物	Yi-Large	企业定价	企业定价	开源 Yi 系列
昆仑万维	Skywork-13B	企业定价	企业定价	开源系列

海外厂商（目标 10 家）

厂商	代表模型	API 平台
OpenAI	GPT-4o / GPT-4.5 / o3 / o4	platform.openai.com
Anthropic	Claude 3.5 Sonnet / Claude 4	console.anthropic.com
Google	Gemini 2.0 / Gemini 1.5	ai.google.dev
Meta	Llama 4 / Llama 3.3	(via Azure/单独部署)
xAI	Grok-3 / Grok-4	x.ai
Mistral	Mistral Large / Codestral	mistral.ai
Cohere	Command R+ / Command	Cohere
Perplexity	Sonar (Pro/Rtel)	perplexity.ai
Amazon	Claude/Gemini/Llama (on Bedrock)	AWS Bedrock
Microsoft	GPT-4 (on Azure)	Azure OpenAI

4.2 运营商/云平台（目标 30+）

国内云厂商（8 家）

平台	网址	主力模型
阿里云	aliyun.com	Qwen / 通义全系
腾讯云	cloud.tencent.com	Hunyuan 全系
百度智能云	cloud.baidu.com	ERNIE 全系
华为云	huaweicloud.com	Pangu 全系
火山引擎	volcengine.com	Doubao 全系
京东云	jdcloud.com	言犀（自研）
电信天翼云	ctyun.cn	（接入第三方模型）
移动云	cmcc.cn	（接入第三方模型）

国内中转/聚合（5 家）

平台	网址	特色
硅基流动	siliconflow.cn	国内最便宜中转之一
OpenAI 中转	openai-sg.com 等	直连/新加坡节点
DeepSeek 中转	多家	国内访问 DeepSeek
Azure 中转	多家	绕过 Azure 限制
Claude 中转	多家	国内访问 Claude

海外云厂商（6 家）

平台	网址	主力模型
AWS Bedrock	aws.amazon.com/bedrock	Claude/Gemini/Llama/Titan
Azure OpenAI	azure.microsoft.com	GPT-4/GPT-4o
Google Cloud	cloud.google.com	Gemini/PaLM
Cloudflare Workers AI	developers.cloudflare.com/workers-ai	Llama/Gemma 等
Oracle Cloud AI	oracle.com/cloud	Llama/Mistral
IBM watsonx	ibm.com/watsonx	Granite/Maestro

海外中转聚合（8 家）

平台	网址	特色
OpenRouter	openrouter.ai	371+ 模型，ELO 排行，免费模型多
Together AI	together.ai	开源模型为主
Groq	console.groq.com	高速推理（Llama/Mixtral）
Replicate	replicate.com	镜像部署，方便
Anyscale	anyscale.com	Ray serving
Fireworks AI	fireworks.ai	高速开源模型
Lepton AI	lepton.ai	按需计费
Perplexity API	perplexity.ai	Sonar 模型专属

六、竞品对比

维度	OpenRouter	AgentDeals	硅基流动	Artificial Analysis	LLM Intelligence Hub
模型数量	371+	19+	50+	不明	500+
实时数据	✅ API	✅ 月更	✅ API	定期	✅ 每日
CNY 定价	❌	❌	✅	❌	✅
USD 定价	✅	✅	部分	✅	✅
国内厂商	有限	有限	✅全	❌	✅ 12家
免费政策	✅ 标记	✅ 详细	✅	✅ 基础	✅ 详细追踪
性能评测	❌	❌	❌	✅	✅ 聚合
告警通知	❌	❌	❌	❌	✅
每日报告	❌	❌	❌	❌	✅
中文界面	❌	❌	✅	❌	✅
Web 界面	✅	✅	✅	✅付费	✅
MCP Server	❌	❌	❌	❌	✅

七、里程碑

Phase	时间	目标	关键交付
Phase 1	2026-Q2	MVP 上线	采集+存储+日报+Explorer
Phase 2	2026-Q3	多数据源+告警	国内厂商采集+推送+趋势图
Phase 3	2026-Q4	商业化	订阅付费+API+MCP Server

八、术语表

术语	定义
MTok	Million Tokens，百万 Token
Reseller	中转聚合平台（如硅基流动、OpenRouter）
ELO	模型质量评分系统（OpenRouter 采用）
Context Length	上下文窗口长度（tokens）
Free Tier	免费额度层
Capability	模型能力（如 vision、function calling）

九、参考链接

8.1 数据来源

OpenRouter API Docs: https://openrouter.ai/docs
硅基流动定价: https://siliconflow.cn/pricing
AgentDeals.dev: https://agentdeals.dev
Artificial Analysis: https://artificialanalysis.ai

8.2 厂商开放平台

OpenAI: https://platform.openai.com/pricing
Anthropic: https://console.anthropic.com
百度 ERNIE: https://qianfan.llm.yundun.cn/
阿里 DashScope: https://help.aliyun.com/zh/dashscope/
DeepSeek: https://platform.deepseek.com/

8.3 数据字典（核心字段）

字段	类型	说明	示例
provider_name	string	模型商名称	"OpenAI" / "百度"
model_name	string	模型名称	"GPT-4o" / "ERNIE-4.0"
operator_name	string	运营商名称	"AWS Bedrock" / "硅基流动"
region	string	区域代码	"CN" / "US" / "GLOBAL"
currency	string	货币	"USD" / "CNY"
input_price	float	输入价格（/MTok）	2.5
output_price	float	输出价格（/MTok）	10.0
free_tier	text	免费额度描述	"每日100次，每次不超过4000 tokens"
context_length	int	上下文窗口	128000
capabilities	array	能力列表	["vision","function_calling"]

十一、数据质量与血缘

六、数据质量与血缘

数据校验规则：价格不能为负、context_length 不能超过 10M、currency 必须为 CNY/USD/EUR 之一
数据新鲜度指标：每条记录标注 retrieved_at，超过 24h 标记为 stale
数据血缘追踪：每条价格记录记录来源 API URL、采集批次号、采集器版本
质量分级：official（官方API）/ inferred（推导）/ unverified（未验证）/ stale（过期）
自动清洗：采集失败时保留上次成功数据，标记 "data_stale_until_next_run"
质量报告：每日报告包含数据质量摘要（覆盖率/新鲜度/异常数）

16 KiB Raw Blame History Unescape Escape