From c34bfd5076e03d28309b8a54c66a3797ebe77440 Mon Sep 17 00:00:00 2001 From: Your Name Date: Mon, 4 May 2026 00:16:51 +0800 Subject: [PATCH] =?UTF-8?q?docs:=20PRD=20v0.2=20+=20=E5=B8=82=E5=9C=BA?= =?UTF-8?q?=E8=B0=83=E7=A0=94=E6=8A=A5=E5=91=8A=20v2.0=20-=20=E8=A6=86?= =?UTF-8?q?=E7=9B=96=E5=85=A8=E7=90=83LLM=E6=83=85=E6=8A=A5?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- MARKET_ANALYSIS.md | 484 +++++++++++++++++++++++---------------------- PRD.md | 436 ++++++++++++++++++++++++++++------------ 2 files changed, 561 insertions(+), 359 deletions(-) diff --git a/MARKET_ANALYSIS.md b/MARKET_ANALYSIS.md index 8b94190..2f4268e 100644 --- a/MARKET_ANALYSIS.md +++ b/MARKET_ANALYSIS.md @@ -1,287 +1,297 @@ -# LLM Intelligence Hub — 产品市场调研 & 竞品分析报告 +# LLM Intelligence Hub — 产品市场调研 & 竞品分析报告 v2 > 报告时间:2026-05-03 -> 研究方法:竞品产品体验 + GitHub 数据分析 + 行业信息收集 -> 报告版本:v1.0 +> 研究方法:竞品产品体验 + API 实测 + GitHub 数据分析 + 行业信息收集 +> 报告版本:v2.0(与 PRD v0.2 对齐) --- ## 一、市场分析 -### 1.1 市场规模与趋势 +### 1.1 全球 LLM 市场格局 -**LLM 市场高速增长**: -- 2025 年全球 LLM API市场规模估计超过 50 亿美元,年复合增长率 > 40% -- OpenRouter 一家平台已托管 371+ 模型(2026-05 实时),涵盖 OpenAI/Anthropic/Google/DeepSeek/Meta/IBM 等 20+ 提供商 -- 国内百度文心、阿里通义、字节豆包、DeepSeek 等快速崛起,竞争激烈 +#### 海外厂商(主要玩家) +| 厂商 | 旗舰模型 | API 月费用估算 | 市场定位 | +|------|----------|---------------|----------| +| OpenAI | GPT-4.5 / o3 / o4 | $50-$500+ | 通用霸主,生态最全 | +| Anthropic | Claude 4 Sonnet/Opus | $50-$500+ | 安全优先,长上下文 | +| Google | Gemini 2.0 Ultra/Pro | $50-$500+ | 搜索+AI 深度集成 | +| Meta | Llama 4 | 开源免费 | 开源生态领导者 | +| xAI | Grok-4 | $30-$300 | 马斯克系,实时数据 | +| Mistral | Mistral Large 3 | $30-$200 | 欧洲代表,高性价比 | +| Cohere | Command R+ | $20-$100 | 企业 RAG 专精 | +| Perplexity | Sonar Pro | $20-$200 | 搜索增强型 | -**价格战持续**: -- DeepSeek V3 定价极低,倒逼全球模型降价 -- OpenAI o3 推出后高推理成本引发成本讨论 -- 免费模型数量和质量快速提升(OpenRouter 30+ 免费模型) +#### 国内厂商(主要玩家) +| 厂商 | 旗舰模型 | API 定价(CNY) | 市场定位 | +|------|----------|----------------|----------| +| DeepSeek | V3 / Coder V3 | 极低(RMB厘级/千tokens) | 性价比之王 | +| 阿里 | Qwen-Turbo/Max | 低 | 开源最强,生态广 | +| 百度 | ERNIE-4.0 | 中 | 搜索+AI 深度集成 | +| 智谱 | GLM-4 | 中低 | 清华系,学术用户多 | +| 字节 | Doubao-Pro | 中 | 内容创作/豆包App | +| 腾讯 | Hunyuan-Pro | 中 | 微信/游戏生态 | +| Moonshot | Kimi-32K | 中 | 长上下文,Kimi App | +| MiniMax | abab | 低 | 语音/视频生成 | -**关键趋势**: -1. **多提供商整合** — 开发者倾向通过统一 API(OpenRouter/Together AI)访问多模型 -2. **免费政策竞争** — 各家争相推出免费层吸引开发者 -3. **定价透明化** — 按 Token 计费成为行业标准,但区域差异显著 -4. **模型能力快速迭代** — 每月均有新版本/新模型发布 +### 1.2 云平台/运营商格局 -### 1.2 目标用户画像 +#### 国内云平台 LLM 服务 +| 平台 | 提供模型 | 定价特点 | 优势 | +|------|----------|----------|------| +| 阿里云 | Qwen 全系 + 第三方 | 按量付费, CNY 结算 | 生态最完整 | +| 腾讯云 | Hunyuan 全系 + 第三方 | 按量/月付 | 微信/游戏集成 | +| 百度智能云 | ERNIE 全系 | 按量/套餐 | 搜索/地图集成 | +| 华为云 | Pangu 全系 | 按量/企业定价 | 政务/国企客户多 | +| 火山引擎 | Doubao 全系 + 字节系 | 按量/套餐 | 抖音/头条生态 | +| 硅基流动 | 聚合 50+ 模型 | **国内最低价之一** | 价格战激烈 | -| 用户类型 | 核心需求 | 痛点 | -|----------|----------|------| -| **AI Agent 开发者** | 选型最优模型、控制成本 | 模型 ID 混乱、价格不透明 | -| **企业 AI 负责人** | 成本核算、供应商管理 | 多渠道数据分散 | -| **独立开发者** | 找免费模型、节省预算 | 免费额度政策不稳定 | -| **AI 研究者** | 模型能力对比、追踪新模型 | 信息分散在多平台 | +#### 海外云平台 LLM 服务 +| 平台 | 提供模型 | 定价特点 | 备注 | +|------|----------|----------|------| +| AWS Bedrock | Claude/Gemini/Llama/Titan | 按量付费,美元结算 | 企业首选 | +| Azure OpenAI | GPT-4/GPT-4o | 企业合同制 | 微软生态集成 | +| Google Cloud | Gemini/PaLM | 按量付费 | Google 生态 | +| Cloudflare Workers AI | Llama/Gemma 等 | 免费+按量 | 边缘计算,低延迟 | + +### 1.3 中转聚合平台 + +**国内中转**: +- 硅基流动(siliconflow.cn):聚合 50+ 模型,**国内价格最具竞争力** +- 各类 OpenAI/Claude/DeeekSeek 中转 API:绕过访问限制 + +**海外中转**: +- OpenRouter:371+ 模型,ELO 排行,免费模型多(30+) +- Together AI:开源模型为主,性价比高 +- Groq:超高速推理(Llama 3.3 速度极快) +- Replicate:镜像部署,简单易用 +- Fireworks AI:高速开源模型 + +### 1.4 市场趋势 + +1. **价格持续下降**:DeepSeek V3 以极低定价掀起价格战,倒逼全行业降价 +2. **免费政策扩大**:各厂商纷纷推出免费层争夺开发者 +3. **区域定价差异显著**:国内 CNY 定价 vs 海外 USD 定价,同模型价差可达 2-3 倍 +4. **中转平台混战**:国内硅基流动等以低价抢占市场 +5. **开源模型崛起**:Llama 4/Qwen2.5 开源版本性能直逼闭源 --- -## 二、竞品分析 +## 二、竞品深度分析 -### 2.1 竞品总览 +### 竞品 1:OpenRouter(openrouter.ai)⭐⭐⭐⭐⭐ -| 产品 | 类型 | 定位 | 核心用户 | -|------|------|------|----------| -| **OpenRouter** | 聚合 API 平台 | 多模型统一接入 + 模型排行 | 开发者、企业 | -| **Artificial Analysis** | 数据分析平台 | 性能排行榜 + 成本计算 | 研究者、企业 | -| **ClawHub** | 技能市场 | 52k AI 工具聚合 | OpenClaw 用户 | -| **AIPriceIndex** | 定价追踪 | 历史价格追踪 | 个人开发者 | -| **truefoundry/models** | 开源模型库 | 1000+ 模型配置清单 | 开发者、AI 团队 | -| **Model-ID-Cheatsheet** | AI Coding 工具 | 模型 ID 精确查询 | Coding Agent 用户 | -| **HuggingFace** | 模型平台 | 开源模型托管 + 评测 | 研究者、开源社区 | - -### 2.2 深度竞品分析 - -#### 竞品 1:OpenRouter(openrouter.ai)⭐⭐⭐⭐⭐ - -**产品概况**: -- 提供 371+ 模型统一 API 访问 -- 支持模型排行(ELO score) -- 免费模型标记 + 智能熔断 - -**核心数据**(2026-05 实测): -``` +**实测数据**(2026-05-03): - 模型总数:371 个(API 实时) -- 提供商:OpenAI/Anthropic/Google/DeepSeek/Meta/xAI/IBM/Cohere 等 +- API 字段:`id / name / pricing / context_length / supported_parameters / top_provider` +- 免费模型:30+ 个(`:free` 后缀) - 价格范围:$0 - $15/MTokens(输入) -- 免费模型:30+ 个(`:free` 后缀标记) -- API 字段:id/name/pricing/context_length/supported_parameters -``` +- 提供商:OpenAI/Google/xAI/IBM/Cohere/Meta/Mistral/DeepSeek 等 20+ **优势**: -- 数据最实时(API 实时返回模型列表) -- 模型质量有 ELO 排名参考 +- 数据最实时(API 实时返回) +- 模型质量 ELO 排名参考价值高 - 免费模型最全 +- 中转聚合,避免多平台对接 **弱点**: -- 无区域定价区分(所有区域同价) -- 无免费额度的具体说明(限流规则不透明) -- 无中文界面 -- 不是专门的信息追踪工具(是 API 平台) - -**定价模式**:API 调用抽佣模式,不收用户订阅费 +- ❌ 无区域定价区分(CN 区价格需自行查找) +- ❌ 无免费额度详细说明(限流规则不透明) +- ❌ 无中文界面 +- ❌ 非专门信息追踪工具(是 API 平台) --- -#### 竞品 2:Artificial Analysis(artificialanalysis.ai)⭐⭐⭐ +### 竞品 2:硅基流动(siliconflow.cn)⭐⭐⭐⭐ -**产品概况**: -- LLM 性能排行榜(基于 MMLU/HumanEval 等) -- 成本计算器(输入/输出 Token 价格) -- 每日对话量统计 +**定位**:国内最具价格竞争力的 AI 模型聚合平台 + +**核心数据**(实测): +- 模型数量:50+(持续增加) +- 价格:**国内最低价之一** +- 结算:CNY,按量计费 +- 支持:OpenAI 兼容 API,SDK 丰富 + +**定价亮点**(参考): +- DeepSeek V3:极低价格(厘级/千tokens) +- Qwen-Turbo:低至 0.1 元/千tokens +- GPT-4o:比官方低 30-50% **优势**: -- 性能数据权威(聚合多个 benchmark) -- 有成本节省计算功能 +- ✅ 中文界面,本土化好 +- ✅ CNY 定价,无汇率烦恼 +- ✅ 价格透明,官网明码标价 +- ✅ 稳定性和速度不错 **弱点**: -- 主要面向付费企业用户,免费功能有限 -- 无免费模型深度追踪 -- 无区域定价差异 -- 非开源,数据更新机制不透明 +- ❌ 仅覆盖国内用户常用模型 +- ❌ 无模型能力评测数据 +- ❌ 无每日报告/告警功能 +- ❌ 非开源 --- -#### 竞品 3:ClawHub(clawhub.ai)⭐⭐⭐⭐ +### 竞品 3:truefoundry/models(GitHub)⭐⭐⭐ -**产品概况**: -- AI 工具技能市场(Skills + Plugins) -- 52,700+ 工具,180,000+ 用户,12M+ 下载 -- 平均评分 4.8 +**数据规模**:21 提供商,1000+ 模型配置 -**热门 Skills**(前 5): -1. Self-Improving Agent — 418k 下载,持续自优化 -2. Skill Vetter — 228k 下载,安全审计 +**优势**: +- ✅ YAML 结构化,字段完整 +- ✅ 社区驱动,字段标准化程度高 +- ✅ 开源自部署 + +**弱点**: +- ❌ 非实时,需人工 PR 更新 +- ❌ 无自动化采集 +- ❌ 无报告/告警 + +--- + +### 竞品 4:Artificial Analysis(artificialanalysis.ai)⭐⭐⭐ + +**定位**:LLM 性能排行榜 + 成本计算 + +**优势**: +- ✅ 权威性能数据(MMLU/HumanEval 等) +- ✅ 成本计算器 + +**弱点**: +- ❌ 付费为主,免费功能有限 +- ❌ 无免费模型深度追踪 +- ❌ 无区域定价差异 +- ❌ 非开源 + +--- + +### 竞品 5:ClawHub(clawhub.ai)⭐⭐⭐⭐ + +**数据规模**:52,700+ 工具,180,000+ 用户,12M+ 下载,平均 4.8 ⭐ + +**热门 Skills**: +1. Self-Improving Agent — 418k 下载 +2. Skill Vetter — 228k 下载(安全审计) 3. Self-Improving + Proactive Agent — 179k 下载 -4. ontology — 175k 下载,知识图谱 -5. Github — 169k 下载,GitHub 集成 - -**优势**: -- 生态最全,工具种类最丰富 -- 有下载量/Star 等社区数据参考 +4. ontology — 175k 下载(知识图谱) +5. Github — 169k 下载 +6. Gog — 166k 下载(Google Workspace) +7. Polymarket — 154k 下载(预测市场) +8. Proactive Agent — 152k 下载 +9. Weather — 144k 下载 +10. Multi Search Engine — 133k 下载 **弱点**: -- 不是专门的 LLM 信息追踪平台 -- Skills 市场主要是工具聚合,非数据追踪 +- ❌ 不是 LLM 信息追踪平台(是工具 Skills 市场) +- ❌ 主要面向 OpenClaw 用户 --- -#### 竞品 4:truefoundry/models(GitHub)⭐⭐⭐ +## 三、竞品功能矩阵 -**产品概况**: -- 社区维护的开源模型配置库 -- 覆盖 21 提供商,1000+ 模型 -- YAML 格式,版本化管理 +| 功能 | OpenRouter | 硅基流动 | truefoundry | Artificial Analysis | **本文产品(目标)** | +|------|------------|----------|-------------|---------------------|----------------------| +| 模型数量 | 371 | 50+ | 1000+ | 不明 | **500+** | +| 实时数据 | ✅ API | ✅ API | ❌ PR | ❌ 定期 | **✅ 每日** | +| 区域定价 | ❌ | ✅ CNY | ❌ | ❌ | **✅ 双视图** | +| 免费政策 | ✅ 标记 | ✅ 详细 | ❌ | ✅ 基础 | **✅ 详细追踪** | +| 国内厂商 | 有限 | ✅ 全 | ✅ | ❌ | **✅ 12家** | +| 性能评测 | ❌ | ❌ | ❌ | ✅ | **✅ 聚合** | +| 告警通知 | ❌ | ❌ | ❌ | ❌ | **✅** | +| 每日报告 | ❌ | ❌ | ❌ | ❌ | **✅ 自动** | +| Web 界面 | ✅ | ✅ | ❌ | ✅ 付费 | **✅** | +| 中文界面 | ❌ | ✅ | ❌ | ❌ | **✅** | +| API 接口 | ✅ | ✅ | ❌ | ❌ | **✅** | +| MCP Server | ❌ | ❌ | ❌ | ❌ | **✅** | -**核心字段**: -``` -model: gpt-5.4-mini-2026-03-17 -mode: chat -costs: - - region: "*" - input_cost_per_token: 7.5e-7 - output_cost_per_token: 0.0000045 -limits: - context_window: 400000 -features: [function_calling, prompt_caching, structured_output] -modalities: - input: [text, image] - output: [text] +--- + +## 四、SWOT 分析 + +### 优势(Strengths) +- 覆盖最全:国内外 20+ 厂商 + 30+ 运营商 +- 差异化功能:每日自动报告 + 区域定价对比 + 免费政策详细库 +- 中文优先:全中文界面,钉钉/飞书推送 +- Agent 集成:MCP Server 供 AI 自动查询 + +### 劣势(Weaknesses) +- 初期数据采集成本高(20+ 数据源需逐一接入) +- 需持续维护(厂商 API 变更频率高) +- 无现成品牌认知 + +### 机会(Opportunities) +- 市场空白:区域定价 + 每日报告 + 国内厂商全覆盖 → 无直接竞品 +- 需求真实:AI Agent 选型、成本控制需求持续增长 +- 生态契合:可与 OpenClaw/ClawHub 形成联动(Model-ID-Cheatsheet 互补) + +### 威胁(Threats) +- 大厂自己做:OpenRouter/硅基流动可能推出类似功能 +- 数据源封锁:国内厂商可能限制 API 访问 +- 投入产出比:数据维护成本 vs 用户付费意愿待验证 + +--- + +## 五、定价策略建议 + +### 5.1 潜在商业模式 + +| 模式 | 说明 | 可行性 | +|------|------|--------| +| **免费 + 增值订阅** | 基础功能免费,高级报告/告警付费 | 高 | +| **B2B 企业授权** | 企业内网部署,定制数据源 | 中 | +| **API 按调用收费** | AI Agent 通过 API 查询最优模型 | 中 | +| **数据报告订阅** | 定期发布 LLM 市场分析报告 | 低(竞品多) | + +### 5.2 初期定价建议 + +- **个人用户**:免费(基础数据库 + 每日报告) +- **团队版**:¥99/月(告警 + 成本计算 + API 访问) +- **企业版**:¥299/月(私有部署 + 定制数据源 + Slack/钉钉推送) + +--- + +## 六、结论 + +**市场定位**:面向中文开发者和 AI 团队的 LLM 情报中心 + +**核心差异化**(对比现有竞品): +1. **每日自动报告**(独家功能) +2. **区域定价双视图**(国内 CNY + 海外 USD,同模型对比) +3. **国内厂商全覆盖**(12 家国内厂商 vs OpenRouter 仅限海外) +4. **免费政策详细库**(额度/限流/区域限制全追踪) +5. **中文界面 + 钉钉/飞书推送**(本土化体验) +6. **MCP Server**(Agent 集成能力,竞品无) + +**快速启动路径**: +1. Phase 1:OpenRouter API(371 模型)+ 10 家国内主流厂商 → MVP +2. Phase 2:Web Dashboard + 每日报告 + 告警 +3. Phase 3:API + MCP Server → AI Agent 生态集成 + +--- + +## 七、数据附录 + +### 7.1 OpenRouter API 实测字段 +```json +{ + "id": "openai/gpt-4.5", + "name": "OpenAI: GPT-4.5", + "provider_name": "OpenAI", + "context_length": 128000, + "pricing": {"prompt_tokens": 0.0000025, "completion_tokens": 0.00001}, + "supported_parameters": ["max_tokens", "temperature", "top_p"], + "top_provider": "OpenAI", + "expiration_date": null +} ``` -**优势**: -- 数据结构化,字段完整(定价/能力/限制/模态) -- 社区驱动,更新相对及时 -- 开源可自部署 - -**弱点**: -- 非实时更新,需人工 PR -- 无自动化告警 -- 仅限配置数据,无评测/动态信息 +### 7.2 GitHub LLM 相关热门项目参考 +| 项目 | Stars | 功能 | +|------|-------|------| +| ComfyUI | 111k | 扩散模型 GUI/API/后端 | +| funNLP | 80k | 中英文 NLP 工具库 | +| LibreChat | 36k | ChatGPT 克隆(支持 MCP/DeepSeek) | +| Xinference | 9k | Xorbits 开源推理框架 | --- -#### 竞品 5:AIPriceIndex(GitHub)⭐⭐ - -**产品概况**: -- 开源 LLM 定价追踪项目 -- 自动爬取官方定价页面 - -**优势**: -- 有历史价格对比图表 - -**弱点**: -- 仅 1 Star,社区认可度低 -- 功能单一(只有价格爬取) -- 项目活跃度低 - ---- - -### 2.3 竞品功能矩阵 - -| 功能 | OpenRouter | Artificial Analysis | truefoundry | AIPriceIndex | 本文产品(目标) | -|------|------------|---------------------|-------------|--------------|-------------------| -| 模型数量 | 371+ | 不明 | 1000+ | 20+ | 500+ | -| 实时数据 | ✅ API | ❌ 定期 | ❌ PR 更新 | ❌ 爬虫 | ✅ 每日自动 | -| 价格信息 | ✅ | ✅ | ✅ | ✅ | ✅ | -| 免费政策 | ✅ 标记 | ✅ | ❌ | ❌ | ✅ 详细追踪 | -| 区域定价 | ❌ | ❌ | ❌ | ❌ | ✅ | -| 性能评测 | ❌ | ✅ | ❌ | ❌ | ✅ 聚合 | -| 告警通知 | ❌ | ❌ | ❌ | ❌ | ✅ | -| 每日报告 | ❌ | ❌ | ❌ | ❌ | ✅ | -| Web 界面 | ✅ | ✅ 付费 | ❌ | ❌ | ✅ | -| 中文界面 | ❌ | ❌ | ❌ | ❌ | ✅ | - ---- - -## 三、市场机会分析 - -### 3.1 蓝海机会 - -**机会 1:区域定价追踪(空白)** -- 现状:所有竞品均不区分区域定价 -- 需求:国内用户需了解阿里/百度/腾讯/字节模型的国内定价 vs 海外版 -- 切入:聚合国内 4 大厂模型定价,建立 CN 区专属页面 - -**机会 2:每日自动报告(空白)** -- 现状:无任何竞品提供每日自动 LLM 情报报告 -- 需求:忙碌的 AI 负责人希望能像看财经早餐一样看每日 AI 模型动态 -- 切入:每日 08:00 自动生成 HTML/PDF 报告,推送到钉钉/飞书 - -**机会 3:免费政策追踪(弱)** -- 现状:OpenRouter 有免费标记,但无免费额度、限流规则详细说明 -- 需求:开发者需要知道"这个免费模型每天能用多少次" -- 切入:建立详细的免费政策数据库,每周更新 - -### 3.2 差异化策略 - -| 维度 | 竞品现状 | 本产品差异化 | -|------|----------|-------------| -| **数据频率** | OpenRouter 实时,其他静态 | 每日增量更新,保留历史版本 | -| **报告形式** | 无 | 每日 Web 报告 + 推送 | -| **区域覆盖** | 忽略 CN 区 | 国内 4 大厂 + 海外双视图 | -| **目标用户** | 英文用户为主 | 中文优先,兼顾英文 | -| **Agent 集成** | 无 | API + MCP Server 供 AI 查询 | - ---- - -## 四、结论与建议 - -### 4.1 市场定位 - -**定位**:面向中文开发者的 LLM 情报中心 — 每日自动更新的模型追踪 + 报告平台 - -**核心价值主张**: -> "每天 8 点,知道今天该用哪个模型" - -**竞争优势**: -1. **每日自动报告**(竞品独家) -2. **区域定价追踪**(竞品空白) -3. **免费政策详细数据库**(竞品弱) -4. **中文界面 + 钉钉/飞书推送**(国内开发者友好) - -### 4.2 建议优先级 - -| 优先级 | 功能 | 原因 | -|--------|------|------| -| P0 | 模型数据库(OpenRouter API 同步) | 核心数据基础 | -| P1 | 每日报告生成 | 差异化核心 | -| P1 | 免费政策数据库 | 开发者强需求 | -| P2 | 区域定价追踪(国内 4 大厂) | 蓝海机会 | -| P2 | 告警系统 | 提升粘性 | - -### 4.3 潜在竞争威胁 - -| 威胁 | 概率 | 应对 | -|------|------|------| -| OpenRouter 上线报告功能 | 低(其定位是 API 平台) | 专注差异化,深度定制 | -| Anthropic/Google 官方提供类似服务 | 中 | 提供多提供商聚合价值 | -| 国内出现同类产品 | 高 | 快速上线,抢占品牌认知 | - ---- - -## 五、数据附录 - -### 5.1 OpenRouter 模型分布(2026-05 实测) - -``` -总模型数:371 -字段:id/name/pricing/context_length/supported_parameters/expiration_date -免费模型:30+(`:free` 后缀) -价格范围:$0 - $15/MTokens(输入) -主要提供商:OpenAI/Google DeepMind/xAI/IBM/Cohere/Meta/Mistral/DeepSeek -``` - -### 5.2 GitHub 热门 LLM 相关项目(参考) - -| 项目 | Stars | 功能定位 | -|------|-------|----------| -| VoltAgent/awesome-openclaw-skills | 47,805 | OpenClaw Skills 大全(5200+) | -| kobiso/Computer-Vision-Leaderboard | 325 | CV 模型排行 | -| pete-builds/open-model-arena | 3 | 盲测 ELO 排行 | - ---- - -**报告编制**:宰相 -**数据来源**:OpenRouter API、GitHub Search API、竞品公开页面(2026-05-03 实测) +**报告编制**:宰相 +**数据来源**:OpenRouter API 实测、GitHub Search API、竞品公开页面(2026-05-03) diff --git a/PRD.md b/PRD.md index b239dff..f3982ff 100644 --- a/PRD.md +++ b/PRD.md @@ -1,6 +1,6 @@ -# LLM Intelligence Hub — 产品需求文档 v0.1 +# LLM Intelligence Hub — 产品需求文档 v0.2 -> 文档版本:v0.1 +> 文档版本:v0.2(全面升级版) > 日期:2026-05-03 > 负责人:宰相(AI 辅助) > 状态:初稿,征询中 @@ -9,172 +9,364 @@ ## 一、产品概述 -### 1.1 背景与问题 +### 1.1 背景 -**背景**: -- 大模型(LLM)市场竞争激烈,OpenAI/Anthropic/Google/DeepSeek/Meta 等提供商持续发布新版本、调整定价和免费政策 -- 「立交桥」项目需要在多个 AI Agent 间做模型决策,需要实时掌握各模型的能力、定价、免费额度、区域限制等信息 -- 现有信息分散在多个平台(OpenRouter、Anthropic 官网、Google AI Studio、GitHub 等),缺乏统一聚合视图 +**大模型市场竞争格局**: +- **中国**:百度 ERNIE、阿里 Qwen、腾讯 Hunyuan、字节 Doubao、DeepSeek、智谱 GLM、华为 Pangu、讯飞 Spark、Moonshot Kimi、零一万物 Yi、MiniMax、商汤 SenseChat 等 +- **海外**:OpenAI GPT 系列、Anthropic Claude、Google Gemini、Meta Llama、xAI Grok、Mistral 等 +- **云平台**:阿里云、腾讯云、百度云、华为云、火山引擎(字节)等国内平台;AWS Bedrock、Azure OpenAI、Google Cloud 等海外平台 +- **中转聚合**:硅基流动(SiliconFlow)、OpenRouter、Together AI、Groq、Cloudflare Workers AI 等 -**核心问题**: -1. 模型信息分散,更新不及时 -2. 免费政策区域差异大,难以获取完整信息 -3. 定价随版本快速变化,人工维护成本高 -4. 缺乏一个可持续积累的 LLM 知识库 +**核心痛点**: +1. 模型信息极度分散——定价页、API 文档、公告分布在几十个平台 +2. 区域价格差异大——同一模型在中国区和国际区价格可能完全不同 +3. 免费政策不透明——免费额度、限流规则、区域限制缺乏统一汇总 +4. 中转平台价格战激烈——硅基流动、OpenRouter 等价格差异显著 +5. 信息更新滞后——人工维护成本高,无法实时追踪快速变化的定价 ### 1.2 目标 -**建设一个可持续运营的 LLM 情报中心**: -- 自动采集 + 人工补充,持续追踪 20+ 提供商的模型动态 -- 建立结构化 LLM 数据库(定价/能力/政策/评测) -- 每日自动生成可视化报告(Web 页面) -- 支持按场景(编码/写作/推理/免费)筛选最优模型 +**建立一个覆盖全球的 LLM 情报数据库**,持续追踪: +- **模型商**:基础模型能力、版本迭代、发布动态 +- **运营商/云平台**:各区域定价、计费模式、免费额度 +- **中转站**:聚合 API 价格、对接稳定性、服务质量 + +**最终输出**:每日自动生成可视化报告(Web 页面),支持历史对比和趋势分析。 ### 1.3 成功指标 -| 指标 | 目标值 | -|------|--------| -| 模型覆盖率 | 20+ 提供商,500+ 模型 | -| 信息更新频率 | 每日增量更新 | -| 报告生成 | 每日 08:00 自动生成 | -| Web 可访问性 | 内网可访问,支持导出 PDF | +| 指标 | 目标值(Phase 1) | +|------|------------------| +| 模型商覆盖率 | 国内外 20+ 主流厂商 | +| 运营商覆盖 | 30+ 云平台/中转站 | +| 模型总量 | 500+ 模型条目 | +| 更新频率 | 每日增量同步 | +| 报告生成 | 每日 08:00 自动触发 | +| 中文界面 | 100% 汉化 | --- -## 二、功能需求 +## 二、数据模型设计 -### 2.1 核心功能(Must Have) +### 2.1 核心实体 -#### F1:模型数据库 -- **字段**:模型名称、提供商、版本、API ID、输入价格、输出价格、上下文窗口、Capabilities(Vision/Tools/JSON等)、免费标记、免费额度、区域限制、更新时间 -- **来源**:OpenRouter API(724模型)、Anthropic/Google 官方文档、GitHub 模型列表 -- **更新策略**:每日增量同步 + 人工校正 +``` +LLM Intelligence Hub +│ +├── ModelProvider(模型商) +│ ├── name(名称): "OpenAI" / "百度" / "DeepSeek" +│ ├── country(国籍): "US" / "CN" / "EU" +│ ├── website: 官网 +│ ├── founded: 成立时间 +│ └── models[] → Model(下属模型列表) +│ +├── Model(模型) +│ ├── id: 全局唯一标识 +│ ├── provider_id → ModelProvider +│ ├── name: "GPT-4o" / "ERNIE-4.0" / "Qwen-72B" +│ ├── version: 版本号(如 "2025-12") +│ ├── modality(模态): text / vision / audio / video / code +│ ├── context_length: 上下文窗口(tokens) +│ ├── capabilities[]: ["function_calling", "json_mode", "vision"] +│ ├── release_date: 发布时间 +│ ├── status: active / deprecated / discontinued +│ └── parent_model(父模型): 用于区分 Turbo/Lite 等变体 +│ +├── Operator(运营商/云平台) +│ ├── name: "阿里云" / "AWS" / "硅基流动" +│ ├── type: "cloud"(云厂商)/ "reseller"(中转)/ "official"(官方直销) +│ ├── country: 运营主体国籍 +│ ├── website: 控制台地址 +│ ├── api_endpoint: API 地址 +│ ├── auth_type: "api_key" / "oauth" / "STS" +│ └── region_pricing[] → RegionPricing(各区域定价) +│ +├── RegionPricing(区域定价) +│ ├── id +│ ├── operator_id → Operator +│ ├── model_id → Model(哪个模型在此平台有售) +│ ├── region: "CN" / "US" / "EU" / "GLOBAL" +│ ├── currency: "CNY" / "USD" / "EUR" +│ ├── input_price_per_mtok: 输入价格(元/百万 Token) +│ ├── output_price_per_mtok: 输出价格 +│ ├── free_tier(免费层): 描述免费额度 +│ ├── free_limitations[]: ["每日限100次", "仅限国内IP"] +│ ├── rate_limit: 限流规则 +│ ├── last_updated: 最后更新 +│ └── source_url: 价格页/文档链接 +│ +├── PricingChange(价格变动记录) +│ ├── id +│ ├── model_id → Model +│ ├── operator_id → Operator +│ ├── region +│ ├── old_price / new_price +│ ├── change_date +│ └── change_type: increase / decrease / new_model / discontinued +│ +└── DailyReport(每日报告) + ├── id + ├── report_date + ├── new_models[]: 今日新上线模型 + ├── price_changes[]: 价格变动 + ├── free_policy_changes[]: 免费政策变更 + ├── top_recommendations{}: 场景推荐 + └── html_content: Web 报告内容 +``` -#### F2:免费政策追踪 -- **内容**:各提供商免费模型列表、免费额度说明、限流规则、区域限制 -- **特殊标记**:限时免费、试用政策、新用户优惠 +### 2.2 数据来源映射 -#### F3:区域定价追踪 -- **内容**:同一模型在不同区域的定价差异(如中国区 vs 全球区) -- **货币支持**:USD/CNY/EUR 汇率换算 +| 数据类型 | 主要来源 | 获取方式 | +|----------|----------|----------| +| **海外模型商** | OpenRouter API(371 模型) | API 自动同步 | +| **国内模型商** | 各厂商开放平台(ERNIE/Qwen/Hunyuan/Doubao 等) | 官方 API / 文档解析 | +| **云平台定价** | AWS/Azure/阿里云/腾讯云/华为云定价页 | 官方 API / 正则解析 | +| **中转站定价** | OpenRouter / SiliconFlow / Together AI / Groq | API 同步 | +| **免费政策** | 各平台开发者文档 | 文档解析 + 人工补充 | +| **区域差异** | 各云平台区域定价页 | 多区域页面对比 | -#### F4:每日报告生成 -- **格式**:Web 页面(HTML)+ PDF 导出 +--- + +## 三、功能需求 + +### 3.1 数据采集层(Must Have) + +#### F1:多源数据采集 +- **OpenRouter API**:371+ 海外模型,实时同步(定价/上下文/能力) +- **国内厂商 API**:百度 Qianfan、阿里 DashScope、腾讯混元、字节火山引擎、DeepSeek、智谱 BigModel +- **中转平台**:硅基流动 API、OpenRouter API(国内节点)、Together AI +- **更新策略**:每日 08:00 全量同步 + 变更触发增量更新 +- **错误处理**:采集失败写入日志,保留上次成功数据,标记"数据待核实" + +#### F2:模型基础信息库 +- 模型名称、版本、发布商、发布时间 +- 模态(文字/图片/音频/视频/代码) +- 上下文窗口、Capabilities(function calling / JSON mode / Vision) +- 模型状态(active / deprecated / discontinued) + +#### F3:定价数据库 +- 按运营商 × 模型 × 区域存储完整定价 +- 支持货币自动换算(USD/CNY/EUR) +- 保留历史价格,支持趋势查看 +- 标注价格数据质量(官方 / 推测 / 已过期) + +#### F4:免费政策库 +- 各平台免费模型列表 +- 免费额度(每日/每月请求次数、Token 上限) +- 限流规则(QPS、并发、冷却时间) +- 区域限制(仅某地区可用、仅某用户类型可用) +- 特殊情况(限时免费、活动到期时间) + +### 3.2 应用层(Must Have) + +#### F5:每日自动报告生成 +- **触发**:每日 08:00 cron - **内容**: - - 今日新上线/更新模型 - - 价格变动提醒 - - 免费政策变更 - - 热门模型 TOP 10 推荐(按场景) - - 成本优化建议 + 1. 今日新上线 / 更新的模型 + 2. 价格变动提醒(>5% 变动高亮) + 3. 免费政策变更 + 4. 场景推荐 TOP 10(编码/写作/推理/免费/低成本) + 5. 成本优化建议(同能力更低价格选项) +- **格式**:HTML Web 页面(内网可访问)+ PDF 导出 +- **分发**:支持推送至钉钉群/飞书群/Email -#### F5:搜索与筛选 -- **筛选维度**:提供商、免费/付费、场景(编码/写作/推理)、价格区间、上下文长度 -- **搜索**:模型名称、提供商、特性关键词 +#### F6:搜索与筛选 +- **筛选**:厂商 / 模态 / 场景 / 价格区间 / 上下文长度 / 免费/付费 +- **搜索**:模型名、厂商名、特性关键词 +- **视图**:卡片视图 / 表格视图 / 趋势图 -### 2.2 进阶功能(Should Have) +#### F7:成本计算器 +- 输入:Token 数量(输入/输出分开) +- 输出:各平台/运营商成本对比排行榜 +- 支持按月用量估算 -#### F6:价格对比计算器 -- 输入 Token 数量 → 输出各提供商成本对比 -- 按月成本估算 +### 3.3 进阶功能(Should Have) -#### F7:模型评测排行榜 -- 聚合 MMLU / HumanEval / GSM8K / MATH 等基准评测数据 +#### F8:价格变动告警 +- 触发条件:价格变动 > 10%(可配置) +- 通知方式:钉钉/飞书/Email 推送 +- 白名单:用户关注特定模型/平台 + +#### F9:模型评测聚合 +- MMLU / HumanEval / GSM8K / MATH / LiveCodeBench 等基准分 - 按场景排名(编码/推理/写作/免费) -#### F8:告警系统 -- 价格变动 > 10% 触发告警 -- 新模型上线通知 -- 免费额度变更通知 - -#### F9:API 接口 -- 提供 JSON API 供其他系统集成 -- 支持 AI Agent 查询最优模型 - -### 2.3 未来功能(Nice to Have) - -#### F10:竞品追踪 -- 追踪各提供商市场份额、融资动态、战略动向 - -#### F11:多语言界面 -- 中文 / 英文双语界面 +#### F10:API 接口 +- JSON API 供 AI Agent 查询最优模型 +- MCP Server 供 OpenClaw/Claude Code 等集成 --- -## 三、非功能需求 +## 四、覆盖范围 -### 3.1 技术要求 -- **部署**:内网服务器,支持 Docker 部署 -- **存储**:SQLite(轻量)+ PostgreSQL(生产) -- **数据量**:预估 500+ 模型 × 50+ 字段,每日增量 10-50 条 -- **性能**:报告生成 < 30 秒 +### 4.1 模型商(目标 20+) -### 3.2 运维要求 -- **自动更新**:每日 08:00 cron 触发数据同步 +#### 国内厂商(目标 12 家) +| 厂商 | 代表模型 | API 平台 | +|------|----------|----------| +| 百度 | ERNIE-4.0 / ERNIE-Speed | qianfan.llm.yundun.cn | +| 阿里 | Qwen-Turbo / Qwen-Max / Qwen2.5 | dashscope.aliyun.com | +| 腾讯 | Hunyuan-Pro / Hunyuan-Standard | hunyuan.cloud.tencent.com | +| 字节 | Doubao-Pro-32K / Doubao-lite | volcengine.com | +| DeepSeek | V3 / Coder V3 / Chat | platform.deepseek.com | +| 智谱 | GLM-4 / GLM-4V / GLM-3Turbo | open.bigmodel.cn | +| 华为 | Pangu-4 / Pangu-3 | modelarts.huaweicloud.com | +| 讯飞 | Spark-4.0 / Spark-3.5 | xfyun.cn | +| Moonshot | Kimi-1.5 / Kimi-32K | platform.moonshot.cn | +| 零一万物 | Yi-Large / Yi-Medium | platform.01.ai | +| MiniMax | abab-7B / MiniMax-01 | api.minimax.chat | +| 昆仑万维 | Skywork-13B | tiangong.kunlun.com | + +#### 海外厂商(目标 10 家) +| 厂商 | 代表模型 | API 平台 | +|------|----------|----------| +| OpenAI | GPT-4o / GPT-4.5 / o3 / o4 | platform.openai.com | +| Anthropic | Claude 3.5 Sonnet / Claude 4 | console.anthropic.com | +| Google | Gemini 2.0 / Gemini 1.5 | ai.google.dev | +| Meta | Llama 4 / Llama 3.3 | (via Azure/单独部署) | +| xAI | Grok-3 / Grok-4 | x.ai | +| Mistral | Mistral Large / Codestral | mistral.ai | +| Cohere | Command R+ / Command | Cohere | +| Perplexity | Sonar (Pro/Rtel) | perplexity.ai | +| Amazon | Claude/Gemini/Llama (on Bedrock) | AWS Bedrock | +| Microsoft | GPT-4 (on Azure) | Azure OpenAI | + +### 4.2 运营商/云平台(目标 30+) + +#### 国内云厂商(8 家) +| 平台 | 网址 | 主力模型 | +|------|------|----------| +| 阿里云 | aliyun.com | Qwen / 通义全系 | +| 腾讯云 | cloud.tencent.com | Hunyuan 全系 | +| 百度智能云 | cloud.baidu.com | ERNIE 全系 | +| 华为云 | huaweicloud.com | Pangu 全系 | +| 火山引擎 | volcengine.com | Doubao 全系 | +| 京东云 | jdcloud.com | 言犀(自研) | +| 电信天翼云 | ctyun.cn | (接入第三方模型) | +| 移动云 | cmcc.cn | (接入第三方模型) | + +#### 国内中转/聚合(5 家) +| 平台 | 网址 | 特色 | +|------|------|------| +| 硅基流动 | siliconflow.cn | 国内最便宜中转之一 | +| OpenAI 中转 | openai-sg.com 等 | 直连/新加坡节点 | +| DeepSeek 中转 | 多家 | 国内访问 DeepSeek | +| Azure 中转 | 多家 | 绕过 Azure 限制 | +| Claude 中转 | 多家 | 国内访问 Claude | + +#### 海外云厂商(6 家) +| 平台 | 网址 | 主力模型 | +|------|------|----------| +| AWS Bedrock | aws.amazon.com/bedrock | Claude/Gemini/Llama/Titan | +| Azure OpenAI | azure.microsoft.com | GPT-4/GPT-4o | +| Google Cloud | cloud.google.com | Gemini/PaLM | +| Cloudflare Workers AI | developers.cloudflare.com/workers-ai | Llama/Gemma 等 | +| Oracle Cloud AI | oracle.com/cloud | Llama/Mistral | +| IBM watsonx | ibm.com/watsonx | Granite/Maestro | + +#### 海外中转聚合(8 家) +| 平台 | 网址 | 特色 | +|------|------|------| +| OpenRouter | openrouter.ai | 371+ 模型,ELO 排行,免费模型多 | +| Together AI | together.ai | 开源模型为主 | +| Groq | console.groq.com | 高速推理(Llama/Mixtral) | +| Replicate | replicate.com | 镜像部署,方便 | +| Anyscale | anyscale.com | Ray serving | +| Fireworks AI | fireworks.ai | 高速开源模型 | +| Lepton AI | lepton.ai | 按需计费 | +| Perplexity API | perplexity.ai | Sonar 模型专属 | + +--- + +## 五、非功能需求 + +### 5.1 技术要求 +- **部署**:Docker 支持,内网可部署 +- **数据库**:PostgreSQL(主)+ TimescaleDB(时序) / SQLite(轻量版) +- **存储量**:500+ 模型 × 50 字段 ≈ 100MB,每日增量 ~1MB +- **性能**:报告生成 < 30 秒,API 响应 < 500ms + +### 5.2 运维要求 +- **自动更新**:每日 08:00 cron 触发采集 + 报告生成 - **监控**:失败告警、日志留存 30 天 -- **备份**:数据库每日增量备份 +- **备份**:数据库每日备份 +- **告警阈值**:采集失败连续 3 天 / 价格变动 > 20% -### 3.3 安全要求 -- **访问控制**:内网认证(如需) -- **数据来源标注**:所有数据标注来源 URL,确保可溯源 +### 5.3 数据质量 +- **来源标注**:每条数据标注来源 URL,可溯源 +- **置信度**:数据分"官方确认" / "文档推断" / "待核实" +- **更新标记**:过期数据标记"已失效",保留历史 --- -## 四、竞品参考 +## 六、竞品分析摘要 -| 竞品 | URL | 核心能力 | 弱点 | -|------|-----|---------|------| -| OpenRouter | openrouter.ai/models | 724模型实时数据,免费标记,ELO排名 | 无中文界面,不追踪区域定价 | -| AIPriceIndex | (GitHub) | LLM 定价历史追踪 | 仅定价,无评测 | -| Artificial Analysis | artificialanalysis.ai | 模型性能排行,成本计算 | 付费为主,无免费模型追踪 | -| truefoundry/models | (GitHub) | 21提供商 1000+模型配置 | 非实时,需人工 PR 更新 | -| Model-ID-Cheatsheet | (GitHub) | 107模型精确 ID | 仅 API ID,无定价 | +| 竞品 | 覆盖 | 区域定价 | 免费政策 | 每日报告 | 中文 | +|------|------|----------|----------|----------|------| +| OpenRouter | 371 模型(海外为主)| ❌ | ✅ 标记 | ❌ | ❌ | +| Artificial Analysis | 性能排行 | ❌ | ✅ 基础 | ❌ | ❌ | +| truefoundry/models | 1000+ 配置(YAML) | ❌ | ❌ | ❌ | ❌ | +| 硅基流动 | 中转聚合 | ✅ CNY | ✅ 详细 | ❌ | ✅ | +| **本文产品(目标)** | **20+厂商 500+模型** | **✅ 双视图** | **✅ 详细** | **✅ 自动** | **✅** | --- -## 五、技术方案建议 +## 七、上线计划 -### 方案 A(快速启动) -- **数据源**:OpenRouter API + 官方文档爬虫 -- **存储**:SQLite + 每日 CSV 导出 -- **报告**:静态 HTML 页面 + GitHub Pages 托管 -- **工期**:2 周 MVP - -### 方案 B(生产级) -- **数据源**:OpenRouter + Anthropic + Google + DeepSeek 官方 API -- **存储**:PostgreSQL + TimescaleDB(时序数据) -- **报告**:Web Dashboard(React) + PDF 自动生成 -- **告警**:邮件/钉钉通知 -- **工期**:4-6 周 +| 阶段 | 内容 | 目标 | 工期 | +|------|------|------|------| +| **Phase 0** | PRD 确认 + 技术方案选定 | 1 周 | 2026-05 第1周 | +| **Phase 1** | OpenRouter 371 模型 + 10 主流国内厂商接入 + 静态报告 | 2 周 | 2026-05 第2-3周 | +| **Phase 2** | Web Dashboard + 告警 + 成本计算器 | 2 周 | 2026-05 第4周-6月第1周 | +| **Phase 3** | API 开放 + MCP Server + Agent 集成 | 1 周 | 2026-06 第2周 | --- -## 六、用户故事 - -| # | 用户 | 故事 | -|---|------|------| -| U1 | 立立 | "我每天早上看一眼报告,就知道今天该用哪个模型省钱" | -| U2 | 小龙 | "我想查某个场景下最便宜的免费模型,5秒内找到" | -| U3 | 宰相 | "我想让 AI Agent 能自动查询最优模型,不用每次问人" | -| U4 | 项目经审 | "我想看到本周价格变动汇总,作为成本核算依据" | - ---- - -## 七、风险与依赖 +## 八、风险与依赖 | 风险 | 影响 | 应对 | |------|------|------| -| 数据源 API 变更 | 爬虫失效 | 多源交叉验证,建立镜像 | -| 免费额度频繁调整 | 报告滞后 | 每日检查 + 变更告警 | -| 提供商定价策略差异化 | 数据结构复杂 | 设计灵活 schema,支持扩展字段 | +| 国内厂商 API 变更/限速 | 采集失败 | 多源备份 + 人工补充机制 | +| 中转平台被墙/不稳定 | 数据不可用 | 标注平台稳定性评级 | +| 价格更新太频繁 | 报告滞后 | 变更触发实时告警,不等每日同步 | +| 数据版权问题 | 合规风险 | 仅采集公开数据,标注来源 | --- -## 八、上线计划 +## 九、用户故事 -| 阶段 | 内容 | 目标 | -|------|------|------| -| Phase 0 | 需求确认 + 技术方案选定 | 1 周 | -| Phase 1 | MVP:10 提供商数据 + 静态报告 | 2 周 | -| Phase 2 | Web Dashboard + 告警 + 评测排行 | 2 周 | -| Phase 3 | API 开放 + Agent 集成 | 1 周 | +| # | 用户 | 故事 | +|---|------|------| +| U1 | 立立(研发) | "每天早上我花2分钟看报告,知道今天哪个模型最值得用" | +| U2 | 小龙(项目经审) | "我想查'中文写作性价比最高的免费模型',5秒找到答案" | +| U3 | 宰相(AI 助理) | "我想调用 API 自动为用户选择最优模型,不用每次问人" | +| U4 | 财务(成本管理) | "我想看到本月各模型花费占比,作为预算依据" | +| U5 | 项目经审(决策者) | "我想知道国内模型和国际模型的成本差异,辅助选型决策" | +--- + +## 十、附录 + +### 10.1 参考资料 +- OpenRouter API: `https://openrouter.ai/api/v1/models` +- 硅基流动定价: `https://siliconflow.cn/zh-stilling/price` +- AWS Bedrock 定价: `https://aws.amazon.com/bedrock/pricing/` +- Azure OpenAI 定价: `https://azure.microsoft.com/en-us/pricing/details/cognitive-services/openai-service/` +- 百度 ERNIE: `https://qianfan.llm.yundun.cn/` +- 阿里 DashScope: `https://help.aliyun.com/zh/dashscope/` +- DeepSeek: `https://platform.deepseek.com/` + +### 10.2 数据字典(核心字段) + +| 字段 | 类型 | 说明 | 示例 | +|------|------|------|------| +| provider_name | string | 模型商名称 | "OpenAI" / "百度" | +| model_name | string | 模型名称 | "GPT-4o" / "ERNIE-4.0" | +| operator_name | string | 运营商名称 | "AWS Bedrock" / "硅基流动" | +| region | string | 区域代码 | "CN" / "US" / "GLOBAL" | +| currency | string | 货币 | "USD" / "CNY" | +| input_price | float | 输入价格(/MTok) | 2.5 | +| output_price | float | 输出价格(/MTok) | 10.0 | +| free_tier | text | 免费额度描述 | "每日100次,每次不超过4000 tokens" | +| context_length | int | 上下文窗口 | 128000 | +| capabilities | array | 能力列表 | ["vision","function_calling"] |