diff --git a/docs/API_REFERENCE.md b/docs/API_REFERENCE.md index 314b156..d8841e0 100644 --- a/docs/API_REFERENCE.md +++ b/docs/API_REFERENCE.md @@ -49,6 +49,8 @@ curl -fsS http://127.0.0.1:8080/health "providerCN": "OpenAI", "modality": "text", "contextLength": 128000, + "pricingMode": "input_output", + "priceUnit": "million_tokens", "inputPrice": 2.5, "outputPrice": 10, "currency": "USD", @@ -70,6 +72,9 @@ curl -fsS http://127.0.0.1:8080/health | `providerCN` | 中文厂商名;缺失时回退为英文名或 `external_id` 前缀 | | `modality` | 模态类型 | | `contextLength` | 上下文窗口 | +| `pricingMode` | 定价模式:`input_output`(默认,按输入/输出 token)或 `flat`(按字符/秒等单一单位) | +| `priceUnit` | 价格单位;默认 `million_tokens`,语音类可能是 `10k_characters` / `second` | +| `flatPrice` | `pricingMode=flat` 时的统一单价 | | `inputPrice` | 输入价格,单位与 `currency` 配套,默认按每百万 token | | `outputPrice` | 输出价格 | | `currency` | 币种 | diff --git a/docs/NEXT_IMPORTER_RUNTIME_PRIORITY.md b/docs/NEXT_IMPORTER_RUNTIME_PRIORITY.md index 89a393f..784a64b 100644 --- a/docs/NEXT_IMPORTER_RUNTIME_PRIORITY.md +++ b/docs/NEXT_IMPORTER_RUNTIME_PRIORITY.md @@ -11,22 +11,25 @@ 1. 腾讯云 TokenHub runtime 挂载 2. 魔搭 API-Inference importerKey 校准 3. 天翼云模型推理服务 payg importerKey 校准 +4. 联通云 Token Plan pricing importer(3 模型 blended price + 区域支持矩阵) 对应结果: - `tencent_subscription` 已进入 `run_daily.sh` / `run_intel_pipeline.sh` / `run_real_pipeline.sh` - `verify_importer_smoke.sh` 已新增腾讯 fixture/live smoke,并通过 - `魔搭 API-Inference` 与 `天翼云模型推理服务 payg` 已从错误的价格 importer 映射回退到 `import_catalog_seed_verification.go` +- `cucloud_pricing` 已进入 `run_daily.sh` / `run_real_pipeline.sh` / `run_intel_pipeline.sh` +- `verify_importer_smoke.sh` 已新增联通云 fixture/live smoke,并通过 - 覆盖矩阵已同步到新真相 ## 当前事实基线 来自 `docs/PLAN_CATALOG_COVERAGE_MATRIX.md`: -- 目录基线:70/70 -- 目录核验:32/70 -- 已有 importer:34/70 -- 已真实入库:34/70 -- 仍缺细颗粒度价格:41/70 +- 目录基线:71/71 +- 目录核验:32/71 +- 已有 importer:35/71 +- 已真实入库:35/71 +- 仍缺细颗粒度价格:41/71 解读: - 这轮不是单纯“把数字做大” @@ -46,8 +49,8 @@ | 优先级 | 平台 | 当前状态 | 价值 | 建议动作 | |---|---|---|---|---| -| P2-1 | 联通云 AICP / AI 应用开发平台 | 已真实入库,但仍缺细颗粒度价格 | 当前仅目录/入口层覆盖,不足以支撑价格对比 | 在 `import_cucloud_catalog.go` 基础上升级为 pricing importer 或新增 `import_cucloud_pricing.go` | -| P2-2 | 移动云 AI 应用专区 | 已真实入库,但事实粒度仍偏粗 | 已有 runtime,但事实粒度不足 | 从 `import_mobile_cloud_catalog.go` 升级到 pricing importer | +| P2-1 | 移动云 MoMA | 已升级为官方价格 importer,并补齐语音按字符/按秒计费落表 | 文本/视觉/向量/排序/语音模型都可进入价格对比 | 已完成,后续仅做新增模型跟进 | +| P2-2 | 联通云 AICP / AI 应用开发平台 | 已新增 `cucloud_pricing`,但当前只覆盖 AISP Token Plan 3 模型 blended price 与区域矩阵 | 目录入口与部分结构化价格已打通,但 payg per-model 公开价表仍缺 | 后续若官方公开 payg 模型销售价,再扩 `import_cucloud_pricing.go` | | P2-3 | 豆包与 Seed 开放平台 | 已有多源/订阅链路,但仍缺细颗粒度价格标注 | 当前矩阵里仍保留缺口 | 区分“已有多源模型采集”与“官方价格页结构化价格”能力 | | P2-4 | 天翼云息壤 / CloudBase AI+ / TI 平台大模型广场 | manual_review | 平台入口存在,但尚无真实 importer | 先回查官方页面结构,再决定 catalog importer 还是 pricing importer | @@ -82,9 +85,11 @@ - 华为侧保留 package + payg 双链路;但公开 payg 页面未见独立盘古 SKU 单价,已按真实页面语义落地 ### 第二批(平台深挖) -4. 联通云 pricing importer -5. 移动云 pricing importer -6. 火山方舟官方价格页结构化 importer +4. 移动云 pricing importer 后续 schema 扩展 +5. 联通云 payg per-model 价格公开表跟进 +6. 百川 / 零一万物 / 商汤 / 讯飞 任一官方 payg importer + +注:火山方舟官方价格页结构化 importer 已接入 `import_bytedance_pricing.go`,当前覆盖 `在线推理(常规)` 公开的 token 定价;向量/图片/3D 与低延迟/批量/TPM 保障包仍待 schema 扩展后细化。 ### 第三批(全球参考集) 7. Gemini API @@ -110,7 +115,7 @@ A. 先做 `百川 / 零一万物 / 商汤 / 讯飞` 中任一条官方 payg impo 如果允许做一个“小批次闭环”: -B. `联通云 pricing importer + 移动云 pricing importer + 火山方舟官方价格页 importer` +B. `移动云语音价补齐 + 联通云 payg 公开价跟进 + 百川/零一万物/商汤/讯飞 任一官方价格页 importer` -通义千问 / 腾讯混元 / 华为云 MaaS 这一批已完成,后续优先转向仍缺细颗粒度价格的平台。 +通义千问 / 腾讯混元 / 华为云 MaaS / 联通云 Token Plan 这一批已完成,后续优先转向仍缺公开 payg 价格的平台。 diff --git a/docs/PLAN_CATALOG_COVERAGE_MATRIX.md b/docs/PLAN_CATALOG_COVERAGE_MATRIX.md index 8260016..4fdd771 100644 --- a/docs/PLAN_CATALOG_COVERAGE_MATRIX.md +++ b/docs/PLAN_CATALOG_COVERAGE_MATRIX.md @@ -12,11 +12,11 @@ ## 汇总 -- 目录基线:70/70 -- 目录核验:32/70 -- 已有 importer:34/70 -- 已真实入库:34/70 -- 仍缺细颗粒度价格:41/70 +- 目录基线:71/71 +- 目录核验:32/71 +- 已有 importer:35/71 +- 已真实入库:35/71 +- 仍缺细颗粒度价格:41/71 ## 基础目录 @@ -34,7 +34,7 @@ | 通义千问开放平台 | 什么是大模型服务平台百炼 | 按量计费 | ✓ | ✓ | ✓ | ✓ | — | run_daily source=qwen_pricing | | 腾讯混元开放平台 | 腾讯混元 | 按量计费 | ✓ | ✓ | ✓ | ✓ | — | run_daily source=hunyuan_pricing | | 文心大模型开放平台 | 文心千帆大模型平台 | 按量计费 | ✓ | — | ✓ | ✓ | — | run_daily 多源采集 source=baidu | -| 豆包与 Seed 开放平台 | 火山方舟 | 按量计费 | ✓ | — | ✓ | ✓ | ✓ | run_daily 多源采集 source=bytedance | +| 豆包与 Seed 开放平台 | 火山方舟 | 按量计费 | ✓ | — | ✓ | ✓ | 部分 | run_daily source=bytedance_pricing(当前落地在线推理常规定价;向量/图片/3D 与低延迟/批量/TPM 保障包等多 service-class 价格待 schema 扩展) | | 智谱 Coding Plan | 套餐概览 | Coding Plan | ✓ | — | ✓ | ✓ | — | run_daily source=zhipu_coding_plan | | 盘古大模型服务 | 大模型即服务 MaaS | 按量计费 | ✓ | ✓ | ✓ | ✓ | 部分 | run_daily source=huawei_maas_pricing(当前官方公开 payg 实际覆盖华为云 MaaS 文本模型集合,未见独立盘古 SKU 单价) | | DeepSeek API | 模型 & 价格 | 按量计费 | ✓ | — | ✓ | ✓ | — | run_daily 多源采集 source=deepseek | @@ -73,9 +73,9 @@ | 天翼云模型推理服务 | 天翼云模型推理服务 | 按量计费 | ✓ | ✓ | — | — | ✓ | 当前仅走目录级官方入口核验 | | 天翼云模型推理服务 | 天翼云模型推理服务 | Coding Plan | ✓ | — | ✓ | ✓ | — | run_daily source=ctyun_subscription | | 天翼云息壤 | 天翼云息壤 | Unknown | ✓ | — | — | — | ✓ | 仅人工核对占位,尚未接入 importer | -| 联通云 AICP | 联通云智算专区 | 按量计费 | ✓ | — | ✓ | ✓ | ✓ | run_daily source=cucloud_catalog | -| 联通云 AI 应用开发平台 | 联通云智算专区 | 按量计费 | ✓ | — | ✓ | ✓ | ✓ | run_daily source=cucloud_catalog | -| 移动云 AI 应用专区 | 移动云市场 AI 应用专区 | Unknown | ✓ | — | ✓ | ✓ | ✓ | run_daily source=mobile_cloud_catalog | +| 联通云 AICP | 联通云智算专区 | 按量计费 | ✓ | — | ✓ | ✓ | ✓ | run_daily source=cucloud_catalog;另有 `cucloud_pricing` 补充 AISP Token Plan 三模型 blended price + 区域矩阵,但 AICP/AI 应用平台本身仍缺公开 payg per-model 价表 | +| 联通云 AI 应用开发平台 | 联通云智算专区 | 按量计费 | ✓ | — | ✓ | ✓ | ✓ | run_daily source=cucloud_catalog;另有 `cucloud_pricing` 补充 AISP Token Plan 三模型 blended price + 区域矩阵,但 AI 应用平台本身仍缺公开 payg per-model 价表 | +| 移动云 MoMA | 预置模型服务-token按量计费 | 按量计费 | ✓ | — | ✓ | ✓ | ✓ | run_daily source=mobile_cloud_pricing;文本/视觉/向量/排序与语音按字符/按秒计费均已入库 | | 有道智云 MaaS | 有道智云 MaaS | 按量计费 | ✓ | — | ✓ | ✓ | — | run_daily source=youdao_pricing | | 360 智脑开放平台 | 360 智脑开放平台 | 按量计费 | ✓ | — | ✓ | ✓ | — | run_daily source=platform360_pricing | | 硅基流动云平台 | SiliconCloud | 按量计费 | ✓ | — | ✓ | ✓ | — | run_daily source=siliconflow_pricing | @@ -111,7 +111,8 @@ ## 需要重点关注的边界 - 腾讯云 TokenHub:本轮已补齐 runtime 挂载,并通过 `verify_importer_smoke.sh` 的 fixture/live 双 smoke;当前可按 `tencent_subscription` 计入真实入库。 -- `existing_price_importer`:这是 seed 层的已存在价格导入标记,不是脚本文件名;当前只对 OpenAI / DeepSeek / Moonshot / 百度文心 / 豆包-Seed 按现有日跑 source 判定为“已真实入库”。 +- 联通云:当前同时存在 `cucloud_catalog`(目录入口核验)与 `cucloud_pricing`(AISP Token Plan 三模型 blended price + 区域支持矩阵)两条链路;后者不能被夸大为联通云 payg per-model 价格已完整打通。 +- `existing_price_importer`:这是 seed 层的已存在价格导入标记,不是脚本文件名;当前 OpenAI / DeepSeek / Moonshot / 百度文心 仍沿用既有真实入库链路,火山方舟 payg 已切换到 `import_bytedance_pricing.go`。 - `manual_review`:当前仍只是人工占位,不应误判为 importer 已接入。 - 目录核验类平台:`import_catalog_seed_verification.go` 会更新 `plan_catalog_inventory.last_checked_at`,但它不是 `region_pricing` 级别的细颗粒度价格抓取。 - 本轮已校准两处 importerKey 漂移:`魔搭 API-Inference` 与 `天翼云模型推理服务 payg` 已回退到目录级官方入口核验,不再冒充 `youdao_pricing` / `platform360_pricing` 真实入库来源。