Skip to content

Instantly share code, notes, and snippets.

@iblueer
Last active December 1, 2025 13:27
Show Gist options
  • Select an option

  • Save iblueer/230efbbca2a203d5d5c6d3742674ffb3 to your computer and use it in GitHub Desktop.

Select an option

Save iblueer/230efbbca2a203d5d5c6d3742674ffb3 to your computer and use it in GitHub Desktop.
[各个平台模型报价(无优惠)] #AIProvider

模型 & 价格

下表所列模型价格以“百万 tokens”为单位。Token 是模型用来表示自然语言文本的的最小单位,可以是一个词、一个数字或一个标点符号等。我们将根据模型输入和输出的总 token 数进行计量计费。


模型细节

模型 deepseek-chat deepseek-reasoner
模型版本 DeepSeek-V3.2-Exp(非思考模式) DeepSeek-V3.2-Exp(思考模式)
上下文长度 128K
输出长度 默认4K,最大8K 默认32K,最大64K
功能 JsonOutput 支持 支持
FunctionCalling 支持 不支持(1)
对话前缀续写(Beta) 支持 支持
FIM补全(Beta) 支持 不支持
价格 百万tokens输入(缓存命中) 0.2元
百万tokens输入(缓存未命中) 2元
百万tokens输出 3元
  • (1) 如果给 deepseek-reasoner 模型的请求中有 tools 参数,请求实际上将使用 deepseek-chat 模型。

扣费规则

扣减费用 = token 消耗量 × 模型单价,对应的费用将直接从充值余额或赠送余额中进行扣减。 当充值余额与赠送余额同时存在时,优先扣减赠送余额。

产品价格可能发生变动,DeepSeek 保留修改价格的权利。请您依据实际用量按需充值,定期查看此页面以获知最新价格信息。

模型推理价格说明

计费基本概念

计费单元

Token:代表常见的字符序列,每个汉字使用的 Token 数目可能是不同的。例如,单个汉字"夔"可能会被分解为若干 Token 的组合,而像"中国"这样短且常见的短语则可能会使用单个 Token。

大致来说,对于一段通常的中文文本,1 个 Token 大约相当于 1.5-2 个汉字。具体每次调用实际产生的 Tokens 数量可以通过调用计算 Token API 来获得。

计费逻辑

Chat Completion 接口收费:我们对 Input 和 Output 均实行按量计费。如果您上传并抽取文档内容,并将抽取的文档内容作为 Input 传输给模型,那么文档内容也将按量计费。

文件相关接口(文件内容抽取/文件存储)接口限时免费,即您只上传并抽取文档,这个API本身不会产生费用。

产品定价

生成模型 kimi-k2

模型 计费单位 输入价格 (缓存命中) 输入价格 (缓存未命中) 输出价格 模型上下文长度
kimi-k2-0905-preview 1M tokens ¥1.00 ¥4.00 ¥16.00 262,144 tokens
kimi-k2-0711-preview 1M tokens ¥1.00 ¥4.00 ¥16.00 131,072 tokens
kimi-k2-turbo-preview推荐 1M tokens ¥1.00 ¥8.00 ¥58.00 262,144 tokens
kimi-k2-thinking 1M tokens ¥1.00 ¥4.00 ¥16.00 262,144 tokens
kimi-k2-thinking-turbo 1M tokens ¥1.00 ¥8.00 ¥58.00 262,144 tokens
  • kimi-k2 是一款具备超强代码和 Agent 能力的 MoE 架构基础模型,总参数 1T,激活参数 32B。在通用知识推理、编程、数学、Agent 等主要类别的基准性能测试中,K2 模型的性能超过其他主流开源模型
  • kimi-k2-0905-preview 模型上下文长度 256k,在 kimi-k2-0711-preview 能力的基础上,具备更强的 Agentic Coding 能力、更突出的前端代码的美观度和实用性、以及更好的上下文理解能力
  • kimi-k2-turbo-preview 模型上下文长度 256k,是 kimi k2 的高速版本模型,始终对标最新版本的 kimi-k2 模型(kimi-k2-0905-preview)。模型参数与 kimi-k2 一致,但输出速度已提至每秒 60 tokens,最高可达每秒 100 tokens
  • kimi-k2-0711-preview 模型上下文长度为 128k
  • kimi-k2-thinking 模型上下文长度 256k,是具有通用 Agentic 能力和推理能力的思考模型,它擅长深度推理使用须知
  • kimi-k2-thinking-turbo 模型上下文长度 256k,是 kimi-k2-thinking 模型的高速版,适用于需要深度推理和追求极致高速的场景
  • 支持 ToolCalls、JSON Mode、Partial Mode、联网搜索功能等,不支持视觉功能
  • 支持自动上下文缓存功能,缓存命中的 tokens 将按照输入价格(缓存命中)单价收费,您可以在控制台中查看"context caching"类型的费用明细

生成模型 kimi-latest

💡 计费说明:kimi-latest 模型会根据您请求的上下文长度自动选择对应的计费模型,上下文越长,价格越高

模型 请求上下文长度范围 (自动选择计费模型) 计费单位 输入价格 (缓存命中) 输入价格 (缓存未命中) 输出价格
kimi-latest ≤ 8,192 tokens 1M tokens ¥1.00 ¥2.00 ¥10.00
8,192 < 长度 ≤ 32,768 tokens 1M tokens ¥1.00 ¥5.00 ¥20.00
32,768 < 长度 ≤ 131,072 tokens 1M tokens ¥1.00 ¥10.00 ¥30.00
  • kimi-latest 模型总是使用 Kimi 智能助手产品使用最新的 Kimi 大模型版本,可能包含尚未稳定的特性
  • kimi-latest 模型上下文长度为 128k,会自动根据请求的上下文长度选择 8k/32k/128k 模型作为计费模型
  • kimi-latest 是视觉模型,支持图片理解
  • 支持自动上下文缓存,缓存命中的 Tokens 费用仅为 ¥1/M Tokens
  • 其余功能与 moonshot-v1 系列模型保持一致,包括:ToolCalls、JSON Mode、Partial Mode、联网搜索功能等

生成模型 Moonshot-v1

模型 计费单位 输入价格 输出价格 模型上下文长度
moonshot-v1-8k 1M tokens ¥2.00 ¥10.00 8,192 tokens
moonshot-v1-32k 1M tokens ¥5.00 ¥20.00 32,768 tokens
moonshot-v1-128k 1M tokens ¥10.00 ¥30.00 131,072 tokens
moonshot-v1-8k-vision-preview 1M tokens ¥2.00 ¥10.00 8,192 tokens
moonshot-v1-32k-vision-preview 1M tokens ¥5.00 ¥20.00 32,768 tokens
moonshot-v1-128k-vision-preview 1M tokens ¥10.00 ¥30.00 131,072 tokens

此处 1M = 1,000,000,表格中的价格代表每消耗 1M tokens 的价格。

Last updated on 2025年11月11日

模型ID 模型名称 发行商 功能特性 上下文长度 条件 计费项 价格
deepseek/deepseek-v3.1-terminus DeepSeek/DeepSeek-V3.1-Terminus DeepSeek 工具调用;AI编程 128K 不限制 输入 0.004元/K
deepseek/deepseek-v3.1-terminus DeepSeek/DeepSeek-V3.1-Terminus DeepSeek 工具调用;AI编程 128K 不限制 输出 0.012元/K
qwen3-max 通义千问3Max Aliyun 工具调用 256K 输入长度(0,32K] 输入 0.006元/K
qwen3-max 通义千问3Max Aliyun 工具调用 256K 输入长度(0,32K] 输出 0.024元/K
qwen3-max 通义千问3Max Aliyun 工具调用 256K 输入长度(32K,128K] 输入 0.01元/K
qwen3-max 通义千问3Max Aliyun 工具调用 256K 输入长度(32K,128K] 输出 0.04元/K
qwen3-max 通义千问3Max Aliyun 工具调用 256K 输入长度(128K,+∞] 输入 0.015元/K
qwen3-max 通义千问3Max Aliyun 工具调用 256K 输入长度(128K,+∞] 输出 0.06元/K
gpt-oss-20b gpt-oss-20b OpenAI 工具调用;深度思考 128K 不限制 输入 0.00072元/K
gpt-oss-20b gpt-oss-20b OpenAI 工具调用;深度思考 128K 不限制 输出 0.0036元/K
gpt-oss-120b gpt-oss-120b OpenAI 工具调用;深度思考 128K 不限制 输入 0.00108元/K
gpt-oss-120b gpt-oss-120b OpenAI 工具调用;深度思考 128K 不限制 输出 0.0054元/K
deepseek/deepseek-v3.2-exp-thinking DeepSeek/DeepSeek-V3.2-Exp-Thinking DeepSeek 深度思考 128K 不限制 输入 0.002元/K
deepseek/deepseek-v3.2-exp-thinking DeepSeek/DeepSeek-V3.2-Exp-Thinking DeepSeek 深度思考 128K 不限制 输出 0.003元/K
deepseek/deepseek-v3.2-exp DeepSeek/DeepSeek-V3.2-Exp DeepSeek 工具调用 128K 不限制 输入 0.002元/K
deepseek/deepseek-v3.2-exp DeepSeek/DeepSeek-V3.2-Exp DeepSeek 工具调用 128K 不限制 输出 0.003元/K
deepseek/deepseek-v3.1-terminus-thinking DeepSeek/DeepSeek-V3.1-Terminus-Thinking DeepSeek 深度思考 128K 不限制 输入 0.004元/K
deepseek/deepseek-v3.1-terminus-thinking DeepSeek/DeepSeek-V3.1-Terminus-Thinking DeepSeek 深度思考 128K 不限制 输出 0.012元/K
deepseek-v3.1 DeepSeek-V3.1 DeepSeek AI编程;工具调用;深度思考 128K 不限制 输入 0.004元/K
deepseek-v3.1 DeepSeek-V3.1 DeepSeek AI编程;工具调用;深度思考 128K 不限制 输出 0.012元/K
deepseek-v3.1 DeepSeek-V3.1 DeepSeek AI编程;工具调用;深度思考 128K 不限制 批量输入 0.002元/K
deepseek-v3.1 DeepSeek-V3.1 DeepSeek AI编程;工具调用;深度思考 128K 不限制 批量输出 0.006元/K
deepseek-r1-0528 DeepSeek-R1-0528 DeepSeek 工具调用;深度思考 80K 不限制 输入 0.004元/K
deepseek-r1-0528 DeepSeek-R1-0528 DeepSeek 工具调用;深度思考 80K 不限制 输出 0.016元/K
deepseek-r1-0528 DeepSeek-R1-0528 DeepSeek 工具调用;深度思考 80K 不限制 批量输入 0.002元/K
deepseek-r1-0528 DeepSeek-R1-0528 DeepSeek 工具调用;深度思考 80K 不限制 批量输出 0.008元/K
deepseek-v3-0324 DeepSeek-V3-0324 DeepSeek 工具调用 128K 不限制 输入 0.002元/K
deepseek-v3-0324 DeepSeek-V3-0324 DeepSeek 工具调用 128K 不限制 输出 0.008元/K
deepseek-v3-0324 DeepSeek-V3-0324 DeepSeek 工具调用 128K 不限制 批量输入 0.001元/K
deepseek-v3-0324 DeepSeek-V3-0324 DeepSeek 工具调用 128K 不限制 批量输出 0.004元/K
deepseek-r1 DeepSeek-R1 DeepSeek 工具调用;深度思考 80K 不限制 输入 0.004元/K
deepseek-r1 DeepSeek-R1 DeepSeek 工具调用;深度思考 80K 不限制 输出 0.016元/K
deepseek-r1 DeepSeek-R1 DeepSeek 工具调用;深度思考 80K 不限制 批量输入 0.002元/K
deepseek-r1 DeepSeek-R1 DeepSeek 工具调用;深度思考 80K 不限制 批量输出 0.008元/K
doubao-seed-1.6-thinking Doubao-Seed1.6Thinking ByteDance 图像理解;工具调用;深度思考 256K 输入长度(0,32K] 输入 0.0008元/K
doubao-seed-1.6-thinking Doubao-Seed1.6Thinking ByteDance 图像理解;工具调用;深度思考 256K 输入长度(0,32K] 输出 0.008元/K
doubao-seed-1.6-thinking Doubao-Seed1.6Thinking ByteDance 图像理解;工具调用;深度思考 256K 输入长度(32K,128K] 输入 0.0012元/K
doubao-seed-1.6-thinking Doubao-Seed1.6Thinking ByteDance 图像理解;工具调用;深度思考 256K 输入长度(32K,128K] 输出 0.016元/K
doubao-seed-1.6-thinking Doubao-Seed1.6Thinking ByteDance 图像理解;工具调用;深度思考 256K 输入长度(128K,+∞] 输入 0.0024元/K
doubao-seed-1.6-thinking Doubao-Seed1.6Thinking ByteDance 图像理解;工具调用;深度思考 256K 输入长度(128K,+∞] 输出 0.024元/K
doubao-seed-1.6-flash Doubao-Seed1.6Flash ByteDance 图像理解;工具调用;深度思考 256K 输入长度(0,32K] 输入 0.00015元/K
doubao-seed-1.6-flash Doubao-Seed1.6Flash ByteDance 图像理解;工具调用;深度思考 256K 输入长度(0,32K] 输出 0.0015元/K
doubao-seed-1.6-flash Doubao-Seed1.6Flash ByteDance 图像理解;工具调用;深度思考 256K 输入长度(32K,128K] 输入 0.0003元/K
doubao-seed-1.6-flash Doubao-Seed1.6Flash ByteDance 图像理解;工具调用;深度思考 256K 输入长度(32K,128K] 输出 0.003元/K
doubao-seed-1.6-flash Doubao-Seed1.6Flash ByteDance 图像理解;工具调用;深度思考 256K 输入长度(128K,+∞] 输入 0.0003元/K
doubao-seed-1.6-flash Doubao-Seed1.6Flash ByteDance 图像理解;工具调用;深度思考 256K 输入长度(128K,+∞] 输出 0.003元/K
doubao-1.5-pro-32k Doubao1.5Pro32k ByteDance 工具调用 128K 不限制 输入 0.0008元/K
doubao-1.5-pro-32k Doubao1.5Pro32k ByteDance 工具调用 128K 不限制 输出 0.002元/K
doubao-1.5-thinking-pro Doubao1.5ThinkingPro ByteDance 工具调用;深度思考 128K 不限制 输入 0.004元/K
doubao-1.5-thinking-pro Doubao1.5ThinkingPro ByteDance 工具调用;深度思考 128K 不限制 输出 0.016元/K
doubao-1.5-vision-pro Doubao1.5VisionPro ByteDance 图像理解 128K 不限制 输入 0.003元/K
doubao-1.5-vision-pro Doubao1.5VisionPro ByteDance 图像理解 128K 不限制 输出 0.009元/K
doubao-seed-1.6 Doubao-Seed1.6 ByteDance 图像理解;工具调用;深度思考 256K 输入长度(0,32K]且输出长度(0,200] 输入 0.0008元/K
doubao-seed-1.6 Doubao-Seed1.6 ByteDance 图像理解;工具调用;深度思考 256K 输入长度(0,32K]且输出长度(0,200] 输出 0.002元/K
doubao-seed-1.6 Doubao-Seed1.6 ByteDance 图像理解;工具调用;深度思考 256K 输入长度(0,32K]且输出长度(200,+∞] 输入 0.0008元/K
doubao-seed-1.6 Doubao-Seed1.6 ByteDance 图像理解;工具调用;深度思考 256K 输入长度(0,32K]且输出长度(200,+∞] 输出 0.008元/K
doubao-seed-1.6 Doubao-Seed1.6 ByteDance 图像理解;工具调用;深度思考 256K 输入长度(32K,128K] 输入 0.0012元/K
doubao-seed-1.6 Doubao-Seed1.6 ByteDance 图像理解;工具调用;深度思考 256K 输入长度(32K,128K] 输出 0.016元/K
doubao-seed-1.6 Doubao-Seed1.6 ByteDance 图像理解;工具调用;深度思考 256K 输入长度(128K,+∞] 输入 0.0024元/K
doubao-seed-1.6 Doubao-Seed1.6 ByteDance 图像理解;工具调用;深度思考 256K 输入长度(128K,+∞] 输出 0.024元/K
qwen-turbo 通义千问-Turbo Aliyun 工具调用;深度思考 1000K 不限制 思考输入 0.0003元/K
qwen-turbo 通义千问-Turbo Aliyun 工具调用;深度思考 1000K 不限制 思考输出 0.003元/K
qwen-turbo 通义千问-Turbo Aliyun 工具调用;深度思考 1000K 不限制 非思考输入 0.0003元/K
qwen-turbo 通义千问-Turbo Aliyun 工具调用;深度思考 1000K 不限制 非思考输出 0.0006元/K
qwen3-next-80b-a3b-instruct 通义千问3Next80BA3BInstruct Aliyun 工具调用 131.072K 不限制 输入 0.001元/K
qwen3-next-80b-a3b-instruct 通义千问3Next80BA3BInstruct Aliyun 工具调用 131.072K 不限制 输出 0.004元/K
qwen3-coder-480b-a35b-instruct 通义千问3Coder480BA35BInstruct Aliyun AI编程;工具调用 262K 输入长度(0,32K] 输入 0.006元/K
qwen3-coder-480b-a35b-instruct 通义千问3Coder480BA35BInstruct Aliyun AI编程;工具调用 262K 输入长度(0,32K] 输出 0.024元/K
qwen3-coder-480b-a35b-instruct 通义千问3Coder480BA35BInstruct Aliyun AI编程;工具调用 262K 输入长度(32K,128K] 输入 0.009元/K
qwen3-coder-480b-a35b-instruct 通义千问3Coder480BA35BInstruct Aliyun AI编程;工具调用 262K 输入长度(32K,128K] 输出 0.036元/K
qwen3-coder-480b-a35b-instruct 通义千问3Coder480BA35BInstruct Aliyun AI编程;工具调用 262K 输入长度(128K,+∞] 输入 0.015元/K
qwen3-coder-480b-a35b-instruct 通义千问3Coder480BA35BInstruct Aliyun AI编程;工具调用 262K 输入长度(128K,+∞] 输出 0.06元/K
qwen3-235b-a22b-thinking-2507 通义千问3235BA22BThinking2507 Aliyun 工具调用;深度思考 262.144K 不限制 输入 0.002元/K
qwen3-235b-a22b-thinking-2507 通义千问3235BA22BThinking2507 Aliyun 工具调用;深度思考 262.144K 不限制 输出 0.02元/K
qwen3-235b-a22b-instruct-2507 通义千问3235bA22BInstruct2507 Aliyun 工具调用 262.144K 不限制 输入 0.002元/K
qwen3-235b-a22b-instruct-2507 通义千问3235bA22BInstruct2507 Aliyun 工具调用 262.144K 不限制 输出 0.008元/K
qwen-max-2025-01-25 通义千问2.5-Max-2025-01-25 Aliyun 工具调用 128K 不限制 输入 0.0024元/K
qwen-max-2025-01-25 通义千问2.5-Max-2025-01-25 Aliyun 工具调用 128K 不限制 输出 0.0096元/K
qwen3-next-80b-a3b-thinking 通义千问3Next80BA3BThinking Aliyun 工具调用;深度思考 131.072K 不限制 输入 0.001元/K
qwen3-next-80b-a3b-thinking 通义千问3Next80BA3BThinking Aliyun 工具调用;深度思考 131.072K 不限制 输出 0.01元/K
qwen-vl-max-2025-01-25 通义千问VL-MAX-2025-01-25 Aliyun 图像理解;工具调用 128K 不限制 输入 0.003元/K
qwen-vl-max-2025-01-25 通义千问VL-MAX-2025-01-25 Aliyun 图像理解;工具调用 128K 不限制 输出 0.009元/K
qwen2.5-vl-72b-instruct 通义千问2.5VL72BInstruct Aliyun 图像理解;工具调用 128K 不限制 输入 0.016元/K
qwen2.5-vl-72b-instruct 通义千问2.5VL72BInstruct Aliyun 图像理解;工具调用 128K 不限制 输出 0.048元/K
qwen3-max-preview 通义千问3MaxPreview Aliyun 工具调用 0 输入长度(0,32K] 输入 0.006元/K
qwen3-max-preview 通义千问3MaxPreview Aliyun 工具调用 0 输入长度(0,32K] 输出 0.024元/K
qwen3-max-preview 通义千问3MaxPreview Aliyun 工具调用 0 输入长度(32K,128K] 输入 0.01元/K
qwen3-max-preview 通义千问3MaxPreview Aliyun 工具调用 0 输入长度(32K,128K] 输出 0.04元/K
qwen3-max-preview 通义千问3MaxPreview Aliyun 工具调用 0 输入长度(128K,+∞] 输入 0.015元/K
qwen3-max-preview 通义千问3MaxPreview Aliyun 工具调用 0 输入长度(128K,+∞] 输出 0.06元/K
qwen3-32b 通义千问332B Aliyun 工具调用;深度思考 40K 不限制 思考输入 0.002元/K
qwen3-32b 通义千问332B Aliyun 工具调用;深度思考 40K 不限制 思考输出 0.02元/K
qwen3-32b 通义千问332B Aliyun 工具调用;深度思考 40K 不限制 非思考输入 0.002元/K
qwen3-32b 通义千问332B Aliyun 工具调用;深度思考 40K 不限制 非思考输出 0.008元/K
qwen3-30b-a3b 通义千问330BA3B Aliyun 工具调用;深度思考 40K 不限制 思考输入 0.00075元/K
qwen3-30b-a3b 通义千问330BA3B Aliyun 工具调用;深度思考 40K 不限制 思考输出 0.0075元/K
qwen3-30b-a3b 通义千问330BA3B Aliyun 工具调用;深度思考 40K 不限制 非思考输入 0.00075元/K
qwen3-30b-a3b 通义千问330BA3B Aliyun 工具调用;深度思考 40K 不限制 非思考输出 0.003元/K
qwen3-235b-a22b 通义千问3235BA22B Aliyun 工具调用 128K 不限制 思考输入 0.002元/K
qwen3-235b-a22b 通义千问3235BA22B Aliyun 工具调用 128K 不限制 思考输出 0.02元/K
qwen3-235b-a22b 通义千问3235BA22B Aliyun 工具调用 128K 不限制 非思考输入 0.002元/K
qwen3-235b-a22b 通义千问3235BA22B Aliyun 工具调用 128K 不限制 非思考输出 0.008元/K
qwen2.5-vl-7b-instruct 通义千问2.5VL7BInstruct Aliyun 图像理解;工具调用 128K 不限制 输入 0.002元/K
qwen2.5-vl-7b-instruct 通义千问2.5VL7BInstruct Aliyun 图像理解;工具调用 128K 不限制 输出 0.005元/K
MiniMax-M1 MiniMaxM1 Minimax 工具调用;深度思考 1000K 不限制 输入 0.004元/K
MiniMax-M1 MiniMaxM1 Minimax 工具调用;深度思考 1000K 不限制 输出 0.016元/K
minimax/minimax-m2 Minimax/Minimax-M2 Minimax AI编程 200K 不限制 输入 0.0021元/K
minimax/minimax-m2 Minimax/Minimax-M2 Minimax AI编程 200K 不限制 输出 0.0084元/K
glm-4.5 GLM4.5 Zhipu-GLM AI编程;工具调用;深度思考 131K 不限制 输入 0.004元/K
glm-4.5 GLM4.5 Zhipu-GLM AI编程;工具调用;深度思考 131K 不限制 输出 0.016元/K
glm-4.5-air GLM4.5Air Zhipu-GLM 工具调用;深度思考 131K 不限制 输入 0.002元/K
glm-4.5-air GLM4.5Air Zhipu-GLM 工具调用;深度思考 131K 不限制 输出 0.008元/K
kimi-k2 KimiK2 Moonshot-Kimi 工具调用 128K 不限制 输入 0.004元/K
kimi-k2 KimiK2 Moonshot-Kimi 工具调用 128K 不限制 输出 0.016元/K
moonshotai/kimi-k2-thinking KimiK2Thinking Moonshot-Kimi 工具调用;AI编程;结构化输出 256K 不限制 输入 0.004元/K
moonshotai/kimi-k2-thinking KimiK2Thinking Moonshot-Kimi 工具调用;AI编程;结构化输出 256K 不限制 输出 0.016元/K
moonshotai/kimi-k2-0905 KimiK20905 Moonshot-Kimi 工具调用;AI编程 256K 不限制 输入 0.004元/K
moonshotai/kimi-k2-0905 KimiK20905 Moonshot-Kimi 工具调用;AI编程 256K 不限制 输出 0.016元/K
deepseek-v3 DeepSeek-V3 DeepSeek 8.192K 不限制 输入 0.002元/K
deepseek-v3 DeepSeek-V3 DeepSeek 8.192K 不限制 输出 0.008元/K
deepseek-v3 DeepSeek-V3 DeepSeek 8.192K 不限制 批量输入 0.001元/K
deepseek-v3 DeepSeek-V3 DeepSeek 8.192K 不限制 批量输出 0.004元/K
z-ai/glm-4.6 Z-Ai/GLM4.6 Zhipu-GLM 工具调用;AI编程 200K 不限制 输入 0.0072元/K
z-ai/glm-4.6 Z-Ai/GLM4.6 Zhipu-GLM 工具调用;AI编程 200K 不限制 输出 0.0126元/K
meituan/longcat-flash-chat Meituan/Longcat-Flash-Chat Meituan 131.072K 不限制 输入 --
meituan/longcat-flash-chat Meituan/Longcat-Flash-Chat Meituan 131.072K 不限制 输出 --
tts TTS 七牛云 0 不限制 文本转语音 0.06元/100字符
asr ASR 七牛云 0 不限制 自动语音识别 0.08元/分钟
模型ID 模型名称 发行商 功能特性 上下文长度 条件 计费项 价格
deepseek/deepseek-v3.1-terminus DeepSeek/DeepSeek-V3.1-Terminus DeepSeek 工具调用;AI编程 128K 不限制 输入 0.004元/K
deepseek/deepseek-v3.1-terminus DeepSeek/DeepSeek-V3.1-Terminus DeepSeek 工具调用;AI编程 128K 不限制 输出 0.012元/K
qwen3-max 通义千问3Max Aliyun 工具调用 256K 输入长度(0,32K] 输入 0.006元/K
qwen3-max 通义千问3Max Aliyun 工具调用 256K 输入长度(0,32K] 输出 0.024元/K
qwen3-max 通义千问3Max Aliyun 工具调用 256K 输入长度(32K,128K] 输入 0.01元/K
qwen3-max 通义千问3Max Aliyun 工具调用 256K 输入长度(32K,128K] 输出 0.04元/K
qwen3-max 通义千问3Max Aliyun 工具调用 256K 输入长度(128K,+∞] 输入 0.015元/K
qwen3-max 通义千问3Max Aliyun 工具调用 256K 输入长度(128K,+∞] 输出 0.06元/K
gpt-oss-20b gpt-oss-20b OpenAI 工具调用;深度思考 128K 不限制 输入 0.00072元/K
gpt-oss-20b gpt-oss-20b OpenAI 工具调用;深度思考 128K 不限制 输出 0.0036元/K
gpt-oss-120b gpt-oss-120b OpenAI 工具调用;深度思考 128K 不限制 输入 0.00108元/K
gpt-oss-120b gpt-oss-120b OpenAI 工具调用;深度思考 128K 不限制 输出 0.0054元/K
deepseek/deepseek-v3.2-exp-thinking DeepSeek/DeepSeek-V3.2-Exp-Thinking DeepSeek 深度思考 128K 不限制 输入 0.002元/K
deepseek/deepseek-v3.2-exp-thinking DeepSeek/DeepSeek-V3.2-Exp-Thinking DeepSeek 深度思考 128K 不限制 输出 0.003元/K
deepseek/deepseek-v3.2-exp DeepSeek/DeepSeek-V3.2-Exp DeepSeek 工具调用 128K 不限制 输入 0.002元/K
deepseek/deepseek-v3.2-exp DeepSeek/DeepSeek-V3.2-Exp DeepSeek 工具调用 128K 不限制 输出 0.003元/K
deepseek/deepseek-v3.1-terminus-thinking DeepSeek/DeepSeek-V3.1-Terminus-Thinking DeepSeek 深度思考 128K 不限制 输入 0.004元/K
deepseek/deepseek-v3.1-terminus-thinking DeepSeek/DeepSeek-V3.1-Terminus-Thinking DeepSeek 深度思考 128K 不限制 输出 0.012元/K
deepseek-v3.1 DeepSeek-V3.1 DeepSeek AI编程;工具调用;深度思考 128K 不限制 输入 0.004元/K
deepseek-v3.1 DeepSeek-V3.1 DeepSeek AI编程;工具调用;深度思考 128K 不限制 输出 0.012元/K
deepseek-v3.1 DeepSeek-V3.1 DeepSeek AI编程;工具调用;深度思考 128K 不限制 批量输入 0.002元/K
deepseek-v3.1 DeepSeek-V3.1 DeepSeek AI编程;工具调用;深度思考 128K 不限制 批量输出 0.006元/K
deepseek-r1-0528 DeepSeek-R1-0528 DeepSeek 工具调用;深度思考 80K 不限制 输入 0.004元/K
deepseek-r1-0528 DeepSeek-R1-0528 DeepSeek 工具调用;深度思考 80K 不限制 输出 0.016元/K
deepseek-r1-0528 DeepSeek-R1-0528 DeepSeek 工具调用;深度思考 80K 不限制 批量输入 0.002元/K
deepseek-r1-0528 DeepSeek-R1-0528 DeepSeek 工具调用;深度思考 80K 不限制 批量输出 0.008元/K
deepseek-v3-0324 DeepSeek-V3-0324 DeepSeek 工具调用 128K 不限制 输入 0.002元/K
deepseek-v3-0324 DeepSeek-V3-0324 DeepSeek 工具调用 128K 不限制 输出 0.008元/K
deepseek-v3-0324 DeepSeek-V3-0324 DeepSeek 工具调用 128K 不限制 批量输入 0.001元/K
deepseek-v3-0324 DeepSeek-V3-0324 DeepSeek 工具调用 128K 不限制 批量输出 0.004元/K
deepseek-r1 DeepSeek-R1 DeepSeek 工具调用;深度思考 80K 不限制 输入 0.004元/K
deepseek-r1 DeepSeek-R1 DeepSeek 工具调用;深度思考 80K 不限制 输出 0.016元/K
deepseek-r1 DeepSeek-R1 DeepSeek 工具调用;深度思考 80K 不限制 批量输入 0.002元/K
deepseek-r1 DeepSeek-R1 DeepSeek 工具调用;深度思考 80K 不限制 批量输出 0.008元/K
doubao-seed-1.6-thinking Doubao-Seed1.6Thinking ByteDance 图像理解;工具调用;深度思考 256K 输入长度(0,32K] 输入 0.0008元/K
doubao-seed-1.6-thinking Doubao-Seed1.6Thinking ByteDance 图像理解;工具调用;深度思考 256K 输入长度(0,32K] 输出 0.008元/K
doubao-seed-1.6-thinking Doubao-Seed1.6Thinking ByteDance 图像理解;工具调用;深度思考 256K 输入长度(32K,128K] 输入 0.0012元/K
doubao-seed-1.6-thinking Doubao-Seed1.6Thinking ByteDance 图像理解;工具调用;深度思考 256K 输入长度(32K,128K] 输出 0.016元/K
doubao-seed-1.6-thinking Doubao-Seed1.6Thinking ByteDance 图像理解;工具调用;深度思考 256K 输入长度(128K,+∞] 输入 0.0024元/K
doubao-seed-1.6-thinking Doubao-Seed1.6Thinking ByteDance 图像理解;工具调用;深度思考 256K 输入长度(128K,+∞] 输出 0.024元/K
doubao-seed-1.6-flash Doubao-Seed1.6Flash ByteDance 图像理解;工具调用;深度思考 256K 输入长度(0,32K] 输入 0.00015元/K
doubao-seed-1.6-flash Doubao-Seed1.6Flash ByteDance 图像理解;工具调用;深度思考 256K 输入长度(0,32K] 输出 0.0015元/K
doubao-seed-1.6-flash Doubao-Seed1.6Flash ByteDance 图像理解;工具调用;深度思考 256K 输入长度(32K,128K] 输入 0.0003元/K
doubao-seed-1.6-flash Doubao-Seed1.6Flash ByteDance 图像理解;工具调用;深度思考 256K 输入长度(32K,128K] 输出 0.003元/K
doubao-seed-1.6-flash Doubao-Seed1.6Flash ByteDance 图像理解;工具调用;深度思考 256K 输入长度(128K,+∞] 输入 0.0003元/K
doubao-seed-1.6-flash Doubao-Seed1.6Flash ByteDance 图像理解;工具调用;深度思考 256K 输入长度(128K,+∞] 输出 0.003元/K
doubao-1.5-pro-32k Doubao1.5Pro32k ByteDance 工具调用 128K 不限制 输入 0.0008元/K
doubao-1.5-pro-32k Doubao1.5Pro32k ByteDance 工具调用 128K 不限制 输出 0.002元/K
doubao-1.5-thinking-pro Doubao1.5ThinkingPro ByteDance 工具调用;深度思考 128K 不限制 输入 0.004元/K
doubao-1.5-thinking-pro Doubao1.5ThinkingPro ByteDance 工具调用;深度思考 128K 不限制 输出 0.016元/K
doubao-1.5-vision-pro Doubao1.5VisionPro ByteDance 图像理解 128K 不限制 输入 0.003元/K
doubao-1.5-vision-pro Doubao1.5VisionPro ByteDance 图像理解 128K 不限制 输出 0.009元/K
doubao-seed-1.6 Doubao-Seed1.6 ByteDance 图像理解;工具调用;深度思考 256K 输入长度(0,32K]且输出长度(0,200] 输入 0.0008元/K
doubao-seed-1.6 Doubao-Seed1.6 ByteDance 图像理解;工具调用;深度思考 256K 输入长度(0,32K]且输出长度(0,200] 输出 0.002元/K
doubao-seed-1.6 Doubao-Seed1.6 ByteDance 图像理解;工具调用;深度思考 256K 输入长度(0,32K]且输出长度(200,+∞] 输入 0.0008元/K
doubao-seed-1.6 Doubao-Seed1.6 ByteDance 图像理解;工具调用;深度思考 256K 输入长度(0,32K]且输出长度(200,+∞] 输出 0.008元/K
doubao-seed-1.6 Doubao-Seed1.6 ByteDance 图像理解;工具调用;深度思考 256K 输入长度(32K,128K] 输入 0.0012元/K
doubao-seed-1.6 Doubao-Seed1.6 ByteDance 图像理解;工具调用;深度思考 256K 输入长度(32K,128K] 输出 0.016元/K
doubao-seed-1.6 Doubao-Seed1.6 ByteDance 图像理解;工具调用;深度思考 256K 输入长度(128K,+∞] 输入 0.0024元/K
doubao-seed-1.6 Doubao-Seed1.6 ByteDance 图像理解;工具调用;深度思考 256K 输入长度(128K,+∞] 输出 0.024元/K
qwen-turbo 通义千问-Turbo Aliyun 工具调用;深度思考 1000K 不限制 思考输入 0.0003元/K
qwen-turbo 通义千问-Turbo Aliyun 工具调用;深度思考 1000K 不限制 思考输出 0.003元/K
qwen-turbo 通义千问-Turbo Aliyun 工具调用;深度思考 1000K 不限制 非思考输入 0.0003元/K
qwen-turbo 通义千问-Turbo Aliyun 工具调用;深度思考 1000K 不限制 非思考输出 0.0006元/K
qwen3-next-80b-a3b-instruct 通义千问3Next80BA3BInstruct Aliyun 工具调用 131.072K 不限制 输入 0.001元/K
qwen3-next-80b-a3b-instruct 通义千问3Next80BA3BInstruct Aliyun 工具调用 131.072K 不限制 输出 0.004元/K
qwen3-coder-480b-a35b-instruct 通义千问3Coder480BA35BInstruct Aliyun AI编程;工具调用 262K 输入长度(0,32K] 输入 0.006元/K
qwen3-coder-480b-a35b-instruct 通义千问3Coder480BA35BInstruct Aliyun AI编程;工具调用 262K 输入长度(0,32K] 输出 0.024元/K
qwen3-coder-480b-a35b-instruct 通义千问3Coder480BA35BInstruct Aliyun AI编程;工具调用 262K 输入长度(32K,128K] 输入 0.009元/K
qwen3-coder-480b-a35b-instruct 通义千问3Coder480BA35BInstruct Aliyun AI编程;工具调用 262K 输入长度(32K,128K] 输出 0.036元/K
qwen3-coder-480b-a35b-instruct 通义千问3Coder480BA35BInstruct Aliyun AI编程;工具调用 262K 输入长度(128K,+∞] 输入 0.015元/K
qwen3-coder-480b-a35b-instruct 通义千问3Coder480BA35BInstruct Aliyun AI编程;工具调用 262K 输入长度(128K,+∞] 输出 0.06元/K
qwen3-235b-a22b-thinking-2507 通义千问3235BA22BThinking2507 Aliyun 工具调用;深度思考 262.144K 不限制 输入 0.002元/K
qwen3-235b-a22b-thinking-2507 通义千问3235BA22BThinking2507 Aliyun 工具调用;深度思考 262.144K 不限制 输出 0.02元/K
qwen3-235b-a22b-instruct-2507 通义千问3235bA22BInstruct2507 Aliyun 工具调用 262.144K 不限制 输入 0.002元/K
qwen3-235b-a22b-instruct-2507 通义千问3235bA22BInstruct2507 Aliyun 工具调用 262.144K 不限制 输出 0.008元/K
qwen-max-2025-01-25 通义千问2.5-Max-2025-01-25 Aliyun 工具调用 128K 不限制 输入 0.0024元/K
qwen-max-2025-01-25 通义千问2.5-Max-2025-01-25 Aliyun 工具调用 128K 不限制 输出 0.0096元/K
qwen3-next-80b-a3b-thinking 通义千问3Next80BA3BThinking Aliyun 工具调用;深度思考 131.072K 不限制 输入 0.001元/K
qwen3-next-80b-a3b-thinking 通义千问3Next80BA3BThinking Aliyun 工具调用;深度思考 131.072K 不限制 输出 0.01元/K
qwen-vl-max-2025-01-25 通义千问VL-MAX-2025-01-25 Aliyun 图像理解;工具调用 128K 不限制 输入 0.003元/K
qwen-vl-max-2025-01-25 通义千问VL-MAX-2025-01-25 Aliyun 图像理解;工具调用 128K 不限制 输出 0.009元/K
qwen2.5-vl-72b-instruct 通义千问2.5VL72BInstruct Aliyun 图像理解;工具调用 128K 不限制 输入 0.016元/K
qwen2.5-vl-72b-instruct 通义千问2.5VL72BInstruct Aliyun 图像理解;工具调用 128K 不限制 输出 0.048元/K
qwen3-max-preview 通义千问3MaxPreview Aliyun 工具调用 0 输入长度(0,32K] 输入 0.006元/K
qwen3-max-preview 通义千问3MaxPreview Aliyun 工具调用 0 输入长度(0,32K] 输出 0.024元/K
qwen3-max-preview 通义千问3MaxPreview Aliyun 工具调用 0 输入长度(32K,128K] 输入 0.01元/K
qwen3-max-preview 通义千问3MaxPreview Aliyun 工具调用 0 输入长度(32K,128K] 输出 0.04元/K
qwen3-max-preview 通义千问3MaxPreview Aliyun 工具调用 0 输入长度(128K,+∞] 输入 0.015元/K
qwen3-max-preview 通义千问3MaxPreview Aliyun 工具调用 0 输入长度(128K,+∞] 输出 0.06元/K
qwen3-32b 通义千问332B Aliyun 工具调用;深度思考 40K 不限制 思考输入 0.002元/K
qwen3-32b 通义千问332B Aliyun 工具调用;深度思考 40K 不限制 思考输出 0.02元/K
qwen3-32b 通义千问332B Aliyun 工具调用;深度思考 40K 不限制 非思考输入 0.002元/K
qwen3-32b 通义千问332B Aliyun 工具调用;深度思考 40K 不限制 非思考输出 0.008元/K
qwen3-30b-a3b 通义千问330BA3B Aliyun 工具调用;深度思考 40K 不限制 思考输入 0.00075元/K
qwen3-30b-a3b 通义千问330BA3B Aliyun 工具调用;深度思考 40K 不限制 思考输出 0.0075元/K
qwen3-30b-a3b 通义千问330BA3B Aliyun 工具调用;深度思考 40K 不限制 非思考输入 0.00075元/K
qwen3-30b-a3b 通义千问330BA3B Aliyun 工具调用;深度思考 40K 不限制 非思考输出 0.003元/K
qwen3-235b-a22b 通义千问3235BA22B Aliyun 工具调用 128K 不限制 思考输入 0.002元/K
qwen3-235b-a22b 通义千问3235BA22B Aliyun 工具调用 128K 不限制 思考输出 0.02元/K
qwen3-235b-a22b 通义千问3235BA22B Aliyun 工具调用 128K 不限制 非思考输入 0.002元/K
qwen3-235b-a22b 通义千问3235BA22B Aliyun 工具调用 128K 不限制 非思考输出 0.008元/K
qwen2.5-vl-7b-instruct 通义千问2.5VL7BInstruct Aliyun 图像理解;工具调用 128K 不限制 输入 0.002元/K
qwen2.5-vl-7b-instruct 通义千问2.5VL7BInstruct Aliyun 图像理解;工具调用 128K 不限制 输出 0.005元/K
MiniMax-M1 MiniMaxM1 Minimax 工具调用;深度思考 1000K 不限制 输入 0.004元/K
MiniMax-M1 MiniMaxM1 Minimax 工具调用;深度思考 1000K 不限制 输出 0.016元/K
minimax/minimax-m2 Minimax/Minimax-M2 Minimax AI编程 200K 不限制 输入 0.0021元/K
minimax/minimax-m2 Minimax/Minimax-M2 Minimax AI编程 200K 不限制 输出 0.0084元/K
glm-4.5 GLM4.5 Zhipu-GLM AI编程;工具调用;深度思考 131K 不限制 输入 0.004元/K
glm-4.5 GLM4.5 Zhipu-GLM AI编程;工具调用;深度思考 131K 不限制 输出 0.016元/K
glm-4.5-air GLM4.5Air Zhipu-GLM 工具调用;深度思考 131K 不限制 输入 0.002元/K
glm-4.5-air GLM4.5Air Zhipu-GLM 工具调用;深度思考 131K 不限制 输出 0.008元/K
kimi-k2 KimiK2 Moonshot-Kimi 工具调用 128K 不限制 输入 0.004元/K
kimi-k2 KimiK2 Moonshot-Kimi 工具调用 128K 不限制 输出 0.016元/K
moonshotai/kimi-k2-thinking KimiK2Thinking Moonshot-Kimi 工具调用;AI编程;结构化输出 256K 不限制 输入 0.004元/K
moonshotai/kimi-k2-thinking KimiK2Thinking Moonshot-Kimi 工具调用;AI编程;结构化输出 256K 不限制 输出 0.016元/K
moonshotai/kimi-k2-0905 KimiK20905 Moonshot-Kimi 工具调用;AI编程 256K 不限制 输入 0.004元/K
moonshotai/kimi-k2-0905 KimiK20905 Moonshot-Kimi 工具调用;AI编程 256K 不限制 输出 0.016元/K
deepseek-v3 DeepSeek-V3 DeepSeek 8.192K 不限制 输入 0.002元/K
deepseek-v3 DeepSeek-V3 DeepSeek 8.192K 不限制 输出 0.008元/K
deepseek-v3 DeepSeek-V3 DeepSeek 8.192K 不限制 批量输入 0.001元/K
deepseek-v3 DeepSeek-V3 DeepSeek 8.192K 不限制 批量输出 0.004元/K
z-ai/glm-4.6 Z-Ai/GLM4.6 Zhipu-GLM 工具调用;AI编程 200K 不限制 输入 0.0072元/K
z-ai/glm-4.6 Z-Ai/GLM4.6 Zhipu-GLM 工具调用;AI编程 200K 不限制 输出 0.0126元/K
meituan/longcat-flash-chat Meituan/Longcat-Flash-Chat Meituan 131.072K 不限制 输入 --
meituan/longcat-flash-chat Meituan/Longcat-Flash-Chat Meituan 131.072K 不限制 输出 --
tts TTS 七牛云 0 不限制 文本转语音 0.06元/100字符
asr ASR 七牛云 0 不限制 自动语音识别 0.08元/分钟
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment