模型价格表

[M]claude-3-7-sonnet
文字 · Anthropic chat
300 / K tokens (输入)
900 / K tokens (输出)
余额 或 次数卡
上下文长度 200000
支付方式 余额 或 次数卡
余额价格
300 / K tokens (输入)
900 / K tokens (输出)
次数卡消耗
4.0 次/次调用
模型描述
[M]claude-3-7-sonnet-thinking
文字 · Anthropic chat
300 / K tokens (输入)
900 / K tokens (输出)
余额 或 次数卡
上下文长度 200000
支付方式 余额 或 次数卡
余额价格
300 / K tokens (输入)
900 / K tokens (输出)
次数卡消耗
4.0 次/次调用
模型描述
[M]claude-opus-4
文字 · Anthropic chat
750 / K tokens (输入)
2250 / K tokens (输出)
余额 或 次数卡
上下文长度 200000
支付方式 余额 或 次数卡
余额价格
750 / K tokens (输入)
2250 / K tokens (输出)
次数卡消耗
15.0 次/次调用
模型描述
[M]claude-opus-4-thinking
文字 · Anthropic chat
750 / K tokens (输入)
2250 / K tokens (输出)
余额 或 次数卡
上下文长度 200000
支付方式 余额 或 次数卡
余额价格
750 / K tokens (输入)
2250 / K tokens (输出)
次数卡消耗
15.0 次/次调用
模型描述
[M]claude-opus-4.1
文字 · Anthropic chat
750 / K tokens (输入)
2250 / K tokens (输出)
余额 或 次数卡
上下文长度 200000
支付方式 余额 或 次数卡
余额价格
750 / K tokens (输入)
2250 / K tokens (输出)
次数卡消耗
15.0 次/次调用
模型描述
[M]claude-opus-4.1-thinking
文字 · Anthropic chat
750 / K tokens (输入)
2250 / K tokens (输出)
余额 或 次数卡
上下文长度 200000
支付方式 余额 或 次数卡
余额价格
750 / K tokens (输入)
2250 / K tokens (输出)
次数卡消耗
15.0 次/次调用
模型描述
[M]claude-sonnet-4
文字 · Anthropic chat
300 / K tokens (输入)
900 / K tokens (输出)
余额 或 次数卡
上下文长度 200000
支付方式 余额 或 次数卡
余额价格
300 / K tokens (输入)
900 / K tokens (输出)
次数卡消耗
4.0 次/次调用
模型描述
[M]claude-sonnet-4-thinking
文字 · Anthropic chat
300 / K tokens (输入)
900 / K tokens (输出)
余额 或 次数卡
上下文长度 200000
支付方式 余额 或 次数卡
余额价格
300 / K tokens (输入)
900 / K tokens (输出)
次数卡消耗
4.0 次/次调用
模型描述
[New]Kimi-K2
文字 · Anthropic
10.50 / K tokens (输入)
31.50 / K tokens (输出)
余额 或 次数卡
上下文长度 200000
支付方式 余额 或 次数卡
余额价格
10.50 / K tokens (输入)
31.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述 暂无描述
[New]claude-opus-4
文字 · Anthropic
60 / K tokens (输入)
180 / K tokens (输出)
余额 或 次数卡
上下文长度 1000000
支付方式 余额 或 次数卡
余额价格
60 / K tokens (输入)
180 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述 暂无描述
[New]claude-opus-4-thinking
文字 · Anthropic
75 / K tokens (输入)
225 / K tokens (输出)
余额 或 次数卡
上下文长度 1000000
支付方式 余额 或 次数卡
余额价格
75 / K tokens (输入)
225 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述 暂无描述
[New]claude-opus-4.1
文字 · Anthropic
60 / K tokens (输入)
180 / K tokens (输出)
余额 或 次数卡
上下文长度 1000000
支付方式 余额 或 次数卡
余额价格
60 / K tokens (输入)
180 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述 暂无描述
[New]claude-opus-4.1-thinking
文字 · Anthropic
75 / K tokens (输入)
225 / K tokens (输出)
余额 或 次数卡
上下文长度 1000000
支付方式 余额 或 次数卡
余额价格
75 / K tokens (输入)
225 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述 暂无描述
[New]claude-sonnet-4
文字 · Anthropic
60 / K tokens (输入)
180 / K tokens (输出)
余额 或 次数卡
上下文长度 1000000
支付方式 余额 或 次数卡
余额价格
60 / K tokens (输入)
180 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述 暂无描述
[New]claude-sonnet-4-thinking
文字 · Anthropic
75 / K tokens (输入)
225 / K tokens (输出)
余额 或 次数卡
上下文长度 1000000
支付方式 余额 或 次数卡
余额价格
75 / K tokens (输入)
225 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述 暂无描述
claude-3-5-haiku
文字 · Anthropic work
22.50 / K tokens (输入)
67.50 / K tokens (输出)
余额 或 次数卡
上下文长度 200000
支付方式 余额 或 次数卡
余额价格
22.50 / K tokens (输入)
67.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
claude-3-5-sonnet
文字 · Anthropic work
60 / K tokens (输入)
180 / K tokens (输出)
余额 或 次数卡
上下文长度 200000
支付方式 余额 或 次数卡
余额价格
60 / K tokens (输入)
180 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
claude-3-5-sonnet-20240620
文字 · Anthropic work
60 / K tokens (输入)
180 / K tokens (输出)
余额 或 次数卡
上下文长度 200000
支付方式 余额 或 次数卡
余额价格
60 / K tokens (输入)
180 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
claude-3-7-sonnet
文字 · Anthropic work
60 / K tokens (输入)
180 / K tokens (输出)
余额 或 次数卡
上下文长度 200000
支付方式 余额 或 次数卡
余额价格
60 / K tokens (输入)
180 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
claude-3-7-sonnet-thinking
文字 · Anthropic work
75 / K tokens (输入)
225 / K tokens (输出)
余额 或 次数卡
上下文长度 200000
支付方式 余额 或 次数卡
余额价格
75 / K tokens (输入)
225 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
claude-opus-4
文字 · Anthropic work
60 / K tokens (输入)
180 / K tokens (输出)
余额 或 次数卡
上下文长度 200000
支付方式 余额 或 次数卡
余额价格
60 / K tokens (输入)
180 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
claude-opus-4-thinking
文字 · Anthropic work
75 / K tokens (输入)
225 / K tokens (输出)
余额 或 次数卡
上下文长度 200000
支付方式 余额 或 次数卡
余额价格
75 / K tokens (输入)
225 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
claude-sonnet-4
文字 · Anthropic work
60 / K tokens (输入)
180 / K tokens (输出)
余额 或 次数卡
上下文长度 200000
支付方式 余额 或 次数卡
余额价格
60 / K tokens (输入)
180 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
claude-sonnet-4-thinking
文字 · Anthropic work
75 / K tokens (输入)
225 / K tokens (输出)
余额 或 次数卡
上下文长度 200000
支付方式 余额 或 次数卡
余额价格
75 / K tokens (输入)
225 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
doubao-seed-1-6
文字 · ByteDance work
10.50 / K tokens (输入)
31.50 / K tokens (输出)
余额 或 次数卡
上下文长度 262144
支付方式 余额 或 次数卡
余额价格
10.50 / K tokens (输入)
31.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
doubao-seed-1-6-flash-250615
文字 · ByteDance work
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度 262144
支付方式 余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
doubao-seed-1-6-flash-250615-nothinking
文字 · ByteDance work
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度 262144
支付方式 余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
doubao-seed-1-6-flash-250715
文字 · ByteDance work
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度 262144
支付方式 余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
doubao-seed-1-6-flash-250715-nothinking
文字 · ByteDance work
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度 262144
支付方式 余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
doubao-seed-1-6-nothinking
文字 · ByteDance work
10.50 / K tokens (输入)
31.50 / K tokens (输出)
余额 或 次数卡
上下文长度 262144
支付方式 余额 或 次数卡
余额价格
10.50 / K tokens (输入)
31.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
doubao-seed-1-6-vision
文字 · ByteDance work
12 / K tokens (输入)
36 / K tokens (输出)
余额 或 次数卡
上下文长度 262144
支付方式 余额 或 次数卡
余额价格
12 / K tokens (输入)
36 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
doubao-seed-1-6-vision-nothinking
文字 · ByteDance work
12 / K tokens (输入)
36 / K tokens (输出)
余额 或 次数卡
上下文长度 262144
支付方式 余额 或 次数卡
余额价格
12 / K tokens (输入)
36 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
GLM-4-9b
文字 · ChatGLM
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度 128000
支付方式 余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
GLM-4.5
文字 · ChatGLM
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度 131072
支付方式 余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
GLM-4.5-Air
文字 · ChatGLM
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度 131072
支付方式 余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
GLM-4.5-Air-nothinking
文字 · ChatGLM
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度 131072
支付方式 余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
GLM-4.5-nothinking
文字 · ChatGLM
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度 131072
支付方式 余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
[F]GLM-4.5
文字 · ChatGLM
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度 131072
支付方式 余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
[F]GLM-4.5-Air
文字 · ChatGLM
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度 131072
支付方式 余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
DeepSeek-Prover-V2-671B
文字 · DeepSeek work chat
4.50 / K tokens (输入)
13.50 / K tokens (输出)
余额 或 次数卡
上下文长度 160000
支付方式 余额 或 次数卡
余额价格
4.50 / K tokens (输入)
13.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述 DeepSeek-Prover-V2 是一个专门为 Lean 4 形式定理证明设计的开源大语言模型。该模型基于由公司的 DeepSeek-V3 基础模型驱动的递归定理证明流程构建。
DeepSeek-R1
文字 · DeepSeek work chat
4.50 / K tokens (输入)
13.50 / K tokens (输出)
余额 或 次数卡
上下文长度 163840
支付方式 余额 或 次数卡
余额价格
4.50 / K tokens (输入)
13.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述 先进的大型推理模型,以较低成本提供问题解决、数学和编程能力;会解释其思维过程。使用最新的2025年5月28日快照。
DeepSeek-V3
文字 · DeepSeek work chat
4.50 / K tokens (输入)
13.50 / K tokens (输出)
余额 或 次数卡
上下文长度 131072
支付方式 余额 或 次数卡
余额价格
4.50 / K tokens (输入)
13.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述 DeepSeek-V3是一个开源的专家混合(MoE)语言模型;能够在竞争性基准测试中表现出色,并具有成本效益的训练和推理能力。
DeepSeek-V3.1
文字 · DeepSeek work chat
4.50 / K tokens (输入)
13.50 / K tokens (输出)
余额 或 次数卡
上下文长度 163840
支付方式 余额 或 次数卡
余额价格
4.50 / K tokens (输入)
13.50 / K tokens (输出)
次数卡消耗
0.5 次/次调用
模型描述 DeepSeek-V3.1是在DeepSeek-V3-Base的基础上进行后期训练的,该基础模型是通过两阶段长上下文扩展方法在原始V3基础检查点上构建的,遵循原始DeepSeek-V3报告中概述的方法。它支持128k词元的上下文窗口。
DeepSeek-V3.1-nothinking
文字 · DeepSeek work chat
4.50 / K tokens (输入)
13.50 / K tokens (输出)
余额 或 次数卡
上下文长度 163840
支付方式 余额 或 次数卡
余额价格
4.50 / K tokens (输入)
13.50 / K tokens (输出)
次数卡消耗
0.5 次/次调用
模型描述 DeepSeek-V3.1是在DeepSeek-V3-Base的基础上进行后期训练的,该基础模型是通过两阶段长上下文扩展方法在原始V3基础检查点上构建的,遵循原始DeepSeek-V3报告中概述的方法。
DeepSeek-VL2
文字 · DeepSeek
4.50 / K tokens (输入)
13.50 / K tokens (输出)
余额 或 次数卡
上下文长度 128000
支付方式 余额 或 次数卡
余额价格
4.50 / K tokens (输入)
13.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述 DeepSeek-VL2 是一个基于 DeepSeekMoE-27B 开发的混合专家(MoE)视觉语言模型,采用稀疏激活的 MoE 架构,在仅激活 4.5B 参数的情况下实现了卓越性能。该模型在视觉问答、光学字符识别、文档/表格/图表理解和视觉定位等多个任务中表现优异,与现有的开源密集模型和基于 MoE 的模型相比,在使用相同或更少的激活参数的情况下,实现了具有竞争力的或最先进的性能表现。
[F]DeepSeek-R1
文字 · DeepSeek work chat
4.50 / K tokens (输入)
13.50 / K tokens (输出)
余额 或 次数卡
上下文长度 160000
支付方式 余额 或 次数卡
余额价格
4.50 / K tokens (输入)
13.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述 先进的大型推理模型,以较低成本提供问题解决、数学和编程能力;会解释其思维过程。使用最新的2025年5月28日快照。
[F]DeepSeek-R1-0528
文字 · DeepSeek work chat
4.50 / K tokens (输入)
13.50 / K tokens (输出)
余额 或 次数卡
上下文长度 160000
支付方式 余额 或 次数卡
余额价格
4.50 / K tokens (输入)
13.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述 先进的大型推理模型,以较低成本提供问题解决、数学和编程能力;会解释其思维过程。使用最新的2025年5月28日快照。
[F]DeepSeek-R1-Fast
文字 · DeepSeek work chat
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度 160000
支付方式 余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述 先进的大型推理模型,以较低成本提供问题解决、数学和编程能力;会解释其思维过程。使用最新的2025年5月28日快照。
[F]DeepSeek-V3
文字 · DeepSeek work chat
4.50 / K tokens (输入)
13.50 / K tokens (输出)
余额 或 次数卡
上下文长度 128000
支付方式 余额 或 次数卡
余额价格
4.50 / K tokens (输入)
13.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述 DeepSeek-V3是一个开源的专家混合(MoE)语言模型;能够在竞争性基准测试中表现出色,并具有成本效益的训练和推理能力。
[F]DeepSeek-V3-0324
文字 · DeepSeek work chat
4.50 / K tokens (输入)
13.50 / K tokens (输出)
余额 或 次数卡
上下文长度 131072
支付方式 余额 或 次数卡
余额价格
4.50 / K tokens (输入)
13.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述 DeepSeek-V3是一个开源的专家混合(MoE)语言模型;能够在竞争性基准测试中表现出色,并具有成本效益的训练和推理能力。
[F]DeepSeek-V3.1
文字 · DeepSeek work chat
4.50 / K tokens (输入)
13.50 / K tokens (输出)
余额 或 次数卡
上下文长度 163840
支付方式 余额 或 次数卡
余额价格
4.50 / K tokens (输入)
13.50 / K tokens (输出)
次数卡消耗
0.5 次/次调用
模型描述 DeepSeek-V3.1是在DeepSeek-V3-Base的基础上进行后期训练的,该基础模型是通过两阶段长上下文扩展方法在原始V3基础检查点上构建的,遵循原始DeepSeek-V3报告中概述的方法。
[F]DeepSeek-V3.1-nothinking
文字 · DeepSeek work chat
4.50 / K tokens (输入)
13.50 / K tokens (输出)
余额 或 次数卡
上下文长度 163840
支付方式 余额 或 次数卡
余额价格
4.50 / K tokens (输入)
13.50 / K tokens (输出)
次数卡消耗
0.5 次/次调用
模型描述 DeepSeek-V3.1是在DeepSeek-V3-Base的基础上进行后期训练的,该基础模型是通过两阶段长上下文扩展方法在原始V3基础检查点上构建的,遵循原始DeepSeek-V3报告中概述的方法。
[F]DeepSeek-V3.1-thinking
文字 · DeepSeek work chat
4.50 / K tokens (输入)
13.50 / K tokens (输出)
余额 或 次数卡
上下文长度 163840
支付方式 余额 或 次数卡
余额价格
4.50 / K tokens (输入)
13.50 / K tokens (输出)
次数卡消耗
0.5 次/次调用
模型描述 DeepSeek-V3.1是在DeepSeek-V3-Base的基础上进行后期训练的,该基础模型是通过两阶段长上下文扩展方法在原始V3基础检查点上构建的,遵循原始DeepSeek-V3报告中概述的方法。
[G]gemini-2.5-pro
文字 · Google work chat
37.50 / K tokens (输入)
112.50 / K tokens (输出)
余额 或 次数卡
上下文长度 1000000
支付方式 余额 或 次数卡
余额价格
37.50 / K tokens (输入)
112.50 / K tokens (输出)
次数卡消耗
1.5 次/次调用
模型描述
[G]gemini-2.5-pro-EXPRESS
文字 · Google chat
14999999985 / K tokens (输入)
44999999955 / K tokens (输出)
余额 或 次数卡
上下文长度 2000000
支付方式 余额 或 次数卡
余额价格
14999999985 / K tokens (输入)
44999999955 / K tokens (输出)
次数卡消耗
2.5 次/次调用
模型描述
[G]gemini-2.5-pro-preview-03-25
文字 · Google work chat
37.50 / K tokens (输入)
112.50 / K tokens (输出)
余额 或 次数卡
上下文长度 1000000
支付方式 余额 或 次数卡
余额价格
37.50 / K tokens (输入)
112.50 / K tokens (输出)
次数卡消耗
1.5 次/次调用
模型描述
[G]gemini-2.5-pro-preview-05-06
文字 · Google work chat
37.50 / K tokens (输入)
112.50 / K tokens (输出)
余额 或 次数卡
上下文长度 1000000
支付方式 余额 或 次数卡
余额价格
37.50 / K tokens (输入)
112.50 / K tokens (输出)
次数卡消耗
1.5 次/次调用
模型描述
[G]gemini-2.5-pro-preview-06-05
文字 · Google work chat
37.50 / K tokens (输入)
112.50 / K tokens (输出)
余额 或 次数卡
上下文长度 1000000
支付方式 余额 或 次数卡
余额价格
37.50 / K tokens (输入)
112.50 / K tokens (输出)
次数卡消耗
1.5 次/次调用
模型描述
[G]gemini-2.5-pro-preview-06-05-EXPRESS
文字 · Google chat
14999999985 / K tokens (输入)
44999999955 / K tokens (输出)
余额 或 次数卡
上下文长度 2000000
支付方式 余额 或 次数卡
余额价格
14999999985 / K tokens (输入)
44999999955 / K tokens (输出)
次数卡消耗
2.5 次/次调用
模型描述
[G]gemini-2.5-pro-thinking
文字 · Google work chat
37.50 / K tokens (输入)
112.50 / K tokens (输出)
余额 或 次数卡
上下文长度 1000000
支付方式 余额 或 次数卡
余额价格
37.50 / K tokens (输入)
112.50 / K tokens (输出)
次数卡消耗
1.5 次/次调用
模型描述
[G]gemini-2.5-pro-满血
文字 · Google work chat
52.50 / K tokens (输入)
157.50 / K tokens (输出)
余额 或 次数卡
上下文长度 1000000
支付方式 余额 或 次数卡
余额价格
52.50 / K tokens (输入)
157.50 / K tokens (输出)
次数卡消耗
5.0 次/次调用
模型描述
[New]gemini-2.5-pro
文字 · Google work
12 / K tokens (输入)
36 / K tokens (输出)
余额 或 次数卡
上下文长度 1000000
支付方式 余额 或 次数卡
余额价格
12 / K tokens (输入)
36 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
[WD]gemini-2.5-pro
文字 · Google work chat
149999999985 / K tokens (输入)
449999999955 / K tokens (输出)
余额 或 次数卡
上下文长度 2000000
支付方式 余额 或 次数卡
余额价格
149999999985 / K tokens (输入)
449999999955 / K tokens (输出)
次数卡消耗
1.5 次/次调用
模型描述
[WD]gemini-2.5-pro-preview-05-06
文字 · Google work chat
149999999985 / K tokens (输入)
449999999955 / K tokens (输出)
余额 或 次数卡
上下文长度 2000000
支付方式 余额 或 次数卡
余额价格
149999999985 / K tokens (输入)
449999999955 / K tokens (输出)
次数卡消耗
1.5 次/次调用
模型描述
[WD]gemini-2.5-pro-preview-06-05
文字 · Google work chat
149999999985 / K tokens (输入)
449999999955 / K tokens (输出)
余额 或 次数卡
上下文长度 2000000
支付方式 余额 或 次数卡
余额价格
149999999985 / K tokens (输入)
449999999955 / K tokens (输出)
次数卡消耗
1.5 次/次调用
模型描述
gemini-2.0-flash
文字 · Google
3 / K tokens (输入)
9 / K tokens (输出)
余额 或 次数卡
上下文长度 1000000
支付方式 余额 或 次数卡
余额价格
3 / K tokens (输入)
9 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gemini-2.0-flash-lite
文字 · Google
2.25 / K tokens (输入)
6.75 / K tokens (输出)
余额 或 次数卡
上下文长度 1000000
支付方式 余额 或 次数卡
余额价格
2.25 / K tokens (输入)
6.75 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gemini-2.0-flash-preview
文字 · Google
3.75 / K tokens (输入)
11.25 / K tokens (输出)
余额 或 次数卡
上下文长度 1000000
支付方式 余额 或 次数卡
余额价格
3.75 / K tokens (输入)
11.25 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gemini-2.5-flash
文字 · Google work
4.50 / K tokens (输入)
13.50 / K tokens (输出)
余额 或 次数卡
上下文长度 1000000
支付方式 余额 或 次数卡
余额价格
4.50 / K tokens (输入)
13.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gemini-2.5-flash-lite-preview-06-17
文字 · Google work chat
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度 1000000
支付方式 余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gemini-2.5-flash-lite-preview-06-17-nothinking
文字 · Google work chat
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度 1000000
支付方式 余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gemini-2.5-flash-lite-preview-06-17-search
文字 · Google work chat
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度 1000000
支付方式 余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gemini-2.5-flash-lite-preview-06-17-search-nothinking
文字 · Google work chat
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度 1000000
支付方式 余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gemini-2.5-flash-nothinking
文字 · Google work
4.50 / K tokens (输入)
13.50 / K tokens (输出)
余额 或 次数卡
上下文长度 1000000
支付方式 余额 或 次数卡
余额价格
4.50 / K tokens (输入)
13.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gemini-2.5-flash-search
文字 · Google work
4.50 / K tokens (输入)
13.50 / K tokens (输出)
余额 或 次数卡
上下文长度 1000000
支付方式 余额 或 次数卡
余额价格
4.50 / K tokens (输入)
13.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gemini-2.5-flash-search-nothinking
文字 · Google work
4.50 / K tokens (输入)
13.50 / K tokens (输出)
余额 或 次数卡
上下文长度 1000000
支付方式 余额 或 次数卡
余额价格
4.50 / K tokens (输入)
13.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gemini-2.5-pro
文字 · Google work
12 / K tokens (输入)
36 / K tokens (输出)
余额 或 次数卡
上下文长度 216384
支付方式 余额 或 次数卡
余额价格
12 / K tokens (输入)
36 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gemini-2.5-pro-nothinking
文字 · Google work
12 / K tokens (输入)
36 / K tokens (输出)
余额 或 次数卡
上下文长度 216384
支付方式 余额 或 次数卡
余额价格
12 / K tokens (输入)
36 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gemini-2.5-pro-search
文字 · Google work
12 / K tokens (输入)
36 / K tokens (输出)
余额 或 次数卡
上下文长度 216384
支付方式 余额 或 次数卡
余额价格
12 / K tokens (输入)
36 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gemini-2.5-pro-search-nothinking
文字 · Google work
12 / K tokens (输入)
36 / K tokens (输出)
余额 或 次数卡
上下文长度 216384
支付方式 余额 或 次数卡
余额价格
12 / K tokens (输入)
36 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gemma-7b
文字 · Google
0.45 / K tokens (输入)
1.35 / K tokens (输出)
余额 或 次数卡
上下文长度 128000
支付方式 余额 或 次数卡
余额价格
0.45 / K tokens (输入)
1.35 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
palm-2
文字 · Google
1.50 / K tokens (输入)
4.50 / K tokens (输出)
余额 或 次数卡
上下文长度 64000
支付方式 余额 或 次数卡
余额价格
1.50 / K tokens (输入)
4.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
phi-4
文字 · Google
2.25 / K tokens (输入)
6.75 / K tokens (输出)
余额 或 次数卡
上下文长度 128000
支付方式 余额 或 次数卡
余额价格
2.25 / K tokens (输入)
6.75 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
[F]kimi-k2-instruct
文字 · Kimi work
10.50 / K tokens (输入)
31.50 / K tokens (输出)
余额 或 次数卡
上下文长度 131072
支付方式 余额 或 次数卡
余额价格
10.50 / K tokens (输入)
31.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述 Kimi K2是一个最先进的专家混合语言模型,具有320亿个激活参数和1万亿个总参数。使用Muon优化器训练,在前沿知识,推理和编码任务中实现卓越的性能,同时针对代理功能进行精心优化。
[F]kimi-k2-instruct-0905
文字 · Kimi work
10.50 / K tokens (输入)
31.50 / K tokens (输出)
余额 或 次数卡
上下文长度 262144
支付方式 余额 或 次数卡
余额价格
10.50 / K tokens (输入)
31.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述 Kimi K2 0905 是 Kimi K2 0711 的九月更新版本。它是由月之暗面(Moonshot AI)开发的大规模专家混合(MoE)语言模型,拥有1万亿总参数,每次前向传播激活320亿参数。该模型支持长上下文推理,最高可达25.6万tokens,相比之前的12.8万tokens有所扩展。 此次更新改进了智能体编程能力,在各种框架中实现了更高准确性和更好的泛化性能,并增强了前端编程能力,在网页、3D及相关任务中提供更美观和实用的输出。Kimi K2 针对智能体能力进行了优化,包括高级工具使用、推理和代码合成。该模型在编程(LiveCodeBench、SWE-bench)、推理(ZebraLogic、GPQA)和工具使用(Tau2、AceBench)等基准测试中表现优异。该模型采用创新技术栈进行训练,结合了MuonClip优化器,确保大规模MoE训练的稳定性。
kimi-k2-0711
文字 · Kimi work
10.50 / K tokens (输入)
31.50 / K tokens (输出)
余额 或 次数卡
上下文长度 131072
支付方式 余额 或 次数卡
余额价格
10.50 / K tokens (输入)
31.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述 Kimi K2是一个最先进的专家混合语言模型,具有320亿个激活参数和1万亿个总参数。使用Muon优化器训练,在前沿知识,推理和编码任务中实现卓越的性能,同时针对代理功能进行精心优化。
kimi-k2-0905
文字 · Kimi work
10.50 / K tokens (输入)
31.50 / K tokens (输出)
余额 或 次数卡
上下文长度 262144
支付方式 余额 或 次数卡
余额价格
10.50 / K tokens (输入)
31.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述 Kimi K2 0905 是 Kimi K2 0711 的九月更新版本。它是由月之暗面(Moonshot AI)开发的大规模专家混合(MoE)语言模型,拥有1万亿总参数,每次前向传播激活320亿参数。该模型支持长上下文推理,最高可达25.6万tokens,相比之前的12.8万tokens有所扩展。 此次更新改进了智能体编程能力,在各种框架中实现了更高准确性和更好的泛化性能,并增强了前端编程能力,在网页、3D及相关任务中提供更美观和实用的输出。Kimi K2 针对智能体能力进行了优化,包括高级工具使用、推理和代码合成。该模型在编程(LiveCodeBench、SWE-bench)、推理(ZebraLogic、GPQA)和工具使用(Tau2、AceBench)等基准测试中表现优异。该模型采用创新技术栈进行训练,结合了MuonClip优化器,确保大规模MoE训练的稳定性。
llama-4-maverick
文字 · Meta
3 / K tokens (输入)
9 / K tokens (输出)
余额 或 次数卡
上下文长度 1050000
支付方式 余额 或 次数卡
余额价格
3 / K tokens (输入)
9 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
llama-4-scout
文字 · Meta
2.25 / K tokens (输入)
6.75 / K tokens (输出)
余额 或 次数卡
上下文长度 300000
支付方式 余额 或 次数卡
余额价格
2.25 / K tokens (输入)
6.75 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
MiniMax-M1-80k
文字 · MiniMax work
10.50 / K tokens (输入)
31.50 / K tokens (输出)
余额 或 次数卡
上下文长度 128000
支付方式 余额 或 次数卡
余额价格
10.50 / K tokens (输入)
31.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
magistral-medium-2506(thinking)
文字 · Mistral AI
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度 40960
支付方式 余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
mistral-NeMo
文字 · Mistral AI
1.50 / K tokens (输入)
4.50 / K tokens (输出)
余额 或 次数卡
上下文长度 128000
支付方式 余额 或 次数卡
余额价格
1.50 / K tokens (输入)
4.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
mistral-large-2
文字 · Mistral AI
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度 128000
支付方式 余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
mistral-medium
文字 · Mistral AI
2.25 / K tokens (输入)
6.75 / K tokens (输出)
余额 或 次数卡
上下文长度 32000
支付方式 余额 或 次数卡
余额价格
2.25 / K tokens (输入)
6.75 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
mistral-medium-3
文字 · Mistral AI
1.50 / K tokens (输入)
4.50 / K tokens (输出)
余额 或 次数卡
上下文长度 131072
支付方式 余额 或 次数卡
余额价格
1.50 / K tokens (输入)
4.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
mistral-small-3
文字 · Mistral AI
1.50 / K tokens (输入)
4.50 / K tokens (输出)
余额 或 次数卡
上下文长度 128000
支付方式 余额 或 次数卡
余额价格
1.50 / K tokens (输入)
4.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
mistral-small-3.1
文字 · Mistral AI
1.50 / K tokens (输入)
4.50 / K tokens (输出)
余额 或 次数卡
上下文长度 128000
支付方式 余额 或 次数卡
余额价格
1.50 / K tokens (输入)
4.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
mistral-small-3.2
文字 · Mistral AI
1.50 / K tokens (输入)
4.50 / K tokens (输出)
余额 或 次数卡
上下文长度 131072
支付方式 余额 或 次数卡
余额价格
1.50 / K tokens (输入)
4.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
[New]gpt-4.1
文字 · OpenAI work
41.25 / K tokens (输入)
123.75 / K tokens (输出)
余额 或 次数卡
上下文长度 1000000
支付方式 余额 或 次数卡
余额价格
41.25 / K tokens (输入)
123.75 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
[New]gpt-4o
文字 · OpenAI work
52.50 / K tokens (输入)
157.50 / K tokens (输出)
余额 或 次数卡
上下文长度 128000
支付方式 余额 或 次数卡
余额价格
52.50 / K tokens (输入)
157.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
[New]o3
文字 · OpenAI work
120 / K tokens (输入)
360 / K tokens (输出)
余额 或 次数卡
上下文长度 200000
支付方式 余额 或 次数卡
余额价格
120 / K tokens (输入)
360 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
[New]o3-mini
文字 · OpenAI work
90 / K tokens (输入)
270 / K tokens (输出)
余额 或 次数卡
上下文长度 200000
支付方式 余额 或 次数卡
余额价格
90 / K tokens (输入)
270 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
[New]o4-mini
文字 · OpenAI work
45 / K tokens (输入)
135 / K tokens (输出)
余额 或 次数卡
上下文长度 200000
支付方式 余额 或 次数卡
余额价格
45 / K tokens (输入)
135 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
chatgpt-4o-latest
文字 · OpenAI work
37.50 / K tokens (输入)
112.50 / K tokens (输出)
余额 或 次数卡
上下文长度 128000
支付方式 余额 或 次数卡
余额价格
37.50 / K tokens (输入)
112.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gpt-3.5-turbo
文字 · OpenAI
10.50 / K tokens (输入)
31.50 / K tokens (输出)
余额 或 次数卡
上下文长度 16384
支付方式 余额 或 次数卡
余额价格
10.50 / K tokens (输入)
31.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gpt-3.5-turbo-instruct
文字 · OpenAI
10.50 / K tokens (输入)
31.50 / K tokens (输出)
余额 或 次数卡
上下文长度 16384
支付方式 余额 或 次数卡
余额价格
10.50 / K tokens (输入)
31.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gpt-4-turbo
文字 · OpenAI work
37.50 / K tokens (输入)
112.50 / K tokens (输出)
余额 或 次数卡
上下文长度 128000
支付方式 余额 或 次数卡
余额价格
37.50 / K tokens (输入)
112.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gpt-4.1-2025-04-14
文字 · OpenAI work
41.25 / K tokens (输入)
123.75 / K tokens (输出)
余额 或 次数卡
上下文长度 1000000
支付方式 余额 或 次数卡
余额价格
41.25 / K tokens (输入)
123.75 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gpt-4.1-mini-2025-04-14
文字 · OpenAI work
18.75 / K tokens (输入)
56.25 / K tokens (输出)
余额 或 次数卡
上下文长度 1000000
支付方式 余额 或 次数卡
余额价格
18.75 / K tokens (输入)
56.25 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gpt-4.1-nano-2025-04-14
文字 · OpenAI work
11.25 / K tokens (输入)
33.75 / K tokens (输出)
余额 或 次数卡
上下文长度 1000000
支付方式 余额 或 次数卡
余额价格
11.25 / K tokens (输入)
33.75 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gpt-4o-2024-08-06
文字 · OpenAI work
37.50 / K tokens (输入)
112.50 / K tokens (输出)
余额 或 次数卡
上下文长度 128000
支付方式 余额 或 次数卡
余额价格
37.50 / K tokens (输入)
112.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gpt-4o-2024-11-20
文字 · OpenAI work
37.50 / K tokens (输入)
112.50 / K tokens (输出)
余额 或 次数卡
上下文长度 128000
支付方式 余额 或 次数卡
余额价格
37.50 / K tokens (输入)
112.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gpt-4o-mini
文字 · OpenAI work
3 / K tokens (输入)
9 / K tokens (输出)
余额 或 次数卡
上下文长度 128000
支付方式 余额 或 次数卡
余额价格
3 / K tokens (输入)
9 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gpt-4o-mini-search
文字 · OpenAI
15 / K tokens (输入)
45 / K tokens (输出)
余额 或 次数卡
上下文长度 128000
支付方式 余额 或 次数卡
余额价格
15 / K tokens (输入)
45 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gpt-4o-search
文字 · OpenAI
48.75 / K tokens (输入)
146.25 / K tokens (输出)
余额 或 次数卡
上下文长度 128000
支付方式 余额 或 次数卡
余额价格
48.75 / K tokens (输入)
146.25 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gpt-5-2025-08-07
文字 · OpenAI work
12 / K tokens (输入)
36 / K tokens (输出)
余额 或 次数卡
上下文长度 400000
支付方式 余额 或 次数卡
余额价格
12 / K tokens (输入)
36 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gpt-5-2025-08-07-search
文字 · OpenAI work
12 / K tokens (输入)
36 / K tokens (输出)
余额 或 次数卡
上下文长度 400000
支付方式 余额 或 次数卡
余额价格
12 / K tokens (输入)
36 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gpt-5-chat-latest
文字 · OpenAI work
12 / K tokens (输入)
36 / K tokens (输出)
余额 或 次数卡
上下文长度 400000
支付方式 余额 或 次数卡
余额价格
12 / K tokens (输入)
36 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述 GPT-5 是 OpenAI 的最新旗舰模型,具有显著提升的编程能力、长文本处理能力(40万个标记)和更好的指令遵循能力。支持原生视觉功能,整体智能水平超过 GPT-4.1。
gpt-5-mini-2025-08-07
文字 · OpenAI work
4.50 / K tokens (输入)
13.50 / K tokens (输出)
余额 或 次数卡
上下文长度 400000
支付方式 余额 或 次数卡
余额价格
4.50 / K tokens (输入)
13.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gpt-5-mini-2025-08-07-search
文字 · OpenAI work
4.50 / K tokens (输入)
13.50 / K tokens (输出)
余额 或 次数卡
上下文长度 400000
支付方式 余额 或 次数卡
余额价格
4.50 / K tokens (输入)
13.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gpt-5-nano-2025-08-07
文字 · OpenAI work
1.50 / K tokens (输入)
4.50 / K tokens (输出)
余额 或 次数卡
上下文长度 400000
支付方式 余额 或 次数卡
余额价格
1.50 / K tokens (输入)
4.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gpt-oss-120b
文字 · OpenAI work
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度 200000
支付方式 余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述 GPT-OSS-120b 是一个高性能开放权重语言模型,专为生产级通用场景设计。它可以在单个H100 GPU上运行,无需多GPU基础设施即可使用。该模型基于Harmony响应格式训练,在复杂推理方面表现出色,支持可配置的推理强度、完全透明的思维链过程以便于调试和建立信任,并具有原生代理功能,可用于函数调用、工具使用和结构化输出。
gpt-oss-20b
文字 · OpenAI work
6 / K tokens (输入)
18 / K tokens (输出)
余额 或 次数卡
上下文长度 200000
支付方式 余额 或 次数卡
余额价格
6 / K tokens (输入)
18 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述 GPT-OSS-20b 是一个紧凑型开放权重语言模型,针对低延迟和资源受限的环境进行了优化,包括本地和边缘部署。它与120B共享相同的Harmony训练基础和功能,具有更快的推理速度和更简便的部署方式,非常适合专业化或离线使用场景、快速响应性能、思维链输出和可调节的推理水平,以及代理工作流程。
o3
文字 · OpenAI work
120 / K tokens (输入)
360 / K tokens (输出)
余额 或 次数卡
上下文长度 200000
支付方式 余额 或 次数卡
余额价格
120 / K tokens (输入)
360 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
o3-mini
文字 · OpenAI work
90 / K tokens (输入)
270 / K tokens (输出)
余额 或 次数卡
上下文长度 200000
支付方式 余额 或 次数卡
余额价格
90 / K tokens (输入)
270 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
o4-mini
文字 · OpenAI work
45 / K tokens (输入)
135 / K tokens (输出)
余额 或 次数卡
上下文长度 200000
支付方式 余额 或 次数卡
余额价格
45 / K tokens (输入)
135 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
InternLM2.5-20B
文字 · OpenGVLab
60 / K tokens (输入)
180 / K tokens (输出)
余额 或 次数卡
上下文长度 128000
支付方式 余额 或 次数卡
余额价格
60 / K tokens (输入)
180 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
InternLM2.5-7B
文字 · OpenGVLab
60 / K tokens (输入)
180 / K tokens (输出)
余额 或 次数卡
上下文长度 128000
支付方式 余额 或 次数卡
余额价格
60 / K tokens (输入)
180 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
InternVL2-26B
文字 · OpenGVLab
60 / K tokens (输入)
180 / K tokens (输出)
余额 或 次数卡
上下文长度 128000
支付方式 余额 或 次数卡
余额价格
60 / K tokens (输入)
180 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
ppl-sonar
文字 · Perplexity work
22.50 / K tokens (输入)
67.50 / K tokens (输出)
余额 或 次数卡
上下文长度 131072
支付方式 余额 或 次数卡
余额价格
22.50 / K tokens (输入)
67.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
ppl-sonar-pro-hign
文字 · Perplexity work
33.75 / K tokens (输入)
101.25 / K tokens (输出)
余额 或 次数卡
上下文长度 131072
支付方式 余额 或 次数卡
余额价格
33.75 / K tokens (输入)
101.25 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
ppl-sonar-reasoning
文字 · Perplexity work
30 / K tokens (输入)
90 / K tokens (输出)
余额 或 次数卡
上下文长度 163840
支付方式 余额 或 次数卡
余额价格
30 / K tokens (输入)
90 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
ppl-sonar-reasoning-pro-hign
文字 · Perplexity work
41.25 / K tokens (输入)
123.75 / K tokens (输出)
余额 或 次数卡
上下文长度 163840
支付方式 余额 或 次数卡
余额价格
41.25 / K tokens (输入)
123.75 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
QwQ-32B
文字 · Qwen
45 / K tokens (输入)
135 / K tokens (输出)
余额 或 次数卡
上下文长度 131072
支付方式 余额 或 次数卡
余额价格
45 / K tokens (输入)
135 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
Qwen-Plus-2025-01-12
文字 · Qwen
45 / K tokens (输入)
135 / K tokens (输出)
余额 或 次数卡
上下文长度 128000
支付方式 余额 或 次数卡
余额价格
45 / K tokens (输入)
135 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
Qwen2.5-14B-Instruct
文字 · Qwen
15 / K tokens (输入)
45 / K tokens (输出)
余额 或 次数卡
上下文长度 128000
支付方式 余额 或 次数卡
余额价格
15 / K tokens (输入)
45 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
Qwen2.5-32B-Instruct
文字 · Qwen
15 / K tokens (输入)
45 / K tokens (输出)
余额 或 次数卡
上下文长度 128000
支付方式 余额 或 次数卡
余额价格
15 / K tokens (输入)
45 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
Qwen2.5-72B-Instruct
文字 · Qwen
15 / K tokens (输入)
45 / K tokens (输出)
余额 或 次数卡
上下文长度 128000
支付方式 余额 或 次数卡
余额价格
15 / K tokens (输入)
45 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
Qwen2.5-7B-Instruct
文字 · Qwen
15 / K tokens (输入)
45 / K tokens (输出)
余额 或 次数卡
上下文长度 128000
支付方式 余额 或 次数卡
余额价格
15 / K tokens (输入)
45 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
Qwen2.5-Coder-32B-Instruct
文字 · Qwen
15 / K tokens (输入)
45 / K tokens (输出)
余额 或 次数卡
上下文长度 128000
支付方式 余额 或 次数卡
余额价格
15 / K tokens (输入)
45 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
Qwen2.5-Coder-7B-Instruct
文字 · Qwen
15 / K tokens (输入)
45 / K tokens (输出)
余额 或 次数卡
上下文长度 128000
支付方式 余额 或 次数卡
余额价格
15 / K tokens (输入)
45 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
Qwen2.5-VL-32B
文字 · Qwen
15 / K tokens (输入)
45 / K tokens (输出)
余额 或 次数卡
上下文长度 128000
支付方式 余额 或 次数卡
余额价格
15 / K tokens (输入)
45 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
Qwen3-235B-A22B-2507-Instruct
文字 · Qwen work
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度 262144
支付方式 余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
Qwen3-235B-A22B-2507-Thinking
文字 · Qwen work
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度 262144
支付方式 余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
Qwen3-30B-A3B-2507-Instruct
文字 · Qwen work
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度 262144
支付方式 余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
Qwen3-32B
文字 · Qwen work
1.50 / K tokens (输入)
4.50 / K tokens (输出)
余额 或 次数卡
上下文长度 128000
支付方式 余额 或 次数卡
余额价格
1.50 / K tokens (输入)
4.50 / K tokens (输出)
次数卡消耗
0.1 次/次调用
模型描述
Qwen3-Coder-30B-A3B-Instruct
文字 · Qwen work
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度 262144
支付方式 余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
Qwen3-Coder-480B-A35B-Instruct
文字 · Qwen work
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度 262144
支付方式 余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
Qwen3-Max
文字 · Qwen work
6 / K tokens (输入)
18 / K tokens (输出)
余额 或 次数卡
上下文长度 131072
支付方式 余额 或 次数卡
余额价格
6 / K tokens (输入)
18 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述 Qwen3-Max是Qwen3系列的重大更新,在推理,指导和多语言支持方面提供了显着的改进。它在编码和数学等复杂任务中提供了更高的准确度,同时减少了幻觉,在开放式问题上表现更好。
Qwen3-Next-80B-Instruct
文字 · Qwen work
4.50 / K tokens (输入)
13.50 / K tokens (输出)
余额 或 次数卡
上下文长度 65536
支付方式 余额 或 次数卡
余额价格
4.50 / K tokens (输入)
13.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
Qwen3-Next-80B-Thinking
文字 · Qwen work
4.50 / K tokens (输入)
13.50 / K tokens (输出)
余额 或 次数卡
上下文长度 65536
支付方式 余额 或 次数卡
余额价格
4.50 / K tokens (输入)
13.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
[F]Qwen3-235B-A22B
文字 · Qwen work
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度 131072
支付方式 余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
[F]Qwen3-235B-A22B-2507-Instruct
文字 · Qwen work
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度 262144
支付方式 余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
[F]Qwen3-235B-A22B-2507-Thinking
文字 · Qwen work
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度 262144
支付方式 余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
[F]Qwen3-30B-A3B
文字 · Qwen work
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度 262144
支付方式 余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
[F]Qwen3-30B-A3B-2507-Instruct
文字 · Qwen work
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度 262144
支付方式 余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
[F]Qwen3-30B-A3B-2507-Thinking
文字 · Qwen work
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度 262144
支付方式 余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
[F]Qwen3-Coder-30B-A3B-Instruct
文字 · Qwen work
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度 262144
支付方式 余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
[F]Qwen3-Coder-480B-A35B-Instruct
文字 · Qwen work
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度 262144
支付方式 余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
Grok-4-Fast
文字 · xAI work chat
1.50 / K tokens (输入)
4.50 / K tokens (输出)
余额 或 次数卡
上下文长度 2000000
支付方式 余额 或 次数卡
余额价格
1.50 / K tokens (输入)
4.50 / K tokens (输出)
次数卡消耗
0.3 次/次调用
模型描述 Grok 4 Fast 专为内容生成和网页或 X 搜索等快速高效的任务而设计,具有200万字符的上下文窗口。它将尖端性能与成本效益相结合,确保日常简单应用能获得高质量的结果。
Grok-4-Fast-Reasoning
文字 · xAI work chat
1.50 / K tokens (输入)
4.50 / K tokens (输出)
余额 或 次数卡
上下文长度 2000000
支付方式 余额 或 次数卡
余额价格
1.50 / K tokens (输入)
4.50 / K tokens (输出)
次数卡消耗
0.3 次/次调用
模型描述 Grok 4 Fast Reasoning 在需要逻辑思维和问题解决的任务中表现出色。凭借200万token的上下文窗口和最先进的成本效益,它能够准确快速地处理复杂的推理任务,让更多用户能够使用先进的AI功能。
[New]grok-3-beta
文字 · xAI work
30 / K tokens (输入)
90 / K tokens (输出)
余额 或 次数卡
上下文长度 200000
支付方式 余额 或 次数卡
余额价格
30 / K tokens (输入)
90 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
grok-2-1212
文字 · xAI
30 / K tokens (输入)
90 / K tokens (输出)
余额 或 次数卡
上下文长度 128000
支付方式 余额 或 次数卡
余额价格
30 / K tokens (输入)
90 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
grok-3-beta
文字 · xAI work
30 / K tokens (输入)
90 / K tokens (输出)
余额 或 次数卡
上下文长度 131072
支付方式 余额 或 次数卡
余额价格
30 / K tokens (输入)
90 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
grok-3-mini-beta
文字 · xAI work
22.50 / K tokens (输入)
67.50 / K tokens (输出)
余额 或 次数卡
上下文长度 131072
支付方式 余额 或 次数卡
余额价格
22.50 / K tokens (输入)
67.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
grok-4
文字 · xAI work chat
27 / K tokens (输入)
81 / K tokens (输出)
余额 或 次数卡
上下文长度 262144
支付方式 余额 或 次数卡
余额价格
27 / K tokens (输入)
81 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
grok-beta
文字 · xAI
37.50 / K tokens (输入)
112.50 / K tokens (输出)
余额 或 次数卡
上下文长度 128000
支付方式 余额 或 次数卡
余额价格
37.50 / K tokens (输入)
112.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
grok-code-fast-1
文字 · xAI work chat
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度 262144
支付方式 余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
Hunyuan-Image-2.1
图像 · Alibaba
2250 Pisces Coin / 次调用
余额 或 次数卡
上下文长度 12800
支付方式 余额 或 次数卡
余额价格
2250 Pisces Coin / 次调用
次数卡消耗
1.0 次/次调用
模型描述 Qwen-Image (20B)是Qwen系列中的一个图像生成基础模型,在复杂文本渲染方面取得了重大进展。
Qwen-Edit-20B
图像 · Alibaba
2250 Pisces Coin / 次调用
余额 或 次数卡
上下文长度 12800
支付方式 余额 或 次数卡
余额价格
2250 Pisces Coin / 次调用
次数卡消耗
1.0 次/次调用
模型描述 Qwen-Edit 是Qwen系列中的一个图像生成基础模型,在复杂文本渲染方面取得了重大进展。
Qwen-Image-20B
图像 · Alibaba
3000 Pisces Coin / 次调用
余额 或 次数卡
上下文长度 12800
支付方式 余额 或 次数卡
余额价格
3000 Pisces Coin / 次调用
次数卡消耗
1.0 次/次调用
模型描述 Qwen-Image (20B) 是Qwen系列中的一个图像生成基础模型,在复杂文本渲染方面取得了重大进展。
Qwen-Image-Edit
图像 · Alibaba
3000 Pisces Coin / 次调用
余额 或 次数卡
上下文长度 12800
支付方式 余额 或 次数卡
余额价格
3000 Pisces Coin / 次调用
次数卡消耗
1.0 次/次调用
模型描述 Qwen-Image (20B) 是Qwen系列中的一个图像生成基础模型,在复杂文本渲染方面取得了重大进展。支持chat接口,传入edits接口自动切换Qwen-Edit模型。
doubao-seededit-3-0-i2i-250628
图像 · ByteDance
6000 Pisces Coin / 次调用
余额 或 次数卡
上下文长度 12800
支付方式 余额 或 次数卡
余额价格
6000 Pisces Coin / 次调用
次数卡消耗
5.0 次/次调用
模型描述 SeedEdit 3.0 是字节跳动自主研发的图像编辑模型,擅长准确执行编辑指令并有效保留图像内容,尤其在处理真实图像方面表现出色。请发送一张图片并附带编辑提示。
doubao-seedream-3-0-t2i-250415
图像 · ByteDance
5250 Pisces Coin / 次调用
余额 或 次数卡
上下文长度 12800
支付方式 余额 或 次数卡
余额价格
5250 Pisces Coin / 次调用
次数卡消耗
5.0 次/次调用
模型描述 Seedream 3.0 by ByteDance 是一个双语(中文和英文)的“文本转图像”模型,在文本到图像生成方面表现出色。
doubao-seedream-3.1-t2i-2500804
图像 · ByteDance
5250 Pisces Coin / 次调用
余额 或 次数卡
上下文长度 12800
支付方式 余额 或 次数卡
余额价格
5250 Pisces Coin / 次调用
次数卡消耗
1.0 次/次调用
模型描述 ByteDance的Dreamina 3.1文本生成图像模型展示了卓越的图像效果,在图像美感、精确多样的风格和丰富的细节方面都有显著提升。该模型在处理较长提示词时表现出色,如遇到内容检查问题请尽量使用较长的提示词。
doubao-seedream-4-0-250828
图像 · ByteDance
5250 Pisces Coin / 次调用
余额 或 次数卡
上下文长度 32768
支付方式 余额 或 次数卡
余额价格
5250 Pisces Coin / 次调用
次数卡消耗
5.0 次/次调用
模型描述 Seedream 4.0 是字节跳动最新、最好的文本到图像模型,能够实现令人印象深刻的高保真图像生成,具有出色的文本渲染能力。Seedream 4.0 还可以接收多个图像作为引用,并将其组合在一起或编辑它们以返回输出。
FLUX.1 Kontext [max]
图像 · FLUX
7500 Pisces Coin / 次调用
余额 或 次数卡
上下文长度 200
支付方式 余额 或 次数卡
余额价格
7500 Pisces Coin / 次调用
次数卡消耗
1.0 次/次调用
模型描述
FLUX.1 Kontext [pro]
图像 · FLUX
5250 Pisces Coin / 次调用
余额 或 次数卡
上下文长度 200
支付方式 余额 或 次数卡
余额价格
5250 Pisces Coin / 次调用
次数卡消耗
1.0 次/次调用
模型描述
FLUX.1 Krea [dev]
图像 · FLUX
3000 Pisces Coin / 次调用
余额 或 次数卡
上下文长度 512
支付方式 余额 或 次数卡
余额价格
3000 Pisces Coin / 次调用
次数卡消耗
1.0 次/次调用
模型描述 FLUX-Krea是FLUX Dev的一个版本,专为优质美学效果而调校。发送一张图片,让这个模型通过FLUX Krea Redux重新构想/重新生成它。
FLUX.1 [dev]
图像 · FLUX
3000 Pisces Coin / 次调用
余额 或 次数卡
上下文长度 80
支付方式 余额 或 次数卡
余额价格
3000 Pisces Coin / 次调用
次数卡消耗
1.0 次/次调用
模型描述
FLUX.1 [schnell]
图像 · FLUX
2250 Pisces Coin / 次调用
余额 或 次数卡
上下文长度 80
支付方式 余额 或 次数卡
余额价格
2250 Pisces Coin / 次调用
次数卡消耗
1.0 次/次调用
模型描述
FLUX1.1 [pro]
图像 · FLUX
2250 Pisces Coin / 次调用
余额 或 次数卡
上下文长度 80
支付方式 余额 或 次数卡
余额价格
2250 Pisces Coin / 次调用
次数卡消耗
1.0 次/次调用
模型描述
FLUX1.1 [pro] [ultra]
图像 · FLUX
3000 Pisces Coin / 次调用
余额 或 次数卡
上下文长度 80
支付方式 余额 或 次数卡
余额价格
3000 Pisces Coin / 次调用
次数卡消耗
1.0 次/次调用
模型描述
Google Imagen-3
图像 · Google
1050 Pisces Coin / 次调用
余额 或 次数卡
上下文长度 480
支付方式 余额 或 次数卡
余额价格
1050 Pisces Coin / 次调用
次数卡消耗
1.0 次/次调用
模型描述
Google Imagen-3 Fast
图像 · Google
750 Pisces Coin / 次调用
余额 或 次数卡
上下文长度 480
支付方式 余额 或 次数卡
余额价格
750 Pisces Coin / 次调用
次数卡消耗
1.0 次/次调用
模型描述
Google Imagen-4
图像 · Google
1200 Pisces Coin / 次调用
余额 或 次数卡
上下文长度 480
支付方式 余额 或 次数卡
余额价格
1200 Pisces Coin / 次调用
次数卡消耗
1.0 次/次调用
模型描述
Google Imagen-4 Fast
图像 · Google
1200 Pisces Coin / 次调用
余额 或 次数卡
上下文长度 480
支付方式 余额 或 次数卡
余额价格
1200 Pisces Coin / 次调用
次数卡消耗
1.0 次/次调用
模型描述
Google Imagen-4-Ultra
图像 · Google
3000 Pisces Coin / 次调用
余额 或 次数卡
上下文长度 480
支付方式 余额 或 次数卡
余额价格
3000 Pisces Coin / 次调用
次数卡消耗
1.0 次/次调用
模型描述
gemini-2.5-flash-image-preview
图像 · Google work
3000 Pisces Coin / K tokens
余额 或 次数卡
上下文长度 32768
支付方式 余额 或 次数卡
余额价格
3000 Pisces Coin / K tokens
次数卡消耗
0.5 次/次调用
模型描述
Ideogram 3.0
图像 · Ideogram
2250 Pisces Coin / 次调用
余额 或 次数卡
上下文长度 200
支付方式 余额 或 次数卡
余额价格
2250 Pisces Coin / 次调用
次数卡消耗
1.0 次/次调用
模型描述
DALL-E-3
图像 · OpenAI
12000 Pisces Coin / 次调用
余额 或 次数卡
上下文长度 80
支付方式 余额 或 次数卡
余额价格
12000 Pisces Coin / 次调用
次数卡消耗
1.0 次/次调用
模型描述
GPT-Image-1
图像 · OpenAI
15000 Pisces Coin / 次调用
余额 或 次数卡
上下文长度 2000
支付方式 余额 或 次数卡
余额价格
15000 Pisces Coin / 次调用
次数卡消耗
1.0 次/次调用
模型描述
Playground-v2.5
图像 · Playground AI
1500 Pisces Coin / 次调用
余额 或 次数卡
上下文长度 80
支付方式 余额 或 次数卡
余额价格
1500 Pisces Coin / 次调用
次数卡消耗
1.0 次/次调用
模型描述
Playground-v3
图像 · Playground AI
1500 Pisces Coin / 次调用
余额 或 次数卡
上下文长度 80
支付方式 余额 或 次数卡
余额价格
1500 Pisces Coin / 次调用
次数卡消耗
1.0 次/次调用
模型描述
sana-t2i
图像 · Sana
450 Pisces Coin / 次调用
余额 或 次数卡
上下文长度 80
支付方式 余额 或 次数卡
余额价格
450 Pisces Coin / 次调用
次数卡消耗
1.0 次/次调用
模型描述
StableDiffusion-3.5
图像 · Stability AI
300 Pisces Coin / 次调用
余额 或 次数卡
上下文长度 80
支付方式 余额 或 次数卡
余额价格
300 Pisces Coin / 次调用
次数卡消耗
1.0 次/次调用
模型描述
Qwen3-Embedding-0.6B
其它 · Alibaba
240
余额
上下文长度 32768
支付方式 余额
余额价格
240
次数卡消耗
--
模型描述 多语言文本嵌入模型,支持自定义输出维度,向量维度1024
Qwen3-Embedding-4B
其它 · Alibaba
450
余额
上下文长度 32768
支付方式 余额
余额价格
450
次数卡消耗
--
模型描述 多语言、多模态任务通用的高性能文本和代码嵌入模型,向量维度2560
Qwen3-Embedding-8B
其它 · Alibaba
600
余额
上下文长度 32768
支付方式 余额
余额价格
600
次数卡消耗
--
模型描述 面向多语言文本和代码的高性能嵌入模型,向量维度4096
Qwen3-Reranker-0.6B
其它 · Alibaba
240
余额
上下文长度 32768
支付方式 余额
余额价格
240
次数卡消耗
--
模型描述 轻量级重排序模型,专为信息检索任务中的文档排序优化设计
Qwen3-Reranker-4B
其它 · Alibaba
450
余额
上下文长度 32768
支付方式 余额
余额价格
450
次数卡消耗
--
模型描述 40亿参数的跨语言和多域信息检索排序优化模型
Qwen3-Reranker-8B
其它 · Alibaba
600
余额
上下文长度 32768
支付方式 余额
余额价格
600
次数卡消耗
--
模型描述 80亿参数的多语言跨域大型reranker模型,支持多种语言和复杂语义理解
bge-large-zh-v1.5
其它 · BAAI
150
余额
上下文长度 512
支付方式 余额
余额价格
150
次数卡消耗
--
模型描述 中文优化的文本检索模型,向量维度1024
bge-m3
其它 · BAAI
300
余额
上下文长度 8192
支付方式 余额
余额价格
300
次数卡消耗
--
模型描述 由智源研究院开源的多语言、多粒度和多功能嵌入模型,向量维度1024,支持100+种语言
bge-reranker-v2-m3
其它 · BAAI
300
余额
上下文长度 8192
支付方式 余额
余额价格
300
次数卡消耗
--
模型描述 支持多语言、高精度语义匹配和高效检索优化的文本重排序模型
bge-small-zh-v1.5
其它 · BAAI
90
余额
上下文长度 512
支付方式 余额
余额价格
90
次数卡消耗
--
模型描述 中文优化的轻量级文本检索模型,向量维度512
ElevenLabs-v2.5-Turbo
其它 · ElevenLabs
300
余额
上下文长度 200000
支付方式 余额
余额价格
300
次数卡消耗
--
模型描述
ElevenLabs-v3
其它 · ElevenLabs
300
余额
上下文长度 200000
支付方式 余额
余额价格
300
次数卡消耗
--
模型描述
MiniMax-Speech-02-HD
其它 · ElevenLabs
300
余额
上下文长度 200000
支付方式 余额
余额价格
300
次数卡消耗
--
模型描述
jina-clip-v1
其它 · Jina AI
240
余额
上下文长度 512
支付方式 余额
余额价格
240
次数卡消耗
--
模型描述 多模态检索模型,向量维度768,支持跨模态文本匹配
jina-clip-v2
其它 · Jina AI
450
余额
上下文长度 8192
支付方式 余额
余额价格
450
次数卡消耗
--
模型描述 支持8k上下文和强大图片处理能力的多模态对齐模型,向量维度1024
jina-embeddings-v4
其它 · Jina AI
600
余额
上下文长度 32768
支付方式 余额
余额价格
600
次数卡消耗
--
模型描述 3.8亿参数的多模态、多语言通用嵌入模型,向量维度2048
jina-reranker-m0
其它 · Jina AI
360
余额
上下文长度 10240
支付方式 余额
余额价格
360
次数卡消耗
--
模型描述 多模态多语言重排器,支持29种语言的视觉文档排序
MiniMax-Speech-02-Turbo
其它 · MiniMax
300
余额
上下文长度 200000
支付方式 余额
余额价格
300
次数卡消耗
--
模型描述
bce-embedding-base_v1
其它 · NetEase
150
余额
上下文长度 512
支付方式 余额
余额价格
150
次数卡消耗
--
模型描述 优化文本嵌入任务的预训练模型,向量维度768,中英文优化
bce-reranker-base_v1
其它 · NetEase
150
余额
上下文长度 512
支付方式 余额
余额价格
150
次数卡消耗
--
模型描述 优化排序任务的预训练模型,支持多语言文本重排序
nomic-embed-code
其它 · Nomic AI
300
余额
上下文长度 32768
支付方式 余额
余额价格
300
次数卡消耗
--
模型描述 70亿参数的先进开源代码嵌入模型,向量维度768,支持多种编程语言
gpt-5-nano-2025-08-07-search
其它 · OpenAI work
1500
余额
上下文长度 400000
支付方式 余额
余额价格
1500
次数卡消耗
--
模型描述
all-mpnet-base-v2
其它 · sentence-transformers
150
余额
上下文长度 512
支付方式 余额
余额价格
150
次数卡消耗
--
模型描述 基于MPNet架构的高性能句子嵌入模型,向量维度768
模型名称已复制到剪贴板!

价格说明

  • 模型支持余额和次数卡,余额消耗按 Pisces Coin 计价,次数卡按次扣除。
  • 所有价格均以 Pisces Coin 或次数卡计价,最终解释权归本站所有。
  • 蓝色表示余额消耗价格,绿色表示次数卡消耗。
  • 享有专属价格时,原价会被删除线划掉,并突出显示专属优惠价格。
  • 点击模型名称可复制到剪贴板。
  • 分组标签:work 办公用途,chat 聊天用途