Pisces API
模型价格表
全部
文字
图像
全部供应商
Alibaba
Anthropic
BAAI
ByteDance
ChatGLM
DeepSeek
ElevenLabs
FLUX
Google
Ideogram
Jina AI
Kimi
Meta
MiniMax
Mistral AI
NetEase
Nomic AI
OpenAI
OpenGVLab
Perplexity
Playground AI
Qwen
Sana
Stability AI
sentence-transformers
xAI
全部分组
全部
chat
work
默认
[M]claude-3-7-sonnet
文字 · Anthropic
chat
300 / K tokens (输入)
900 / K tokens (输出)
余额 或 次数卡
上下文长度
200000
支付方式
余额 或 次数卡
余额价格
300 / K tokens (输入)
900 / K tokens (输出)
次数卡消耗
4.0 次/次调用
模型描述
[M]claude-3-7-sonnet-thinking
文字 · Anthropic
chat
300 / K tokens (输入)
900 / K tokens (输出)
余额 或 次数卡
上下文长度
200000
支付方式
余额 或 次数卡
余额价格
300 / K tokens (输入)
900 / K tokens (输出)
次数卡消耗
4.0 次/次调用
模型描述
[M]claude-opus-4
文字 · Anthropic
chat
750 / K tokens (输入)
2250 / K tokens (输出)
余额 或 次数卡
上下文长度
200000
支付方式
余额 或 次数卡
余额价格
750 / K tokens (输入)
2250 / K tokens (输出)
次数卡消耗
15.0 次/次调用
模型描述
[M]claude-opus-4-thinking
文字 · Anthropic
chat
750 / K tokens (输入)
2250 / K tokens (输出)
余额 或 次数卡
上下文长度
200000
支付方式
余额 或 次数卡
余额价格
750 / K tokens (输入)
2250 / K tokens (输出)
次数卡消耗
15.0 次/次调用
模型描述
[M]claude-opus-4.1
文字 · Anthropic
chat
750 / K tokens (输入)
2250 / K tokens (输出)
余额 或 次数卡
上下文长度
200000
支付方式
余额 或 次数卡
余额价格
750 / K tokens (输入)
2250 / K tokens (输出)
次数卡消耗
15.0 次/次调用
模型描述
[M]claude-opus-4.1-thinking
文字 · Anthropic
chat
750 / K tokens (输入)
2250 / K tokens (输出)
余额 或 次数卡
上下文长度
200000
支付方式
余额 或 次数卡
余额价格
750 / K tokens (输入)
2250 / K tokens (输出)
次数卡消耗
15.0 次/次调用
模型描述
[M]claude-sonnet-4
文字 · Anthropic
chat
300 / K tokens (输入)
900 / K tokens (输出)
余额 或 次数卡
上下文长度
200000
支付方式
余额 或 次数卡
余额价格
300 / K tokens (输入)
900 / K tokens (输出)
次数卡消耗
4.0 次/次调用
模型描述
[M]claude-sonnet-4-thinking
文字 · Anthropic
chat
300 / K tokens (输入)
900 / K tokens (输出)
余额 或 次数卡
上下文长度
200000
支付方式
余额 或 次数卡
余额价格
300 / K tokens (输入)
900 / K tokens (输出)
次数卡消耗
4.0 次/次调用
模型描述
[New]Kimi-K2
文字 · Anthropic
10.50 / K tokens (输入)
31.50 / K tokens (输出)
余额 或 次数卡
上下文长度
200000
支付方式
余额 或 次数卡
余额价格
10.50 / K tokens (输入)
31.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
暂无描述
[New]claude-opus-4
文字 · Anthropic
60 / K tokens (输入)
180 / K tokens (输出)
余额 或 次数卡
上下文长度
1000000
支付方式
余额 或 次数卡
余额价格
60 / K tokens (输入)
180 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
暂无描述
[New]claude-opus-4-thinking
文字 · Anthropic
75 / K tokens (输入)
225 / K tokens (输出)
余额 或 次数卡
上下文长度
1000000
支付方式
余额 或 次数卡
余额价格
75 / K tokens (输入)
225 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
暂无描述
[New]claude-opus-4.1
文字 · Anthropic
60 / K tokens (输入)
180 / K tokens (输出)
余额 或 次数卡
上下文长度
1000000
支付方式
余额 或 次数卡
余额价格
60 / K tokens (输入)
180 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
暂无描述
[New]claude-opus-4.1-thinking
文字 · Anthropic
75 / K tokens (输入)
225 / K tokens (输出)
余额 或 次数卡
上下文长度
1000000
支付方式
余额 或 次数卡
余额价格
75 / K tokens (输入)
225 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
暂无描述
[New]claude-sonnet-4
文字 · Anthropic
60 / K tokens (输入)
180 / K tokens (输出)
余额 或 次数卡
上下文长度
1000000
支付方式
余额 或 次数卡
余额价格
60 / K tokens (输入)
180 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
暂无描述
[New]claude-sonnet-4-thinking
文字 · Anthropic
75 / K tokens (输入)
225 / K tokens (输出)
余额 或 次数卡
上下文长度
1000000
支付方式
余额 或 次数卡
余额价格
75 / K tokens (输入)
225 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
暂无描述
claude-3-5-haiku
文字 · Anthropic
work
22.50 / K tokens (输入)
67.50 / K tokens (输出)
余额 或 次数卡
上下文长度
200000
支付方式
余额 或 次数卡
余额价格
22.50 / K tokens (输入)
67.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
claude-3-5-sonnet
文字 · Anthropic
work
60 / K tokens (输入)
180 / K tokens (输出)
余额 或 次数卡
上下文长度
200000
支付方式
余额 或 次数卡
余额价格
60 / K tokens (输入)
180 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
claude-3-5-sonnet-20240620
文字 · Anthropic
work
60 / K tokens (输入)
180 / K tokens (输出)
余额 或 次数卡
上下文长度
200000
支付方式
余额 或 次数卡
余额价格
60 / K tokens (输入)
180 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
claude-3-7-sonnet
文字 · Anthropic
work
60 / K tokens (输入)
180 / K tokens (输出)
余额 或 次数卡
上下文长度
200000
支付方式
余额 或 次数卡
余额价格
60 / K tokens (输入)
180 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
claude-3-7-sonnet-thinking
文字 · Anthropic
work
75 / K tokens (输入)
225 / K tokens (输出)
余额 或 次数卡
上下文长度
200000
支付方式
余额 或 次数卡
余额价格
75 / K tokens (输入)
225 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
claude-opus-4
文字 · Anthropic
work
60 / K tokens (输入)
180 / K tokens (输出)
余额 或 次数卡
上下文长度
200000
支付方式
余额 或 次数卡
余额价格
60 / K tokens (输入)
180 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
claude-opus-4-thinking
文字 · Anthropic
work
75 / K tokens (输入)
225 / K tokens (输出)
余额 或 次数卡
上下文长度
200000
支付方式
余额 或 次数卡
余额价格
75 / K tokens (输入)
225 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
claude-sonnet-4
文字 · Anthropic
work
60 / K tokens (输入)
180 / K tokens (输出)
余额 或 次数卡
上下文长度
200000
支付方式
余额 或 次数卡
余额价格
60 / K tokens (输入)
180 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
claude-sonnet-4-thinking
文字 · Anthropic
work
75 / K tokens (输入)
225 / K tokens (输出)
余额 或 次数卡
上下文长度
200000
支付方式
余额 或 次数卡
余额价格
75 / K tokens (输入)
225 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
doubao-seed-1-6
文字 · ByteDance
work
10.50 / K tokens (输入)
31.50 / K tokens (输出)
余额 或 次数卡
上下文长度
262144
支付方式
余额 或 次数卡
余额价格
10.50 / K tokens (输入)
31.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
doubao-seed-1-6-flash-250615
文字 · ByteDance
work
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度
262144
支付方式
余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
doubao-seed-1-6-flash-250615-nothinking
文字 · ByteDance
work
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度
262144
支付方式
余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
doubao-seed-1-6-flash-250715
文字 · ByteDance
work
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度
262144
支付方式
余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
doubao-seed-1-6-flash-250715-nothinking
文字 · ByteDance
work
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度
262144
支付方式
余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
doubao-seed-1-6-nothinking
文字 · ByteDance
work
10.50 / K tokens (输入)
31.50 / K tokens (输出)
余额 或 次数卡
上下文长度
262144
支付方式
余额 或 次数卡
余额价格
10.50 / K tokens (输入)
31.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
doubao-seed-1-6-vision
文字 · ByteDance
work
12 / K tokens (输入)
36 / K tokens (输出)
余额 或 次数卡
上下文长度
262144
支付方式
余额 或 次数卡
余额价格
12 / K tokens (输入)
36 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
doubao-seed-1-6-vision-nothinking
文字 · ByteDance
work
12 / K tokens (输入)
36 / K tokens (输出)
余额 或 次数卡
上下文长度
262144
支付方式
余额 或 次数卡
余额价格
12 / K tokens (输入)
36 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
GLM-4-9b
文字 · ChatGLM
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度
128000
支付方式
余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
GLM-4.5
文字 · ChatGLM
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度
131072
支付方式
余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
GLM-4.5-Air
文字 · ChatGLM
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度
131072
支付方式
余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
GLM-4.5-Air-nothinking
文字 · ChatGLM
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度
131072
支付方式
余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
GLM-4.5-nothinking
文字 · ChatGLM
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度
131072
支付方式
余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
[F]GLM-4.5
文字 · ChatGLM
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度
131072
支付方式
余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
[F]GLM-4.5-Air
文字 · ChatGLM
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度
131072
支付方式
余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
DeepSeek-Prover-V2-671B
文字 · DeepSeek
work
chat
4.50 / K tokens (输入)
13.50 / K tokens (输出)
余额 或 次数卡
上下文长度
160000
支付方式
余额 或 次数卡
余额价格
4.50 / K tokens (输入)
13.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
DeepSeek-Prover-V2 是一个专门为 Lean 4 形式定理证明设计的开源大语言模型。该模型基于由公司的 DeepSeek-V3 基础模型驱动的递归定理证明流程构建。
DeepSeek-R1
文字 · DeepSeek
work
chat
4.50 / K tokens (输入)
13.50 / K tokens (输出)
余额 或 次数卡
上下文长度
163840
支付方式
余额 或 次数卡
余额价格
4.50 / K tokens (输入)
13.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
先进的大型推理模型,以较低成本提供问题解决、数学和编程能力;会解释其思维过程。使用最新的2025年5月28日快照。
DeepSeek-V3
文字 · DeepSeek
work
chat
4.50 / K tokens (输入)
13.50 / K tokens (输出)
余额 或 次数卡
上下文长度
131072
支付方式
余额 或 次数卡
余额价格
4.50 / K tokens (输入)
13.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
DeepSeek-V3是一个开源的专家混合(MoE)语言模型;能够在竞争性基准测试中表现出色,并具有成本效益的训练和推理能力。
DeepSeek-V3.1
文字 · DeepSeek
work
chat
4.50 / K tokens (输入)
13.50 / K tokens (输出)
余额 或 次数卡
上下文长度
163840
支付方式
余额 或 次数卡
余额价格
4.50 / K tokens (输入)
13.50 / K tokens (输出)
次数卡消耗
0.5 次/次调用
模型描述
DeepSeek-V3.1是在DeepSeek-V3-Base的基础上进行后期训练的,该基础模型是通过两阶段长上下文扩展方法在原始V3基础检查点上构建的,遵循原始DeepSeek-V3报告中概述的方法。它支持128k词元的上下文窗口。
DeepSeek-V3.1-nothinking
文字 · DeepSeek
work
chat
4.50 / K tokens (输入)
13.50 / K tokens (输出)
余额 或 次数卡
上下文长度
163840
支付方式
余额 或 次数卡
余额价格
4.50 / K tokens (输入)
13.50 / K tokens (输出)
次数卡消耗
0.5 次/次调用
模型描述
DeepSeek-V3.1是在DeepSeek-V3-Base的基础上进行后期训练的,该基础模型是通过两阶段长上下文扩展方法在原始V3基础检查点上构建的,遵循原始DeepSeek-V3报告中概述的方法。
DeepSeek-VL2
文字 · DeepSeek
4.50 / K tokens (输入)
13.50 / K tokens (输出)
余额 或 次数卡
上下文长度
128000
支付方式
余额 或 次数卡
余额价格
4.50 / K tokens (输入)
13.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
DeepSeek-VL2 是一个基于 DeepSeekMoE-27B 开发的混合专家(MoE)视觉语言模型,采用稀疏激活的 MoE 架构,在仅激活 4.5B 参数的情况下实现了卓越性能。该模型在视觉问答、光学字符识别、文档/表格/图表理解和视觉定位等多个任务中表现优异,与现有的开源密集模型和基于 MoE 的模型相比,在使用相同或更少的激活参数的情况下,实现了具有竞争力的或最先进的性能表现。
[F]DeepSeek-R1
文字 · DeepSeek
work
chat
4.50 / K tokens (输入)
13.50 / K tokens (输出)
余额 或 次数卡
上下文长度
160000
支付方式
余额 或 次数卡
余额价格
4.50 / K tokens (输入)
13.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
先进的大型推理模型,以较低成本提供问题解决、数学和编程能力;会解释其思维过程。使用最新的2025年5月28日快照。
[F]DeepSeek-R1-0528
文字 · DeepSeek
work
chat
4.50 / K tokens (输入)
13.50 / K tokens (输出)
余额 或 次数卡
上下文长度
160000
支付方式
余额 或 次数卡
余额价格
4.50 / K tokens (输入)
13.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
先进的大型推理模型,以较低成本提供问题解决、数学和编程能力;会解释其思维过程。使用最新的2025年5月28日快照。
[F]DeepSeek-R1-Fast
文字 · DeepSeek
work
chat
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度
160000
支付方式
余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
先进的大型推理模型,以较低成本提供问题解决、数学和编程能力;会解释其思维过程。使用最新的2025年5月28日快照。
[F]DeepSeek-V3
文字 · DeepSeek
work
chat
4.50 / K tokens (输入)
13.50 / K tokens (输出)
余额 或 次数卡
上下文长度
128000
支付方式
余额 或 次数卡
余额价格
4.50 / K tokens (输入)
13.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
DeepSeek-V3是一个开源的专家混合(MoE)语言模型;能够在竞争性基准测试中表现出色,并具有成本效益的训练和推理能力。
[F]DeepSeek-V3-0324
文字 · DeepSeek
work
chat
4.50 / K tokens (输入)
13.50 / K tokens (输出)
余额 或 次数卡
上下文长度
131072
支付方式
余额 或 次数卡
余额价格
4.50 / K tokens (输入)
13.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
DeepSeek-V3是一个开源的专家混合(MoE)语言模型;能够在竞争性基准测试中表现出色,并具有成本效益的训练和推理能力。
[F]DeepSeek-V3.1
文字 · DeepSeek
work
chat
4.50 / K tokens (输入)
13.50 / K tokens (输出)
余额 或 次数卡
上下文长度
163840
支付方式
余额 或 次数卡
余额价格
4.50 / K tokens (输入)
13.50 / K tokens (输出)
次数卡消耗
0.5 次/次调用
模型描述
DeepSeek-V3.1是在DeepSeek-V3-Base的基础上进行后期训练的,该基础模型是通过两阶段长上下文扩展方法在原始V3基础检查点上构建的,遵循原始DeepSeek-V3报告中概述的方法。
[F]DeepSeek-V3.1-nothinking
文字 · DeepSeek
work
chat
4.50 / K tokens (输入)
13.50 / K tokens (输出)
余额 或 次数卡
上下文长度
163840
支付方式
余额 或 次数卡
余额价格
4.50 / K tokens (输入)
13.50 / K tokens (输出)
次数卡消耗
0.5 次/次调用
模型描述
DeepSeek-V3.1是在DeepSeek-V3-Base的基础上进行后期训练的,该基础模型是通过两阶段长上下文扩展方法在原始V3基础检查点上构建的,遵循原始DeepSeek-V3报告中概述的方法。
[F]DeepSeek-V3.1-thinking
文字 · DeepSeek
work
chat
4.50 / K tokens (输入)
13.50 / K tokens (输出)
余额 或 次数卡
上下文长度
163840
支付方式
余额 或 次数卡
余额价格
4.50 / K tokens (输入)
13.50 / K tokens (输出)
次数卡消耗
0.5 次/次调用
模型描述
DeepSeek-V3.1是在DeepSeek-V3-Base的基础上进行后期训练的,该基础模型是通过两阶段长上下文扩展方法在原始V3基础检查点上构建的,遵循原始DeepSeek-V3报告中概述的方法。
[G]gemini-2.5-pro
文字 · Google
work
chat
37.50 / K tokens (输入)
112.50 / K tokens (输出)
余额 或 次数卡
上下文长度
1000000
支付方式
余额 或 次数卡
余额价格
37.50 / K tokens (输入)
112.50 / K tokens (输出)
次数卡消耗
1.5 次/次调用
模型描述
[G]gemini-2.5-pro-EXPRESS
文字 · Google
chat
14999999985 / K tokens (输入)
44999999955 / K tokens (输出)
余额 或 次数卡
上下文长度
2000000
支付方式
余额 或 次数卡
余额价格
14999999985 / K tokens (输入)
44999999955 / K tokens (输出)
次数卡消耗
2.5 次/次调用
模型描述
[G]gemini-2.5-pro-preview-03-25
文字 · Google
work
chat
37.50 / K tokens (输入)
112.50 / K tokens (输出)
余额 或 次数卡
上下文长度
1000000
支付方式
余额 或 次数卡
余额价格
37.50 / K tokens (输入)
112.50 / K tokens (输出)
次数卡消耗
1.5 次/次调用
模型描述
[G]gemini-2.5-pro-preview-05-06
文字 · Google
work
chat
37.50 / K tokens (输入)
112.50 / K tokens (输出)
余额 或 次数卡
上下文长度
1000000
支付方式
余额 或 次数卡
余额价格
37.50 / K tokens (输入)
112.50 / K tokens (输出)
次数卡消耗
1.5 次/次调用
模型描述
[G]gemini-2.5-pro-preview-06-05
文字 · Google
work
chat
37.50 / K tokens (输入)
112.50 / K tokens (输出)
余额 或 次数卡
上下文长度
1000000
支付方式
余额 或 次数卡
余额价格
37.50 / K tokens (输入)
112.50 / K tokens (输出)
次数卡消耗
1.5 次/次调用
模型描述
[G]gemini-2.5-pro-preview-06-05-EXPRESS
文字 · Google
chat
14999999985 / K tokens (输入)
44999999955 / K tokens (输出)
余额 或 次数卡
上下文长度
2000000
支付方式
余额 或 次数卡
余额价格
14999999985 / K tokens (输入)
44999999955 / K tokens (输出)
次数卡消耗
2.5 次/次调用
模型描述
[G]gemini-2.5-pro-thinking
文字 · Google
work
chat
37.50 / K tokens (输入)
112.50 / K tokens (输出)
余额 或 次数卡
上下文长度
1000000
支付方式
余额 或 次数卡
余额价格
37.50 / K tokens (输入)
112.50 / K tokens (输出)
次数卡消耗
1.5 次/次调用
模型描述
[G]gemini-2.5-pro-满血
文字 · Google
work
chat
52.50 / K tokens (输入)
157.50 / K tokens (输出)
余额 或 次数卡
上下文长度
1000000
支付方式
余额 或 次数卡
余额价格
52.50 / K tokens (输入)
157.50 / K tokens (输出)
次数卡消耗
5.0 次/次调用
模型描述
[New]gemini-2.5-pro
文字 · Google
work
12 / K tokens (输入)
36 / K tokens (输出)
余额 或 次数卡
上下文长度
1000000
支付方式
余额 或 次数卡
余额价格
12 / K tokens (输入)
36 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
[WD]gemini-2.5-pro
文字 · Google
work
chat
149999999985 / K tokens (输入)
449999999955 / K tokens (输出)
余额 或 次数卡
上下文长度
2000000
支付方式
余额 或 次数卡
余额价格
149999999985 / K tokens (输入)
449999999955 / K tokens (输出)
次数卡消耗
1.5 次/次调用
模型描述
[WD]gemini-2.5-pro-preview-05-06
文字 · Google
work
chat
149999999985 / K tokens (输入)
449999999955 / K tokens (输出)
余额 或 次数卡
上下文长度
2000000
支付方式
余额 或 次数卡
余额价格
149999999985 / K tokens (输入)
449999999955 / K tokens (输出)
次数卡消耗
1.5 次/次调用
模型描述
[WD]gemini-2.5-pro-preview-06-05
文字 · Google
work
chat
149999999985 / K tokens (输入)
449999999955 / K tokens (输出)
余额 或 次数卡
上下文长度
2000000
支付方式
余额 或 次数卡
余额价格
149999999985 / K tokens (输入)
449999999955 / K tokens (输出)
次数卡消耗
1.5 次/次调用
模型描述
gemini-2.0-flash
文字 · Google
3 / K tokens (输入)
9 / K tokens (输出)
余额 或 次数卡
上下文长度
1000000
支付方式
余额 或 次数卡
余额价格
3 / K tokens (输入)
9 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gemini-2.0-flash-lite
文字 · Google
2.25 / K tokens (输入)
6.75 / K tokens (输出)
余额 或 次数卡
上下文长度
1000000
支付方式
余额 或 次数卡
余额价格
2.25 / K tokens (输入)
6.75 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gemini-2.0-flash-preview
文字 · Google
3.75 / K tokens (输入)
11.25 / K tokens (输出)
余额 或 次数卡
上下文长度
1000000
支付方式
余额 或 次数卡
余额价格
3.75 / K tokens (输入)
11.25 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gemini-2.5-flash
文字 · Google
work
4.50 / K tokens (输入)
13.50 / K tokens (输出)
余额 或 次数卡
上下文长度
1000000
支付方式
余额 或 次数卡
余额价格
4.50 / K tokens (输入)
13.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gemini-2.5-flash-lite-preview-06-17
文字 · Google
work
chat
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度
1000000
支付方式
余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gemini-2.5-flash-lite-preview-06-17-nothinking
文字 · Google
work
chat
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度
1000000
支付方式
余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gemini-2.5-flash-lite-preview-06-17-search
文字 · Google
work
chat
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度
1000000
支付方式
余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gemini-2.5-flash-lite-preview-06-17-search-nothinking
文字 · Google
work
chat
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度
1000000
支付方式
余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gemini-2.5-flash-nothinking
文字 · Google
work
4.50 / K tokens (输入)
13.50 / K tokens (输出)
余额 或 次数卡
上下文长度
1000000
支付方式
余额 或 次数卡
余额价格
4.50 / K tokens (输入)
13.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gemini-2.5-flash-search
文字 · Google
work
4.50 / K tokens (输入)
13.50 / K tokens (输出)
余额 或 次数卡
上下文长度
1000000
支付方式
余额 或 次数卡
余额价格
4.50 / K tokens (输入)
13.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gemini-2.5-flash-search-nothinking
文字 · Google
work
4.50 / K tokens (输入)
13.50 / K tokens (输出)
余额 或 次数卡
上下文长度
1000000
支付方式
余额 或 次数卡
余额价格
4.50 / K tokens (输入)
13.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gemini-2.5-pro
文字 · Google
work
12 / K tokens (输入)
36 / K tokens (输出)
余额 或 次数卡
上下文长度
216384
支付方式
余额 或 次数卡
余额价格
12 / K tokens (输入)
36 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gemini-2.5-pro-nothinking
文字 · Google
work
12 / K tokens (输入)
36 / K tokens (输出)
余额 或 次数卡
上下文长度
216384
支付方式
余额 或 次数卡
余额价格
12 / K tokens (输入)
36 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gemini-2.5-pro-search
文字 · Google
work
12 / K tokens (输入)
36 / K tokens (输出)
余额 或 次数卡
上下文长度
216384
支付方式
余额 或 次数卡
余额价格
12 / K tokens (输入)
36 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gemini-2.5-pro-search-nothinking
文字 · Google
work
12 / K tokens (输入)
36 / K tokens (输出)
余额 或 次数卡
上下文长度
216384
支付方式
余额 或 次数卡
余额价格
12 / K tokens (输入)
36 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gemma-7b
文字 · Google
0.45 / K tokens (输入)
1.35 / K tokens (输出)
余额 或 次数卡
上下文长度
128000
支付方式
余额 或 次数卡
余额价格
0.45 / K tokens (输入)
1.35 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
palm-2
文字 · Google
1.50 / K tokens (输入)
4.50 / K tokens (输出)
余额 或 次数卡
上下文长度
64000
支付方式
余额 或 次数卡
余额价格
1.50 / K tokens (输入)
4.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
phi-4
文字 · Google
2.25 / K tokens (输入)
6.75 / K tokens (输出)
余额 或 次数卡
上下文长度
128000
支付方式
余额 或 次数卡
余额价格
2.25 / K tokens (输入)
6.75 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
[F]kimi-k2-instruct
文字 · Kimi
work
10.50 / K tokens (输入)
31.50 / K tokens (输出)
余额 或 次数卡
上下文长度
131072
支付方式
余额 或 次数卡
余额价格
10.50 / K tokens (输入)
31.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
Kimi K2是一个最先进的专家混合语言模型,具有320亿个激活参数和1万亿个总参数。使用Muon优化器训练,在前沿知识,推理和编码任务中实现卓越的性能,同时针对代理功能进行精心优化。
[F]kimi-k2-instruct-0905
文字 · Kimi
work
10.50 / K tokens (输入)
31.50 / K tokens (输出)
余额 或 次数卡
上下文长度
262144
支付方式
余额 或 次数卡
余额价格
10.50 / K tokens (输入)
31.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
Kimi K2 0905 是 Kimi K2 0711 的九月更新版本。它是由月之暗面(Moonshot AI)开发的大规模专家混合(MoE)语言模型,拥有1万亿总参数,每次前向传播激活320亿参数。该模型支持长上下文推理,最高可达25.6万tokens,相比之前的12.8万tokens有所扩展。 此次更新改进了智能体编程能力,在各种框架中实现了更高准确性和更好的泛化性能,并增强了前端编程能力,在网页、3D及相关任务中提供更美观和实用的输出。Kimi K2 针对智能体能力进行了优化,包括高级工具使用、推理和代码合成。该模型在编程(LiveCodeBench、SWE-bench)、推理(ZebraLogic、GPQA)和工具使用(Tau2、AceBench)等基准测试中表现优异。该模型采用创新技术栈进行训练,结合了MuonClip优化器,确保大规模MoE训练的稳定性。
kimi-k2-0711
文字 · Kimi
work
10.50 / K tokens (输入)
31.50 / K tokens (输出)
余额 或 次数卡
上下文长度
131072
支付方式
余额 或 次数卡
余额价格
10.50 / K tokens (输入)
31.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
Kimi K2是一个最先进的专家混合语言模型,具有320亿个激活参数和1万亿个总参数。使用Muon优化器训练,在前沿知识,推理和编码任务中实现卓越的性能,同时针对代理功能进行精心优化。
kimi-k2-0905
文字 · Kimi
work
10.50 / K tokens (输入)
31.50 / K tokens (输出)
余额 或 次数卡
上下文长度
262144
支付方式
余额 或 次数卡
余额价格
10.50 / K tokens (输入)
31.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
Kimi K2 0905 是 Kimi K2 0711 的九月更新版本。它是由月之暗面(Moonshot AI)开发的大规模专家混合(MoE)语言模型,拥有1万亿总参数,每次前向传播激活320亿参数。该模型支持长上下文推理,最高可达25.6万tokens,相比之前的12.8万tokens有所扩展。 此次更新改进了智能体编程能力,在各种框架中实现了更高准确性和更好的泛化性能,并增强了前端编程能力,在网页、3D及相关任务中提供更美观和实用的输出。Kimi K2 针对智能体能力进行了优化,包括高级工具使用、推理和代码合成。该模型在编程(LiveCodeBench、SWE-bench)、推理(ZebraLogic、GPQA)和工具使用(Tau2、AceBench)等基准测试中表现优异。该模型采用创新技术栈进行训练,结合了MuonClip优化器,确保大规模MoE训练的稳定性。
llama-4-maverick
文字 · Meta
3 / K tokens (输入)
9 / K tokens (输出)
余额 或 次数卡
上下文长度
1050000
支付方式
余额 或 次数卡
余额价格
3 / K tokens (输入)
9 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
llama-4-scout
文字 · Meta
2.25 / K tokens (输入)
6.75 / K tokens (输出)
余额 或 次数卡
上下文长度
300000
支付方式
余额 或 次数卡
余额价格
2.25 / K tokens (输入)
6.75 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
MiniMax-M1-80k
文字 · MiniMax
work
10.50 / K tokens (输入)
31.50 / K tokens (输出)
余额 或 次数卡
上下文长度
128000
支付方式
余额 或 次数卡
余额价格
10.50 / K tokens (输入)
31.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
magistral-medium-2506(thinking)
文字 · Mistral AI
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度
40960
支付方式
余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
mistral-NeMo
文字 · Mistral AI
1.50 / K tokens (输入)
4.50 / K tokens (输出)
余额 或 次数卡
上下文长度
128000
支付方式
余额 或 次数卡
余额价格
1.50 / K tokens (输入)
4.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
mistral-large-2
文字 · Mistral AI
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度
128000
支付方式
余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
mistral-medium
文字 · Mistral AI
2.25 / K tokens (输入)
6.75 / K tokens (输出)
余额 或 次数卡
上下文长度
32000
支付方式
余额 或 次数卡
余额价格
2.25 / K tokens (输入)
6.75 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
mistral-medium-3
文字 · Mistral AI
1.50 / K tokens (输入)
4.50 / K tokens (输出)
余额 或 次数卡
上下文长度
131072
支付方式
余额 或 次数卡
余额价格
1.50 / K tokens (输入)
4.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
mistral-small-3
文字 · Mistral AI
1.50 / K tokens (输入)
4.50 / K tokens (输出)
余额 或 次数卡
上下文长度
128000
支付方式
余额 或 次数卡
余额价格
1.50 / K tokens (输入)
4.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
mistral-small-3.1
文字 · Mistral AI
1.50 / K tokens (输入)
4.50 / K tokens (输出)
余额 或 次数卡
上下文长度
128000
支付方式
余额 或 次数卡
余额价格
1.50 / K tokens (输入)
4.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
mistral-small-3.2
文字 · Mistral AI
1.50 / K tokens (输入)
4.50 / K tokens (输出)
余额 或 次数卡
上下文长度
131072
支付方式
余额 或 次数卡
余额价格
1.50 / K tokens (输入)
4.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
[New]gpt-4.1
文字 · OpenAI
work
41.25 / K tokens (输入)
123.75 / K tokens (输出)
余额 或 次数卡
上下文长度
1000000
支付方式
余额 或 次数卡
余额价格
41.25 / K tokens (输入)
123.75 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
[New]gpt-4o
文字 · OpenAI
work
52.50 / K tokens (输入)
157.50 / K tokens (输出)
余额 或 次数卡
上下文长度
128000
支付方式
余额 或 次数卡
余额价格
52.50 / K tokens (输入)
157.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
[New]o3
文字 · OpenAI
work
120 / K tokens (输入)
360 / K tokens (输出)
余额 或 次数卡
上下文长度
200000
支付方式
余额 或 次数卡
余额价格
120 / K tokens (输入)
360 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
[New]o3-mini
文字 · OpenAI
work
90 / K tokens (输入)
270 / K tokens (输出)
余额 或 次数卡
上下文长度
200000
支付方式
余额 或 次数卡
余额价格
90 / K tokens (输入)
270 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
[New]o4-mini
文字 · OpenAI
work
45 / K tokens (输入)
135 / K tokens (输出)
余额 或 次数卡
上下文长度
200000
支付方式
余额 或 次数卡
余额价格
45 / K tokens (输入)
135 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
chatgpt-4o-latest
文字 · OpenAI
work
37.50 / K tokens (输入)
112.50 / K tokens (输出)
余额 或 次数卡
上下文长度
128000
支付方式
余额 或 次数卡
余额价格
37.50 / K tokens (输入)
112.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gpt-3.5-turbo
文字 · OpenAI
10.50 / K tokens (输入)
31.50 / K tokens (输出)
余额 或 次数卡
上下文长度
16384
支付方式
余额 或 次数卡
余额价格
10.50 / K tokens (输入)
31.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gpt-3.5-turbo-instruct
文字 · OpenAI
10.50 / K tokens (输入)
31.50 / K tokens (输出)
余额 或 次数卡
上下文长度
16384
支付方式
余额 或 次数卡
余额价格
10.50 / K tokens (输入)
31.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gpt-4-turbo
文字 · OpenAI
work
37.50 / K tokens (输入)
112.50 / K tokens (输出)
余额 或 次数卡
上下文长度
128000
支付方式
余额 或 次数卡
余额价格
37.50 / K tokens (输入)
112.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gpt-4.1-2025-04-14
文字 · OpenAI
work
41.25 / K tokens (输入)
123.75 / K tokens (输出)
余额 或 次数卡
上下文长度
1000000
支付方式
余额 或 次数卡
余额价格
41.25 / K tokens (输入)
123.75 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gpt-4.1-mini-2025-04-14
文字 · OpenAI
work
18.75 / K tokens (输入)
56.25 / K tokens (输出)
余额 或 次数卡
上下文长度
1000000
支付方式
余额 或 次数卡
余额价格
18.75 / K tokens (输入)
56.25 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gpt-4.1-nano-2025-04-14
文字 · OpenAI
work
11.25 / K tokens (输入)
33.75 / K tokens (输出)
余额 或 次数卡
上下文长度
1000000
支付方式
余额 或 次数卡
余额价格
11.25 / K tokens (输入)
33.75 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gpt-4o-2024-08-06
文字 · OpenAI
work
37.50 / K tokens (输入)
112.50 / K tokens (输出)
余额 或 次数卡
上下文长度
128000
支付方式
余额 或 次数卡
余额价格
37.50 / K tokens (输入)
112.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gpt-4o-2024-11-20
文字 · OpenAI
work
37.50 / K tokens (输入)
112.50 / K tokens (输出)
余额 或 次数卡
上下文长度
128000
支付方式
余额 或 次数卡
余额价格
37.50 / K tokens (输入)
112.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gpt-4o-mini
文字 · OpenAI
work
3 / K tokens (输入)
9 / K tokens (输出)
余额 或 次数卡
上下文长度
128000
支付方式
余额 或 次数卡
余额价格
3 / K tokens (输入)
9 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gpt-4o-mini-search
文字 · OpenAI
15 / K tokens (输入)
45 / K tokens (输出)
余额 或 次数卡
上下文长度
128000
支付方式
余额 或 次数卡
余额价格
15 / K tokens (输入)
45 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gpt-4o-search
文字 · OpenAI
48.75 / K tokens (输入)
146.25 / K tokens (输出)
余额 或 次数卡
上下文长度
128000
支付方式
余额 或 次数卡
余额价格
48.75 / K tokens (输入)
146.25 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gpt-5-2025-08-07
文字 · OpenAI
work
12 / K tokens (输入)
36 / K tokens (输出)
余额 或 次数卡
上下文长度
400000
支付方式
余额 或 次数卡
余额价格
12 / K tokens (输入)
36 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gpt-5-2025-08-07-search
文字 · OpenAI
work
12 / K tokens (输入)
36 / K tokens (输出)
余额 或 次数卡
上下文长度
400000
支付方式
余额 或 次数卡
余额价格
12 / K tokens (输入)
36 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gpt-5-chat-latest
文字 · OpenAI
work
12 / K tokens (输入)
36 / K tokens (输出)
余额 或 次数卡
上下文长度
400000
支付方式
余额 或 次数卡
余额价格
12 / K tokens (输入)
36 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
GPT-5 是 OpenAI 的最新旗舰模型,具有显著提升的编程能力、长文本处理能力(40万个标记)和更好的指令遵循能力。支持原生视觉功能,整体智能水平超过 GPT-4.1。
gpt-5-mini-2025-08-07
文字 · OpenAI
work
4.50 / K tokens (输入)
13.50 / K tokens (输出)
余额 或 次数卡
上下文长度
400000
支付方式
余额 或 次数卡
余额价格
4.50 / K tokens (输入)
13.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gpt-5-mini-2025-08-07-search
文字 · OpenAI
work
4.50 / K tokens (输入)
13.50 / K tokens (输出)
余额 或 次数卡
上下文长度
400000
支付方式
余额 或 次数卡
余额价格
4.50 / K tokens (输入)
13.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gpt-5-nano-2025-08-07
文字 · OpenAI
work
1.50 / K tokens (输入)
4.50 / K tokens (输出)
余额 或 次数卡
上下文长度
400000
支付方式
余额 或 次数卡
余额价格
1.50 / K tokens (输入)
4.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
gpt-oss-120b
文字 · OpenAI
work
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度
200000
支付方式
余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
GPT-OSS-120b 是一个高性能开放权重语言模型,专为生产级通用场景设计。它可以在单个H100 GPU上运行,无需多GPU基础设施即可使用。该模型基于Harmony响应格式训练,在复杂推理方面表现出色,支持可配置的推理强度、完全透明的思维链过程以便于调试和建立信任,并具有原生代理功能,可用于函数调用、工具使用和结构化输出。
gpt-oss-20b
文字 · OpenAI
work
6 / K tokens (输入)
18 / K tokens (输出)
余额 或 次数卡
上下文长度
200000
支付方式
余额 或 次数卡
余额价格
6 / K tokens (输入)
18 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
GPT-OSS-20b 是一个紧凑型开放权重语言模型,针对低延迟和资源受限的环境进行了优化,包括本地和边缘部署。它与120B共享相同的Harmony训练基础和功能,具有更快的推理速度和更简便的部署方式,非常适合专业化或离线使用场景、快速响应性能、思维链输出和可调节的推理水平,以及代理工作流程。
o3
文字 · OpenAI
work
120 / K tokens (输入)
360 / K tokens (输出)
余额 或 次数卡
上下文长度
200000
支付方式
余额 或 次数卡
余额价格
120 / K tokens (输入)
360 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
o3-mini
文字 · OpenAI
work
90 / K tokens (输入)
270 / K tokens (输出)
余额 或 次数卡
上下文长度
200000
支付方式
余额 或 次数卡
余额价格
90 / K tokens (输入)
270 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
o4-mini
文字 · OpenAI
work
45 / K tokens (输入)
135 / K tokens (输出)
余额 或 次数卡
上下文长度
200000
支付方式
余额 或 次数卡
余额价格
45 / K tokens (输入)
135 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
InternLM2.5-20B
文字 · OpenGVLab
60 / K tokens (输入)
180 / K tokens (输出)
余额 或 次数卡
上下文长度
128000
支付方式
余额 或 次数卡
余额价格
60 / K tokens (输入)
180 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
InternLM2.5-7B
文字 · OpenGVLab
60 / K tokens (输入)
180 / K tokens (输出)
余额 或 次数卡
上下文长度
128000
支付方式
余额 或 次数卡
余额价格
60 / K tokens (输入)
180 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
InternVL2-26B
文字 · OpenGVLab
60 / K tokens (输入)
180 / K tokens (输出)
余额 或 次数卡
上下文长度
128000
支付方式
余额 或 次数卡
余额价格
60 / K tokens (输入)
180 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
ppl-sonar
文字 · Perplexity
work
22.50 / K tokens (输入)
67.50 / K tokens (输出)
余额 或 次数卡
上下文长度
131072
支付方式
余额 或 次数卡
余额价格
22.50 / K tokens (输入)
67.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
ppl-sonar-pro-hign
文字 · Perplexity
work
33.75 / K tokens (输入)
101.25 / K tokens (输出)
余额 或 次数卡
上下文长度
131072
支付方式
余额 或 次数卡
余额价格
33.75 / K tokens (输入)
101.25 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
ppl-sonar-reasoning
文字 · Perplexity
work
30 / K tokens (输入)
90 / K tokens (输出)
余额 或 次数卡
上下文长度
163840
支付方式
余额 或 次数卡
余额价格
30 / K tokens (输入)
90 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
ppl-sonar-reasoning-pro-hign
文字 · Perplexity
work
41.25 / K tokens (输入)
123.75 / K tokens (输出)
余额 或 次数卡
上下文长度
163840
支付方式
余额 或 次数卡
余额价格
41.25 / K tokens (输入)
123.75 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
QwQ-32B
文字 · Qwen
45 / K tokens (输入)
135 / K tokens (输出)
余额 或 次数卡
上下文长度
131072
支付方式
余额 或 次数卡
余额价格
45 / K tokens (输入)
135 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
Qwen-Plus-2025-01-12
文字 · Qwen
45 / K tokens (输入)
135 / K tokens (输出)
余额 或 次数卡
上下文长度
128000
支付方式
余额 或 次数卡
余额价格
45 / K tokens (输入)
135 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
Qwen2.5-14B-Instruct
文字 · Qwen
15 / K tokens (输入)
45 / K tokens (输出)
余额 或 次数卡
上下文长度
128000
支付方式
余额 或 次数卡
余额价格
15 / K tokens (输入)
45 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
Qwen2.5-32B-Instruct
文字 · Qwen
15 / K tokens (输入)
45 / K tokens (输出)
余额 或 次数卡
上下文长度
128000
支付方式
余额 或 次数卡
余额价格
15 / K tokens (输入)
45 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
Qwen2.5-72B-Instruct
文字 · Qwen
15 / K tokens (输入)
45 / K tokens (输出)
余额 或 次数卡
上下文长度
128000
支付方式
余额 或 次数卡
余额价格
15 / K tokens (输入)
45 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
Qwen2.5-7B-Instruct
文字 · Qwen
15 / K tokens (输入)
45 / K tokens (输出)
余额 或 次数卡
上下文长度
128000
支付方式
余额 或 次数卡
余额价格
15 / K tokens (输入)
45 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
Qwen2.5-Coder-32B-Instruct
文字 · Qwen
15 / K tokens (输入)
45 / K tokens (输出)
余额 或 次数卡
上下文长度
128000
支付方式
余额 或 次数卡
余额价格
15 / K tokens (输入)
45 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
Qwen2.5-Coder-7B-Instruct
文字 · Qwen
15 / K tokens (输入)
45 / K tokens (输出)
余额 或 次数卡
上下文长度
128000
支付方式
余额 或 次数卡
余额价格
15 / K tokens (输入)
45 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
Qwen2.5-VL-32B
文字 · Qwen
15 / K tokens (输入)
45 / K tokens (输出)
余额 或 次数卡
上下文长度
128000
支付方式
余额 或 次数卡
余额价格
15 / K tokens (输入)
45 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
Qwen3-235B-A22B-2507-Instruct
文字 · Qwen
work
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度
262144
支付方式
余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
Qwen3-235B-A22B-2507-Thinking
文字 · Qwen
work
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度
262144
支付方式
余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
Qwen3-30B-A3B-2507-Instruct
文字 · Qwen
work
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度
262144
支付方式
余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
Qwen3-32B
文字 · Qwen
work
1.50 / K tokens (输入)
4.50 / K tokens (输出)
余额 或 次数卡
上下文长度
128000
支付方式
余额 或 次数卡
余额价格
1.50 / K tokens (输入)
4.50 / K tokens (输出)
次数卡消耗
0.1 次/次调用
模型描述
Qwen3-Coder-30B-A3B-Instruct
文字 · Qwen
work
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度
262144
支付方式
余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
Qwen3-Coder-480B-A35B-Instruct
文字 · Qwen
work
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度
262144
支付方式
余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
Qwen3-Max
文字 · Qwen
work
6 / K tokens (输入)
18 / K tokens (输出)
余额 或 次数卡
上下文长度
131072
支付方式
余额 或 次数卡
余额价格
6 / K tokens (输入)
18 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
Qwen3-Max是Qwen3系列的重大更新,在推理,指导和多语言支持方面提供了显着的改进。它在编码和数学等复杂任务中提供了更高的准确度,同时减少了幻觉,在开放式问题上表现更好。
Qwen3-Next-80B-Instruct
文字 · Qwen
work
4.50 / K tokens (输入)
13.50 / K tokens (输出)
余额 或 次数卡
上下文长度
65536
支付方式
余额 或 次数卡
余额价格
4.50 / K tokens (输入)
13.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
Qwen3-Next-80B-Thinking
文字 · Qwen
work
4.50 / K tokens (输入)
13.50 / K tokens (输出)
余额 或 次数卡
上下文长度
65536
支付方式
余额 或 次数卡
余额价格
4.50 / K tokens (输入)
13.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
[F]Qwen3-235B-A22B
文字 · Qwen
work
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度
131072
支付方式
余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
[F]Qwen3-235B-A22B-2507-Instruct
文字 · Qwen
work
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度
262144
支付方式
余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
[F]Qwen3-235B-A22B-2507-Thinking
文字 · Qwen
work
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度
262144
支付方式
余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
[F]Qwen3-30B-A3B
文字 · Qwen
work
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度
262144
支付方式
余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
[F]Qwen3-30B-A3B-2507-Instruct
文字 · Qwen
work
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度
262144
支付方式
余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
[F]Qwen3-30B-A3B-2507-Thinking
文字 · Qwen
work
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度
262144
支付方式
余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
[F]Qwen3-Coder-30B-A3B-Instruct
文字 · Qwen
work
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度
262144
支付方式
余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
[F]Qwen3-Coder-480B-A35B-Instruct
文字 · Qwen
work
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度
262144
支付方式
余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
Grok-4-Fast
文字 · xAI
work
chat
1.50 / K tokens (输入)
4.50 / K tokens (输出)
余额 或 次数卡
上下文长度
2000000
支付方式
余额 或 次数卡
余额价格
1.50 / K tokens (输入)
4.50 / K tokens (输出)
次数卡消耗
0.3 次/次调用
模型描述
Grok 4 Fast 专为内容生成和网页或 X 搜索等快速高效的任务而设计,具有200万字符的上下文窗口。它将尖端性能与成本效益相结合,确保日常简单应用能获得高质量的结果。
Grok-4-Fast-Reasoning
文字 · xAI
work
chat
1.50 / K tokens (输入)
4.50 / K tokens (输出)
余额 或 次数卡
上下文长度
2000000
支付方式
余额 或 次数卡
余额价格
1.50 / K tokens (输入)
4.50 / K tokens (输出)
次数卡消耗
0.3 次/次调用
模型描述
Grok 4 Fast Reasoning 在需要逻辑思维和问题解决的任务中表现出色。凭借200万token的上下文窗口和最先进的成本效益,它能够准确快速地处理复杂的推理任务,让更多用户能够使用先进的AI功能。
[New]grok-3-beta
文字 · xAI
work
30 / K tokens (输入)
90 / K tokens (输出)
余额 或 次数卡
上下文长度
200000
支付方式
余额 或 次数卡
余额价格
30 / K tokens (输入)
90 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
grok-2-1212
文字 · xAI
30 / K tokens (输入)
90 / K tokens (输出)
余额 或 次数卡
上下文长度
128000
支付方式
余额 或 次数卡
余额价格
30 / K tokens (输入)
90 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
grok-3-beta
文字 · xAI
work
30 / K tokens (输入)
90 / K tokens (输出)
余额 或 次数卡
上下文长度
131072
支付方式
余额 或 次数卡
余额价格
30 / K tokens (输入)
90 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
grok-3-mini-beta
文字 · xAI
work
22.50 / K tokens (输入)
67.50 / K tokens (输出)
余额 或 次数卡
上下文长度
131072
支付方式
余额 或 次数卡
余额价格
22.50 / K tokens (输入)
67.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
grok-4
文字 · xAI
work
chat
27 / K tokens (输入)
81 / K tokens (输出)
余额 或 次数卡
上下文长度
262144
支付方式
余额 或 次数卡
余额价格
27 / K tokens (输入)
81 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
grok-beta
文字 · xAI
37.50 / K tokens (输入)
112.50 / K tokens (输出)
余额 或 次数卡
上下文长度
128000
支付方式
余额 或 次数卡
余额价格
37.50 / K tokens (输入)
112.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
grok-code-fast-1
文字 · xAI
work
chat
7.50 / K tokens (输入)
22.50 / K tokens (输出)
余额 或 次数卡
上下文长度
262144
支付方式
余额 或 次数卡
余额价格
7.50 / K tokens (输入)
22.50 / K tokens (输出)
次数卡消耗
1.0 次/次调用
模型描述
Hunyuan-Image-2.1
图像 · Alibaba
2250
Pisces Coin
/ 次调用
余额 或 次数卡
上下文长度
12800
支付方式
余额 或 次数卡
余额价格
2250
Pisces Coin
/ 次调用
次数卡消耗
1.0 次/次调用
模型描述
Qwen-Image (20B)是Qwen系列中的一个图像生成基础模型,在复杂文本渲染方面取得了重大进展。
Qwen-Edit-20B
图像 · Alibaba
2250
Pisces Coin
/ 次调用
余额 或 次数卡
上下文长度
12800
支付方式
余额 或 次数卡
余额价格
2250
Pisces Coin
/ 次调用
次数卡消耗
1.0 次/次调用
模型描述
Qwen-Edit 是Qwen系列中的一个图像生成基础模型,在复杂文本渲染方面取得了重大进展。
Qwen-Image-20B
图像 · Alibaba
3000
Pisces Coin
/ 次调用
余额 或 次数卡
上下文长度
12800
支付方式
余额 或 次数卡
余额价格
3000
Pisces Coin
/ 次调用
次数卡消耗
1.0 次/次调用
模型描述
Qwen-Image (20B) 是Qwen系列中的一个图像生成基础模型,在复杂文本渲染方面取得了重大进展。
Qwen-Image-Edit
图像 · Alibaba
3000
Pisces Coin
/ 次调用
余额 或 次数卡
上下文长度
12800
支付方式
余额 或 次数卡
余额价格
3000
Pisces Coin
/ 次调用
次数卡消耗
1.0 次/次调用
模型描述
Qwen-Image (20B) 是Qwen系列中的一个图像生成基础模型,在复杂文本渲染方面取得了重大进展。支持chat接口,传入edits接口自动切换Qwen-Edit模型。
doubao-seededit-3-0-i2i-250628
图像 · ByteDance
6000
Pisces Coin
/ 次调用
余额 或 次数卡
上下文长度
12800
支付方式
余额 或 次数卡
余额价格
6000
Pisces Coin
/ 次调用
次数卡消耗
5.0 次/次调用
模型描述
SeedEdit 3.0 是字节跳动自主研发的图像编辑模型,擅长准确执行编辑指令并有效保留图像内容,尤其在处理真实图像方面表现出色。请发送一张图片并附带编辑提示。
doubao-seedream-3-0-t2i-250415
图像 · ByteDance
5250
Pisces Coin
/ 次调用
余额 或 次数卡
上下文长度
12800
支付方式
余额 或 次数卡
余额价格
5250
Pisces Coin
/ 次调用
次数卡消耗
5.0 次/次调用
模型描述
Seedream 3.0 by ByteDance 是一个双语(中文和英文)的“文本转图像”模型,在文本到图像生成方面表现出色。
doubao-seedream-3.1-t2i-2500804
图像 · ByteDance
5250
Pisces Coin
/ 次调用
余额 或 次数卡
上下文长度
12800
支付方式
余额 或 次数卡
余额价格
5250
Pisces Coin
/ 次调用
次数卡消耗
1.0 次/次调用
模型描述
ByteDance的Dreamina 3.1文本生成图像模型展示了卓越的图像效果,在图像美感、精确多样的风格和丰富的细节方面都有显著提升。该模型在处理较长提示词时表现出色,如遇到内容检查问题请尽量使用较长的提示词。
doubao-seedream-4-0-250828
图像 · ByteDance
5250
Pisces Coin
/ 次调用
余额 或 次数卡
上下文长度
32768
支付方式
余额 或 次数卡
余额价格
5250
Pisces Coin
/ 次调用
次数卡消耗
5.0 次/次调用
模型描述
Seedream 4.0 是字节跳动最新、最好的文本到图像模型,能够实现令人印象深刻的高保真图像生成,具有出色的文本渲染能力。Seedream 4.0 还可以接收多个图像作为引用,并将其组合在一起或编辑它们以返回输出。
FLUX.1 Kontext [max]
图像 · FLUX
7500
Pisces Coin
/ 次调用
余额 或 次数卡
上下文长度
200
支付方式
余额 或 次数卡
余额价格
7500
Pisces Coin
/ 次调用
次数卡消耗
1.0 次/次调用
模型描述
FLUX.1 Kontext [pro]
图像 · FLUX
5250
Pisces Coin
/ 次调用
余额 或 次数卡
上下文长度
200
支付方式
余额 或 次数卡
余额价格
5250
Pisces Coin
/ 次调用
次数卡消耗
1.0 次/次调用
模型描述
FLUX.1 Krea [dev]
图像 · FLUX
3000
Pisces Coin
/ 次调用
余额 或 次数卡
上下文长度
512
支付方式
余额 或 次数卡
余额价格
3000
Pisces Coin
/ 次调用
次数卡消耗
1.0 次/次调用
模型描述
FLUX-Krea是FLUX Dev的一个版本,专为优质美学效果而调校。发送一张图片,让这个模型通过FLUX Krea Redux重新构想/重新生成它。
FLUX.1 [dev]
图像 · FLUX
3000
Pisces Coin
/ 次调用
余额 或 次数卡
上下文长度
80
支付方式
余额 或 次数卡
余额价格
3000
Pisces Coin
/ 次调用
次数卡消耗
1.0 次/次调用
模型描述
FLUX.1 [schnell]
图像 · FLUX
2250
Pisces Coin
/ 次调用
余额 或 次数卡
上下文长度
80
支付方式
余额 或 次数卡
余额价格
2250
Pisces Coin
/ 次调用
次数卡消耗
1.0 次/次调用
模型描述
FLUX1.1 [pro]
图像 · FLUX
2250
Pisces Coin
/ 次调用
余额 或 次数卡
上下文长度
80
支付方式
余额 或 次数卡
余额价格
2250
Pisces Coin
/ 次调用
次数卡消耗
1.0 次/次调用
模型描述
FLUX1.1 [pro] [ultra]
图像 · FLUX
3000
Pisces Coin
/ 次调用
余额 或 次数卡
上下文长度
80
支付方式
余额 或 次数卡
余额价格
3000
Pisces Coin
/ 次调用
次数卡消耗
1.0 次/次调用
模型描述
Google Imagen-3
图像 · Google
1050
Pisces Coin
/ 次调用
余额 或 次数卡
上下文长度
480
支付方式
余额 或 次数卡
余额价格
1050
Pisces Coin
/ 次调用
次数卡消耗
1.0 次/次调用
模型描述
Google Imagen-3 Fast
图像 · Google
750
Pisces Coin
/ 次调用
余额 或 次数卡
上下文长度
480
支付方式
余额 或 次数卡
余额价格
750
Pisces Coin
/ 次调用
次数卡消耗
1.0 次/次调用
模型描述
Google Imagen-4
图像 · Google
1200
Pisces Coin
/ 次调用
余额 或 次数卡
上下文长度
480
支付方式
余额 或 次数卡
余额价格
1200
Pisces Coin
/ 次调用
次数卡消耗
1.0 次/次调用
模型描述
Google Imagen-4 Fast
图像 · Google
1200
Pisces Coin
/ 次调用
余额 或 次数卡
上下文长度
480
支付方式
余额 或 次数卡
余额价格
1200
Pisces Coin
/ 次调用
次数卡消耗
1.0 次/次调用
模型描述
Google Imagen-4-Ultra
图像 · Google
3000
Pisces Coin
/ 次调用
余额 或 次数卡
上下文长度
480
支付方式
余额 或 次数卡
余额价格
3000
Pisces Coin
/ 次调用
次数卡消耗
1.0 次/次调用
模型描述
gemini-2.5-flash-image-preview
图像 · Google
work
3000
Pisces Coin
/ K tokens
余额 或 次数卡
上下文长度
32768
支付方式
余额 或 次数卡
余额价格
3000
Pisces Coin
/ K tokens
次数卡消耗
0.5 次/次调用
模型描述
Ideogram 3.0
图像 · Ideogram
2250
Pisces Coin
/ 次调用
余额 或 次数卡
上下文长度
200
支付方式
余额 或 次数卡
余额价格
2250
Pisces Coin
/ 次调用
次数卡消耗
1.0 次/次调用
模型描述
DALL-E-3
图像 · OpenAI
12000
Pisces Coin
/ 次调用
余额 或 次数卡
上下文长度
80
支付方式
余额 或 次数卡
余额价格
12000
Pisces Coin
/ 次调用
次数卡消耗
1.0 次/次调用
模型描述
GPT-Image-1
图像 · OpenAI
15000
Pisces Coin
/ 次调用
余额 或 次数卡
上下文长度
2000
支付方式
余额 或 次数卡
余额价格
15000
Pisces Coin
/ 次调用
次数卡消耗
1.0 次/次调用
模型描述
Playground-v2.5
图像 · Playground AI
1500
Pisces Coin
/ 次调用
余额 或 次数卡
上下文长度
80
支付方式
余额 或 次数卡
余额价格
1500
Pisces Coin
/ 次调用
次数卡消耗
1.0 次/次调用
模型描述
Playground-v3
图像 · Playground AI
1500
Pisces Coin
/ 次调用
余额 或 次数卡
上下文长度
80
支付方式
余额 或 次数卡
余额价格
1500
Pisces Coin
/ 次调用
次数卡消耗
1.0 次/次调用
模型描述
sana-t2i
图像 · Sana
450
Pisces Coin
/ 次调用
余额 或 次数卡
上下文长度
80
支付方式
余额 或 次数卡
余额价格
450
Pisces Coin
/ 次调用
次数卡消耗
1.0 次/次调用
模型描述
StableDiffusion-3.5
图像 · Stability AI
300
Pisces Coin
/ 次调用
余额 或 次数卡
上下文长度
80
支付方式
余额 或 次数卡
余额价格
300
Pisces Coin
/ 次调用
次数卡消耗
1.0 次/次调用
模型描述
Qwen3-Embedding-0.6B
其它 · Alibaba
240
余额
上下文长度
32768
支付方式
余额
余额价格
240
次数卡消耗
--
模型描述
多语言文本嵌入模型,支持自定义输出维度,向量维度1024
Qwen3-Embedding-4B
其它 · Alibaba
450
余额
上下文长度
32768
支付方式
余额
余额价格
450
次数卡消耗
--
模型描述
多语言、多模态任务通用的高性能文本和代码嵌入模型,向量维度2560
Qwen3-Embedding-8B
其它 · Alibaba
600
余额
上下文长度
32768
支付方式
余额
余额价格
600
次数卡消耗
--
模型描述
面向多语言文本和代码的高性能嵌入模型,向量维度4096
Qwen3-Reranker-0.6B
其它 · Alibaba
240
余额
上下文长度
32768
支付方式
余额
余额价格
240
次数卡消耗
--
模型描述
轻量级重排序模型,专为信息检索任务中的文档排序优化设计
Qwen3-Reranker-4B
其它 · Alibaba
450
余额
上下文长度
32768
支付方式
余额
余额价格
450
次数卡消耗
--
模型描述
40亿参数的跨语言和多域信息检索排序优化模型
Qwen3-Reranker-8B
其它 · Alibaba
600
余额
上下文长度
32768
支付方式
余额
余额价格
600
次数卡消耗
--
模型描述
80亿参数的多语言跨域大型reranker模型,支持多种语言和复杂语义理解
bge-large-zh-v1.5
其它 · BAAI
150
余额
上下文长度
512
支付方式
余额
余额价格
150
次数卡消耗
--
模型描述
中文优化的文本检索模型,向量维度1024
bge-m3
其它 · BAAI
300
余额
上下文长度
8192
支付方式
余额
余额价格
300
次数卡消耗
--
模型描述
由智源研究院开源的多语言、多粒度和多功能嵌入模型,向量维度1024,支持100+种语言
bge-reranker-v2-m3
其它 · BAAI
300
余额
上下文长度
8192
支付方式
余额
余额价格
300
次数卡消耗
--
模型描述
支持多语言、高精度语义匹配和高效检索优化的文本重排序模型
bge-small-zh-v1.5
其它 · BAAI
90
余额
上下文长度
512
支付方式
余额
余额价格
90
次数卡消耗
--
模型描述
中文优化的轻量级文本检索模型,向量维度512
ElevenLabs-v2.5-Turbo
其它 · ElevenLabs
300
余额
上下文长度
200000
支付方式
余额
余额价格
300
次数卡消耗
--
模型描述
ElevenLabs-v3
其它 · ElevenLabs
300
余额
上下文长度
200000
支付方式
余额
余额价格
300
次数卡消耗
--
模型描述
MiniMax-Speech-02-HD
其它 · ElevenLabs
300
余额
上下文长度
200000
支付方式
余额
余额价格
300
次数卡消耗
--
模型描述
jina-clip-v1
其它 · Jina AI
240
余额
上下文长度
512
支付方式
余额
余额价格
240
次数卡消耗
--
模型描述
多模态检索模型,向量维度768,支持跨模态文本匹配
jina-clip-v2
其它 · Jina AI
450
余额
上下文长度
8192
支付方式
余额
余额价格
450
次数卡消耗
--
模型描述
支持8k上下文和强大图片处理能力的多模态对齐模型,向量维度1024
jina-embeddings-v4
其它 · Jina AI
600
余额
上下文长度
32768
支付方式
余额
余额价格
600
次数卡消耗
--
模型描述
3.8亿参数的多模态、多语言通用嵌入模型,向量维度2048
jina-reranker-m0
其它 · Jina AI
360
余额
上下文长度
10240
支付方式
余额
余额价格
360
次数卡消耗
--
模型描述
多模态多语言重排器,支持29种语言的视觉文档排序
MiniMax-Speech-02-Turbo
其它 · MiniMax
300
余额
上下文长度
200000
支付方式
余额
余额价格
300
次数卡消耗
--
模型描述
bce-embedding-base_v1
其它 · NetEase
150
余额
上下文长度
512
支付方式
余额
余额价格
150
次数卡消耗
--
模型描述
优化文本嵌入任务的预训练模型,向量维度768,中英文优化
bce-reranker-base_v1
其它 · NetEase
150
余额
上下文长度
512
支付方式
余额
余额价格
150
次数卡消耗
--
模型描述
优化排序任务的预训练模型,支持多语言文本重排序
nomic-embed-code
其它 · Nomic AI
300
余额
上下文长度
32768
支付方式
余额
余额价格
300
次数卡消耗
--
模型描述
70亿参数的先进开源代码嵌入模型,向量维度768,支持多种编程语言
gpt-5-nano-2025-08-07-search
其它 · OpenAI
work
1500
余额
上下文长度
400000
支付方式
余额
余额价格
1500
次数卡消耗
--
模型描述
all-mpnet-base-v2
其它 · sentence-transformers
150
余额
上下文长度
512
支付方式
余额
余额价格
150
次数卡消耗
--
模型描述
基于MPNet架构的高性能句子嵌入模型,向量维度768
模型名称已复制到剪贴板!
价格说明
模型支持余额和次数卡,余额消耗按 Pisces Coin 计价,次数卡按次扣除。
所有价格均以 Pisces Coin 或次数卡计价,最终解释权归本站所有。
蓝色
表示余额消耗价格,
绿色
表示次数卡消耗。
享有专属价格时,
原价会被删除线划掉
,并突出显示专属优惠价格。
点击模型名称可复制到剪贴板。
分组标签:
work
办公用途,
chat
聊天用途
确认登出
您确定要登出吗?
取消
登出
×