本页汇总本产品当前支持的模型与常用限制参数(单位:Tokens)。如你的工具支持“思考/推理”模式,请留意同一模型在不同模式下的最大输入/输出可能不同。

支持的模型

  • qwen3.6-plus
  • glm-5.1
  • glm-4.7
  • kimi-k2.5
  • MiniMax-M2.5

上下文与输出限制

qwen3.6-plus

模式最大输入思维链 / 输出
思考模式983,616最长思维链 81,920
非思考模式991,808最大输出 65,536

glm-5.1

上下文长度最大输入最长思维链最大回复
202,745202,745131,072131,072

glm-4.7

上下文长度最大输入最长思维链最大回复
202,752169,98432,76816,384

MiniMax-M2.5

上下文长度最大输入思维链 + 回复(合计上限)
196,608196,60132,768
MiniMax-M2.5 不支持 thinking_budget 参数。

kimi-k2.5

模式上下文长度最大输入最长思维链最大回复
思考模式262,144258,04881,92098,304
非思考模式262,144260,09698,304