1. 推理聊天
MetaChat API
  • 概述
  • OpenAI
    • 接入说明
    • 配置方法
    • 模型价格
    • 聊天(Chat)
      • Chat Completions 对象
      • Chat Completions 对象块
      • 创建 Chat Completions
    • 图像(Images)
      • 图像对象
      • 图像生成
      • 图片编辑
  • Claude
    • 接入说明
    • 配置方法
    • 模型价格
    • 聊天(Messages)
      • 消息
  • Gemini
    • 接入说明
    • 配置方法
    • 模型价格
    • 文本生成
      • 图片/视频/文档多模态输入
      • 文字输入
      • 图片输入
      • 流式输出
      • 多轮对话
      • 多轮对话(流式)
      • 配置参数
    • 图像生成
      • 使用 Gemini API 生成图像
      • 使用 Gemini API 编辑图像
      • 使用 Imagen API 生成图像
  • DeepSeek
    • 接入说明
    • 配置方法
    • 模型价格
    • 普通聊天
      • 多轮对话
      • 对话补全
    • 推理聊天
      • 思考模式
  • Grok
    • 接入说明
    • 配置方法
    • 模型价格
  • GLM
    • 接入说明
    • 配置方法
    • 模型价格
  • MiniMax
    • 接入说明
    • 配置方法
    • 模型价格
  • Kimi
    • 接入说明
    • 配置方法
    • 模型价格
  • Midjourney
    • 接入说明
    • 模型价格
    • 图像生成
      • 图像生成
    • 图像变换
      • 图像拆分
      • 图像微调(四宫格)
      • 图像重绘
      • 图像高清
      • 图像微调(单图)
      • 图像变焦
      • 图像平移
    • 图像处理
      • 图像描述
      • 图像融合
    • 视频生成
      • 视频生成
    • 任务查询
      • 查询图像生成结果
      • 查询视频生成结果
  • FLUX
    • 接入说明
    • 模型价格
    • 图像生成
      • 图像生成
    • 任务查询
      • 查询结果
  • Z-Image
    • 接入说明
    • 模型价格
    • 图像生成
      • 图像生成
    • 任务查询
      • 查询结果
  • Seedream
    • 接入说明
    • 模型价格
    • 图像生成
      • 图像生成
    • 任务查询
      • 查询结果
  • Account
    • 查询 API 元点余额
    • 查询 API 元点使用记录
  1. 推理聊天

思考模式

思考模式#

DeepSeek 模型支持思考模式:在输出最终回答之前,模型会先输出一段思维链内容,以提升最终答案的准确性。

思考模式开关与思考强度控制#

控制参数(OpenAI 格式)控制参数(Anthropic 格式)
思考模式开关 (1){"thinking": {"type": "enabled/disabled"}}
思考强度控制 (2)(3){"reasoning_effort": "high/max"}{"output_config": {"effort": "high/max"}}
(1) 默认思考开关为 enabled
(2) 思考模式下,对普通请求,默认 effort 为 high;对一些复杂 Agent 类请求(如 Claude Code、OpenCode),effort 自动设置为 max
(3) 思考模式下,出于兼容考虑 low 、 medium 会映射为 high, xhigh 会映射为 max
您在使用 OpenAI SDK 设置 thinking 参数时,需要将 thinking 参数传入 extra_body 中:

输入输出参数#

思考模式不支持 temperature 、 top_p 、 presence_penalty 、 frequency_penalty 参数。请注意,为了兼容已有软件,设置参数不会报错,但也不会生效。
在思考模式下,思维链内容通过 reasoning_content 参数返回,与 content 同级。在后续的轮次的拼接中,可以选择性地返回 reasoning_content 给 API:
在两个 user 消息之间,如果模型 未进行工具调用 ,则中间 assistant 的 reasoning_content 无需参与上下文拼接,在后续轮次中将其传入 API 会被忽略。详见 多轮对话拼接 。
在两个 user 消息之间,如果模型 进行了工具调用 ,则中间 assistant 的 reasoning_content 需参与上下文拼接,在后续所有 user 交互轮次中必须 回传给 API 。详见 工具调用 。

多轮对话拼接#

在每一轮对话过程中,模型会输出思维链内容( reasoning_content )和最终回答( content )。如果没有工具调用,则在下一轮对话中,之前轮输出的思维链内容不会被拼接到上下文中,如下图所示:

样例代码#

下面的代码以 Python 语言为例,展示了如何访问思维链和最终回答,以及如何在多轮对话中进行上下文拼接。
非流式
流式

工具调用#

DeepSeek 模型的思考模式支持工具调用功能。模型在输出最终答案之前,可以进行多轮的思考与工具调用,以提升答案的质量。其调用模式如下图所示:
请注意,区别于思考模式下的未进行工具调用的轮次,进行了工具调用的轮次,在后续所有请求中,必须完整回传 reasoning_content 给 API。
若您的代码中未正确回传 reasoning_content ,API 会返回 400 报错。正确回传方法请您参考下面的样例代码。

样例代码#

下面是一个简单的在思考模式下进行工具调用的样例代码:
在 Turn 1 的每个子请求中,都携带了该 Turn 下产生的 reasoning_content 给 API,从而让模型继续之前的思考。 response.choices[0].message 携带了 assistant 消息的所有必要字段,包括 content 、 reasoning_content 、 tool_calls 。简单起见,可以直接用如下代码将消息 append 到 messages 结尾:
这行代码等价于:
且在 Turn 2 的请求中,我们仍然携带着 Turn1 所产生的 reasoning_content 给 API。
该代码的样例输出如下:
修改于 2026-04-28 07:29:33
上一页
对话补全
下一页
接入说明
Built with