思考模式

DeepSeek 模型支持思考模式：在输出最终回答之前，模型会先输出一段思维链内容，以提升最终答案的准确性。

思考模式开关与思考强度控制

	控制参数（OpenAI 格式）	控制参数（Anthropic 格式）
思考模式开关 ⁽¹⁾	`{"thinking": {"type": "enabled/disabled"}}`
思考强度控制 ⁽²⁾⁽³⁾	`{"reasoning_effort": "high/max"}`	`{"output_config": {"effort": "high/max"}}`

(1) 默认思考开关为 enabled
(2) 思考模式下，对普通请求，默认 effort 为 high；对一些复杂 Agent 类请求（如 Claude Code、OpenCode），effort 自动设置为 max
(3) 思考模式下，出于兼容考虑 low 、 medium 会映射为 high, xhigh 会映射为 max

您在使用 OpenAI SDK 设置 thinking 参数时，需要将 thinking 参数传入 extra_body 中：

输入输出参数

思考模式不支持 temperature 、 top_p 、 presence_penalty 、 frequency_penalty 参数。请注意，为了兼容已有软件，设置参数不会报错，但也不会生效。

在思考模式下，思维链内容通过 reasoning_content 参数返回，与 content 同级。在后续的轮次的拼接中，可以选择性地返回 reasoning_content 给 API：

在两个 user 消息之间，如果模型 未进行工具调用 ，则中间 assistant 的 reasoning_content 无需参与上下文拼接，在后续轮次中将其传入 API 会被忽略。详见多轮对话拼接。

在两个 user 消息之间，如果模型 进行了工具调用 ，则中间 assistant 的 reasoning_content 需参与上下文拼接，在后续所有 user 交互轮次中必须 回传给 API 。详见工具调用。

多轮对话拼接

在每一轮对话过程中，模型会输出思维链内容（ reasoning_content ）和最终回答（ content ）。如果没有工具调用，则在下一轮对话中，之前轮输出的思维链内容不会被拼接到上下文中，如下图所示：

样例代码

下面的代码以 Python 语言为例，展示了如何访问思维链和最终回答，以及如何在多轮对话中进行上下文拼接。

非流式

流式

工具调用

DeepSeek 模型的思考模式支持工具调用功能。模型在输出最终答案之前，可以进行多轮的思考与工具调用，以提升答案的质量。其调用模式如下图所示：

请注意，区别于思考模式下的未进行工具调用的轮次，进行了工具调用的轮次，在后续所有请求中，必须完整回传 reasoning_content 给 API。

若您的代码中未正确回传 reasoning_content ，API 会返回 400 报错。正确回传方法请您参考下面的样例代码。

样例代码

下面是一个简单的在思考模式下进行工具调用的样例代码：

在 Turn 1 的每个子请求中，都携带了该 Turn 下产生的 reasoning_content 给 API，从而让模型继续之前的思考。 response.choices[0].message 携带了 assistant 消息的所有必要字段，包括 content 、 reasoning_content 、 tool_calls 。简单起见，可以直接用如下代码将消息 append 到 messages 结尾：

这行代码等价于：

且在 Turn 2 的请求中，我们仍然携带着 Turn1 所产生的 reasoning_content 给 API。

该代码的样例输出如下：

思考模式

思考模式#

思考模式开关与思考强度控制#

输入输出参数#

多轮对话拼接#

样例代码#

工具调用#

样例代码#

思考模式

思考模式开关与思考强度控制

输入输出参数

多轮对话拼接

样例代码

工具调用

样例代码