在 Claude Code 中使用 Claude Opus 4.7 的最佳实践

这篇官方文章讲清了 Opus 4.7 在 Claude Code 中最值得调整的几个点：交互式 session 结构、effort 档位、adaptive thinking，以及若干默认行为变化。

原文：Anthropic Claude Blog 原文链接：https://claude.com/blog/best-practices-for-using-claude-opus-4-7-with-claude-code 发布日期：2026-04-16

这篇文章讲的是：如何利用重新校准后的 effort 档位、adaptive thinking 和新的默认行为，把 Claude Code 上的 Opus 4.7 调到更好用的状态。

Opus 4.7 是目前我们面向公开用户提供的最强通用模型之一，尤其适合编码、企业工作流和长时间运行的 agentic tasks。相比 Opus 4.6，它更擅长处理模糊问题，更会找 bug、更会做代码审查，也更能在跨 session 的场景里稳定地带住上下文。

我们在发布公告里提到过，有两个变化会直接影响 token 使用：一是 tokenizer 更新了，二是模型在更高 effort 档位、尤其是长 session 的后半段，会更倾向于多想一层。所以，如果你是从 Opus 4.6 切到 Opus 4.7，通常需要做一点调参，才能把性能拉到最佳。prompt 和 harness 上几个小调整，就可能带来明显差异。

这篇文章会讲清楚：到底变了什么，以及怎样在 Claude Code 里把 Opus 4.7 用到最好。

如何组织交互式编码 session

在 Claude Code 里，Opus 4.7 的 token 使用和行为，会随着你采用的工作方式不同而明显变化。你可能是在跑更自治、单次用户输入驱动的异步 coding agent，也可能是在跑需要多轮互动的同步式 coding agent。在交互式设置下，模型在每次用户 turn 之后会做更多推理。这会提升它在长 session 里的连贯性、指令遵循能力和编码质量，但也意味着它通常会消耗更多 token。

我们观察到，想把 Opus 4.7 在 Claude Code 里的效果发挥出来，最好的心态是：把 Claude 当成一个你正在委派任务的靠谱工程师，而不是一个需要你逐行手把手带着走的 pair programmer。

第一轮就把任务讲清楚。任务描述里最好直接带上意图、约束、验收标准和相关文件路径。这样 Opus 4.7 才能拿到足够上下文，给出更强结果。那种把关键要求拆散到很多轮里慢慢补的模糊提示，会同时拖低 token 效率，甚至拖低结果质量。
尽量减少必须发生的用户交互次数。每多一个用户 turn，模型就要为此额外付出推理开销。把问题打包，把它继续往下推进所需的上下文一次性给足。
在合适的时候使用 auto mode。对于那些你愿意让模型在少量 check-in 的情况下安全执行下去的任务，auto mode 能明显缩短循环时间。它尤其适合长任务，前提是你在一开始已经把完整上下文给够了。现在 Claude Code Max 用户可以在 research preview 中使用 auto mode，通过 Shift+Tab 打开。
给任务完成配置通知。你可以让 Claude 在做完任务时播放声音，它也可以自己创建基于 hook 的完成通知。

Opus 4.7 推荐的 effort 设置

Claude Code 里，Opus 4.7 现在的默认 effort 档位是 xhigh。这是一个新的 effort 档位，位于 high 和 max 之间，目的是让用户在处理难题时，对“推理深度”和“响应延迟”之间的权衡有更细的控制。我们推荐把 xhigh 用在大多数 agentic coding 工作上，尤其是那些对智能水平敏感的任务，比如设计 API 和 schema、迁移旧代码、审查大型代码库。

下面是每个 effort 档位的额外建议：

medium 和 low：适合成本敏感、延迟敏感，或者范围非常明确的工作。面对更难的问题时，它们的能力会弱于高 effort 档位，但即便如此，在同档位下它依旧比 Opus 4.6 更强，有时 token 还更省。
high：在智能和成本之间做平衡。如果你在跑并发 session，或者想少花一点 token 又不想损失太多质量，可以选 high。
xhigh（默认、推荐）：大多数编码和 agentic 用途的最佳设置。它在自治能力和智能之间给了一个很好的平衡，同时避免了 max 在长时间 agentic 运行中容易出现的 token 失控。
max：在真正困难的问题上还能再挤出一点性能，但收益已经开始递减，而且更容易过度思考。更适合刻意测试模型能力上限的 eval，或者那些极端依赖智能、同时完全不敏感于成本的任务。

如果你正在升级到新模型，我们建议你主动尝试不同 effort，而不是简单照搬旧设置。你可以在同一个任务过程中切换 effort 档位，用更精细的方式管理 token 使用和推理深度。

我们把 Opus 4.7 的默认 effort 设置成 xhigh，因为我们认为它是大多数编码任务的最佳默认值。如果你本来就在用 Claude Code，但还没有手动设置 effort，那么你会自动升级到 xhigh。当然，你依然可以手动调整。

如何和 adaptive thinking 配合

Opus 4.7 不支持带固定 thinking budget 的 Extended Thinking。取而代之的是 adaptive thinking。它让 thinking 在每一步都变成“可选项”，也让模型可以根据上下文自己决定什么时候多想一点。对简单请求，它可以更快直接响应；当某一步不需要想太多时，它也可以跳过 thinking；而在真正值得思考的地方，它会把 thinking token 投进去。对整段 agentic run 来说，这通常意味着更快的响应和更好的体验。

这一版里，adaptive thinking 有了很明显的改善，尤其是 Opus 4.7 没那么容易陷入 overthinking 了。

如果你想更明确地控制 thinking 频率，可以直接在 prompt 里写出来：

如果你想让它多想一点，可以写：“先认真、逐步地思考，再给出回答；这个问题比表面看起来更难。”
如果你想让它少想一点，可以写：“优先快速响应，而不是深度思考；如果拿不准，直接回答。” 这样会更省 token，但在难步骤上可能会损失一些准确度。

几个值得注意的行为变化

Opus 4.6 到 4.7 之间，有几项默认行为发生了变化。如果你之前专门为旧模型精调过 prompt 或 harness，这些差异值得提前知道。

回答长度会按任务复杂度自动校准。Opus 4.7 的默认风格没有 Opus 4.6 那么啰嗦。简单查找类问题，回答会更短；开放式分析，回答会更长。如果你的场景依赖某种特定长度或风格，请直接在 prompt 里说清楚。我们发现，给出你想要的正向风格示例，往往比写“不要这样做”的负向约束更有效。
模型更少主动调用工具，但会做更多推理。在很多情况下，这反而会让结果更好。如果你希望它多用工具，比如在 agentic 工作里更积极地搜索或读文件，那就要在提示里直接写明：什么时候该用工具，为什么该用。
默认会少起一些 subagents。Opus 4.7 在是否应该把工作委派给 subagent 这件事上更克制。如果你的场景很适合并行 subagents，比如同时 fan-out 到多个文件或多个独立项，那就应该明确写出来。比如：

“对于你能够在单次回复里直接完成的工作，不要起 subagent。只有在需要同时分发到多个项目，或者同时读取多个文件时，才在同一轮里启动多个 subagents。”

接下来可以试什么

Opus 4.7 在长时间运行任务上的表现，比旧模型更强。这使它非常适合那些以前监督成本过高的任务，例如复杂的多文件修改、模糊 bug 调试、跨服务代码审查，以及多步 agentic work。

我们的建议是：先把 effort 保持在 xhigh，然后看看第一轮 prompt 究竟能把任务推进多远。

更多内容可以继续看 Anthropic 的 Opus 4.7 prompting guide，以及 Claude Code 关于 context 和 session management 的那篇文章。

获取 Claude Code

curl -fsSL https://claude.ai/install.sh | bash