这篇官方文章讲清了 Opus 4.7 在 Claude Code 中最值得调整的几个点:交互式 session 结构、effort 档位、adaptive thinking,以及若干默认行为变化。
原文:Anthropic Claude Blog 原文链接:https://claude.com/blog/best-practices-for-using-claude-opus-4-7-with-claude-code 发布日期:2026-04-16
这篇文章讲的是:如何利用重新校准后的 effort 档位、adaptive thinking 和新的默认行为,把 Claude Code 上的 Opus 4.7 调到更好用的状态。
Opus 4.7 是目前我们面向公开用户提供的最强通用模型之一,尤其适合编码、企业工作流和长时间运行的 agentic tasks。相比 Opus 4.6,它更擅长处理模糊问题,更会找 bug、更会做代码审查,也更能在跨 session 的场景里稳定地带住上下文。
我们在发布公告里提到过,有两个变化会直接影响 token 使用:一是 tokenizer 更新了,二是模型在更高 effort 档位、尤其是长 session 的后半段,会更倾向于多想一层。所以,如果你是从 Opus 4.6 切到 Opus 4.7,通常需要做一点调参,才能把性能拉到最佳。prompt 和 harness 上几个小调整,就可能带来明显差异。
这篇文章会讲清楚:到底变了什么,以及怎样在 Claude Code 里把 Opus 4.7 用到最好。
如何组织交互式编码 session
在 Claude Code 里,Opus 4.7 的 token 使用和行为,会随着你采用的工作方式不同而明显变化。你可能是在跑更自治、单次用户输入驱动的异步 coding agent,也可能是在跑需要多轮互动的同步式 coding agent。在交互式设置下,模型在每次用户 turn 之后会做更多推理。这会提升它在长 session 里的连贯性、指令遵循能力和编码质量,但也意味着它通常会消耗更多 token。
我们观察到,想把 Opus 4.7 在 Claude Code 里的效果发挥出来,最好的心态是:把 Claude 当成一个你正在委派任务的靠谱工程师,而不是一个需要你逐行手把手带着走的 pair programmer。
- 第一轮就把任务讲清楚。任务描述里最好直接带上意图、约束、验收标准和相关文件路径。这样 Opus 4.7 才能拿到足够上下文,给出更强结果。那种把关键要求拆散到很多轮里慢慢补的模糊提示,会同时拖低 token 效率,甚至拖低结果质量。
- 尽量减少必须发生的用户交互次数。每多一个用户 turn,模型就要为此额外付出推理开销。把问题打包,把它继续往下推进所需的上下文一次性给足。
- 在合适的时候使用 auto mode。对于那些你愿意让模型在少量 check-in 的情况下安全执行下去的任务,auto mode 能明显缩短循环时间。它尤其适合长任务,前提是你在一开始已经把完整上下文给够了。现在 Claude Code Max 用户可以在 research preview 中使用 auto mode,通过 Shift+Tab 打开。
- 给任务完成配置通知。你可以让 Claude 在做完任务时播放声音,它也可以自己创建基于 hook 的完成通知。
Opus 4.7 推荐的 effort 设置
Claude Code 里,Opus 4.7 现在的默认 effort 档位是 xhigh。这是一个新的 effort 档位,位于 high 和 max 之间,目的是让用户在处理难题时,对“推理深度”和“响应延迟”之间的权衡有更细的控制。我们推荐把 xhigh 用在大多数 agentic coding 工作上,尤其是那些对智能水平敏感的任务,比如设计 API 和 schema、迁移旧代码、审查大型代码库。
下面是每个 effort 档位的额外建议:
medium和low:适合成本敏感、延迟敏感,或者范围非常明确的工作。面对更难的问题时,它们的能力会弱于高 effort 档位,但即便如此,在同档位下它依旧比 Opus 4.6 更强,有时 token 还更省。high:在智能和成本之间做平衡。如果你在跑并发 session,或者想少花一点 token 又不想损失太多质量,可以选high。xhigh(默认、推荐):大多数编码和 agentic 用途的最佳设置。它在自治能力和智能之间给了一个很好的平衡,同时避免了max在长时间 agentic 运行中容易出现的 token 失控。max:在真正困难的问题上还能再挤出一点性能,但收益已经开始递减,而且更容易过度思考。更适合刻意测试模型能力上限的 eval,或者那些极端依赖智能、同时完全不敏感于成本的任务。
如果你正在升级到新模型,我们建议你主动尝试不同 effort,而不是简单照搬旧设置。你可以在同一个任务过程中切换 effort 档位,用更精细的方式管理 token 使用和推理深度。
我们把 Opus 4.7 的默认 effort 设置成 xhigh,因为我们认为它是大多数编码任务的最佳默认值。如果你本来就在用 Claude Code,但还没有手动设置 effort,那么你会自动升级到 xhigh。当然,你依然可以手动调整。
如何和 adaptive thinking 配合
Opus 4.7 不支持带固定 thinking budget 的 Extended Thinking。取而代之的是 adaptive thinking。它让 thinking 在每一步都变成“可选项”,也让模型可以根据上下文自己决定什么时候多想一点。对简单请求,它可以更快直接响应;当某一步不需要想太多时,它也可以跳过 thinking;而在真正值得思考的地方,它会把 thinking token 投进去。对整段 agentic run 来说,这通常意味着更快的响应和更好的体验。
这一版里,adaptive thinking 有了很明显的改善,尤其是 Opus 4.7 没那么容易陷入 overthinking 了。
如果你想更明确地控制 thinking 频率,可以直接在 prompt 里写出来:
- 如果你想让它多想一点,可以写:“先认真、逐步地思考,再给出回答;这个问题比表面看起来更难。”
- 如果你想让它少想一点,可以写:“优先快速响应,而不是深度思考;如果拿不准,直接回答。” 这样会更省 token,但在难步骤上可能会损失一些准确度。
几个值得注意的行为变化
Opus 4.6 到 4.7 之间,有几项默认行为发生了变化。如果你之前专门为旧模型精调过 prompt 或 harness,这些差异值得提前知道。
- 回答长度会按任务复杂度自动校准。Opus 4.7 的默认风格没有 Opus 4.6 那么啰嗦。简单查找类问题,回答会更短;开放式分析,回答会更长。如果你的场景依赖某种特定长度或风格,请直接在 prompt 里说清楚。我们发现,给出你想要的正向风格示例,往往比写“不要这样做”的负向约束更有效。
- 模型更少主动调用工具,但会做更多推理。在很多情况下,这反而会让结果更好。如果你希望它多用工具,比如在 agentic 工作里更积极地搜索或读文件,那就要在提示里直接写明:什么时候该用工具,为什么该用。
- 默认会少起一些 subagents。Opus 4.7 在是否应该把工作委派给 subagent 这件事上更克制。如果你的场景很适合并行 subagents,比如同时 fan-out 到多个文件或多个独立项,那就应该明确写出来。比如:
“对于你能够在单次回复里直接完成的工作,不要起 subagent。只有在需要同时分发到多个项目,或者同时读取多个文件时,才在同一轮里启动多个 subagents。”
接下来可以试什么
Opus 4.7 在长时间运行任务上的表现,比旧模型更强。这使它非常适合那些以前监督成本过高的任务,例如复杂的多文件修改、模糊 bug 调试、跨服务代码审查,以及多步 agentic work。
我们的建议是:先把 effort 保持在 xhigh,然后看看第一轮 prompt 究竟能把任务推进多远。
更多内容可以继续看 Anthropic 的 Opus 4.7 prompting guide,以及 Claude Code 关于 context 和 session management 的那篇文章。
获取 Claude Code
curl -fsSL https://claude.ai/install.sh | bash