Skip to content

Fast Mode 快速模式

用 /fast 切换的 Opus 高速配置,速度最高提升 2.5 倍,但单 token 成本更高。

是什么

Fast Mode 是 Claude Opus 的高速配置,能让模型响应速度最高提升至 2.5 倍,代价是更高的单 token 成本。它不是一个不同的模型——使用的仍是 Claude Opus,只是采用了优先保证速度而非成本效率的 API 配置,因此质量和能力完全一致,只是响应更快。

它属于 research preview(研究预览)功能,特性、定价与可用性可能会根据反馈调整。用 /fast 在需要速度(如快速迭代、实时调试)时开启,在更看重成本时关闭。

怎么工作

  • /fast 切换开关:在 Claude Code CLI 中输入 /fast 并按 Tab 即可开/关;也可在用户 settings 文件中设置 "fastMode": true
  • 开启时若当前在其他模型上,Claude Code 会自动切换到 Opus,并显示确认消息「Fast mode ON」,提示符旁出现小图标
  • /fast 关闭后仍停留在 Opus,不会回退到之前的模型;要切换模型用 /model。再次运行 /fast 可随时查看当前开关状态。
  • 默认情况下 Fast Mode 跨会话持续;管理员可配置为每会话重置。
  • Fast Mode 与 effort level 都影响速度但机制不同:Fast Mode 同质量、低延迟、高成本;降低 effort level 则减少思考时间、加快响应但复杂任务质量可能下降。二者可叠加使用以在简单任务上获得最大速度。
  • 命中 Fast Mode 速率限制或用尽 usage credits 时会自动回落到标准速度( 图标变灰表示冷却),冷却结束后自动重新启用。

怎么配置 / 用法

开启/关闭:

/fast        # 输入后按 Tab 切换开关;再次运行可查看状态

或在用户 settings 文件中:

json
{
  "fastMode": true
}

管理员要求每会话重新选择开启(Team/Enterprise,写入 managed settings 或 server-managed settings):

json
{
  "fastModePerSessionOptIn": true
}

相关环境变量:CLAUDE_CODE_DISABLE_FAST_MODE=1(完全禁用);CLAUDE_CODE_OPUS_4_6_FAST_MODE_OVERRIDE=1(将 Fast Mode 固定到 Opus 4.6)。

什么时候用

  • 代码改动的快速迭代
  • 实时调试会话(live debugging)
  • 有紧迫截止时间、对延迟敏感的工作
  • 总体:交互式工作中响应延迟比成本更重要时

限制 / 坑

  • 不适合速度不那么重要的长时间自主任务、批处理或 CI/CD 流水线、以及对成本敏感的工作负载(这些用标准模式更好)。
  • 仅支持 Opus 4.8 / 4.7 / 4.6,不支持 Sonnet、Haiku 或其他模型。
  • 不支持 VS Code 扩展,仅限 Claude Code CLI。
  • 不支持 Amazon Bedrock、Google Vertex AI、Microsoft Azure Foundry 或 Claude Platform on AWS。
  • Opus 4.6 的 Fast Mode 已弃用,将在 Opus 4.8 发布约 30 天后移除,届时会回落到标准速度与标准定价。

硬事实速查(11 条)

  • Fast Mode 让 Opus 速度最高提升 2.5x,但单 token 成本更高;不是不同模型,质量与能力一致。
  • 需要 Claude Code v2.1.36 或更高版本,用 claude --version 查看。
  • 定价:Opus 4.8 为 $10/$50 MTok;Opus 4.7 与 Opus 4.6 为 $30/$150 MTok(输入/输出),在完整 1M token 上下文窗口内为统一价。
  • 会话中途切入 Fast Mode 会按 Fast Mode 未缓存输入价对整个对话上下文计费,比从一开始就开启更贵;建议在会话开始时启用。
  • 默认模型:v2.1.154 及以后 Fast Mode 默认 Opus 4.8;v2.1.142 至 v2.1.153 默认 Opus 4.7。
  • 面向所有订阅计划用户(Pro/Max/Team/Enterprise)及 Claude Console 开放。
  • 对订阅计划用户,Fast Mode 仅通过 usage credits 提供,不计入订阅的 rate limits,且从第一个 token 起即按 Fast Mode 费率计费。
  • 要求:仅限 Anthropic Console API 或订阅计划(用 usage credits);账户须开启 usage credits。
  • Team 和 Enterprise 默认禁用 Fast Mode,须管理员显式启用(Console 在 Claude Code preferences;Claude AI 在 Admin Settings > Claude Code);未启用时 /fast 显示「Fast mode has been disabled by your organization.」
  • Opus 4.8 / 4.7 / 4.6 的 Fast Mode 共用同一速率限制池。
  • 属 research preview 功能,特性、可用性、定价及底层 API 配置均可能变化。

官方出处:https://code.claude.com/docs/en/fast-mode