主题
Fast Mode 快速模式
用 /fast 切换的 Opus 高速配置,速度最高提升 2.5 倍,但单 token 成本更高。
是什么
Fast Mode 是 Claude Opus 的高速配置,能让模型响应速度最高提升至 2.5 倍,代价是更高的单 token 成本。它不是一个不同的模型——使用的仍是 Claude Opus,只是采用了优先保证速度而非成本效率的 API 配置,因此质量和能力完全一致,只是响应更快。
它属于 research preview(研究预览)功能,特性、定价与可用性可能会根据反馈调整。用 /fast 在需要速度(如快速迭代、实时调试)时开启,在更看重成本时关闭。
怎么工作
- 用
/fast切换开关:在 Claude Code CLI 中输入/fast并按 Tab 即可开/关;也可在用户 settings 文件中设置"fastMode": true。 - 开启时若当前在其他模型上,Claude Code 会自动切换到 Opus,并显示确认消息「Fast mode ON」,提示符旁出现小图标
↯。 - 用
/fast关闭后仍停留在 Opus,不会回退到之前的模型;要切换模型用/model。再次运行/fast可随时查看当前开关状态。 - 默认情况下 Fast Mode 跨会话持续;管理员可配置为每会话重置。
- Fast Mode 与 effort level 都影响速度但机制不同:Fast Mode 同质量、低延迟、高成本;降低 effort level 则减少思考时间、加快响应但复杂任务质量可能下降。二者可叠加使用以在简单任务上获得最大速度。
- 命中 Fast Mode 速率限制或用尽 usage credits 时会自动回落到标准速度(
↯图标变灰表示冷却),冷却结束后自动重新启用。
怎么配置 / 用法
开启/关闭:
/fast # 输入后按 Tab 切换开关;再次运行可查看状态或在用户 settings 文件中:
json
{
"fastMode": true
}管理员要求每会话重新选择开启(Team/Enterprise,写入 managed settings 或 server-managed settings):
json
{
"fastModePerSessionOptIn": true
}相关环境变量:CLAUDE_CODE_DISABLE_FAST_MODE=1(完全禁用);CLAUDE_CODE_OPUS_4_6_FAST_MODE_OVERRIDE=1(将 Fast Mode 固定到 Opus 4.6)。
什么时候用
- 代码改动的快速迭代
- 实时调试会话(live debugging)
- 有紧迫截止时间、对延迟敏感的工作
- 总体:交互式工作中响应延迟比成本更重要时
限制 / 坑
- 不适合速度不那么重要的长时间自主任务、批处理或 CI/CD 流水线、以及对成本敏感的工作负载(这些用标准模式更好)。
- 仅支持 Opus 4.8 / 4.7 / 4.6,不支持 Sonnet、Haiku 或其他模型。
- 不支持 VS Code 扩展,仅限 Claude Code CLI。
- 不支持 Amazon Bedrock、Google Vertex AI、Microsoft Azure Foundry 或 Claude Platform on AWS。
- Opus 4.6 的 Fast Mode 已弃用,将在 Opus 4.8 发布约 30 天后移除,届时会回落到标准速度与标准定价。
硬事实速查(11 条)
- Fast Mode 让 Opus 速度最高提升 2.5x,但单 token 成本更高;不是不同模型,质量与能力一致。
- 需要 Claude Code v2.1.36 或更高版本,用
claude --version查看。 - 定价:Opus 4.8 为 $10/$50 MTok;Opus 4.7 与 Opus 4.6 为 $30/$150 MTok(输入/输出),在完整 1M token 上下文窗口内为统一价。
- 会话中途切入 Fast Mode 会按 Fast Mode 未缓存输入价对整个对话上下文计费,比从一开始就开启更贵;建议在会话开始时启用。
- 默认模型:v2.1.154 及以后 Fast Mode 默认 Opus 4.8;v2.1.142 至 v2.1.153 默认 Opus 4.7。
- 面向所有订阅计划用户(Pro/Max/Team/Enterprise)及 Claude Console 开放。
- 对订阅计划用户,Fast Mode 仅通过 usage credits 提供,不计入订阅的 rate limits,且从第一个 token 起即按 Fast Mode 费率计费。
- 要求:仅限 Anthropic Console API 或订阅计划(用 usage credits);账户须开启 usage credits。
- Team 和 Enterprise 默认禁用 Fast Mode,须管理员显式启用(Console 在 Claude Code preferences;Claude AI 在 Admin Settings > Claude Code);未启用时
/fast显示「Fast mode has been disabled by your organization.」 - Opus 4.8 / 4.7 / 4.6 的 Fast Mode 共用同一速率限制池。
- 属 research preview 功能,特性、可用性、定价及底层 API 配置均可能变化。