模型与 API · 已验证
Anthropic 宣布 Claude Opus 4.1 将于 2026-08-05 退役并要求迁移到 Opus 4.8
Anthropic 官方在 Claude Platform 发布 2026 年 6 月 5 日更新,宣布 `claude-opus-4-1-20250805` 将于 2026-08-05 从 Claude API 退役,并明确建议迁移到 Claude Opus 4.8;同一官方发布页同时给出 Opus 4.8 的上下文窗口、输出上限、工具兼容和采样限制等迁移边界。
- 采用建议
- 观察并试点
- 影响范围
- 影响所有直接依赖 Anthropic Claude API 且把具体 Opus 4.1 模型版本固化在模型路由、Agent 编排、评测基线或成本控制逻辑中的应用与平台。
- 成熟度
- 官方已发布的退役与迁移通知,需在退役日前完成本地兼容验证与灰度切换。
技术变化
- Anthropic 在 2026-06-05 的 Claude Platform release notes 中宣布 `claude-opus-4-1-20250805` 将于 2026-08-05 从 Claude API 退役。
- 官方明确给出迁移目标为 Claude Opus 4.8,而不是继续停留在旧的 Opus 4.1/4.7 路线。
- 同一官方发布页列出 Opus 4.8 具备 1M token 上下文窗口、128k 最大输出,并保持与 Opus 4.7 相同的工具和平台特性集。
架构影响
- 模型网关需要把硬编码的 `claude-opus-4-1-20250805` 路由、回退链路和租户级默认模型切换到可配置映射,避免退役日当天请求直接失败。
- 如果系统依赖长上下文、工具调用或 prompt caching,迁移评估应以 Opus 4.8 的上下文窗口、默认 effort 和缓存阈值为新基线,而不是沿用 Opus 4.1 的历史假设。
- 模型能力矩阵、成本预算和质量回归基线需要把“模型可用性生命周期”视为一等配置,而不是仅关注单次 API 功能差异。
落地步骤
- 盘点所有直接引用 `claude-opus-4-1-20250805` 的服务、批任务、Agent 编排器、评测脚本和前端配置,并统一改成可热更新的模型别名或配置中心映射。
- 按官方迁移建议为 Opus 4.8 补一轮端到端回归,覆盖长上下文、多工具调用、拒答分流、prompt caching 和输出长度控制。
- 对设置非默认 `temperature`、`top_p` 或 `top_k` 的调用补充契约测试,因为官方说明在 Opus 4.8 上这些非默认采样参数会返回 400。
- 先在独立功能或内部用户场景验证,再扩大到生产用户。
风险边界
- 如果业务在 2026-08-05 前未完成迁移,生产流量可能因模型退役而直接中断。
- 把 Opus 4.8 当作无差别替换会忽略默认 effort、缓存阈值和采样参数限制,导致延迟、成本或请求错误特征变化。
- 未更新质量基线和安全审计规则时,旧模型与新模型在拒答、工具行为或长上下文表现上的差异可能被误判为应用回归。
- 关注提示词漂移、权限边界、人工审批和结果可解释性。
验证清单
- 在代码库和运行时配置中全量检索 `claude-opus-4-1-20250805`,确认是否仍有直接依赖旧模型标识。
- 用 Opus 4.8 复跑现网代表性提示和工具工作流,记录成功率、延迟、token 消耗和拒答分布,再与旧基线对比。
- 对所有设置了 `temperature`、`top_p` 或 `top_k` 的调用执行契约测试,验证是否需要在迁移时移除或改写这些参数。
- 用离线样例集、线上抽检和人工复核记录验证输出质量。
原始来源
来源类型:official · 可信度:high · 状态:verified