Anthropic在5月28日发布了Claude Opus 4.8,这是Opus系列的最新版本。不过从社区反应来看,这次升级引发了不小的争议——有人觉得是”minor upgrade”,也有人认为这正是大模型发展进入平稳期的标志。
Opus 4.8更新了什么
根据Anthropic官方公告,Opus 4.8主要在以下几个方面做了改进:
编程和Agent能力提升:在编程任务、Agent技能、推理和实用知识测试中,Opus 4.8相比前代都有所提升。Anthropic表示早期测试者发现新模型在执行Agent任务时”更可靠、判断力更敏锐”。
努力程度控制:claude.ai用户现在可以控制Claude在任务中投入的”努力程度”。Opus 4.8默认使用高努力模式,Anthropic认为这是质量和用户体验之间的最佳平衡。在编程任务中,这种努力级别会花费更多token,但能产出更高质量的结果。
Claude Code增强:Claude Code也获得了更新,新模型会更主动地提问、捕捉自身错误,并在计划不合理时提出异议。
Project Glasswing预告:Anthropic还预告了一个名为”Project Glasswing”的计划,将推出比Opus更高智能水平的新模型类别,部分组织已经获得了早期访问权限。
社区反应:争议不小
在Hacker News上,这个消息拿到了1674分和上千条评论,但讨论区的氛围颇为复杂。
不少用户直接表示”失望”。一条高赞评论说”seems like a really minor upgrade?”,另一条则讽刺道”Yes, but if version number go up, so do all other number”。有人注意到Anthropic自己也承认”Users will find Opus 4.8 to be a modest but tangible improvement”——官方自己都说是”modest”。
但也有理性分析的声音。有用户指出:”I think they will all be minor going forward, feels like the major improvements have all been made and we’ll only see incremental improvements from here on out.” 这反映了AI社区中越来越多人认为大模型的能力提升正在放缓。
反驳者则认为训练数据并没有枯竭:”With RLHF and RLVR we are creating tons of new training data, that is much more focused than reading the Internet.” 标注公司每年产生数十亿美元收入来创建新的训练数据,这些数据比互联网原始数据更有针对性。
还有人指出了一个有趣的问题——互联网上AI生成内容越来越多,导致模型训练数据质量下降。有人提到GPT-5.5开始”痴迷于地精(goblins)”,系统提示词中不得不加入专门指令来阻止模型反复提起这个话题。
对站长和开发者意味着什么
这次升级虽然幅度不大,但有几个值得关注的点:
1. Claude Code用户直接受益:如果你在用Claude Code做开发,新模型的错误捕捉和主动提问能力会让你的编码体验更顺畅。
2. 努力程度控制是实用功能:对于简单任务可以降低努力程度节省token,复杂任务则拉满。这个功能对控制API成本很有帮助。
3. 大模型发展进入”挤牙膏”阶段:如果你在等一个”划时代的飞跃”,可能还要等Project Glasswing。目前各大厂商的模型更新越来越频繁,但每次改进幅度在缩小。这对站长来说其实是好事——不需要频繁切换模型,选一个稳定的长期使用即可。
4. 定价没变:Opus 4.8保持了和前代相同的价格,包括快速模式的定价。增量提升+不涨价,算是一个务实的更新。
实际体验建议
如果你已经在用Claude Opus 4,建议直接切换到4.8,不需要做特别的适配。主要改进集中在Agent任务和编程场景,如果你主要用Claude做文本生成或对话,感知可能不明显。
对于API用户,建议关注”努力程度”参数的使用。简单任务用低努力模式,可以显著降低token消耗。复杂代码生成或分析任务用高努力模式,获得更好的结果质量。
本文参考来源:Anthropic官方公告 | HN讨论(1674分)
















暂无评论内容