2026年5月18日,AI编程编辑器Cursor正式发布了Composer 2.5。相比上一代Composer 2,新版本在模型智能、长任务处理能力和指令遵循方面都有显著提升。更重要的是,Composer 2.5的训练方法引入了多项创新,值得AI开发者关注。
Composer 2.5是什么
Composer是Cursor的核心AI功能,允许开发者通过自然语言描述来生成和修改代码。从最初的单文件编辑,到支持多文件、多步骤的代码生成,Composer已经成为很多开发者日常工作中不可或缺的工具。
Composer 2.5基于Moonshot的Kimi K2.5开源模型构建,在此基础上进行了大量定制化训练。
训练方法的关键创新
1. 带文本反馈的定向强化学习(Targeted RL with Textual Feedback)
传统的强化学习在长上下文场景下面临一个挑战:当一次推理跨越数十万个token时,最终的奖励信号很难告诉模型”到底是哪一步做对了或做错了”。
Cursor团队引入了”定向文本反馈”方法:在模型推理轨迹中具体的错误位置插入文本提示,描述期望的改进方向。然后用这个带有反馈的上下文作为”教师”,用原始上下文作为”学生”,通过KL散度损失让学生向教师靠拢。这样就获得了针对特定行为的局部训练信号。
2. 合成数据
Cursor团队大量使用合成数据来训练Composer 2.5。具体细节没有完全公开,但从描述来看,他们构建了复杂的RL环境来生成高质量的训练数据。
3. 分片Muon优化器和双网格HSDP
在训练基础设施方面,Cursor使用了分片Muon优化器和双网格分层数据并行(HSDP)技术,提高了大规模训练的效率。
实际体验提升
根据Cursor官方的描述,Composer 2.5在以下方面有明显改进:
- 长任务持续性:能够更好地在长时间、多步骤的任务中保持一致的工作状态
- 指令遵循:更可靠地执行复杂指令,减少偏离预期的情况
- 协作体验:与开发者协作时更加自然和舒适
- 行为优化:改进了沟通风格和努力校准等行为维度
更大的模型正在路上
Cursor在博客中透露,他们正在与SpaceX AI合作,使用10倍以上的计算量从头训练一个更大的模型。借助Colossus 2的百万H100等效算力,预计这将带来模型能力的重大飞跃。
如何使用
Composer 2.5已经在Cursor中可用。如果你已经是Cursor用户,更新到最新版本即可使用。对于新用户,可以从 cursor.com 下载。
对AI编程工具市场的启示
Composer 2.5的发布反映了AI编程工具竞争的白热化。从Cursor、Windsurf到Claude Code、GitHub Copilot,各大玩家都在不断迭代。对于开发者来说,这意味着更好的工具和更快的进步速度。
值得注意的是,Cursor选择在Kimi K2.5开源模型基础上进行定制训练,而不是依赖闭源API,这种策略可能会成为更多AI工具公司的选择。











Timothy Gowers Blog – A Recent Experience with ChatGPT 5.5 Pro



暂无评论内容