Cursor Composer 2.5发布：训练方法全面升级，长任务能力大幅提升

1个月前发布

0429

2026年5月18日，AI编程编辑器Cursor正式发布了Composer 2.5。相比上一代Composer 2，新版本在模型智能、长任务处理能力和指令遵循方面都有显著提升。更重要的是，Composer 2.5的训练方法引入了多项创新，值得AI开发者关注。

Composer 2.5是什么

Composer是Cursor的核心AI功能，允许开发者通过自然语言描述来生成和修改代码。从最初的单文件编辑，到支持多文件、多步骤的代码生成，Composer已经成为很多开发者日常工作中不可或缺的工具。

Composer 2.5基于Moonshot的Kimi K2.5开源模型构建，在此基础上进行了大量定制化训练。

训练方法的关键创新

1. 带文本反馈的定向强化学习（Targeted RL with Textual Feedback）

传统的强化学习在长上下文场景下面临一个挑战：当一次推理跨越数十万个token时，最终的奖励信号很难告诉模型”到底是哪一步做对了或做错了”。

Cursor团队引入了”定向文本反馈”方法：在模型推理轨迹中具体的错误位置插入文本提示，描述期望的改进方向。然后用这个带有反馈的上下文作为”教师”，用原始上下文作为”学生”，通过KL散度损失让学生向教师靠拢。这样就获得了针对特定行为的局部训练信号。

2. 合成数据

Cursor团队大量使用合成数据来训练Composer 2.5。具体细节没有完全公开，但从描述来看，他们构建了复杂的RL环境来生成高质量的训练数据。

3. 分片Muon优化器和双网格HSDP

在训练基础设施方面，Cursor使用了分片Muon优化器和双网格分层数据并行（HSDP）技术，提高了大规模训练的效率。

实际体验提升

根据Cursor官方的描述，Composer 2.5在以下方面有明显改进：

长任务持续性：能够更好地在长时间、多步骤的任务中保持一致的工作状态
指令遵循：更可靠地执行复杂指令，减少偏离预期的情况
协作体验：与开发者协作时更加自然和舒适
行为优化：改进了沟通风格和努力校准等行为维度

更大的模型正在路上

Cursor在博客中透露，他们正在与SpaceX AI合作，使用10倍以上的计算量从头训练一个更大的模型。借助Colossus 2的百万H100等效算力，预计这将带来模型能力的重大飞跃。

如何使用

Composer 2.5已经在Cursor中可用。如果你已经是Cursor用户，更新到最新版本即可使用。对于新用户，可以从 cursor.com 下载。

对AI编程工具市场的启示

Composer 2.5的发布反映了AI编程工具竞争的白热化。从Cursor、Windsurf到Claude Code、GitHub Copilot，各大玩家都在不断迭代。对于开发者来说，这意味着更好的工具和更快的进步速度。

值得注意的是，Cursor选择在Kimi K2.5开源模型基础上进行定制训练，而不是依赖闭源API，这种策略可能会成为更多AI工具公司的选择。

本文参考来源：Cursor – Introducing Composer 2.5

文章版权声明 1、本网站名称：枫选
2、本站永久网址：https://feng.cx
3、本网站的文章部分内容可能来源于网络，仅供大家学习与参考，如有侵权，请联系站长进行删除处理。
4、本站一切资源不代表本站立场，并不代表本站赞同其观点和对其真实性负责。
5、本站一律禁止以任何方式发布或转载任何违法的相关信息，访客发现请向站长举报
6、本站资源大多存储在云盘，如发现链接失效，请联系我们我们会第一时间更新。

THE END