Cursor Composer 2.5发布:训练方法全面升级,长任务能力大幅提升

2026年5月18日,AI编程编辑器Cursor正式发布了Composer 2.5。相比上一代Composer 2,新版本在模型智能、长任务处理能力和指令遵循方面都有显著提升。更重要的是,Composer 2.5的训练方法引入了多项创新,值得AI开发者关注。

Composer 2.5是什么

Composer是Cursor的核心AI功能,允许开发者通过自然语言描述来生成和修改代码。从最初的单文件编辑,到支持多文件、多步骤的代码生成,Composer已经成为很多开发者日常工作中不可或缺的工具。

Composer 2.5基于Moonshot的Kimi K2.5开源模型构建,在此基础上进行了大量定制化训练。

训练方法的关键创新

1. 带文本反馈的定向强化学习(Targeted RL with Textual Feedback)

传统的强化学习在长上下文场景下面临一个挑战:当一次推理跨越数十万个token时,最终的奖励信号很难告诉模型”到底是哪一步做对了或做错了”。

Cursor团队引入了”定向文本反馈”方法:在模型推理轨迹中具体的错误位置插入文本提示,描述期望的改进方向。然后用这个带有反馈的上下文作为”教师”,用原始上下文作为”学生”,通过KL散度损失让学生向教师靠拢。这样就获得了针对特定行为的局部训练信号。

2. 合成数据

Cursor团队大量使用合成数据来训练Composer 2.5。具体细节没有完全公开,但从描述来看,他们构建了复杂的RL环境来生成高质量的训练数据。

3. 分片Muon优化器和双网格HSDP

在训练基础设施方面,Cursor使用了分片Muon优化器和双网格分层数据并行(HSDP)技术,提高了大规模训练的效率。

实际体验提升

根据Cursor官方的描述,Composer 2.5在以下方面有明显改进:

  • 长任务持续性:能够更好地在长时间、多步骤的任务中保持一致的工作状态
  • 指令遵循:更可靠地执行复杂指令,减少偏离预期的情况
  • 协作体验:与开发者协作时更加自然和舒适
  • 行为优化:改进了沟通风格和努力校准等行为维度

更大的模型正在路上

Cursor在博客中透露,他们正在与SpaceX AI合作,使用10倍以上的计算量从头训练一个更大的模型。借助Colossus 2的百万H100等效算力,预计这将带来模型能力的重大飞跃。

如何使用

Composer 2.5已经在Cursor中可用。如果你已经是Cursor用户,更新到最新版本即可使用。对于新用户,可以从 cursor.com 下载。

对AI编程工具市场的启示

Composer 2.5的发布反映了AI编程工具竞争的白热化。从Cursor、Windsurf到Claude Code、GitHub Copilot,各大玩家都在不断迭代。对于开发者来说,这意味着更好的工具和更快的进步速度。

值得注意的是,Cursor选择在Kimi K2.5开源模型基础上进行定制训练,而不是依赖闭源API,这种策略可能会成为更多AI工具公司的选择。

本文参考来源:Cursor – Introducing Composer 2.5

© 版权声明
THE END
喜欢就支持一下吧
点赞9 分享
相关推荐
<p>菲尔兹奖得主、剑桥大学数学家Timothy Gowers近日在个人博客上分享了他使用ChatGPT 5.5 Pro的体验。令他惊讶的是,这款模型在一小时内连续攻克了多个博士级别的数学难题,展现出远超前代的推理能力。</p>

<h2>菲尔兹奖得主的实测</h2>

<p>Timothy Gowers是当代最有影响力的数学家之一,1998年获得菲尔兹奖,在组合数学和泛函分析领域有重要贡献。他在5月8日发布了一篇详细的博文,记录了自己测试ChatGPT 5.5 Pro推理能力的过程。</p>

<p>据Gowers描述,他给ChatGPT 5.5 Pro提出了多个需要深度推理的数学问题,这些问题的难度大致相当于数学博士资格考试或研究级别。让他印象深刻的是,模型不仅能够给出正确答案,还能提供完整的推理过程,包括:</p>

<ul>
<li>对问题的准确理解</li>
<li>合理的解题策略选择</li>
<li>严密的逻辑推导链</li>
<li>对特殊情况的处理</li>
</ul>

<h2>与前代模型的对比</h2>

<p>Gowers在博文中提到,之前版本的ChatGPT在处理类似难度的数学问题时,经常出现以下问题:</p>

<ul>
<li>推理链中途断裂,得出错误结论</li>
<li>混淆不同数学概念</li>
<li>在计算步骤中出错</li>
<li>无法识别问题的关键约束条件</li>
</ul>

<p>而ChatGPT 5.5 Pro在这些方面有了显著提升。Gowers认为,这一代模型的数学推理能力已经达到了”可以辅助专业数学研究”的水平。</p>

<h2>对普通用户意味着什么</h2>

<p>虽然菲尔兹奖级别的数学测试看起来离普通人很远,但ChatGPT 5.5 Pro展现出的推理能力提升,对日常使用也有实际影响:</p>

<ul>
<li><strong>编程辅助</strong>:更强的逻辑推理能力意味着在代码调试、算法设计等场景下能给出更准确的建议。</li>
<li><strong>数据分析</strong>:处理复杂的数据分析任务时,模型能更好地理解数据关系和统计方法。</li>
<li><strong>技术文档</strong>:在撰写技术文档、API文档等需要严密逻辑的内容时,输出质量更高。</li>
<li><strong>教育辅导</strong>:作为学习辅助工具,能提供更准确的解题思路和步骤讲解。</li>
</ul>

<h2>AI数学能力的里程碑</h2>

<p>ChatGPT 5.5 Pro的表现引发了AI社区的广泛讨论。有观点认为,这标志着大语言模型在形式推理领域取得了重要突破。也有研究者持谨慎态度,指出:</p>

<ul>
<li>单一数学家的主观测试不能替代系统性基准评估</li>
<li>模型可能在训练数据中见过类似题目</li>
<li>真正的数学创新(如提出新定理、发现新证明)仍然是AI的短板</li>
</ul>

<p>无论如何,AI在数学推理方面的进步速度是实实在在的。对于站长和开发者来说,善用AI的推理能力来辅助技术工作,已经是一个切实可行的选择。</p>

<blockquote>
<p><strong>来源:</strong></p>
<ul>
<li><a href=Timothy Gowers Blog – A Recent Experience with ChatGPT 5.5 Pro
  • OSCHINA – ChatGPT 5.5 Pro一小时攻克博士级数学难题
  • -枫选">

    菲尔兹奖得主、剑桥大学数学家Timothy Gowers近日在个人博客上分享了他使用ChatGPT 5.5 Pro的体验。令他惊讶的是,这款模型在一小时内连续攻克了多个博士级别的数学难题,展现出远超前代的推理能力。

    菲尔兹奖得主的实测

    Timothy Gowers是当代最有影响力的数学家之一,1998年获得菲尔兹奖,在组合数学和泛函分析领域有重要贡献。他在5月8日发布了一篇详细的博文,记录了自己测试ChatGPT 5.5 Pro推理能力的过程。

    据Gowers描述,他给ChatGPT 5.5 Pro提出了多个需要深度推理的数学问题,这些问题的难度大致相当于数学博士资格考试或研究级别。让他印象深刻的是,模型不仅能够给出正确答案,还能提供完整的推理过程,包括:

    • 对问题的准确理解
    • 合理的解题策略选择
    • 严密的逻辑推导链
    • 对特殊情况的处理

    与前代模型的对比

    Gowers在博文中提到,之前版本的ChatGPT在处理类似难度的数学问题时,经常出现以下问题:

    • 推理链中途断裂,得出错误结论
    • 混淆不同数学概念
    • 在计算步骤中出错
    • 无法识别问题的关键约束条件

    而ChatGPT 5.5 Pro在这些方面有了显著提升。Gowers认为,这一代模型的数学推理能力已经达到了”可以辅助专业数学研究”的水平。

    对普通用户意味着什么

    虽然菲尔兹奖级别的数学测试看起来离普通人很远,但ChatGPT 5.5 Pro展现出的推理能力提升,对日常使用也有实际影响:

    • 编程辅助:更强的逻辑推理能力意味着在代码调试、算法设计等场景下能给出更准确的建议。
    • 数据分析:处理复杂的数据分析任务时,模型能更好地理解数据关系和统计方法。
    • 技术文档:在撰写技术文档、API文档等需要严密逻辑的内容时,输出质量更高。
    • 教育辅导:作为学习辅助工具,能提供更准确的解题思路和步骤讲解。

    AI数学能力的里程碑

    ChatGPT 5.5 Pro的表现引发了AI社区的广泛讨论。有观点认为,这标志着大语言模型在形式推理领域取得了重要突破。也有研究者持谨慎态度,指出:

    • 单一数学家的主观测试不能替代系统性基准评估
    • 模型可能在训练数据中见过类似题目
    • 真正的数学创新(如提出新定理、发现新证明)仍然是AI的短板

    无论如何,AI在数学推理方面的进步速度是实实在在的。对于站长和开发者来说,善用AI的推理能力来辅助技术工作,已经是一个切实可行的选择。

    来源:

    菲尔兹奖得主、剑桥大学数学家Timothy Gowers近日在个人博客上分享了他使用ChatGPT 5.5 Pro的...

    10天前 55
    评论 抢沙发

    请登录后发表评论

      暂无评论内容