Anthropic发布Glasswing月报:Claude Mythos已发现超1万个高危漏洞

Anthropic在5月22日发布了Project Glasswing的首月进展报告,数据令人震惊:参与合作的约50个合作伙伴,使用Claude Mythos Preview模型,在一个月内发现了超过1万个高危或严重级别的安全漏洞。

什么是Project Glasswing

Project Glasswing是Anthropic在2026年4月启动的安全合作项目,旨在利用AI模型发现和修复关键基础设施中的安全漏洞。合作伙伴包括微软、Palo Alto Networks等维护互联网核心软件的公司。

首月成果

根据报告:

1. 1万+高危漏洞:合作伙伴在各自的代码库中发现了超过1万个高危或严重级别的漏洞。

2. 90.6%确认率:在经过独立安全研究公司评估的1752个高危漏洞中,90.6%被确认为真实漏洞。

3. 开源项目扫描:Anthropic用Mythos Preview扫描了1000多个开源项目,发现6202个高危/严重漏洞(总计23019个)。这些项目支撑着互联网的大部分基础设施。

4. 实际案例:在一个合作银行中,Mythos Preview帮助检测并阻止了一笔150万美元的欺诈性电汇。

修复速度加快

报告中最值得注意的是修复速度的变化:

Palo Alto Networks的最新版本包含的补丁数量是平时的5倍以上。微软也报告了修复速度的显著提升。

Anthropic指出,以前的瓶颈是”发现漏洞”,现在瓶颈转移到了”人工分类、报告和设计部署补丁”。AI让发现变得容易,但人类的处理能力跟不上。

开源项目的发现

在扫描的1000多个开源项目中,Mythos Preview发现了一个典型案例:wolfSSL(一个被数十亿设备使用的开源加密库)中的漏洞。这类底层库的漏洞影响范围极广,但过去很难被发现。

对站长和开发者的意义

安全工具的选择在变化:AI驱动的安全扫描工具正在从”辅助工具”变成”核心工具”。如果你的团队还没有开始使用AI辅助代码审计,现在是时候了。

开源依赖风险:1000个开源项目中就有6000+高危漏洞。如果你的项目依赖这些开源库,现在是检查依赖版本和应用安全补丁的好时机。

漏洞赏金模式可能改变:当AI可以批量发现漏洞时,传统的人工漏洞赏金模式可能需要调整。

关注Claude Mythos的公开可用性:目前Mythos Preview只对Glasswing合作伙伴开放,但Anthropic表示会逐步扩大可用范围。一旦公开,站长也可以用它来审计自己的代码。

开源审计工具

值得关注的是,已经有人基于Glasswing的架构开发了开源的漏洞发现工具——evilsocket/audit项目(8阶段漏洞发现Agent),使用Claude Pro/Max订阅即可运行,不需要额外API密钥。这个项目复现了Cloudflare在Glasswing博客中描述的架构,我们会在后续文章中详细介绍。

本文参考来源:Anthropic – Project Glasswing: An initial update | Hacker News讨论

© 版权声明
THE END
喜欢就支持一下吧
点赞8 分享
相关推荐
<p>菲尔兹奖得主、剑桥大学数学家Timothy Gowers近日在个人博客上分享了他使用ChatGPT 5.5 Pro的体验。令他惊讶的是,这款模型在一小时内连续攻克了多个博士级别的数学难题,展现出远超前代的推理能力。</p>

<h2>菲尔兹奖得主的实测</h2>

<p>Timothy Gowers是当代最有影响力的数学家之一,1998年获得菲尔兹奖,在组合数学和泛函分析领域有重要贡献。他在5月8日发布了一篇详细的博文,记录了自己测试ChatGPT 5.5 Pro推理能力的过程。</p>

<p>据Gowers描述,他给ChatGPT 5.5 Pro提出了多个需要深度推理的数学问题,这些问题的难度大致相当于数学博士资格考试或研究级别。让他印象深刻的是,模型不仅能够给出正确答案,还能提供完整的推理过程,包括:</p>

<ul>
<li>对问题的准确理解</li>
<li>合理的解题策略选择</li>
<li>严密的逻辑推导链</li>
<li>对特殊情况的处理</li>
</ul>

<h2>与前代模型的对比</h2>

<p>Gowers在博文中提到,之前版本的ChatGPT在处理类似难度的数学问题时,经常出现以下问题:</p>

<ul>
<li>推理链中途断裂,得出错误结论</li>
<li>混淆不同数学概念</li>
<li>在计算步骤中出错</li>
<li>无法识别问题的关键约束条件</li>
</ul>

<p>而ChatGPT 5.5 Pro在这些方面有了显著提升。Gowers认为,这一代模型的数学推理能力已经达到了”可以辅助专业数学研究”的水平。</p>

<h2>对普通用户意味着什么</h2>

<p>虽然菲尔兹奖级别的数学测试看起来离普通人很远,但ChatGPT 5.5 Pro展现出的推理能力提升,对日常使用也有实际影响:</p>

<ul>
<li><strong>编程辅助</strong>:更强的逻辑推理能力意味着在代码调试、算法设计等场景下能给出更准确的建议。</li>
<li><strong>数据分析</strong>:处理复杂的数据分析任务时,模型能更好地理解数据关系和统计方法。</li>
<li><strong>技术文档</strong>:在撰写技术文档、API文档等需要严密逻辑的内容时,输出质量更高。</li>
<li><strong>教育辅导</strong>:作为学习辅助工具,能提供更准确的解题思路和步骤讲解。</li>
</ul>

<h2>AI数学能力的里程碑</h2>

<p>ChatGPT 5.5 Pro的表现引发了AI社区的广泛讨论。有观点认为,这标志着大语言模型在形式推理领域取得了重要突破。也有研究者持谨慎态度,指出:</p>

<ul>
<li>单一数学家的主观测试不能替代系统性基准评估</li>
<li>模型可能在训练数据中见过类似题目</li>
<li>真正的数学创新(如提出新定理、发现新证明)仍然是AI的短板</li>
</ul>

<p>无论如何,AI在数学推理方面的进步速度是实实在在的。对于站长和开发者来说,善用AI的推理能力来辅助技术工作,已经是一个切实可行的选择。</p>

<blockquote>
<p><strong>来源:</strong></p>
<ul>
<li><a href=Timothy Gowers Blog – A Recent Experience with ChatGPT 5.5 Pro
  • OSCHINA – ChatGPT 5.5 Pro一小时攻克博士级数学难题
  • -枫选">

    菲尔兹奖得主、剑桥大学数学家Timothy Gowers近日在个人博客上分享了他使用ChatGPT 5.5 Pro的体验。令他惊讶的是,这款模型在一小时内连续攻克了多个博士级别的数学难题,展现出远超前代的推理能力。

    菲尔兹奖得主的实测

    Timothy Gowers是当代最有影响力的数学家之一,1998年获得菲尔兹奖,在组合数学和泛函分析领域有重要贡献。他在5月8日发布了一篇详细的博文,记录了自己测试ChatGPT 5.5 Pro推理能力的过程。

    据Gowers描述,他给ChatGPT 5.5 Pro提出了多个需要深度推理的数学问题,这些问题的难度大致相当于数学博士资格考试或研究级别。让他印象深刻的是,模型不仅能够给出正确答案,还能提供完整的推理过程,包括:

    • 对问题的准确理解
    • 合理的解题策略选择
    • 严密的逻辑推导链
    • 对特殊情况的处理

    与前代模型的对比

    Gowers在博文中提到,之前版本的ChatGPT在处理类似难度的数学问题时,经常出现以下问题:

    • 推理链中途断裂,得出错误结论
    • 混淆不同数学概念
    • 在计算步骤中出错
    • 无法识别问题的关键约束条件

    而ChatGPT 5.5 Pro在这些方面有了显著提升。Gowers认为,这一代模型的数学推理能力已经达到了”可以辅助专业数学研究”的水平。

    对普通用户意味着什么

    虽然菲尔兹奖级别的数学测试看起来离普通人很远,但ChatGPT 5.5 Pro展现出的推理能力提升,对日常使用也有实际影响:

    • 编程辅助:更强的逻辑推理能力意味着在代码调试、算法设计等场景下能给出更准确的建议。
    • 数据分析:处理复杂的数据分析任务时,模型能更好地理解数据关系和统计方法。
    • 技术文档:在撰写技术文档、API文档等需要严密逻辑的内容时,输出质量更高。
    • 教育辅导:作为学习辅助工具,能提供更准确的解题思路和步骤讲解。

    AI数学能力的里程碑

    ChatGPT 5.5 Pro的表现引发了AI社区的广泛讨论。有观点认为,这标志着大语言模型在形式推理领域取得了重要突破。也有研究者持谨慎态度,指出:

    • 单一数学家的主观测试不能替代系统性基准评估
    • 模型可能在训练数据中见过类似题目
    • 真正的数学创新(如提出新定理、发现新证明)仍然是AI的短板

    无论如何,AI在数学推理方面的进步速度是实实在在的。对于站长和开发者来说,善用AI的推理能力来辅助技术工作,已经是一个切实可行的选择。

    来源:

    菲尔兹奖得主、剑桥大学数学家Timothy Gowers近日在个人博客上分享了他使用ChatGPT 5.5 Pro的...

    31天前 60
    评论 抢沙发

    请登录后发表评论

      暂无评论内容