340多家美国地方新闻网站限制Internet Archive访问:AI时代的内容保存危机

Internet Archive 的 Wayback Machine 一直是站长和研究者的重要工具——它保存了互联网的历史快照,让我们能回溯任何网站的过去版本。但从 2026 年初开始,越来越多的新闻网站开始封锁 Internet Archive 的爬虫。

发生了什么

据 Nieman Lab 报道,截至 2026 年 5 月,超过 340 家美国地方新闻网站已经限制了 Internet Archive 的访问权限。这些网站背后是美国最大的几家地方新闻出版商:USA Today Co.、McClatchy、Advance Local、MediaNews Group 和 Tribune Publishing。后两者都是 Alden Global Capital 的子公司——这家对冲基金因大幅削减新闻编辑室而被称为”秃鹫基金”。

出版商封锁 Internet Archive 的理由是担心 AI 公司会从 Wayback Machine 抓取内容用于训练模型。但到目前为止,没有任何出版商确认 AI 公司已经这样做了。

为什么这对站长很重要

这场风波的影响远超新闻行业:

  • 内容保存受到威胁:地方新闻是社区历史记录的重要组成部分。一旦这些内容从 Wayback Machine 消失,可能永久丢失
  • SEO 参考受限:很多站长用 Wayback Machine 查看竞争对手或行业网站的历史变化,这个功能正在缩水
  • 法律和合规风险:如果你的网站引用了被删除的新闻内容作为证据,Wayback Machine 可能不再有备份
  • 爬虫封锁趋势蔓延:今天是新闻网站,明天可能是其他类型的网站。AI 恐慌正在推动整个互联网的封闭化

出版商的真实动机

表面上是 AI 训练数据的担忧,但更深层的驱动力可能是:

  • 控制内容的分发渠道,迫使用户直接访问原站(看广告)
  • 为未来与 AI 公司的付费授权谈判保留筹码
  • Alden Global Capital 等对冲基金一贯的成本削减策略

Internet Archive 的困境

密苏里大学新闻图书馆馆长 Edward McCain 警告说:”封锁 Internet Archive 的网络爬虫,威胁到了我们长期捕获和存储新闻内容最有效的方式之一。在当下,我们可能拥有这些信息,但未来几代人可能就没有了。”

Internet Archive 作为非营利组织,其使命就是保存互联网的历史。但面对越来越多网站的封锁,它的能力正在被削弱。

站长可以做什么

  1. 做好自己的内容备份:不要依赖 Wayback Machine 作为唯一备份方案,定期导出网站数据
  2. 关注 robots.txt 配置:如果你不希望自己的内容被 AI 训练,可以通过 robots.txt 精确控制,而不是一刀切封锁所有爬虫
  3. 支持开放互联网:如果你认为内容保存很重要,可以向 Internet Archive 捐款支持
  4. 多元化内容引用来源:不要只依赖 Wayback Machine 链接作为证据,同时保留本地截图和存档

本文参考来源:Nieman Lab | HN 讨论 (166pts)

© 版权声明
THE END
喜欢就支持一下吧
点赞7 分享
相关推荐
<p>菲尔兹奖得主、剑桥大学数学家Timothy Gowers近日在个人博客上分享了他使用ChatGPT 5.5 Pro的体验。令他惊讶的是,这款模型在一小时内连续攻克了多个博士级别的数学难题,展现出远超前代的推理能力。</p>

<h2>菲尔兹奖得主的实测</h2>

<p>Timothy Gowers是当代最有影响力的数学家之一,1998年获得菲尔兹奖,在组合数学和泛函分析领域有重要贡献。他在5月8日发布了一篇详细的博文,记录了自己测试ChatGPT 5.5 Pro推理能力的过程。</p>

<p>据Gowers描述,他给ChatGPT 5.5 Pro提出了多个需要深度推理的数学问题,这些问题的难度大致相当于数学博士资格考试或研究级别。让他印象深刻的是,模型不仅能够给出正确答案,还能提供完整的推理过程,包括:</p>

<ul>
<li>对问题的准确理解</li>
<li>合理的解题策略选择</li>
<li>严密的逻辑推导链</li>
<li>对特殊情况的处理</li>
</ul>

<h2>与前代模型的对比</h2>

<p>Gowers在博文中提到,之前版本的ChatGPT在处理类似难度的数学问题时,经常出现以下问题:</p>

<ul>
<li>推理链中途断裂,得出错误结论</li>
<li>混淆不同数学概念</li>
<li>在计算步骤中出错</li>
<li>无法识别问题的关键约束条件</li>
</ul>

<p>而ChatGPT 5.5 Pro在这些方面有了显著提升。Gowers认为,这一代模型的数学推理能力已经达到了”可以辅助专业数学研究”的水平。</p>

<h2>对普通用户意味着什么</h2>

<p>虽然菲尔兹奖级别的数学测试看起来离普通人很远,但ChatGPT 5.5 Pro展现出的推理能力提升,对日常使用也有实际影响:</p>

<ul>
<li><strong>编程辅助</strong>:更强的逻辑推理能力意味着在代码调试、算法设计等场景下能给出更准确的建议。</li>
<li><strong>数据分析</strong>:处理复杂的数据分析任务时,模型能更好地理解数据关系和统计方法。</li>
<li><strong>技术文档</strong>:在撰写技术文档、API文档等需要严密逻辑的内容时,输出质量更高。</li>
<li><strong>教育辅导</strong>:作为学习辅助工具,能提供更准确的解题思路和步骤讲解。</li>
</ul>

<h2>AI数学能力的里程碑</h2>

<p>ChatGPT 5.5 Pro的表现引发了AI社区的广泛讨论。有观点认为,这标志着大语言模型在形式推理领域取得了重要突破。也有研究者持谨慎态度,指出:</p>

<ul>
<li>单一数学家的主观测试不能替代系统性基准评估</li>
<li>模型可能在训练数据中见过类似题目</li>
<li>真正的数学创新(如提出新定理、发现新证明)仍然是AI的短板</li>
</ul>

<p>无论如何,AI在数学推理方面的进步速度是实实在在的。对于站长和开发者来说,善用AI的推理能力来辅助技术工作,已经是一个切实可行的选择。</p>

<blockquote>
<p><strong>来源:</strong></p>
<ul>
<li><a href=Timothy Gowers Blog – A Recent Experience with ChatGPT 5.5 Pro
  • OSCHINA – ChatGPT 5.5 Pro一小时攻克博士级数学难题
  • -枫选">

    菲尔兹奖得主、剑桥大学数学家Timothy Gowers近日在个人博客上分享了他使用ChatGPT 5.5 Pro的体验。令他惊讶的是,这款模型在一小时内连续攻克了多个博士级别的数学难题,展现出远超前代的推理能力。

    菲尔兹奖得主的实测

    Timothy Gowers是当代最有影响力的数学家之一,1998年获得菲尔兹奖,在组合数学和泛函分析领域有重要贡献。他在5月8日发布了一篇详细的博文,记录了自己测试ChatGPT 5.5 Pro推理能力的过程。

    据Gowers描述,他给ChatGPT 5.5 Pro提出了多个需要深度推理的数学问题,这些问题的难度大致相当于数学博士资格考试或研究级别。让他印象深刻的是,模型不仅能够给出正确答案,还能提供完整的推理过程,包括:

    • 对问题的准确理解
    • 合理的解题策略选择
    • 严密的逻辑推导链
    • 对特殊情况的处理

    与前代模型的对比

    Gowers在博文中提到,之前版本的ChatGPT在处理类似难度的数学问题时,经常出现以下问题:

    • 推理链中途断裂,得出错误结论
    • 混淆不同数学概念
    • 在计算步骤中出错
    • 无法识别问题的关键约束条件

    而ChatGPT 5.5 Pro在这些方面有了显著提升。Gowers认为,这一代模型的数学推理能力已经达到了”可以辅助专业数学研究”的水平。

    对普通用户意味着什么

    虽然菲尔兹奖级别的数学测试看起来离普通人很远,但ChatGPT 5.5 Pro展现出的推理能力提升,对日常使用也有实际影响:

    • 编程辅助:更强的逻辑推理能力意味着在代码调试、算法设计等场景下能给出更准确的建议。
    • 数据分析:处理复杂的数据分析任务时,模型能更好地理解数据关系和统计方法。
    • 技术文档:在撰写技术文档、API文档等需要严密逻辑的内容时,输出质量更高。
    • 教育辅导:作为学习辅助工具,能提供更准确的解题思路和步骤讲解。

    AI数学能力的里程碑

    ChatGPT 5.5 Pro的表现引发了AI社区的广泛讨论。有观点认为,这标志着大语言模型在形式推理领域取得了重要突破。也有研究者持谨慎态度,指出:

    • 单一数学家的主观测试不能替代系统性基准评估
    • 模型可能在训练数据中见过类似题目
    • 真正的数学创新(如提出新定理、发现新证明)仍然是AI的短板

    无论如何,AI在数学推理方面的进步速度是实实在在的。对于站长和开发者来说,善用AI的推理能力来辅助技术工作,已经是一个切实可行的选择。

    来源:

    菲尔兹奖得主、剑桥大学数学家Timothy Gowers近日在个人博客上分享了他使用ChatGPT 5.5 Pro的...

    13天前 56
    评论 抢沙发

    请登录后发表评论

      暂无评论内容