“整个公司正在AI精神错乱”:Mitchell Hashimoto 的警告,站长该怎么看

2026年5月17日,HashiCorp 联合创始人 Mitchell Hashimoto 在 X(前 Twitter)上发了一条帖子,引发了技术圈的广泛讨论。他说:“I believe there are entire companies right now under AI psychosis.”(我相信现在有些整个公司正处于AI精神错乱状态。)

这条帖子在 Hacker News 上获得了超过 2000 个点赞和 1200 多条评论,成为近几天技术社区讨论最热烈的话题之一。作为站长和开发者,这件事值得我们认真想一想。

Hashimoto 说了什么

Hashimoto 没有在帖子里指名道姓说哪家公司,但他用了一个很形象的说法——”AI精神错乱”(AI psychosis)。在后续的讨论中,社区对这个词的理解大致是:

  • 过度依赖 AI 做决策:有些公司把 AI 当成万能工具,连不适合用 AI 的场景也硬上
  • AI 产出无人审核:大量 AI 生成的代码、报告、文档没有经过人工审查就直接上线
  • 为了 AI 而 AI:不是为了解决实际问题,而是因为”别人都在用AI”所以也要用
  • 对 AI 能力的幻觉:高估 AI 的可靠性,低估 AI 带来的风险和维护成本

Hacker News 社区的反应

HN 社区对这个话题的讨论非常热烈,几个高赞观点值得注意:

关于 AI 代码质量:不少开发者反映,他们公司引入 AI 编程工具后,代码量确实增加了,但代码审查的负担也同步增加。AI 生成的代码表面上能跑,但经常存在边界情况处理不当、安全漏洞、性能隐患等问题。

关于 AI 决策:有人提到,一些公司开始用 AI 来做产品决策、招聘筛选甚至财务分析,但 AI 的”幻觉”问题在这些高风险场景下被放大了。

关于成本:近期 Uber 被曝出四个月就烧光了全年的 AI 预算,Claude Code 的使用费用惊人。这说明 AI 工具的成本并不是很多人想象的”用了就省钱”。

站长和开发者该怎么看

Hashimoto 的警告不是说 AI 没用,而是说用错了方式会出问题。对于站长和开发者来说,有几个实际建议:

1. AI 是工具,不是替代品

AI 编程助手(Claude Code、Cursor、Copilot 等)确实能提高效率,但它们输出的内容必须经过人工审核。不要盲目信任 AI 生成的代码,尤其是在安全、数据处理、用户隐私等关键环节。

2. 算清楚 AI 的成本账

AI 工具的费用包括:订阅费(Cursor Pro $20/月、Claude Max $100/月)、API 调用费、以及审核和修正 AI 输出的时间成本。在决定大规模使用之前,先算一笔账。

3. 不要为了追热点而用 AI

如果你的业务用传统方法就能很好地解决,没必要硬塞一个 AI。AI 适合的场景包括:代码补全、文档生成、数据分析、客服自动化等。不适合的场景包括:需要精确控制的业务逻辑、高安全要求的系统、需要人工判断的决策。

4. 关注 AI 安全和合规

使用 AI 工具时,注意不要把敏感数据(用户信息、API密钥、数据库密码)发送给第三方 AI 服务。企业用户尤其要注意数据合规问题。

这件事对行业的影响

Hashimoto 的发言代表了一种正在形成的技术社区共识:AI 的价值是真实的,但过度炒作和不当使用正在制造新问题。2026年以来,我们已经看到了多个相关信号:

  • Uber 四个月烧光全年 AI 预算
  • Linux 内核安全邮件列表被 AI 生成的漏洞报告淹没
  • 多家企业反馈 AI 编程工具的 ROI 不如预期
  • AI 生成内容的质量问题引发法律和版权争议

这些都不是说 AI 不行,而是说行业正在从”AI万能”的幻觉中清醒过来,开始更务实地看待 AI 的能力和局限。

简评

作为站长,我的建议是:继续用 AI 工具,但要保持清醒。AI 编程助手能帮你节省时间,AI 客服能帮你降低人力成本,AI 内容工具能帮你提高产出效率——但前提是你要知道什么时候该用、什么时候不该用、用了之后怎么审核。

Hashimoto 说的”AI精神错乱”,本质上是一种技术决策上的从众心理和能力幻觉。避免这种错乱的方法很简单:让 AI 解决具体问题,而不是让 AI 成为问题本身

来源:

© 版权声明
THE END
喜欢就支持一下吧
点赞14 分享
相关推荐
<p>菲尔兹奖得主、剑桥大学数学家Timothy Gowers近日在个人博客上分享了他使用ChatGPT 5.5 Pro的体验。令他惊讶的是,这款模型在一小时内连续攻克了多个博士级别的数学难题,展现出远超前代的推理能力。</p>

<h2>菲尔兹奖得主的实测</h2>

<p>Timothy Gowers是当代最有影响力的数学家之一,1998年获得菲尔兹奖,在组合数学和泛函分析领域有重要贡献。他在5月8日发布了一篇详细的博文,记录了自己测试ChatGPT 5.5 Pro推理能力的过程。</p>

<p>据Gowers描述,他给ChatGPT 5.5 Pro提出了多个需要深度推理的数学问题,这些问题的难度大致相当于数学博士资格考试或研究级别。让他印象深刻的是,模型不仅能够给出正确答案,还能提供完整的推理过程,包括:</p>

<ul>
<li>对问题的准确理解</li>
<li>合理的解题策略选择</li>
<li>严密的逻辑推导链</li>
<li>对特殊情况的处理</li>
</ul>

<h2>与前代模型的对比</h2>

<p>Gowers在博文中提到,之前版本的ChatGPT在处理类似难度的数学问题时,经常出现以下问题:</p>

<ul>
<li>推理链中途断裂,得出错误结论</li>
<li>混淆不同数学概念</li>
<li>在计算步骤中出错</li>
<li>无法识别问题的关键约束条件</li>
</ul>

<p>而ChatGPT 5.5 Pro在这些方面有了显著提升。Gowers认为,这一代模型的数学推理能力已经达到了”可以辅助专业数学研究”的水平。</p>

<h2>对普通用户意味着什么</h2>

<p>虽然菲尔兹奖级别的数学测试看起来离普通人很远,但ChatGPT 5.5 Pro展现出的推理能力提升,对日常使用也有实际影响:</p>

<ul>
<li><strong>编程辅助</strong>:更强的逻辑推理能力意味着在代码调试、算法设计等场景下能给出更准确的建议。</li>
<li><strong>数据分析</strong>:处理复杂的数据分析任务时,模型能更好地理解数据关系和统计方法。</li>
<li><strong>技术文档</strong>:在撰写技术文档、API文档等需要严密逻辑的内容时,输出质量更高。</li>
<li><strong>教育辅导</strong>:作为学习辅助工具,能提供更准确的解题思路和步骤讲解。</li>
</ul>

<h2>AI数学能力的里程碑</h2>

<p>ChatGPT 5.5 Pro的表现引发了AI社区的广泛讨论。有观点认为,这标志着大语言模型在形式推理领域取得了重要突破。也有研究者持谨慎态度,指出:</p>

<ul>
<li>单一数学家的主观测试不能替代系统性基准评估</li>
<li>模型可能在训练数据中见过类似题目</li>
<li>真正的数学创新(如提出新定理、发现新证明)仍然是AI的短板</li>
</ul>

<p>无论如何,AI在数学推理方面的进步速度是实实在在的。对于站长和开发者来说,善用AI的推理能力来辅助技术工作,已经是一个切实可行的选择。</p>

<blockquote>
<p><strong>来源:</strong></p>
<ul>
<li><a href=Timothy Gowers Blog – A Recent Experience with ChatGPT 5.5 Pro
  • OSCHINA – ChatGPT 5.5 Pro一小时攻克博士级数学难题
  • -枫选">

    菲尔兹奖得主、剑桥大学数学家Timothy Gowers近日在个人博客上分享了他使用ChatGPT 5.5 Pro的体验。令他惊讶的是,这款模型在一小时内连续攻克了多个博士级别的数学难题,展现出远超前代的推理能力。

    菲尔兹奖得主的实测

    Timothy Gowers是当代最有影响力的数学家之一,1998年获得菲尔兹奖,在组合数学和泛函分析领域有重要贡献。他在5月8日发布了一篇详细的博文,记录了自己测试ChatGPT 5.5 Pro推理能力的过程。

    据Gowers描述,他给ChatGPT 5.5 Pro提出了多个需要深度推理的数学问题,这些问题的难度大致相当于数学博士资格考试或研究级别。让他印象深刻的是,模型不仅能够给出正确答案,还能提供完整的推理过程,包括:

    • 对问题的准确理解
    • 合理的解题策略选择
    • 严密的逻辑推导链
    • 对特殊情况的处理

    与前代模型的对比

    Gowers在博文中提到,之前版本的ChatGPT在处理类似难度的数学问题时,经常出现以下问题:

    • 推理链中途断裂,得出错误结论
    • 混淆不同数学概念
    • 在计算步骤中出错
    • 无法识别问题的关键约束条件

    而ChatGPT 5.5 Pro在这些方面有了显著提升。Gowers认为,这一代模型的数学推理能力已经达到了”可以辅助专业数学研究”的水平。

    对普通用户意味着什么

    虽然菲尔兹奖级别的数学测试看起来离普通人很远,但ChatGPT 5.5 Pro展现出的推理能力提升,对日常使用也有实际影响:

    • 编程辅助:更强的逻辑推理能力意味着在代码调试、算法设计等场景下能给出更准确的建议。
    • 数据分析:处理复杂的数据分析任务时,模型能更好地理解数据关系和统计方法。
    • 技术文档:在撰写技术文档、API文档等需要严密逻辑的内容时,输出质量更高。
    • 教育辅导:作为学习辅助工具,能提供更准确的解题思路和步骤讲解。

    AI数学能力的里程碑

    ChatGPT 5.5 Pro的表现引发了AI社区的广泛讨论。有观点认为,这标志着大语言模型在形式推理领域取得了重要突破。也有研究者持谨慎态度,指出:

    • 单一数学家的主观测试不能替代系统性基准评估
    • 模型可能在训练数据中见过类似题目
    • 真正的数学创新(如提出新定理、发现新证明)仍然是AI的短板

    无论如何,AI在数学推理方面的进步速度是实实在在的。对于站长和开发者来说,善用AI的推理能力来辅助技术工作,已经是一个切实可行的选择。

    来源:

    菲尔兹奖得主、剑桥大学数学家Timothy Gowers近日在个人博客上分享了他使用ChatGPT 5.5 Pro的...

    9天前 55
    评论 抢沙发

    请登录后发表评论

      暂无评论内容