geohot发长文警告：AI编程Agent是软件开发史上最昂贵的错误之一

George Hotz（geohot），tinygrad 的创始人、Comma.ai 的创始人，昨天在他的博客上发了一篇措辞激烈的文章”The Eternal Sloptember”，直言不讳地表示：AI 编程 Agent 被引入软件开发，将是这个领域历史上代价最大的错误之一。

这篇文章在 Hacker News 上引发了 327 点的热议和大量讨论。不管你是否同意他的观点，这篇文章都值得认真读一读。

geohot 说了什么

geohot 的核心观点很直接：AI 编程 Agent 不会编程。它们是一个高度复杂的统计模型，设计目的是模仿编程的分布。输出是有问题的，但问题正在变得越来越难以检测——这恰恰是一个越来越精确的统计模型所应该表现出来的。

他特别强调，他不是在说 AI 没有用。AI 显然是有用的，它是一个比 Google 更好的搜索引擎，可以帮你在大多数情况下找到答案。但”有用”和”会编程”是两回事。

他亲自试了 6 个月

geohot 说他过去 6 个月一直在认真尝试使用 AI 编程 Agent：

用 Agent 写了 tinygrad 的部分代码
用 Agent 反向工程了一个 USB 转 PCIe 芯片
尝试了所有不同的模型、不同的 harness、不同的提示方式

但每次他都怀疑，自己手动做可能做得更好、更快。Agent 的输出看起来不错，但总是有些地方不对——需要花时间去发现问题、修正问题，而这些时间本可以用来直接写正确的代码。

对大公司的警告

geohot 的一个很有意思的观察是：AI 编程 Agent 对大公司的伤害会比对个人或小团队更大。

原因是大公司的反馈循环很慢，对齐程度低。底层工程师可能知道 Agent 的输出有问题，但管理层看到的是”代码量增加了”、”功能交付加快了”。问题要到很久以后才会暴露——当技术债积累到一定程度，当系统变得难以维护，当关键 bug 出现在 Agent 生成的代码中。

他特别提到，据说苹果正在推动所有工程师使用 AI。他认为这可能是一个代价高昂的决定。

“AI 精神病”

文章中一个引人注目的概念是”AI 精神病”（AI psychosis）。geohot 认为，当人们看到一个产出物时，会假设它背后有一个可靠的过程。但 AI 生成的内容打破了这个假设——产出物看起来很好，但背后的过程是不可靠的。

他预测，这个时代真正的故事将是：谁能在 AI 精神病中避免伤害自己。

社区反应

HN 上的讨论非常两极化：

支持者认为 geohot 说出了很多人不敢说的话。AI 编程 Agent 的能力被严重高估了，特别是在复杂的、需要深度理解的项目中。很多人分享了类似的体验——Agent 的代码看起来对，但仔细审查后发现各种问题。

反对者认为 geohot 的使用场景不适合 Agent。Agent 在某些场景下（快速原型、简单 CRUD、样板代码）确实能提高效率。而且 Agent 的能力在快速进步，现在的问题可能很快就会被解决。

还有一些中立观点认为，问题不在于 Agent 本身，而在于我们如何使用它。把它当作辅助工具而不是替代品，保持对输出的审查和批判，才是正确的态度。

我的看法

geohot 的观点有些极端，但他提出的问题是真实的。AI 编程 Agent 确实存在一个”看起来对但实际有问题”的输出特征，而且随着模型能力提升，这个问题不是消失了，而是变得更隐蔽了。

对于站长和开发者来说，几个实际建议：

不要盲目信任 Agent 生成的代码，特别是涉及安全、数据、财务的场景
把 Agent 当作辅助工具，而不是替代品
保持自己的编程能力，不要因为有了 Agent 就停止学习
在团队中建立代码审查机制，不要因为 Agent 生成的代码就降低审查标准
关注 Agent 的局限性，了解它在什么场景下表现好，什么场景下表现差

无论你是否同意 geohot 的结论，这篇文章都提醒我们：在拥抱 AI 工具的同时，保持清醒和批判性思维同样重要。

本文参考来源：The Eternal Sloptember – geohot’s blog | Hacker News 讨论

文章版权声明 1、本网站名称：枫选
2、本站永久网址：https://feng.cx
3、本网站的文章部分内容可能来源于网络，仅供大家学习与参考，如有侵权，请联系站长进行删除处理。
4、本站一切资源不代表本站立场，并不代表本站赞同其观点和对其真实性负责。
5、本站一律禁止以任何方式发布或转载任何违法的相关信息，访客发现请向站长举报
6、本站资源大多存储在云盘，如发现链接失效，请联系我们我们会第一时间更新。

THE END