geohot发长文警告:AI编程Agent是软件开发史上最昂贵的错误之一

George Hotz(geohot),tinygrad 的创始人、Comma.ai 的创始人,昨天在他的博客上发了一篇措辞激烈的文章”The Eternal Sloptember”,直言不讳地表示:AI 编程 Agent 被引入软件开发,将是这个领域历史上代价最大的错误之一。

这篇文章在 Hacker News 上引发了 327 点的热议和大量讨论。不管你是否同意他的观点,这篇文章都值得认真读一读。

geohot 说了什么

geohot 的核心观点很直接:AI 编程 Agent 不会编程。它们是一个高度复杂的统计模型,设计目的是模仿编程的分布。输出是有问题的,但问题正在变得越来越难以检测——这恰恰是一个越来越精确的统计模型所应该表现出来的。

他特别强调,他不是在说 AI 没有用。AI 显然是有用的,它是一个比 Google 更好的搜索引擎,可以帮你在大多数情况下找到答案。但”有用”和”会编程”是两回事。

他亲自试了 6 个月

geohot 说他过去 6 个月一直在认真尝试使用 AI 编程 Agent:

  • 用 Agent 写了 tinygrad 的部分代码
  • 用 Agent 反向工程了一个 USB 转 PCIe 芯片
  • 尝试了所有不同的模型、不同的 harness、不同的提示方式

但每次他都怀疑,自己手动做可能做得更好、更快。Agent 的输出看起来不错,但总是有些地方不对——需要花时间去发现问题、修正问题,而这些时间本可以用来直接写正确的代码。

对大公司的警告

geohot 的一个很有意思的观察是:AI 编程 Agent 对大公司的伤害会比对个人或小团队更大。

原因是大公司的反馈循环很慢,对齐程度低。底层工程师可能知道 Agent 的输出有问题,但管理层看到的是”代码量增加了”、”功能交付加快了”。问题要到很久以后才会暴露——当技术债积累到一定程度,当系统变得难以维护,当关键 bug 出现在 Agent 生成的代码中。

他特别提到,据说苹果正在推动所有工程师使用 AI。他认为这可能是一个代价高昂的决定。

“AI 精神病”

文章中一个引人注目的概念是”AI 精神病”(AI psychosis)。geohot 认为,当人们看到一个产出物时,会假设它背后有一个可靠的过程。但 AI 生成的内容打破了这个假设——产出物看起来很好,但背后的过程是不可靠的。

他预测,这个时代真正的故事将是:谁能在 AI 精神病中避免伤害自己。

社区反应

HN 上的讨论非常两极化:

支持者认为 geohot 说出了很多人不敢说的话。AI 编程 Agent 的能力被严重高估了,特别是在复杂的、需要深度理解的项目中。很多人分享了类似的体验——Agent 的代码看起来对,但仔细审查后发现各种问题。

反对者认为 geohot 的使用场景不适合 Agent。Agent 在某些场景下(快速原型、简单 CRUD、样板代码)确实能提高效率。而且 Agent 的能力在快速进步,现在的问题可能很快就会被解决。

还有一些中立观点认为,问题不在于 Agent 本身,而在于我们如何使用它。把它当作辅助工具而不是替代品,保持对输出的审查和批判,才是正确的态度。

我的看法

geohot 的观点有些极端,但他提出的问题是真实的。AI 编程 Agent 确实存在一个”看起来对但实际有问题”的输出特征,而且随着模型能力提升,这个问题不是消失了,而是变得更隐蔽了。

对于站长和开发者来说,几个实际建议:

  • 不要盲目信任 Agent 生成的代码,特别是涉及安全、数据、财务的场景
  • 把 Agent 当作辅助工具,而不是替代品
  • 保持自己的编程能力,不要因为有了 Agent 就停止学习
  • 在团队中建立代码审查机制,不要因为 Agent 生成的代码就降低审查标准
  • 关注 Agent 的局限性,了解它在什么场景下表现好,什么场景下表现差

无论你是否同意 geohot 的结论,这篇文章都提醒我们:在拥抱 AI 工具的同时,保持清醒和批判性思维同样重要。

本文参考来源:The Eternal Sloptember – geohot’s blog | Hacker News 讨论

© 版权声明
THE END
喜欢就支持一下吧
点赞15 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容