antirez 开源 ds4:DeepSeek V4 Flash 本地推理引擎,96GB MacBook 就能跑

Redis 的作者 Salvatore Sanfilippo(网名 antirez)在 GitHub 上发布了一个新项目 ds4,目标是让 DeepSeek V4 Flash 模型可以在个人设备上本地推理运行。项目上线不到两周,就收获了超过 10000 个 star,成为近期最受关注的开源 AI 项目之一。

ds4 是什么

ds4 全称是 DeepSeek 4 Flash local inference engine,是一个独立的本地推理引擎,专门为 DeepSeek V4 Flash 模型设计。它不依赖任何第三方推理框架,而是自己实现了完整的推理流程。

项目地址:https://github.com/antirez/ds4

目前项目处于 alpha 阶段,代码主要由 GPT 5.5 辅助编写,antirez 团队负责架构设计、测试和调试。项目基于 llama.cpp 和 GGML 的技术基础,但在 KV 缓存管理上有独特的设计理念。

核心特点

硬件支持:优化路径针对 macOS 的 Metal 和 Linux 的 CUDA,CPU 路径仅用于正确性检查。在 macOS 上可以直接利用 Apple Silicon 的 GPU 加速。

内存需求:最低需要 96GB 内存的设备(MacBook Pro M4 Max 或 Mac Studio 等),支持 2-bit 量化可以在更小内存上运行,但推荐使用 128GB 内存以获得最佳体验。

KV 缓存创新:ds4 提出了一个重要的理念——KV 缓存应该成为磁盘的一等公民。现代 MacBook 的高速 SSD 和 DeepSeek V4 的压缩 KV 缓存技术,使得将 KV 缓存放在磁盘上成为可行方案,这大幅降低了内存需求。

独立 GGUF 文件:ds4 只能使用项目提供的特定 GGUF 文件,这些文件经过专门优化以配合推理引擎工作。项目会对不同上下文长度下的 logits 进行验证,确保输出质量。

安装和使用

安装步骤相对简单:

macOS:克隆仓库后直接 make 即可,会自动启用 Metal 加速:

git clone https://github.com/antirez/ds4.git
cd ds4
make

Linux(CUDA):需要先安装 CUDA 工具链,然后执行:

make cuda

CPU Only:仅用于调试和检查,不推荐日常使用:

make cpu

编译完成后,ds4 提供两个二进制文件:ds4 用于交互式使用,ds4-server 提供 HTTP API 接口,可以对接各种 AI 客户端。

社区反应

这个项目在 Hacker News 上引发了广泛讨论。社区的关注点主要集中在几个方面:

  • 本地推理的意义:很多开发者认为,即使云端 API 方便,本地推理在隐私保护、离线使用和成本控制上仍有不可替代的价值
  • 量化技术:2-bit 量化虽然降低了精度,但对于很多日常使用场景已经足够,这让更低配置的设备也有机会运行
  • antirez 的影响力:作为 Redis 的作者,antirez 的技术判断力受到社区信任,这也是项目快速获得关注的重要原因

适合谁

这个项目适合以下人群:

  • 拥有高配 MacBook Pro 或 Mac Studio 的开发者,想要在本地体验 DeepSeek V4 Flash
  • 对 LLM 推理原理感兴趣的研究者,ds4 的代码结构清晰,是学习推理引擎实现的好材料
  • 注重数据隐私的用户,不想将敏感数据发送到云端 API
  • 想要构建本地 AI 应用的开发者,ds4-server 的 HTTP API 可以直接对接应用

注意事项

  • 项目处于 alpha 阶段,可能存在 bug 和性能问题
  • macOS 上的虚拟内存实现存在已知 bug,运行 CPU 代码可能导致内核崩溃
  • 需要特定的 GGUF 文件,不能直接使用 HuggingFace 上的通用模型文件
  • 96GB 内存是最低要求,实际使用建议 128GB 以上

简评

antirez 的 ds4 项目代表了本地 LLM 推理的一个重要方向:不追求通用性,而是针对特定模型做深度优化。这种”一个模型做到极致”的思路,可能比”支持所有模型但每个都半吊子”更实用。对于有条件运行的开发者来说,值得尝试。

本文参考来源:antirez/ds4 – GitHub | Hacker News 讨论

© 版权声明
THE END
喜欢就支持一下吧
点赞6 分享
相关推荐
<p>菲尔兹奖得主、剑桥大学数学家Timothy Gowers近日在个人博客上分享了他使用ChatGPT 5.5 Pro的体验。令他惊讶的是,这款模型在一小时内连续攻克了多个博士级别的数学难题,展现出远超前代的推理能力。</p>

<h2>菲尔兹奖得主的实测</h2>

<p>Timothy Gowers是当代最有影响力的数学家之一,1998年获得菲尔兹奖,在组合数学和泛函分析领域有重要贡献。他在5月8日发布了一篇详细的博文,记录了自己测试ChatGPT 5.5 Pro推理能力的过程。</p>

<p>据Gowers描述,他给ChatGPT 5.5 Pro提出了多个需要深度推理的数学问题,这些问题的难度大致相当于数学博士资格考试或研究级别。让他印象深刻的是,模型不仅能够给出正确答案,还能提供完整的推理过程,包括:</p>

<ul>
<li>对问题的准确理解</li>
<li>合理的解题策略选择</li>
<li>严密的逻辑推导链</li>
<li>对特殊情况的处理</li>
</ul>

<h2>与前代模型的对比</h2>

<p>Gowers在博文中提到,之前版本的ChatGPT在处理类似难度的数学问题时,经常出现以下问题:</p>

<ul>
<li>推理链中途断裂,得出错误结论</li>
<li>混淆不同数学概念</li>
<li>在计算步骤中出错</li>
<li>无法识别问题的关键约束条件</li>
</ul>

<p>而ChatGPT 5.5 Pro在这些方面有了显著提升。Gowers认为,这一代模型的数学推理能力已经达到了”可以辅助专业数学研究”的水平。</p>

<h2>对普通用户意味着什么</h2>

<p>虽然菲尔兹奖级别的数学测试看起来离普通人很远,但ChatGPT 5.5 Pro展现出的推理能力提升,对日常使用也有实际影响:</p>

<ul>
<li><strong>编程辅助</strong>:更强的逻辑推理能力意味着在代码调试、算法设计等场景下能给出更准确的建议。</li>
<li><strong>数据分析</strong>:处理复杂的数据分析任务时,模型能更好地理解数据关系和统计方法。</li>
<li><strong>技术文档</strong>:在撰写技术文档、API文档等需要严密逻辑的内容时,输出质量更高。</li>
<li><strong>教育辅导</strong>:作为学习辅助工具,能提供更准确的解题思路和步骤讲解。</li>
</ul>

<h2>AI数学能力的里程碑</h2>

<p>ChatGPT 5.5 Pro的表现引发了AI社区的广泛讨论。有观点认为,这标志着大语言模型在形式推理领域取得了重要突破。也有研究者持谨慎态度,指出:</p>

<ul>
<li>单一数学家的主观测试不能替代系统性基准评估</li>
<li>模型可能在训练数据中见过类似题目</li>
<li>真正的数学创新(如提出新定理、发现新证明)仍然是AI的短板</li>
</ul>

<p>无论如何,AI在数学推理方面的进步速度是实实在在的。对于站长和开发者来说,善用AI的推理能力来辅助技术工作,已经是一个切实可行的选择。</p>

<blockquote>
<p><strong>来源:</strong></p>
<ul>
<li><a href=Timothy Gowers Blog – A Recent Experience with ChatGPT 5.5 Pro
  • OSCHINA – ChatGPT 5.5 Pro一小时攻克博士级数学难题
  • -枫选">

    菲尔兹奖得主、剑桥大学数学家Timothy Gowers近日在个人博客上分享了他使用ChatGPT 5.5 Pro的体验。令他惊讶的是,这款模型在一小时内连续攻克了多个博士级别的数学难题,展现出远超前代的推理能力。

    菲尔兹奖得主的实测

    Timothy Gowers是当代最有影响力的数学家之一,1998年获得菲尔兹奖,在组合数学和泛函分析领域有重要贡献。他在5月8日发布了一篇详细的博文,记录了自己测试ChatGPT 5.5 Pro推理能力的过程。

    据Gowers描述,他给ChatGPT 5.5 Pro提出了多个需要深度推理的数学问题,这些问题的难度大致相当于数学博士资格考试或研究级别。让他印象深刻的是,模型不仅能够给出正确答案,还能提供完整的推理过程,包括:

    • 对问题的准确理解
    • 合理的解题策略选择
    • 严密的逻辑推导链
    • 对特殊情况的处理

    与前代模型的对比

    Gowers在博文中提到,之前版本的ChatGPT在处理类似难度的数学问题时,经常出现以下问题:

    • 推理链中途断裂,得出错误结论
    • 混淆不同数学概念
    • 在计算步骤中出错
    • 无法识别问题的关键约束条件

    而ChatGPT 5.5 Pro在这些方面有了显著提升。Gowers认为,这一代模型的数学推理能力已经达到了”可以辅助专业数学研究”的水平。

    对普通用户意味着什么

    虽然菲尔兹奖级别的数学测试看起来离普通人很远,但ChatGPT 5.5 Pro展现出的推理能力提升,对日常使用也有实际影响:

    • 编程辅助:更强的逻辑推理能力意味着在代码调试、算法设计等场景下能给出更准确的建议。
    • 数据分析:处理复杂的数据分析任务时,模型能更好地理解数据关系和统计方法。
    • 技术文档:在撰写技术文档、API文档等需要严密逻辑的内容时,输出质量更高。
    • 教育辅导:作为学习辅助工具,能提供更准确的解题思路和步骤讲解。

    AI数学能力的里程碑

    ChatGPT 5.5 Pro的表现引发了AI社区的广泛讨论。有观点认为,这标志着大语言模型在形式推理领域取得了重要突破。也有研究者持谨慎态度,指出:

    • 单一数学家的主观测试不能替代系统性基准评估
    • 模型可能在训练数据中见过类似题目
    • 真正的数学创新(如提出新定理、发现新证明)仍然是AI的短板

    无论如何,AI在数学推理方面的进步速度是实实在在的。对于站长和开发者来说,善用AI的推理能力来辅助技术工作,已经是一个切实可行的选择。

    来源:

    菲尔兹奖得主、剑桥大学数学家Timothy Gowers近日在个人博客上分享了他使用ChatGPT 5.5 Pro的...

    9天前 55
    评论 抢沙发

    请登录后发表评论

      暂无评论内容