SubQ大模型发布：1200万Token上下文窗口，号称推理成本降低300倍 - 枫选-枫选

SubQ大模型发布：1200万Token上下文窗口，号称推理成本降低300倍

3天前发布

03713

近期，一家名为 Subquadratic 的 AI 公司发布了其旗舰产品 SubQ 大模型，号称拥有 1200 万 Token 的上下文窗口——这比目前主流模型的上下文窗口大了数十倍。同时，该公司声称 SubQ 的推理成本降低了 300 倍。

SubQ 是什么

SubQ 由 Subquadratic 公司开发，核心技术基于其自研的 SSA（Subquadratic Self-Attention）架构。与传统 Transformer 的 O(n²) 注意力机制不同，SSA 架构号称将注意力计算复杂度降低到亚二次级别。

关键参数：

上下文窗口：1200 万 Token（约 900 万字）
推理成本：号称比同等能力的模型低 300 倍
性能：声称在多项基准测试中接近 Claude 和 GPT 水平
融资：已完成 2900 万美元种子轮融资

实际表现如何

SubQ 在官方宣传中展示了多项基准测试的结果，包括代码生成、数学推理、长文档理解等任务。不过，需要保持审慎态度：

独立第三方的评测数据还比较少
1200 万 Token 上下文的实际可用性还需要验证
“300 倍成本降低”的具体计算基准尚不明确
一些 AI 研究人员对其性能数据表示了保留态度

对站长的意义

如果 SubQ 的宣传属实，这个模型有几个潜在价值：

超长文档处理：可以直接将整本书、完整的代码仓库一次性输入模型
降低 API 成本：对于需要大量 AI 调用的应用来说是显著的成本优化
RAG 简化：超长上下文可能减少对复杂 RAG 架构的依赖

目前 SubQ 已开放 API 访问。建议先用自己的实际业务场景做小规模测试，不要急于将核心业务迁移到新模型上。在独立评测和更多用户反馈出来之前，保持观望是明智的选择。

来源：Fello AI – SubQ LLM Review

© 版权声明

文章版权声明 1、本网站名称：枫选
2、本站永久网址：https://feng.cx
3、本网站的文章部分内容可能来源于网络，仅供大家学习与参考，如有侵权，请联系站长进行删除处理。
4、本站一切资源不代表本站立场，并不代表本站赞同其观点和对其真实性负责。
5、本站一律禁止以任何方式发布或转载任何违法的相关信息，访客发现请向站长举报
6、本站资源大多存储在云盘，如发现链接失效，请联系我们我们会第一时间更新。

THE END

AI资讯
# 大模型 # LLM # API # SubQ # Token

喜欢就支持一下吧

相关推荐

<p>菲尔兹奖得主、剑桥大学数学家Timothy Gowers近日在个人博客上分享了他使用ChatGPT 5.5 Pro的体验。令他惊讶的是，这款模型在一小时内连续攻克了多个博士级别的数学难题，展现出远超前代的推理能力。</p>

<h2>菲尔兹奖得主的实测</h2>

<p>Timothy Gowers是当代最有影响力的数学家之一，1998年获得菲尔兹奖，在组合数学和泛函分析领域有重要贡献。他在5月8日发布了一篇详细的博文，记录了自己测试ChatGPT 5.5 Pro推理能力的过程。</p>

<p>据Gowers描述，他给ChatGPT 5.5 Pro提出了多个需要深度推理的数学问题，这些问题的难度大致相当于数学博士资格考试或研究级别。让他印象深刻的是，模型不仅能够给出正确答案，还能提供完整的推理过程，包括：</p>

<ul>
<li>对问题的准确理解</li>
<li>合理的解题策略选择</li>
<li>严密的逻辑推导链</li>
<li>对特殊情况的处理</li>
</ul>

<h2>与前代模型的对比</h2>

<p>Gowers在博文中提到，之前版本的ChatGPT在处理类似难度的数学问题时，经常出现以下问题：</p>

<ul>
<li>推理链中途断裂，得出错误结论</li>
<li>混淆不同数学概念</li>
<li>在计算步骤中出错</li>
<li>无法识别问题的关键约束条件</li>
</ul>

<p>而ChatGPT 5.5 Pro在这些方面有了显著提升。Gowers认为，这一代模型的数学推理能力已经达到了”可以辅助专业数学研究”的水平。</p>

<h2>对普通用户意味着什么</h2>

<p>虽然菲尔兹奖级别的数学测试看起来离普通人很远，但ChatGPT 5.5 Pro展现出的推理能力提升，对日常使用也有实际影响：</p>

<ul>
<li><strong>编程辅助</strong>：更强的逻辑推理能力意味着在代码调试、算法设计等场景下能给出更准确的建议。</li>
<li><strong>数据分析</strong>：处理复杂的数据分析任务时，模型能更好地理解数据关系和统计方法。</li>
<li><strong>技术文档</strong>：在撰写技术文档、API文档等需要严密逻辑的内容时，输出质量更高。</li>
<li><strong>教育辅导</strong>：作为学习辅助工具，能提供更准确的解题思路和步骤讲解。</li>
</ul>

<h2>AI数学能力的里程碑</h2>

<p>ChatGPT 5.5 Pro的表现引发了AI社区的广泛讨论。有观点认为，这标志着大语言模型在形式推理领域取得了重要突破。也有研究者持谨慎态度，指出：</p>

<ul>
<li>单一数学家的主观测试不能替代系统性基准评估</li>
<li>模型可能在训练数据中见过类似题目</li>
<li>真正的数学创新（如提出新定理、发现新证明）仍然是AI的短板</li>
</ul>

<p>无论如何，AI在数学推理方面的进步速度是实实在在的。对于站长和开发者来说，善用AI的推理能力来辅助技术工作，已经是一个切实可行的选择。</p>

<blockquote>
<p><strong>来源：</strong></p>
<ul>
<li><a href=

Timothy Gowers Blog – A Recent Experience with ChatGPT 5.5 Pro

OSCHINA – ChatGPT 5.5 Pro一小时攻克博士级数学难题

-枫选">

菲尔兹奖得主、剑桥大学数学家Timothy Gowers近日在个人博客上分享了他使用ChatGPT 5.5 Pro的体验。令他惊讶的是，这款模型在一小时内连续攻克了多个博士级别的数学难题，展现出远超前代的推理能力。

菲尔兹奖得主的实测

Timothy Gowers是当代最有影响力的数学家之一，1998年获得菲尔兹奖，在组合数学和泛函分析领域有重要贡献。他在5月8日发布了一篇详细的博文，记录了自己测试ChatGPT 5.5 Pro推理能力的过程。

据Gowers描述，他给ChatGPT 5.5 Pro提出了多个需要深度推理的数学问题，这些问题的难度大致相当于数学博士资格考试或研究级别。让他印象深刻的是，模型不仅能够给出正确答案，还能提供完整的推理过程，包括：

对问题的准确理解
合理的解题策略选择
严密的逻辑推导链
对特殊情况的处理

与前代模型的对比

Gowers在博文中提到，之前版本的ChatGPT在处理类似难度的数学问题时，经常出现以下问题：

推理链中途断裂，得出错误结论
混淆不同数学概念
在计算步骤中出错
无法识别问题的关键约束条件

而ChatGPT 5.5 Pro在这些方面有了显著提升。Gowers认为，这一代模型的数学推理能力已经达到了”可以辅助专业数学研究”的水平。

对普通用户意味着什么

虽然菲尔兹奖级别的数学测试看起来离普通人很远，但ChatGPT 5.5 Pro展现出的推理能力提升，对日常使用也有实际影响：

编程辅助：更强的逻辑推理能力意味着在代码调试、算法设计等场景下能给出更准确的建议。
数据分析：处理复杂的数据分析任务时，模型能更好地理解数据关系和统计方法。
技术文档：在撰写技术文档、API文档等需要严密逻辑的内容时，输出质量更高。
教育辅导：作为学习辅助工具，能提供更准确的解题思路和步骤讲解。

AI数学能力的里程碑

ChatGPT 5.5 Pro的表现引发了AI社区的广泛讨论。有观点认为，这标志着大语言模型在形式推理领域取得了重要突破。也有研究者持谨慎态度，指出：

单一数学家的主观测试不能替代系统性基准评估
模型可能在训练数据中见过类似题目
真正的数学创新（如提出新定理、发现新证明）仍然是AI的短板

无论如何，AI在数学推理方面的进步速度是实实在在的。对于站长和开发者来说，善用AI的推理能力来辅助技术工作，已经是一个切实可行的选择。

来源：

Timothy Gowers Blog – A Recent Experience with ChatGPT 5.5 Pro

OSCHINA – ChatGPT 5.5 Pro一小时攻克博士级数学难题

菲尔兹奖得主、剑桥大学数学家Timothy Gowers近日在个人博客上分享了他使用ChatGPT 5.5 Pro的...

3天前 54

2026年5月AWS弗吉尼亚数据中心过热中断事件：影响范围与站长应对建议

2026年5月AWS弗吉尼亚数据中心过热中断事件：影响范围与站长应对建议

AI编程助手的维护成本陷阱：代码产出翻倍，维护成本可能翻四倍

AI编程助手的维护成本陷阱：代码产出翻倍，维护成本可能翻四倍

Google Chrome 静默安装 4GB AI 模型：站长需要了解的隐私和性能问题-枫选

Google Chrome 静默安装 4GB AI 模型：站长需要了解的隐私和性能问题

Google Chrome 静默安装 4GB AI 模型：站长需要了解的隐私和性能问题

Anthropic 发布自然语言自编码器研究：用 Claude 的思维生成文本

Anthropic 发布自然语言自编码器研究：用 Claude 的思维生成文本

Canvas 教育平台遭 ShinyHunters 攻击后恢复上线，学校数据面临泄露风险

Canvas 教育平台遭 ShinyHunters 攻击后恢复上线，学校数据面临泄露风险

评论抢沙发

请登录后发表评论

暂无评论内容