AI资讯 第10页
大学毕业典礼上学生集体嘘声反对AI赞美:前Google CEO演讲遭冷遇-枫选

大学毕业典礼上学生集体嘘声反对AI赞美:前Google CEO演讲遭冷遇

前Google CEO Eric Schmidt在亚利桑那大学毕业典礼上赞美AI时遭到学生集体嘘声,全美多所大学出现类似情况。
迪滴的头像-枫选迪滴39天前
02710
Trump Mobile确认客户数据泄露:手机号、家庭地址全曝光,站长该吸取什么教训-枫选

Trump Mobile确认客户数据泄露:手机号、家庭地址全曝光,站长该吸取什么教训

特朗普家族移动品牌Trump Mobile确认泄露客户手机号和家庭地址。本文分析事件经过、影响,以及站长应如何防范类似数据泄露风险。
迪滴的头像-枫选迪滴36天前
03410
dnsmasq爆出6个严重CVE漏洞:站长和运维人员速查-枫选

dnsmasq爆出6个严重CVE漏洞:站长和运维人员速查

CERT发布6个针对dnsmasq的严重CVE漏洞,影响大量路由器、服务器和嵌入式设备。站长和运维人员应立即检查并更新dnsmasq版本。
迪滴的头像-枫选迪滴37天前
04210
沃兹尼亚克毕业演讲:你们有AI,但我们有真正的智能-枫选

沃兹尼亚克毕业演讲:你们有AI,但我们有真正的智能

苹果联合创始人沃兹尼亚克在毕业典礼上说'你们有AI,但我们有真正的智能',全场沸腾。这场演讲对技术从业者意味着什么?
迪滴的头像-枫选迪滴36天前
02610
DeepSeek V4 Pro价格永久下调75%:站长AI成本再创新低-枫选

DeepSeek V4 Pro价格永久下调75%:站长AI成本再创新低

DeepSeek V4 Pro API价格永久下调75%,降价后价格约为Claude Sonnet的1/5,站长AI成本再创新低。
迪滴的头像-枫选迪滴37天前
0259
腾讯推出 AI 应用生成平台

腾讯推出 AI 应用生成平台”吐司”:Vibe Coding 新玩家,安卓版已公测

腾讯推出 AI 应用生成平台'吐司',定位 Vibe Coding 产品,安卓版已公测限时免费。用户输入想法即可生成可安装的 APK 应用,支持社交分享和灵感广场。
迪滴的头像-枫选迪滴41天前
0219
Perplexity开源供应链安全扫描工具Bumblebee:开发者必看-枫选

Perplexity开源供应链安全扫描工具Bumblebee:开发者必看

Perplexity AI开源了一个名为Bumblebee的供应链安全扫描工具,专门用于检测本地开发环境中的已知供应链攻击。这个项目在GitHub上迅速获得了700多个Star,反映了开发者对供应链安全的高度关注。 ...
迪滴的头像-枫选迪滴36天前
0279
Spotify将为粉丝预留演唱会门票:音乐流媒体平台的新玩法-枫选

Spotify将为粉丝预留演唱会门票:音乐流媒体平台的新玩法

Spotify将根据用户收听习惯为粉丝预留演唱会门票,这是音乐流媒体平台在演出市场的一次新尝试。
迪滴的头像-枫选迪滴37天前
0319
小米集团宣布200亿港元股份回购计划,释放什么信号?-枫选

小米集团宣布200亿港元股份回购计划,释放什么信号?

小米集团宣布200亿港元股份回购计划,这是公司历史上规模最大的一次回购。分析回购背景、市场信号和对科技行业的影响。
迪滴的头像-枫选迪滴33天前
0299

菲尔兹奖得主、剑桥大学数学家Timothy Gowers近日在个人博客上分享了他使用ChatGPT 5.5 Pro的体验。令他惊讶的是,这款模型在一小时内连续攻克了多个博士级别的数学难题,展现出远超前代的推理能力。

菲尔兹奖得主的实测

Timothy Gowers是当代最有影响力的数学家之一,1998年获得菲尔兹奖,在组合数学和泛函分析领域有重要贡献。他在5月8日发布了一篇详细的博文,记录了自己测试ChatGPT 5.5 Pro推理能力的过程。

据Gowers描述,他给ChatGPT 5.5 Pro提出了多个需要深度推理的数学问题,这些问题的难度大致相当于数学博士资格考试或研究级别。让他印象深刻的是,模型不仅能够给出正确答案,还能提供完整的推理过程,包括:

  • 对问题的准确理解
  • 合理的解题策略选择
  • 严密的逻辑推导链
  • 对特殊情况的处理

与前代模型的对比

Gowers在博文中提到,之前版本的ChatGPT在处理类似难度的数学问题时,经常出现以下问题:

  • 推理链中途断裂,得出错误结论
  • 混淆不同数学概念
  • 在计算步骤中出错
  • 无法识别问题的关键约束条件

而ChatGPT 5.5 Pro在这些方面有了显著提升。Gowers认为,这一代模型的数学推理能力已经达到了”可以辅助专业数学研究”的水平。

对普通用户意味着什么

虽然菲尔兹奖级别的数学测试看起来离普通人很远,但ChatGPT 5.5 Pro展现出的推理能力提升,对日常使用也有实际影响:

  • 编程辅助:更强的逻辑推理能力意味着在代码调试、算法设计等场景下能给出更准确的建议。
  • 数据分析:处理复杂的数据分析任务时,模型能更好地理解数据关系和统计方法。
  • 技术文档:在撰写技术文档、API文档等需要严密逻辑的内容时,输出质量更高。
  • 教育辅导:作为学习辅助工具,能提供更准确的解题思路和步骤讲解。

AI数学能力的里程碑

ChatGPT 5.5 Pro的表现引发了AI社区的广泛讨论。有观点认为,这标志着大语言模型在形式推理领域取得了重要突破。也有研究者持谨慎态度,指出:

  • 单一数学家的主观测试不能替代系统性基准评估
  • 模型可能在训练数据中见过类似题目
  • 真正的数学创新(如提出新定理、发现新证明)仍然是AI的短板

无论如何,AI在数学推理方面的进步速度是实实在在的。对于站长和开发者来说,善用AI的推理能力来辅助技术工作,已经是一个切实可行的选择。

来源:

菲尔兹奖得主Timothy Gowers实测ChatGPT 5.5 Pro,发现其在一小时内解决了多个博士级数学难题,展现惊人推理能力。
迪滴的头像-枫选迪滴50天前
0639