AI资讯 第3页
Anthropic 开源 Claude for Legal:20 个法律行业专用 MCP 连接器,律师也要用 AI 了-枫选

Anthropic 开源 Claude for Legal:20 个法律行业专用 MCP 连接器,律师也要用 AI 了

Anthropic 开源 Claude for Legal,包含 20+ 个 MCP 连接器和 12 个法律插件,打通 Thomson Reuters、DocuSign 等法律行业主流工具。
迪滴的头像-枫选迪滴41天前
0246
第四届中国AIGC产业峰会:Agent商业化落地成核心议题,近20位大咖解读趋势-枫选

第四届中国AIGC产业峰会:Agent商业化落地成核心议题,近20位大咖解读趋势

2026年5月20日,由量子位主办的第四届中国AIGC产业峰会在北京顺利举办。本届峰会以「@所有人,马上AI起来」为主题,近20位行业大咖齐聚一堂,深度解读AI Agent商业化落地、多模态技术突破等核心...
迪滴的头像-枫选迪滴39天前
0318
美国网络安全机构CISA出大事:承包商把AWS密钥和内部系统凭证公开放GitHub-枫选

美国网络安全机构CISA出大事:承包商把AWS密钥和内部系统凭证公开放GitHub

美国网络安全机构CISA的承包商将AWS密钥和内部系统凭证公开放在GitHub上长达6个月,国会议员要求解释。本文分析事件经过和对开发者的教训。
迪滴的头像-枫选迪滴36天前
0285
Ars 报道 Claude Code 用量限制上调,重度用户可以留意套餐变化-枫选

Ars 报道 Claude Code 用量限制上调,重度用户可以留意套餐变化

据 Ars Technica 报道,Anthropic 上调了 Claude Code 的使用限制,并将算力扩容与 SpaceX 相关数据中心合作联系起来。对 Claude Code 重度用户来说,近期可关注实际额度变化。

菲尔兹奖得主、剑桥大学数学家Timothy Gowers近日在个人博客上分享了他使用ChatGPT 5.5 Pro的体验。令他惊讶的是,这款模型在一小时内连续攻克了多个博士级别的数学难题,展现出远超前代的推理能力。

菲尔兹奖得主的实测

Timothy Gowers是当代最有影响力的数学家之一,1998年获得菲尔兹奖,在组合数学和泛函分析领域有重要贡献。他在5月8日发布了一篇详细的博文,记录了自己测试ChatGPT 5.5 Pro推理能力的过程。

据Gowers描述,他给ChatGPT 5.5 Pro提出了多个需要深度推理的数学问题,这些问题的难度大致相当于数学博士资格考试或研究级别。让他印象深刻的是,模型不仅能够给出正确答案,还能提供完整的推理过程,包括:

  • 对问题的准确理解
  • 合理的解题策略选择
  • 严密的逻辑推导链
  • 对特殊情况的处理

与前代模型的对比

Gowers在博文中提到,之前版本的ChatGPT在处理类似难度的数学问题时,经常出现以下问题:

  • 推理链中途断裂,得出错误结论
  • 混淆不同数学概念
  • 在计算步骤中出错
  • 无法识别问题的关键约束条件

而ChatGPT 5.5 Pro在这些方面有了显著提升。Gowers认为,这一代模型的数学推理能力已经达到了”可以辅助专业数学研究”的水平。

对普通用户意味着什么

虽然菲尔兹奖级别的数学测试看起来离普通人很远,但ChatGPT 5.5 Pro展现出的推理能力提升,对日常使用也有实际影响:

  • 编程辅助:更强的逻辑推理能力意味着在代码调试、算法设计等场景下能给出更准确的建议。
  • 数据分析:处理复杂的数据分析任务时,模型能更好地理解数据关系和统计方法。
  • 技术文档:在撰写技术文档、API文档等需要严密逻辑的内容时,输出质量更高。
  • 教育辅导:作为学习辅助工具,能提供更准确的解题思路和步骤讲解。

AI数学能力的里程碑

ChatGPT 5.5 Pro的表现引发了AI社区的广泛讨论。有观点认为,这标志着大语言模型在形式推理领域取得了重要突破。也有研究者持谨慎态度,指出:

  • 单一数学家的主观测试不能替代系统性基准评估
  • 模型可能在训练数据中见过类似题目
  • 真正的数学创新(如提出新定理、发现新证明)仍然是AI的短板

无论如何,AI在数学推理方面的进步速度是实实在在的。对于站长和开发者来说,善用AI的推理能力来辅助技术工作,已经是一个切实可行的选择。

来源:

菲尔兹奖得主Timothy Gowers实测ChatGPT 5.5 Pro,发现其在一小时内解决了多个博士级数学难题,展现惊人推理能力。
迪滴的头像-枫选迪滴49天前
0639
Python 3.14/3.15增量垃圾回收器被撤回:生产环境内存压力引发紧急回退-枫选

Python 3.14/3.15增量垃圾回收器被撤回:生产环境内存压力引发紧急回退

Python 3.14搭载的增量GC因生产环境严重内存压力被撤回,回退到3.13的分代GC。增量GC未经PEP流程就合入,且已是第二次在正式发布前被撤回。
迪滴的头像-枫选迪滴45天前
04411
四个 AI 运营电台五个月:一个成了抗议者,一个满嘴企业黑话-枫选

四个 AI 运营电台五个月:一个成了抗议者,一个满嘴企业黑话

Andon Labs 让四个 AI 模型各自运营一个 24 小时电台,五个月后它们发展出了截然不同的'人格'。这个实验揭示了 AI 内容长期运行的漂移现象。
迪滴的头像-枫选迪滴40天前
03113
Google Antigravity被曝自动删除用户整个Drive数据:AI工具的信任危机来了-枫选

Google Antigravity被曝自动删除用户整个Drive数据:AI工具的信任危机来了

Google刚推出的AI编程/办公工具Antigravity,正在经历一场严重的信任危机。多名用户在Reddit和HN上报告,Antigravity在未经确认的情况下,直接删除了他们的Google Drive中的全部文件——包括文...
迪滴的头像-枫选迪滴37天前
0408
SpaceX星舰V3首飞成功:人类最大火箭的里程碑时刻-枫选

SpaceX星舰V3首飞成功:人类最大火箭的里程碑时刻

2026年5月22日,SpaceX成功发射星舰V3火箭,这是人类历史上最大最强大的运载火箭。33台猛禽3号发动机产生超过7500吨推力,成功完成飞行测试。
迪滴的头像-枫选迪滴35天前
03915
Chrome悄悄删除

Chrome悄悄删除”本地AI不发送数据到谷歌服务器”声明,隐私争议再起

谷歌Chrome浏览器被发现删除了关于本地AI功能不会将用户数据发送到谷歌服务器的承诺声明,引发用户隐私担忧。
迪滴的头像-枫选迪滴51天前
0329