科技行业资讯门户

广告

广告

广告

广告

广告

当 AI “思考” 遇上苹果:一场关于智能本质的追问

【蜂耘网 人工智能】最近,科技圈掀起了一场关于 AI 智能本质的讨论。在人工智能发展的热潮中,苹果机器学习研究中心的一项新发现,如同一颗投入平静湖面的石子,激起了层层涟漪。这项研究揭示了现有 AI 大模型在复杂任务中的真实表现,让我们不得不重新审视这些看似无所不能的智能系统。

 

在人们对 AI 的期待中,推理能力一直被视为衡量其智能水平的重要标准。然而,苹果的研究却指出,现有 AI 大模型并不具备真正的思维能力或推理能力,它们更像是在进行模式匹配与记忆。这一结论源于对 OpenAI o3-mini 等前沿模型的评估,研究发现,当问题复杂度超过某个临界点时,模型的性能会急剧下降,甚至完全崩溃。

 

为了验证这一观点,研究团队设计了一系列精巧的实验。他们选取了汉诺塔、跳棋、过河问题和积木世界等经典谜题,通过改变参数来控制问题的复杂度。在这些实验中,研究人员不仅关注模型的最终答案,还深入分析了模型的思考过程。结果发现,当问题复杂度增加到一定程度时,模型用于思考的计算量(即生成的思考 token 数量)非但没有增加,反而开始显著减少,仿佛在难题面前主动 “放弃思考”。

 

这种现象背后,暴露出当前 AI 模型的深层问题。在简单问题上,模型常常在很早的步骤就找到了正确答案,但之后仍会继续生成大量冗余甚至错误的探索,浪费了大量计算资源。而在面对复杂问题时,如果模型在早期犯了一个错误,它往往会固执地沿着错误的路径继续探索,很难自我纠正,最终导致失败。更令人惊讶的是,即使研究人员直接在提示中提供了完整的解题算法,要求模型仅仅是 “执行” 这个算法,模型的表现也没有任何改善,依然在相同的复杂度点上崩溃。这表明,模型的瓶颈不仅在于 “规划” 和 “寻找” 解决方案,更在于基础的、符号化的逻辑步骤执行与验证能力的缺失。

 

当前,评估 AI 推理能力主要依赖于数学和编程等基准测试。然而,这种方法存在明显的弊端。一方面,这些基准测试的题目和答案很可能已经大量存在于模型的训练数据中,模型可能只是 “记住” 了答案,而非真正 “推理” 出答案。另一方面,最终答案的正确与否,无法告诉我们模型是如何思考的,其思维链是高效、严谨还是充满了冗余和错误。

 

苹果的研究为我们理解 AI 的能力边界提供了新的视角。它提醒我们,尽管 AI 在某些特定领域表现出色,但在面对真正复杂的问题时,其能力仍然存在显著的局限性。这并不意味着 AI 的发展停滞不前,相反,它为我们指明了未来研究的方向。我们需要建立新的评估体系,超越依赖于可能被污染的基准测试和最终答案准确率的评估方法,转向更可控、更深入的过程分析。同时,我们也需要进一步探索 AI 的内在机制,提升其逻辑推理和执行能力,使其能够真正实现类人思考。

 

在这场关于 AI 智能本质的追问中,苹果的研究无疑是一个重要的里程碑。它让我们看到了 AI 发展的现状,也让我们对未来充满了期待。随着技术的不断进步,我们有理由相信,AI 将在突破现有局限的道路上不断前行,为人类带来更多的惊喜和可能。而我们,也将在这个过程中,不断深化对智能本质的理解,探索人与 AI 共生的新方式。

 

 

(蜂耘人工智能网 责任编辑:科技蜜)

2025-06-10 12:38

广告

来源:蜂耘网
最近,科技圈掀起了一场关于 AI 智能本质的讨论。在人工智能发展的热潮中,苹果机器学习研究中心的一项新发现,如同一颗投入平静湖面的石子,激起了层层涟漪。这项研究揭示了现有 AI 大模型在复杂任务中的真实表现,让我们不得不重新审视这些看似无所不能的智能系统。

声明:凡来源标明“蜂耘网”的文章版权均为本站所有,如需转载请务必注明出处,违者本网将追究相关法律责任;所有未标明来源为“蜂耘网”的转载文章目的在于传递更多信息,均不代表本网立场及观点,“蜂耘网”不对这些第三方内容或链接做任何保证或承担任何责任;如涉及版权等问题,请在内容发表之日起一周内与本网联系,否则视为放弃相关权利。

所有评论仅代表网友意见,与本站立场无关

最新资讯

推荐阅读

热门排行

1、

2、

3、

4、

5、

6、

7、

8、

专题推荐

人物访谈

  • 坚定扛牢“走在前、挑大梁”的使命担当(权威访谈·谋发展 启新篇)

    来源:人民日报
    2024年,山东经济社会高质量发展取得积极成效。新的一年,作为经济大省的山东如何坚定扛牢“走在前、挑大梁”的使命担当?如何全面贯彻落实中央经济工作会议精神,奋力推动经济社会高质量发展?记者采访了山东省委书记林武。

    60 2025-01-21
  • 一文了解查理·芒格:为什么他是巴菲特最推崇的人

    来源:
    ①巴菲特写道,“如果没有查理的灵感、智慧和参与,伯克希尔-哈撒韦公司不可能发展到今天的地位”;
    ②芒格曾表示,“如果世上未曾有过查理·芒格这个人,巴菲特的业绩依然会像现在这么漂亮 ”
    ③两周前,芒格还公开在节目中维护93岁的老友巴菲特。

    220 2023-11-29
  • 面壁者,拉里·佩奇

    来源:中欧商业评论
    这两年,硅谷钢铁侠埃隆·马斯克在社交媒体上口无遮拦,这为他的公司引来了铺天盖地的负面新闻,然而,他的好友、谷歌联合创始人拉里·佩奇却因为看不到人同样被媒体炮轰多时。他已经在公共视野中消失太久了。

    344 2022-06-15

会议活动

微信公众号

广告

相关新闻