推理模型不需要思考,伯克利新研究推翻AI刻板印象
【蜂耘网 人工智能】DeepSeek带着它的思考推理闯入人们的视线,并带来一条增加思考计算量来提升大模型性能的道路。
一时间,各种AI模型都加入了“思考”过程,并以长时间多计算量的方式优化模型。
然而,思考得越多,性能就越好吗?
加州大学伯克利分校与艾伦人工智能研究所推翻了人们的刻板印象。原来,跳过思考,无需显式思维,推理模型也可以高效且准确。
图片
传统思维链技术虽然提升了模型性能,增强模型可解释性,但仍存在许多劣势。
作为将问题分解,再分步推理,一步步组合得到最终答案的思维链技术,它常常依赖人工提示,若无精心设计,给出分步示例,它便会陷入无效推理。
由于显式生成了中间步骤,计算开销被迫提升,使其在实际应用中效果并不理想。该过程还会导致延迟,使得推理效率不尽人意。
跳过思考过程,是否能摆脱效率低下、资源浪费的问题?
研究人员借助提示,绕过显式推理,直接给出答案。
在实验中,研究人员使用了DeepSeek-R1的一个蒸馏模型DeepSeek-R1-Distill-Qwen-32B为主要模型,为其准备了数学问题、编程、定理证明等多方面的推理任务。
图片
最终,在不控制token量时,跳过思考在定理证明任务中,可以使用30%的token达到与推理思考差不多的性能,节约大量资源。
图片
但在其他任务中,该数据并没有这么夸张。
若是给定token预算,当模型用完该预算时,系统会直接强制模型给出答案。这种强制限制token用量的情况下,结果会有一些变化。
当预算极低(小于3000 tokens)时,跳过思考过程的模型具有明显优势,全程表现都比显式推理模型更佳。
当预算超过3500 tokens时,显式推理模型初时具有优势,但很快被跳过思考过程的模型追上。
这样看来,跳过思考的模式表现稳定且有效。于是研究团队增加了并行扩展,生成多个独立输出,并在适用于可自动验证的任务上选择通过验证的答案,在无法验证时,选择置信度最高的答案。
这样的情况下,跳过思考+并行扩展在MiniF2F任务中延迟低了6.47倍,tokens用量低了3.91倍,且准确率与显式推理模式相当。
图片
在数学任务中,跳过思考模式则在低延迟中优于显式推理模式。
这样来看,大模型的“思考”似乎并没有想象中那么好用。为什么会这样?
定理证明并不依赖中间步骤,这让两种模式相当,而需要细致推理的编程任务中,跳过思考模式表现并不如显式推理。
不过,我们可以从这篇论文中看到,显式思考过程并不完全代表推理能力,且存在资源消耗大和延迟高的问题。
当资源受限时,可以采用跳过思考的方式,降低预算,减少延迟。有了并行扩展的加入,推理效率还可以继续提高。
如此一来,未来模型推理模式可能会出现新的分支,如何平衡计算资源和模型性能,该怎样分配显式推理和跳过思考模式,让模型得到进一步优化,将成为研究关键。
(蜂耘人工智能网 责任编辑:梅子)
DeepSeek带着它的思考推理闯入人们的视线,并带来一条增加思考计算量来提升大模型性能的道路。
- 2025-04-27
- 2025-04-27
- 2025-04-27
- 2025-04-27
- 2025-04-27
- 2025-04-27
- 2022-08-25
- 2022-10-13
- 2022-10-24
- 2023-09-01
- 2022-10-18
- 2022-09-30
- 2024-05-28
- 2023-03-29
-
坚定扛牢“走在前、挑大梁”的使命担当(权威访谈·谋发展 启新篇)
来源:人民日报
2024年,山东经济社会高质量发展取得积极成效。新的一年,作为经济大省的山东如何坚定扛牢“走在前、挑大梁”的使命担当?如何全面贯彻落实中央经济工作会议精神,奋力推动经济社会高质量发展?记者采访了山东省委书记林武。넶50 2025-01-21 -
一文了解查理·芒格:为什么他是巴菲特最推崇的人
来源:
①巴菲特写道,“如果没有查理的灵感、智慧和参与,伯克希尔-哈撒韦公司不可能发展到今天的地位”;
②芒格曾表示,“如果世上未曾有过查理·芒格这个人,巴菲特的业绩依然会像现在这么漂亮 ”
③两周前,芒格还公开在节目中维护93岁的老友巴菲特。넶207 2023-11-29 -
面壁者,拉里·佩奇
来源:中欧商业评论
这两年,硅谷钢铁侠埃隆·马斯克在社交媒体上口无遮拦,这为他的公司引来了铺天盖地的负面新闻,然而,他的好友、谷歌联合创始人拉里·佩奇却因为看不到人同样被媒体炮轰多时。他已经在公共视野中消失太久了。넶336 2022-06-15
-
4月23日丨苏州人工智能产业生态大会即将启幕,行业大咖论剑技术突围与生态共建
来源:蜂耘网
以蜂耘网为代表的科技平台责无旁贷地肩负起推动中国人工智能产业高质量发展的使命,将于4月23日举办苏州人工智能产业生态大会。넶38 2025-04-03 -
-
3月26日丨成都人工智能产业生态大会强势来袭!不容错过!
来源:蜂耘网
蜂耘网将在成都举办人工智能产业生态大会,汇聚行业顶尖专家、企业领袖、投资机构及政府代表,为行业人士提供一个交流、学习与合作的平台。넶75 2025-02-21
- 2025-04-27
- 2025-04-27
- 2025-04-27
- 2025-04-27
- 2025-04-27
- 2025-04-27
- 2025-04-27
- 2025-04-27
- 2025-04-27
- 2025-04-27
- 2025-04-27
- 2025-04-27