科技行业资讯门户

广告

广告

广告

广告

广告

国产模型炸裂上新,推理性能直逼o1,即将全面开源

【蜂耘网  人工智能】11月20日,DeepSeek上线了全新的推理模型DeepSeek-R1-Lite-Preview,直接冲击 OpenAI o1大模型霸主地位。

          

DeepSeek-R1-Lite 预览版模型在美国数学竞赛(AMC)中难度等级最高的AIME 以及全球顶级编程竞赛(codeforces)等权威评测中,大幅超越了 GPT4o,甚至o1-preview等知名模型。

          

R1在美国数学邀请赛AIME 2024、MATH和Codeforces的测试数据分别是52.5、91.6、1450,击败了OpenAI的o1预览版。

              

img1

          

模型特色

          

与 OpenAI o1 有点不一样的是,DeepSeek-R1-Lite-Preview 会在回复中展示「思路链」推理,也就是响应查询和输入的不同链或「思路」,并解释它在做什么以及为什么这样做。

          

DeepSeek-R1-Lite 的推理过程长,并且包含了大量的反思和验证。随着思维长度的增加,DeepSeek-R1-Lite-Preview 在 AIME 上的得分稳步提高。

          

这与OpenAI o1 提出推理缩放规律是一致的,由此也可以说明推理缩放具有巨大的潜力。如下展示,在AIME测试基准中,随着计算时间增加,其得分稳步提升。   

          

img2

          

红色实线展示了模型所能达到的准确率与所给定的推理长度呈正相关;相比传统的多次采样+投票(Majority Voting),模型思维链长度增加展现出了更高的效率。

          

DeepSeek 官方表示,DeepSeek R1 系列模型使用强化学习训练,推理过程包含大量反思和验证,思维链长度可达数万字。

          

网友评论

          

这令人印象深刻。最新深度搜索来自中国的AI模型与OpenAI的o1-相匹配预览。它甚至使用类似的思维链推理在几个数学和编码基准测试上击败了OpenAl。在o1发布后仅2个月。   

          

img3

          

DeepSeek-R1-Lite-Preview 思考超过 6 分钟!(即使是 GPT4o 和 Claude 3.5 Sonnet 也无法解决这个问题)

          

img4

          

即将开源    

          

目前,DeepSeek还没有开放R1的论文,但可以免费在线使用了,每天提供50次深度思维推理。只要不是专门搞科研、编程开发,这足够用了。

          

登录 chat.deepseek.com,在输入框中选择“深度思考”模式,即可开启与 DeepSeek-R1-Lite 预览版的对话。DeepSeek-R1-Lite 目前仍处于迭代开发阶段,仅支持网页使用,暂不支持 API 调用。

          

另外,DeepSeek-R1-Lite 所使用的是一个较小的基座模型,无法完全释放长思维链的潜力。DeepSeek官方表示当前正在持续迭代推理系列模型,之后正式版 DeepSeek-R1 模型将完全开源,公开技术报告并部署 API 服务。      

 

(蜂耘人工智能网  责任编辑:梅子)

2024-11-22 16:06

广告

来源:蜂耘网
11月20日,DeepSeek上线了全新的推理模型DeepSeek-R1-Lite-Preview,直接冲击 OpenAI o1大模型霸主地位。

声明:凡来源标明“蜂耘网”的文章版权均为本站所有,如需转载请务必注明出处,违者本网将追究相关法律责任;所有未标明来源为“蜂耘网”的转载文章目的在于传递更多信息,均不代表本网立场及观点,“蜂耘网”不对这些第三方内容或链接做任何保证或承担任何责任;如涉及版权等问题,请在内容发表之日起一周内与本网联系,否则视为放弃相关权利。

所有评论仅代表网友意见,与本站立场无关

最新资讯

推荐阅读

热门排行

1、

2、

3、

4、

5、

6、

7、

8、

专题推荐

人物访谈

  • 一文了解查理·芒格:为什么他是巴菲特最推崇的人

    来源:
    ①巴菲特写道,“如果没有查理的灵感、智慧和参与,伯克希尔-哈撒韦公司不可能发展到今天的地位”;
    ②芒格曾表示,“如果世上未曾有过查理·芒格这个人,巴菲特的业绩依然会像现在这么漂亮 ”
    ③两周前,芒格还公开在节目中维护93岁的老友巴菲特。

    149 2023-11-29
  • 面壁者,拉里·佩奇

    来源:中欧商业评论
    这两年,硅谷钢铁侠埃隆·马斯克在社交媒体上口无遮拦,这为他的公司引来了铺天盖地的负面新闻,然而,他的好友、谷歌联合创始人拉里·佩奇却因为看不到人同样被媒体炮轰多时。他已经在公共视野中消失太久了。

    263 2022-06-15
  • 百岁中科院院士文圣常逝世!被誉为我国海浪研究的“点灯人”

    来源:南方都市报
     3月21日上午,中国海洋大学发布讣告,中国科学院院士、著名物理海洋学家、该校教授文圣常,因病医治无效,于3月20日15时37分在山东青岛逝世,享年101岁。

    301 2022-03-21

会议活动

微信公众号

广告

相关新闻