科技行业资讯门户

广告

广告

广告

广告

广告

OpenAI o1横空出世,推理能力达博士水平,碾压GPT-4o

【蜂耘网  人工智能】北京时间周五凌晨,OpenAI o1 横空出世。OpenAI在官网发布公告称,开始向全体订阅用户开始推送OpenAI o1预览模型——也就是此前被广泛期待的“草莓”大模型。

          

img1

 

新推出的模型包括o1-preview和o1-mini,推理能力达博士水平,比GPT-4o强多了。

          

如果按学历来划分OpenAI的产品,那么2023年发布的GPT-4类似于高中生的智能水平,而GPT-5则是完成AI从“高中生跃升至博士”的成长。

          

而OpenAI o1模型是其中关键的一步。

          

OpenAI的研究负责人Jerry Tworek透露,o1模型背后的训练与之前的产品有着根本性的区别。之前的GPT模型旨在模仿其训练数据中的模式,而o1的训练旨在让其独立解决问题。

          

在强化学习的过程中,使用奖励和惩罚机制来“教育”AI使用“思维链”来处理问题,就像人类习得拆解、分析问题的方式一样。可以这么说,OpenAI o1拥有了真正的通用推理能力。   

          

img2

          

在一系列基准测试中,o1相比GPT-4o再次有了巨大提升,具有了奥数金牌能力,在物理、生物、化学问题的基准测试中,直接超过了人类博士水平。

          

根据测试,o1模型在国际数学奥林匹克的资格考试中,能够拿到83%的分数,而GPT-4o只能正确解决13%的问题。而在编程能力比赛Codeforces中,o1模型拿到89%百分位的成绩,而GPT-4o只有11%。

          

img3

 

有网友试用了一下,当提问OpenAI o1:“你能帮我用 Python 编写一个俄罗斯方块游戏吗?”OpenAI o1-preview 思考了大约 5 分钟,直接给出了一个完整的项目......

          

img4

          

OpenAI还发布了OpenAI o1-mini,其速度更快、成本更低,且与标准版一样在数学、编程方面表现突出。

          

OpenAI o1-mini在预训练期间,针对STEM(科学、技术、工程、数学四门学科)推理进行了优化。在使用与o1相同的高计算强化学习(RL)管道进行训练后,o1-mini在许多推理任务上性能优越,同时成本效率显著提高。   

          

让人惊喜的是,新的开放人工智能 OpenAI o1 API 甚至比 Claude 3 Opus 和 3.5 Sonnet 更便宜!

 

img5

img6

     

山姆·奥特曼表示 o1 是OpenAI迄今为止最强大、最一致的一系列模型。当然,o1仍然存在缺陷,仍然有所局限,而且第一次使用时似乎仍然比你花更多时间使用它后更令人印象深刻。

          

img7

          

比如在日期、传记和日常琐事等非STEM主题的事实知识上,o1-mini有所局限,表现与GPT-4o mini等小型模型相当。在写作和编辑等自然语言处理任务中,o1的优势却并不明显,且无法浏览网页或处理文件和图像。

 

 

img8

 

 

OpenAI称将在未来版本中改进这些限制,将模型扩展到STEM之外的其他专业及模态。这也就意味着,未来人类还可以拥有更强大的AI大模型,如今的OpenAI o1已经能媲美人类专家,可以想象更强大的AI大模型,将会给人类带来多大的影响。

          

最后,讲一下大家可以怎么体验o1?

          

o1-preview在ChatGPT中会向所有Plus和Team用户推出,并且在API中向tier 5开发者推出。

 

 

OpenAI还上线了o1模型的API(应用程序接口),在API中向tier 5开发者推出,API文档显示这两款模型的上下文窗口均为128k,而mini版输出窗口更长,是o1的两倍。   

          

img9

          

可能是出于安全考虑,也可能是太消耗算力,目前o1-preview和o1-mini这两款模型均限制了消息次数。

          

OpenAI公司宣布从9月12日起,ChatGPT订阅用户可以访问这两个新模型,但目前o1-preview每周消息数量限制为30条,o1-mini则为50条。

          

总体而言,OpenAI o1的横空出世,在全球范围内引起了不小的轰动。这两款模型目前来看,在AI大模型领域有了重大革新。未来大模型格局是否会在o1的影响下重构,值得我们期待一下。   

 

(蜂耘人工智能网  责任编辑:梅子)

2024-09-14 09:46

广告

来源:蜂耘网
北京时间周五凌晨,OpenAI o1 横空出世。OpenAI在官网发布公告称,开始向全体订阅用户开始推送OpenAI o1预览模型——也就是此前被广泛期待的“草莓”大模型。

声明:凡来源标明“蜂耘网”的文章版权均为本站所有,如需转载请务必注明出处,违者本网将追究相关法律责任;所有未标明来源为“蜂耘网”的转载文章目的在于传递更多信息,均不代表本网立场及观点,“蜂耘网”不对这些第三方内容或链接做任何保证或承担任何责任;如涉及版权等问题,请在内容发表之日起一周内与本网联系,否则视为放弃相关权利。

所有评论仅代表网友意见,与本站立场无关

最新资讯

推荐阅读

热门排行

1、

2、

3、

4、

5、

6、

7、

8、

专题推荐

人物访谈

  • 一文了解查理·芒格:为什么他是巴菲特最推崇的人

    来源:
    ①巴菲特写道,“如果没有查理的灵感、智慧和参与,伯克希尔-哈撒韦公司不可能发展到今天的地位”;
    ②芒格曾表示,“如果世上未曾有过查理·芒格这个人,巴菲特的业绩依然会像现在这么漂亮 ”
    ③两周前,芒格还公开在节目中维护93岁的老友巴菲特。

    100 2023-11-29
  • 面壁者,拉里·佩奇

    来源:中欧商业评论
    这两年,硅谷钢铁侠埃隆·马斯克在社交媒体上口无遮拦,这为他的公司引来了铺天盖地的负面新闻,然而,他的好友、谷歌联合创始人拉里·佩奇却因为看不到人同样被媒体炮轰多时。他已经在公共视野中消失太久了。

    217 2022-06-15
  • 百岁中科院院士文圣常逝世!被誉为我国海浪研究的“点灯人”

    来源:南方都市报
     3月21日上午,中国海洋大学发布讣告,中国科学院院士、著名物理海洋学家、该校教授文圣常,因病医治无效,于3月20日15时37分在山东青岛逝世,享年101岁。

    259 2022-03-21

会议活动

微信公众号

广告

相关新闻