科技行业资讯门户

广告

广告

广告

广告

广告

2GB 内存就能跑 ChatGPT!这个国产「小钢炮」,要让华为 OV 们的 AI 体验突破瓶颈

【蜂耘网  人工智能】在这波 AI 浪潮中,面壁智能是国内少有选 All In 端侧模型的头部大模型厂商。

 

自从面壁智 2 月份发布性能小钢 1.0 后,接连几月陆续迭代升级,其中后续推出的开源模 MiniCPM-Llama3-V 2.5 更是因为强悍的实力遭到了斯坦 AI 团队的抄袭。

 

四月份,面壁智 CTO 曾国洋还曾预言GPT-3.5 级别的模型将在一两年内就能在移动设备上运行。

 

好消息是,不用再等一到两年了,因为今天发布 MiniCPM 3.0 实现了初代小钢炮发布时立下 Flag:今年内 GPT-3.5 水平的模型在端侧跑起来。

 

IMG_256

 

 4B 参数,以小博大,性能超 GPT-3.5MiniCPM 3.0 也标志着「端 ChatGPT」时刻的到来。

 

简单来说就是MiniCPM 3.0 的面世意味着用户未来能体验到快速、安全、且功能丰富的本 AI 服务,无需依赖云端处理,以及获得更流畅、更私密的智能交互体验。

 

从官方分享的基准测试来看MiniCPM 3.0  CMMLUCEVAL 等考究中文能力的基准测试中一骑绝尘,轻松碾 Phi-3.5、以 GPT-3.5 等模型。

 

而即便是对上 8B9B 等国内优秀的大模型MiniCPM 3.0 的表现同样相当出众。

 

IMG_257

 

简单总结一 MiniCPM 3.0 的特点:

 

无限长文本,榜单性能超 Kimi

 

端侧最 Function call,性能比 GPT-4o

 

超强 RAG 外挂三件套,中文检索、中英跨语言第一

 

无限长文本,性能超 Kimi

 

小而强、小而全,或许 MiniCPM 3.0 最贴切的形容词。

 

上下文长度是衡量大模型基础能力的一项重要特性,更长的上下文长度意味着模型能够存储和回忆更多的信息,从而有助于模型更准确地理解和生成语言。

 

举例来说,更长的上下文长度能够让一 AI 写作工具根据用户之前写的内容提供更相关的建议,或者根据更多的背景信息创作出更复杂、更引人入胜的故事。

 

为此,面壁提出 LLMxMapReduce 长本文分帧处理技术。

 

这是一种通过将长上下文切分为多个片段,让模型并行处理,并从不同片段中提取关键信息,汇总最终答案,实现无限长文本。

 

IMG_258

 

据悉,这一技术普遍增强了模型处理长文本的能力,且在文本不断加长的情况,仍保持稳定性能、减少长文本随加长掉分情况。

 

IMG_259

 LLMxMapReduce 技术框架图

 

 32K  512KMiniCPM 3.0 能够打破大模型记忆的限制,将上下文长度无限稳定拓展,用面壁官方的话来说就是「想多长就多长」。

 

IMG_260

 

从大模型长文本的基准测 InfiniteBench 结果来看,随着文本长度的增加4B 参数 MiniCPM 3.0 的性能优势反而愈发明显。

 

InfiniteBench Zh.QA 评测结果显示4B 参数 MiniCPM 3.0 整体性能优 Kimi,在更长的文本上显示出相对更强的稳定性。

 

IMG_261

 

端侧最 Function call,性能比 GPT-4o

 

在接 APPSO 等媒体的采访时,曾国洋也表示MiniCPM 3.0 针对用户关注的一些能力进行了提升,比如加入了完整 system prompt Function Calling  code interpreter 等能力。

 

 Function Calling(函数调用)能够将用户模糊化的输入语义转换为机器可以精确理解执行的结构化指令,并让大模型连接外部工具和系统。

 

具体来说,通过语音在手机上调用日历、天气、邮件、浏览器 APP 或相册、文件等本地数据库,从而打开终端设 Agent 应用的无限可能,也让人机交互更加自然和方便。

 

IMG_262

 

据介绍MiniCPM 3.0 宣称拥有端侧最 Function Calling   Berkeley Function-Calling Leaderboard 榜单上,其性能接 GPT-4o,并超 Llama 3.1-8BQwen-2-7BGLM-4-9B 等众多模型。

 

曾国洋表示,现有的开源模型在这些能力上的覆盖并不全面,通常只有一些云端的大型模型能够完全覆盖这些能力。现在MiniCPM 3.0 也实现了一些相应的功能。

 

 RAG(检索增强生成)为例,这是一种结合了信息检索IR)和自然语言生成NLG)的技术。

 

它通过从大规模文档库中检索相关信息来指导文本的生成过程,能够提升模型在回答问题、生成文本等任务中的准确性和可靠性,减少大模型的幻觉问题。

 

对于法律、医疗等依赖专业知识库、对大模型幻觉容忍度极低的垂直行业来说,大模+RAG 在行业中尤其实用。

 

IMG_263

 

MiniCPM 3.0 一口气上线 RAG 三件套:检索模型,重排序模型和面 RAG 场景 LoRA 插件。

 

MiniCPM-Embedding(检索模型)中英跨语言检索取 SOTA 性能,在评估模型文本嵌入能力 MTEB 的检索榜单上中文第一、英文第十三。

 

MiniCPM-Reranker(重排序模型)在中文、英文、中英跨语言测试上取 SOTA 性能。

 

经过针 RAG 场景 LoRA 训练后MiniCPM 3.0-RAG-LoRA 在开放域问答NQTQAMARCO)、多跳问答HotpotQA)、对话WoW)、事实核查FEVER)和信息填充T-REx)等多项任务上的性能表现,超 Llama3-8B  Baichuan2-13B 等业内优秀模型。

 

模型应用落地,先跑起来再说

 

在接 APPSO 等媒体的采访时,面壁智 CEO 李大海提到,能跑起来和真正流畅地去做应用是两个不同的概念。

 

而经过优化后 MiniCPM 3.0 对端侧设备的资源需求很低,量化后仅 2.2 G 内存iPad 端侧推理也能达 18-20 tokens/s

 

 iPad 这样的移动设备来说,每秒能够处 18-20  token 的速度已经意味着模型能够实时处理自然语言输入。

 

比如在语音识别或实时翻译应用中,用户基本不会感受到明显的延迟,享受到相对流畅的交互体验。

 

另外,相较于云端模型,作为端侧模型的面壁小钢 MiniCPM 系列模型还天然具有弱网、断网可用、超低时延、数据隐私安全等本地优势。

 

IMG_264

 

在贡嘎雪山附近游玩时,想知道欣赏「日照金山」的最佳姿势,网络不佳的你可以 MiniCPM 3.0 发出提问。

 

又或者,如果你是「赶海」的新人,站在波涛汹涌的海岸边,却想要满载而归,那不妨可以遵 MiniCPM 3.0 给出的建议。当你抬头仰望夜空时,萌生了捕捉星轨的念头MiniCPM 3.0 也能给你将拍摄的细节娓娓道来。

 

MiniCPM 小钢炮系列飞速进步的背后是一以贯之的高效大模型第一性原理。

 

IMG_265

 

面壁智能首席科学家刘知远曾提出一个大模型时代的「摩尔定律」,即大模型的知识密度平均 8 个月将提升一倍。

 

知识密=模型能/参与计算的模型参数

 

具体来说,随着模型知识密度的持续增强2020  GPT-3 175B 能力 2024  MiniCPM 2.4B 模型即可达到2022  ChatGPT 首次亮相内置 GPT-3.5  2024  MiniCPM 3.0 模型即可达到。

 

IMG_266

 

基于此,如果 MiniCPM 追求的是极致端侧性能表现,那 MiniCPM-V 追求的是极致多模态创新表现,面壁小钢炮的进步不是单方面的进步,而是端侧双旗舰的齐头并进。

 

经过一两年的技术摸索AI 大模型正逐步进入落地应用的深水区。

 

李大海认为,大模型具有两个大方向的价值,一个方向的价值叫做升级旧世界,第二个方向的价值则是发现新大陆。

 

比如苹果整 ChatGPT 服务 Apple Intelligence 中便是一个典型的例证。

 

端侧模型也是如此,通过在手机、汽车还 PC 这样的场景里面,更适合做的事情是去服务好终端的厂商,然后让终端厂商因为有了端侧模型,整个系统层级的体验也变得更好。

 

只不过,在技术到产品的惊险一跃中,厂商也需要投入大量时间来融合用户需求与技术。

 

正如李大海所言,尽管移动互联网 iPhone 问世以来就已经存在,但真正大规模增长和被验证的应用确实是数年后才开始涌现。

 

IMG_267

 

实际上,面壁智能也一直在探索落地应用的场景。

 

此前,面壁小钢 MiniCPM 端侧模型已经 PC、平板、手机等领域上实际运行。

 

前不久,面壁智能也 WAIC 上联手加速进化机器人,打造出完整「具身智能」的先驱方案,这也是业界首个高效端侧模型运行在人形机器人的演示,理解、推理、并与物理世界互动的智能系统。

 

李大海也 APPSO 等媒体剧透,预计在年底前将会有配备面壁智能端侧模型的产品上市。

 

简言之,面壁智能不断将高效高性能大模型放到离用户最近的地方,让大模型的能力像电力一样被随意调用、无处不在、普适且安全。

 

在这个过程,更多的人也能尽快地享受到大模型的价值和作用。

 

MiniCPM 3.0 开源地址:

 

GitHub:https://github.com/OpenBMB/MiniCPM

 

HuggingFace:https://huggingface.co/openbmb/MiniCPM3-4B

 

 

(蜂耘人工智能网  责任编辑:行云)

2024-09-06 09:24

广告

来源:爱范儿
在这波 AI 浪潮中,面壁智能是国内少有选择 All In 端侧模型的头部大模型厂商。

声明:凡来源标明“蜂耘网”的文章版权均为本站所有,如需转载请务必注明出处,违者本网将追究相关法律责任;所有未标明来源为“蜂耘网”的转载文章目的在于传递更多信息,均不代表本网立场及观点,“蜂耘网”不对这些第三方内容或链接做任何保证或承担任何责任;如涉及版权等问题,请在内容发表之日起一周内与本网联系,否则视为放弃相关权利。

所有评论仅代表网友意见,与本站立场无关

最新资讯

推荐阅读

热门排行

1、

2、

3、

4、

5、

6、

7、

8、

专题推荐

人物访谈

  • 一文了解查理·芒格:为什么他是巴菲特最推崇的人

    来源:
    ①巴菲特写道,“如果没有查理的灵感、智慧和参与,伯克希尔-哈撒韦公司不可能发展到今天的地位”;
    ②芒格曾表示,“如果世上未曾有过查理·芒格这个人,巴菲特的业绩依然会像现在这么漂亮 ”
    ③两周前,芒格还公开在节目中维护93岁的老友巴菲特。

    168 2023-11-29
  • 面壁者,拉里·佩奇

    来源:中欧商业评论
    这两年,硅谷钢铁侠埃隆·马斯克在社交媒体上口无遮拦,这为他的公司引来了铺天盖地的负面新闻,然而,他的好友、谷歌联合创始人拉里·佩奇却因为看不到人同样被媒体炮轰多时。他已经在公共视野中消失太久了。

    287 2022-06-15
  • 百岁中科院院士文圣常逝世!被誉为我国海浪研究的“点灯人”

    来源:南方都市报
     3月21日上午,中国海洋大学发布讣告,中国科学院院士、著名物理海洋学家、该校教授文圣常,因病医治无效,于3月20日15时37分在山东青岛逝世,享年101岁。

    324 2022-03-21

会议活动

微信公众号

广告

相关新闻