科技行业资讯门户

广告

广告

广告

广告

广告

大模型爆火,ChatGPT在全球引发AI“狂飙”

【蜂耘网   行业洞见】太忙了这是清华大学人工智能AI)国际治理研究院副院长梁正面对记者脱口而出的一句话。

      

去年1130日,非营利性研究机OpenAIAI聊天机器ChatGPT,它所展现出的智能涌现能力在全球范围内引发了一AI,也在业界点燃了一场百模大战。在记者询问过的每一个和大模型相关的人中忙”是出现频率最高的词。

      

忙碌的景象不仅在国内,那些大洋彼岸原本早已习惯了“打磨产品AI专家们也进入满负状态在谷歌、微软OpenAI的办公室里,你能感受到他们的工作节奏至少比之前快了两倍。”梁正说。

      

这一切都是因为以ChatGPT为代表的大语言模型向世人展露出了前所未有的能力,一条通AGI(通用人工智能)的道路被打通,谁也不希望落于人后。

      

这一年,人工智能领域发生的事件比前十年加起来还要多。据不完全统计,目前国内的AI大模型已超100个。除了百度、阿里等互联网大厂,创新工CEO李开复、美团创始人王兴、搜狗创始人王小川科技老兵”纷纷重披战甲进军大模型领域。

      

这一年,大模型改变了公众的关注点。据柯林斯词典统计,今年人们提及“AI的次数是去年4倍。而有AI是否会取代人类的担忧,也比以往任何时候都紧迫而强烈。

      

前所未有的变革

      

这是倾盆大雨前的一场雨,是一个分水岭OpenAI首席科学家伊利·苏茨克维这样形ChatGPT的诞生。

      

一年前1130ChatGPT上线,短5天,用户数突破百万。由于太过火爆OpenAI不得不暂时关闭了用户的测试入口。两个月后ChatGPT月活跃用户破亿,刷新App应用用户过亿的最快纪录。半个月前OpenAIChatGPT Plus的新用户注册,原因116日的开发者大会后,用户量激增。

      

一年来ChatGPT从一个只能处理文字信息的网页端应用,变成了一个可以同时处理文字、语音、图像信息的超级应用,每周吸引上亿人使用OpenAI也从一个非营利性研究机构变成了估900亿美元的超独角,聚拢200万开发者。在最新演示中ChatGPT的表现甚至超越神笔马”—当有人想要做一个创业助手时,只要把概念说GPT-4Turbo听,两三分钟后便可生成一个应用。

      

ChatGPT几乎以一己之力改变AI研究生态。在它爆火之前,谷歌是该领域当之无愧的翘楚,不仅论文发表数量最多,其对思维链路提示、大模型涌现现象的研究也走在前列。那时,自然语言处理、计算机视觉等还是众人追捧AI前沿领域;现在,几乎所有人都涌OpenAI引领的生成AI方向。今2月,研究自然语言处理的复旦大学计算机科学技术学院邱锡鹏教授团队发布国内首个ChatGPTMOSS,也曾一度因用户的大量涌入

      

与谷歌技术路线相比OpenAI力大砖的代表我们的算法非常简单伊利·苏茨克维直言不讳。他们把从海量数据中获取的标注信息导入模型,不断重复这个过程,最终得到一个超复杂,即使OpenAI首席科学家自己也不知道模型中正在发生什么。

      

ChatGPT上线后,全球大科技公司几乎都发布了自己的大语言模型,比如谷歌PaLM2MetaLlama2、百度的文心一言、华为的盘古等,但只要使用过这些模型,你就会发现GPT模型独一档的存。对此,梁正解释说这种差距可能无关芯片、算法、数据,纯粹OpenAI比较幸运

 

幸运是指什么?不妨从凯·凯利的畅销书《失控》中寻找答案。他在书中预测生命的智慧来自涌现,而科技也是一种生命。伊利亚同样认为,数据在大模中发生的就是演化,尽管世界上有很多这样,但发生GPT身上的涌现与众不同,如300多万年前开始直立行走人类祖露西。

      

借助于世界上最大的算力和最强GPU芯片,这一年GPT正以人类难以想象的速度继续进化。事实上,在基GPT-3.5模型ChatGPT上线时OpenAI已经完成GPT-4的训练。而据微软研究院估算GPT-4已经是一个早期的、仍不完整AGI系统。

      

业界认为800亿参数是大模型得以涌现,这意味着全球有多个大模型可能涌现智能。对于大模型的未来,梁正借用菲尔茨奖得主陶哲轩的说法表达自己的预见:如果使用得当,2026AI将成为数学研究和许多其他领域值得信赖的合著者。而数学,一直是象征人类智力巅峰的学科领域。

      

前所未有的繁荣

      

在人工智能投资领域,美国与中国是全球投入最多的两个国家。随ChatGPT的横空出世,各国AI的投资继续加码,中美之间AI投资差距正在缩小。

      

ChatGPT发布之初,中国计算机学会术语工委副主任、同济大学特聘研究员王昊奋就意识到,这是一个改变人与计算机交互模式。这也解释了为何整个科技界对它如此兴奋,以至于任何可的人都动了起来。

      

浙江大学上海高等研究院常务副院长、人工智能研究所所长吴飞对大模型的态度有过一次明显改变3月前,我对它还是旁观待变的态度,现在我已经深刻感受到它通用之

      

大模型是比互联网门槛更低。吴飞解释说,互联网的能力是赋能特定领域、特定任务。比如用互联网赋能餐饮,可以让程序员做一个美食推荐应用,而要赋能体育,则可以做一个体育新闻推送应用。因此,现在我们每个人的手机里都装有各种不同功能的应用。大模型则不同,基础大模型可以解答我们提出的任何问题,但如果想要在专业上更进一步,则需要垂直领域大模型。

      

过去一年,吴飞团队打造了多个垂直领域大模型。只45TB(万亿字节)法律方面的专业数据,他们就训练出-,一个为法律从业者提供法律问答、知识检索增强问答、案情分析、意图识别等多项法律辅助服务的工具。过去一年,该模型已应用于浙江省高级人民法院,大大加快了法官审案流程。

      

科大讯飞今年则一口气发布12款行业大模型,涉及金融、汽车、运营商、工业、住建、法律等多个领域。科大讯飞总裁刘庆峰援引知名咨询机Gartner的数据表示,目前全球已5%的企业在使用大模型,2026年,这一数字将达80%

      

在邱锡鹏看来,大模型在应用端的发力速度会比预计的更快,覆盖面也会更广。因为大部分软硬件服务公司都开始接入大模型,在感叹效率提高的同时,用户可能不知道自己其实已经在使用大模型了。

      

梁正30年前的互联诞生时来类比当下,且相较前者,大模型能够覆盖的行业更多,更加避无可避。他甚至认为30年的互联网繁荣似乎就是为大模型准备的,因为驱动大模型涌现的主要数据来自互联网。

      

这一年,大模型已经在教育、医疗等诸多领域展现出过人本领。不久前ChatGPT根据病情描述和检查报告,帮助一位母亲为她的孩子找到了病新生儿发病率最高只0.025%的脊髓栓系综合征。此前,这位母亲已经带着孩子求3年,求助17位医生,都没有诊断出原因。

      

前所未有的分裂

      

如果ChatGPT的问世让全球科技界沉浸在大模型的狂欢之中,那么关AI伦理之争则是新技之下的灵魂拷问。

      

3月底的千人联名信5月底AI风险声明,在要不要继续推动大模型发展、如何防AI风险上,即使AI阵营内部也呈现出了前所未有的分裂5月初,AI之称的计算机科学家杰弗·辛顿离开谷歌,加深了人们AI是否已经失控的担忧。他坦言,之所以离开谷歌,就是为了完全自由地说AI潜在的风险,向世人提出警示。

      

最具戏剧性的事件要属最近发生OpenAI内部:首席执行官山·奥尔特曼被董事会开除,几天后,他又宣布重OpenAI。业内普遍推测,如何规AI发展是公司内部矛盾爆发的导火索。作为掌握大模型的公司OpenAI的态度很大程度上代表AI发展的最真实状态,而据其判断AGI有很大概率会10年内到来。

      

人类已经致力于发AI60年,为什么这一次如此警铃大作?伊利·苏茨克维表示AGI与迄今为止人类创造的任何东西都不同,它是有自己目标的完全自主的生物。如果这一天到来,人AGI的关系相当于人与动物,只不过这一次站在动物位置上的是人类。

      

奥尔特曼则表示AGI只是发AI道路上的一个小节点,他们的远景目标是创造出远超人类智能的超AI。不过即便如此,他仍向美国国会表达了希望加强OpenAI监管的愿望。今7OpenAI首次提超级对概念,宣布将投20%的计算资源、花4年时间全力打造一个超级对齐系统。

      

如何保AI向善?梁正说,目前业界观点主要分成了两派:一派认为应该先AI中普及人类的道德规范再允许其发展;另一派则认AI在发展中会形成自己的道德规范,就像人类在群体行为中产生了道德一样,但前提AI需要拥有和人类一样的外形。

      

 一方面人们对可能到来AGI争论不休,而另一方面,充分的竞争则会加AGI的到来。上海交通大学教授江晓原对人类能否对一AI踩刹表示悲观。他说,企业是推AI的决定性力量,它无法依靠自己的道德慢下来,因为如果你不做,别人就会赶超你。

      

仍有许多科学家坚AI只是人类发明的一件好用的工具,即便如此,它仍然有毁灭人类的风险。清华瑞莱智慧科技有限公AI治理研究院院长张伟强提出了这样一个假设:人类总是在不断试错的过程中走向成功,而大模型提供了前往正确答案的直通车,人们将由此减少很多试错机会。正如刘慈欣在科幻作品《镜子》中描写的一种人,人类因为从不犯错而走向灭亡。

      

还有更多问题

      

与上半年的烈火烹油相比,下半年大家对大模型的态度务实了许多,它还有很多问题没有解决,比如模型复杂度、多模态融合、模型评测等,我们都在全力解决邱锡鹏说。

      

吴飞也表示,继续通过某些任务对大模型进行特定训练,以期在某个指标上超ChatGPT,意义可能并不大,中国在大模型上的机会与当年的互联网一样,即从实际应用倒逼模型迭代。

      

许多专家都表示,国内大模型的挑战主要来自两方算力和数据。大模型与其他软件应用不同,不仅训练起来费钱,运行起来更烧钱。想要处理用户输入的问题,基本上每个字都要在大模型上跑一遍,参数上千亿的大模型,每跑一遍都要调用多A100 GPU,每个价值一万美元,十

      

国内使用大模型的用户画像也和国外有所区别。简单来说,国外有更多高端用户倾向于使GPT,这些相对高质量的海量数据使GPT的迭代比国内大模型要快。

      

如何破局?当务之急是提高算力。据浪潮信息、国际数据公司IDC)和清华大学联合发布2021-2022年全球计算力指数评估报告》15个重点国家的计算力指数平均每提1个点,国家的数字经济GDP将分别增3.51.8,预计该趋势2021-2025年将继续保持。吴飞认为,随算力的落地,国内大模型会在未来几年不断带来好消息。

      

大模型AI发展唯一正确的路吗MetaAI科学家杨乐昆对此并不认同。在他看来,大模型一条下坡,远离了通往更强大AI的道路。他在《经济学家》上撰文说大型语言模型能有多聪明、能有多准确,都是有限度的,因为它们没有现实世界的经验

      

邱锡鹏表示,在使用工程性的方法确保自不掉的前提下,还要想办法研究下一代大模型,即在算力不够的现有条件下,有无新途径去实现生成AI前者我们只能跟随,后者则有几率超越他透露MOSS正朝着这一目标努力。这一年来,它在架构上有所创新,规避了现有系统的一些缺陷;上采用了更人性化、更多维度的幻觉数据集,使内容生成更安全;在学习能力上也更加主动。

      

面对大模型高昂的成本和耗能,整个行业也在寻找解决办法。一些科技巨头亲自下场研发芯片,比如谷歌、亚马逊、微软,甚OpenAI都在考虑针AI运算自研芯片,或是让消费者购买更适合大模型计算的手机和电脑,分担算力成本。

      

开源会让创新速度更快上海对外经贸大学人工智能与变革管理研究院副院长、上海开源信息技术协会秘书长张国锋说,目前国内大模型的开源方式都以企业为主导,并且只开源了整个大模型生态的一小部分,从而出现了算力分散、算力资源浪费等问题。他建议整合政府、高校、企业等优质的大模型生产要素数据、算法和算力,采用开源项目的协作模式和治理方式降低成本,建立大模型时代Linux生态位。

 

(责任编辑:九言)

2023-11-29 10:36

广告

来源:文汇报
“太忙了。”这是清华大学人工智能(AI)国际治理研究院副院长梁正面对记者脱口而出的一句话。

声明:凡来源标明“蜂耘网”的文章版权均为本站所有,如需转载请务必注明出处,违者本网将追究相关法律责任;所有未标明来源为“蜂耘网”的转载文章目的在于传递更多信息,均不代表本网立场及观点,“蜂耘网”不对这些第三方内容或链接做任何保证或承担任何责任;如涉及版权等问题,请在内容发表之日起一周内与本网联系,否则视为放弃相关权利。

所有评论仅代表网友意见,与本站立场无关

最新资讯

推荐阅读

热门排行

1、

2、

3、

4、

5、

6、

7、

8、

专题推荐

人物访谈

  • 一文了解查理·芒格:为什么他是巴菲特最推崇的人

    来源:
    ①巴菲特写道,“如果没有查理的灵感、智慧和参与,伯克希尔-哈撒韦公司不可能发展到今天的地位”;
    ②芒格曾表示,“如果世上未曾有过查理·芒格这个人,巴菲特的业绩依然会像现在这么漂亮 ”
    ③两周前,芒格还公开在节目中维护93岁的老友巴菲特。

    149 2023-11-29
  • 面壁者,拉里·佩奇

    来源:中欧商业评论
    这两年,硅谷钢铁侠埃隆·马斯克在社交媒体上口无遮拦,这为他的公司引来了铺天盖地的负面新闻,然而,他的好友、谷歌联合创始人拉里·佩奇却因为看不到人同样被媒体炮轰多时。他已经在公共视野中消失太久了。

    263 2022-06-15
  • 百岁中科院院士文圣常逝世!被誉为我国海浪研究的“点灯人”

    来源:南方都市报
     3月21日上午,中国海洋大学发布讣告,中国科学院院士、著名物理海洋学家、该校教授文圣常,因病医治无效,于3月20日15时37分在山东青岛逝世,享年101岁。

    301 2022-03-21

会议活动

微信公众号

广告

相关新闻