科技行业资讯门户

广告

广告

广告

广告

广告

AI芯片的一百种死法

【蜂耘网   人工智能】前几天,英伟达成为首家市值达2万亿美金的芯片公司,创造了历史。同一时间,一家名Groq的初创公司横空出世,扬三年之内赶超英伟

 

Groq狠话的底气,来源于它所开发的芯LPU

 

LPU的全称Language Processing Unit,翻译过来就是语言处理单元,是一种新AI加速器。在它的支持下,大模型的推理速度快得惊人,瞬间能输出长篇幅答案;而使用了英伟达芯片GPT-4,只能一个字一个字往外蹦。

 

前者的响应速度最高可达500T/S,而后者只40T/S[1]

 

这是什么概念?相当于一秒钟生300个单词7分钟生成一部《哈姆雷特》长度级的文章。

 

img1

 

Groq背后的团队也可谓群星璀璨,公CEO Jonathan Ross是谷歌初TPU的设计者之一。早期谷TPU团队10位成员中8位都跳槽到Groq

 

2016年成立Groq就饱受市场关注2020Groq的芯片被美国阿贡实验室采用2021Groq获老虎环球基金等机构投资,估值超10亿美元。

 

然而Groq公司的各,英伟达完全没放在眼里。相比之下,此奥特7万亿美元造的新闻出来之后,黄仁勋至少还出来说了两句。

 

毕竟,眼Groq的种种套路,老黄可再熟悉不过了。

 

文字游戏

 

当下,制AI芯片发展的主要困境,是内存墙:内存的传输速度远远慢于处理器算力,导致性能迟迟上不去。

 

如果把芯片想象成一个餐厅,那么内存就是仓库,处理器就是后厨。

 

仓库送菜比后厨烹饪还慢,严重限制了餐厅的出菜速度。因此,包括英伟达在内的芯片厂商,都在围仓库(内存做文章。Groq碾压英伟达的秘诀,也藏在内存结构里。

 

传统计算机所使用的内存,其实有两种:

 

DRAM容量较大,但传输速度较慢,起主存作用;SRAM容量较小,但传输速度极快,作为缓存发挥辅助作用。一直以来,二者都是合作关系,缺一不可。

 

Groq为了追求极致的速度,摒弃DRAMSRAM扛起LPU主存大旗。

 

相当于砍掉距离厨房较远的大仓库,直接将所有食材都堆在厨房边的菜篮子里 这样的设计思路下LPU不但在速度上形成降维打击,还轻松绕过了两个成本最高的技术 HBM和先进封装。

 

这也构成Groq另一个大吹特吹的宣传核心:便宜。

 

Semi Analysis的拆解LPU由于具备架构优势,物料成本仅1050美元。相比之下,去年全球疯狂H100芯片,物料成本则达3700[2]

 

在售价层面,一LPU的价格20000美元,远低H10035000美元。

 

但历史无数次告诉我们,大部分弯道超车的结局都是有田下山LPU也不例外。

 

大模型对内存大小也有着很高的要求。参数量越大的模型,运行时所需要存储的数据也会更多。

 

SRAM虽然快,但缺陷是容量小,通常只4-16MBGroq研发团队多年苦心钻研,最终也只是LPU的容量提升230MB。而一H100的内存容量80GB,两者间差了356倍。菜篮子再怎么升级换代,终究无法和仓库相提并论。

 

想装下所有的食材,唯一的办法就是把菜篮子数量堆上去。因此,在运行同样参数的模型时,需要用到LPU数量就远远高GPU

 

前阿里技术副总裁贾扬清就算了一笔账:

 

以运LLaMA 70b模型为例,需572LPU,售1144万美元;但如果换H100,其实只需8张,总价格30万美元左所谓便压根不成立。

 

芯片一多,整体的功耗成本也直线上升LPU每年至少消25.4万美元电费,H100顶多花2.4万美元。

 

 

img2

 

事实证明Groq的遥遥领先,只是隐去了核心信息的文字游戏。它所宣传,是以近乎夸张的使用成本换来的:运行三LLaMA 70b模型LPU的使用成本将比英伟达GPU32倍。

 

当然Groq的研发团队,显然对此心知肚明。选择此时大张旗鼓,更像是一种拉投资的举动。

 

事实上,这已经不Groq第一次公蹭热了。

 

GPT Store刚发布时GroqOpenAI的奥特曼发了一封信,嘲笑使GPTs深夜读《战争与和平》一样缓。马斯克的聊天机器Grok发布时,它也跑去贴脸嘲讽,质Grok抄袭了自己的名字。

 

img3

 

过去几年,打替代英伟旗号的初创公司数不胜数Groq只不过是其中之一。目前,在超车英伟达的这条弯道,已经出现了严重塞车。

 

前车之鉴

 

Groq最直观的参考样本,来自英国公Graphcore

 

Graphcore诞生之初,也曾拿技术路线别出心裁、演示视频酷炫惊艳、性能数据秒杀同的剧本,拳头产IPUGroqLPU设计思路异曲同工,也是用高速SRAMDRAM作为芯片内存,以实现极致的传输性能。

 

同时Graphcore调整了芯片架构,专注于处理高性能计算。

 

它曾颇有自知之明地表不与英伟达直接竞,只将目标客户定位在,特别需要大量高性能计算的化学材料和医疗等特殊领域。

 

img4

Graphcore的两位创始人

 

2019年,微软成GraphcoreIPU的大客户 20205月,微软科学家IPU内置于微Azure操作系统中,用于识别胸X光片 这位科学家说道:

 

Graphcore芯片可以30分钟内完成GPU5个小时才能完成的工作

 

在最风光20162020年间Graphcore共拿到7.1亿美元融资,估值高27.7亿美元,一度被视为全英国乃至欧洲全村的希望Graphcore的投资者不仅有微软、三星、戴尔等科技巨头,也囊括了红杉资本、柏基投资等顶级风投。

 

相比今天Groq,当年Graphcore只能说有过之无不及。Graphcore的后续发展却远远不及当时的预期。

 

2022Graphcore全年营收只270万美元,为英伟达同期收入的万分之一,且相较前一年下46%,亏损达到2亿美元 2023年,人工智能浪潮爆发,英伟达业绩再度暴涨 H100一卡难求之时Graphcore以为自己至少能捡到英伟达的漏,结果却连汤都没喝着。

 

去年Graphcore的创始Nigel Toon向英国首相写了公开,讨要补贴。

 

他写道Graphcore已经为英国预留了多3000IPU芯片,可以为整个国家提供服,几乎已经是明示要[4]

 

img5

 

不久前,一面业绩亏损,一面融资无果Graphcore走向了最后一条路 寻求收购 The Telegraph爆料,其售价可能5亿多美2020年最高估值时期的五分之[5]

 

当年,Graphcore为首的挑战者们,各怀绝学,来势汹汹,颇有一种八大门派围攻光明顶的既视感。然而,如今多已散作鸟兽状。

 

3月,芯片公Mythic一度因资金耗尽而濒临倒闭,快要淹死之际,才好不容易等到了救命缰绳,拿到1300万美元融资。

 

另一家芯片公Blaize也出现了类似的困境,最后靠着中东土豪的投资,才活了下来。

 

剩下的公司中Habana可能是唯一活得不错它被英特尔20亿收购,保留了独立运营的权利。

 

img6

 

GraphcoreMythic,这些芯片公司的技术路线各不相同;然而,它们失败的原因,却出奇一致。事实上,今天大火Groq,同样也极有可能倒在同一个地方:

 

芯片卖不出去。

 

真正的护城河

 

英伟达GPU固然厉害,但它卖芯片的套路,才是真正的护城河。

 

每年,英伟达都会投入相当一部分的研发经费,围GPU搭建系统性能力。当然,这是高情商的说法,低情商的说法是开发一捆绑销的产这才是英伟达最坚实的城墙。目前,英伟达的城墙共3层:

 

第一层城墙,CUDA的编程生态。

 

众所周知GPU最初的使用场景是游戏与视频图像渲染。早期,一些华尔街精英偶尔利GPU的并行计算能力来跑交易,但由于需要重新编写大量代码,因此并未广泛传播开来。

 

黄仁勋坚GPU能用于更多领域,因此2006年推出了降低编程门槛的软件架CUDA,和自GPU捆绑推出。

 

后来,苹果AMD都推出了类似平台,但此CUDA生态早已构建,用得人越多CUDA越好用,新开发者越倾向于选CUDA的良性循环中稳定前进。

 

如今CUDA可以让英伟GPU的使用成本大幅降低。

 

一位私有CEO曾在接受采访时说过,理论AMD卡也不是不能用,但要把这些卡调试到正常运转,需要多耗费两个[6]找谁下单,答案不言而喻。

 

img7

2017年,英伟达甚至AI研究员赠送V100芯片

 

第二层城墙,NV-Link的高速传输。

 

一个数据中心,不可能只使用一AI芯片。然而,如果2AI芯片连在一起,那么实际算力必然会小2,因为数据传输的速度慢于芯片算力,且过程中还存在损耗。

 

显然,GPU数量迅速膨胀的数据中心内,解决数据传输问题其关键。

 

2016年,英伟达IBM服务器提GPU时,首次用上了自研NVLink技术,带宽高80G/s,通信速度提高5倍,性能提升14%,好评不断。此后几年,英伟达一边迭NVLink技术,一边规定该技术必须绑定自家芯片使用。

 

套路虽然简单直白,但就是有效。

 

而第三层城墙,则是英伟达铁杆好兄弟联

 

过去一年,英伟达是全球最主要的人工智能投资人之一,活跃程度甚至超过a16z和红杉等顶级投资机构。

 

据外媒统计,英伟达去年至少35笔人工智能投资,包括:由DeepMind联合创始人创办Inflection AI,欧洲人工智能独角Mistral,世界最大的开源模型社Hugging Face[7]

 

img8

Inflection AI创始人苏莱曼

 

积极投资的目的,其实很简单:当黄仁勋提着美金H100芯片,敲开这些公司的大门,没有人会再拒绝英伟达。

 

这所有的一切,足以让市面上绝大多数公司,都绑死在英伟达的船上。

 

面对性能强大的英伟GPU,各路初创公司们或许有办法,打造出性能相匹敌的产品。然而。英伟达卖芯片的套路,却让这些公司始终难以招架。因此Graphcore等挑战者的失败,真的不是不努力。

 

当眼下的炒作逐渐回归寂静Groq也得思考相同的问题:到底谁会翻过三座大山,来LPU

 

尾声

 

223日,英伟达市值突2万亿美元。距离上一1万亿,仅仅过9个月。

 

Groq的爆火,让市场又一次开始讨论同一个问题:到底有没有人能叫板英伟达?

 

遗憾的是,英伟达远比人们想象的要强大。人工智能浪潮给芯片行业提供了一块大蛋糕,英伟达并没有分的意思,而是整个端走塞进了口袋。

 

芯片初创公MythicCEO曾愤然表示,人工智能火了,他们却更难融资了,就是英伟搞坏了大环

 

PitchBook数据,截20238月底,美国芯片初创企业融8.814亿美元,约2022年同期的一半。交易数量的变化则更加触目惊心:23宗减少到4[8]

 

GraphcoreMythic的前车之鉴历历在目,所以也不Groq跟大家玩儿文字游戏。面对这么一汤都不给的庞然大物Groq又能怎么办呢?

 

(蜂耘人工智能网   责任编辑:九言)

2024-02-26 09:40

广告

来源:远川科技评论
前几天,英伟达成为首家市值达到2万亿美金的芯片公司,创造了历史。同一时间,一家名为Groq的初创公司横空出世,扬言“三年之内赶超英伟达”。

声明:凡来源标明“蜂耘网”的文章版权均为本站所有,如需转载请务必注明出处,违者本网将追究相关法律责任;所有未标明来源为“蜂耘网”的转载文章目的在于传递更多信息,均不代表本网立场及观点,“蜂耘网”不对这些第三方内容或链接做任何保证或承担任何责任;如涉及版权等问题,请在内容发表之日起一周内与本网联系,否则视为放弃相关权利。

所有评论仅代表网友意见,与本站立场无关

最新资讯

推荐阅读

热门排行

1、

2、

3、

4、

5、

6、

7、

8、

专题推荐

人物访谈

  • 一文了解查理·芒格:为什么他是巴菲特最推崇的人

    来源:
    ①巴菲特写道,“如果没有查理的灵感、智慧和参与,伯克希尔-哈撒韦公司不可能发展到今天的地位”;
    ②芒格曾表示,“如果世上未曾有过查理·芒格这个人,巴菲特的业绩依然会像现在这么漂亮 ”
    ③两周前,芒格还公开在节目中维护93岁的老友巴菲特。

    30 2023-11-29
  • 面壁者,拉里·佩奇

    来源:中欧商业评论
    这两年,硅谷钢铁侠埃隆·马斯克在社交媒体上口无遮拦,这为他的公司引来了铺天盖地的负面新闻,然而,他的好友、谷歌联合创始人拉里·佩奇却因为看不到人同样被媒体炮轰多时。他已经在公共视野中消失太久了。

    137 2022-06-15
  • 百岁中科院院士文圣常逝世!被誉为我国海浪研究的“点灯人”

    来源:南方都市报
     3月21日上午,中国海洋大学发布讣告,中国科学院院士、著名物理海洋学家、该校教授文圣常,因病医治无效,于3月20日15时37分在山东青岛逝世,享年101岁。

    164 2022-03-21

会议活动

微信公众号

广告

相关新闻