科技行业资讯门户

广告

广告

广告

广告

广告

刷屏的清华AI光芯片,突破了什么?

【蜂耘网 激光光学】最近,清华大学传出了好消息。首创AI光芯片架构,研制全AI光芯”—太极Taichi),可以实160 TOPS/W通用智能计算,能效H1001000倍。

 

img1

 

训练下一代万亿级参数大模型的高效芯片诞生了。目前,相关研究论文Large-scale photonic chiplet Taichi empowers 160-TOPS/W artificial general intelligence为题,已发表在权威科学期 Science 上。

 

img2

 

01

 

成果是什么?

 

当前,越来越多迹象表明LLM不会是通AGI的最终路径。

 

计算机早已经成为世界能耗巨头,随着越来越多耗电量大的人工智能投入使用,计算机的能源需求也飞速上涨。

 

以英伟H100为例,其峰值功耗700 瓦,按 61% 的年利用率计算,相当于一个美国家庭的平均功耗(假设每个家 2.51 人)。有专家预测,在大量部H100后,总功耗将于一座美国大城市不相上下,甚至超过一些欧洲小国。

 

若是能够发明一种,节省大量能耗的芯片LLM的性能或在未来实现更大的提升。

 

而太极,可能会让通用人工智能AGI)成为现实。

 

根据清华大学官网介绍,清华团队设计了基于集成衍射干涉异构设计和通用分布式计算架构的大规模光芯太极,该架构具有上千万个神经元的能力,实160万亿/·TOPS/W)的通用智能计算。

 

此外,在太极光芯片在实验中实现了芯片1000个类别级别的分类(1623类别Omniglot数据集上准确率91.89%)和高保真的人工智能生成的内容,效率提高了两个数量级。

 

研究人员表示为大规模的光子计算和高级任务铺平了道路,进一步发掘了光子学在现AGI中的灵活性和潜力。

 

Science对这个研究有高度评论来自清华的团队探索了分布式衍射干涉混合光计算架构,有效地将光神经网络ONN)的规模提高到百万神经元级别。通过实验实现了一个芯片1396万个神经元ONN,用于复杂的、千类级的分类和人工智能生成的内容任务。这项工作是向现实世界的光计算迈出的有希望的一步,支持人工智能中的各种应用

 

02

 

什么东西,有什么用?

 

电子芯片的瓶颈

 

当电子通过晶体管和其他传统集成电路元件时,会遇到阻力并产生热量。随着设计者不断将各种元件添加到芯片上,芯片产生的热量自然会升高。电子这一特性甚至成为了微型芯片性能提升的障碍,同时也是计算机能耗如此之高的主要原因。

 

以电子为载体的技术发展已趋近物理极限,芯片尺寸降到极致时出现功耗难题,访存瓶颈下大量信息存储不过来、计算不过来,以及电子芯片性能提升的同时性价比降低。

 

在电路上,用光子替代电子的设想由来已久。

 

20 世纪六七十年代,研究者就已经开始开发光子芯片了。那时候,部分专家预计光子芯片会像传统集成芯片一样迅速微型化。

 

电路能耗降低,还是归功于光的性质。光子芯片不存在电阻问题。因为由镭射产生的光子能快速通过波导、调制器、反射器等原件阵列。因此,光子芯片产生热量更少,能耗也更低。

 

光为载体的计算芯片

 

光计算,顾名思义是将计算载体从电变为光,利用光在芯片中的传播进行计算。

 

人工智能时代是由算力支撑起来的,从能耗的角度来看,硅光技术能够有效提GPU的整体性能、大幅降低其功耗,有效解决目前的算力瓶颈。也就是说,下一代算力很可能会是光子计算甚至量子计算。

 

问题在于,当前的集成光子计算,特别是光学神经网络ONN),通常包含数百到数千个参数,其中数十个是可调参数,仅支持基本任务,如简单的模式识别和元音识别。能够进行一些简单任务和浅层模型,无法支撑亟需高算力与高能效的复杂大模型智能计算。

 

光计算对于集成度的要求会更高,但其技术难点其实并不只在集成,在计算单元循环使用和非线性处理方面挑战更大。

 

据了解,一个巨大AI模型中,每一层网络都需要进行矩阵运算,一个大矩阵还可能需要拆成几个小矩阵进行计算。也就是说,在大模型中,矩阵乘加运算是一个反复、循环的计算过程,每次循环,矩阵上的元素权重都会被更新。

 

与电子相比,光的矩阵乘加运算非常快,但一涉及到权重的更新,光的速度就会变慢。

 

要实现大规模、高能效的光子计算,简单地扩大现有的光子神经网络芯片是不现实的,因为随着神经网络层数的增加,不可避免的模拟噪声会呈指数级扩大。放大现有架构的规模并不能成比例地提高性能。

 

新架构:分布式衍-干涉混合光子计算架构

 

清华团队进行了架构方面的研究01重新设计适合光计算的新架构。

 

根据论文介绍,清华团队为采用分布式计算的太极,构建了一个深度较浅但宽度较广的网络结构。

 

与为深度计算堆叠一系列层的传统方法不同Taichi 将计算资源分布到多个独立的集群中,为子任务分别组织集群,并最终合成这些子任务,从而完成复杂的高级任务。

 

具体地说,光学衍射层的完全连通特性,可以提供比传DNN中的卷积层更大的变形能力。

 

这意味着光学网络有可能用比电子系统更少的层数实现相同的变换。

 

img3

图中(B)中展示了「太极」芯片,包括用于大规模输入和输出数据的双衍射单元,以及用于可重构特征嵌入和硬件多路复用MZI阵列的可调矩阵乘法。

 

论文第一作者、电子系博士生徐智昊介绍架构中,自顶向下的编码拆-解码重构机制,将复杂智能任务化繁为简,拆分为多通道高并行的子任务,构建的分布大感受浅层光网络对子任务分而治之,突破物理模拟器件多层深度级联的固有计算误差

 

AI光芯片:干-衍射融合计算芯片

 

在这项工作中,团队设计了一种具有灵活分布式计算架构的大规模衍-干涉混合型光AI「太极」。

 

据论文报道光芯片具879 T MACS/mm²的面积效率160 TOPS/W的能量效率,实现了高达两个数量级的能效提升。首次赋能光计算实现自然场景千类对象识别、跨模态内容生成等人工智能复杂任务。

 

03

 

国内光芯片企业情况如何?

 

在面后摩尔时的潜在颠覆性技术里,光子芯片已进入人们的视野。其所具有的高速度、低能耗、工艺技术相对成熟等优势,能够有效突破传统集成电路物理极限上的瓶颈,满足新一轮科技革命中人工智能、物联网、云计算等产业对信息获取、传输、计算、存储、显示的技术需求。

 

目前,全球光子芯片产业刚刚起步,作为独立于电子集成技术的新集成技术,其技术壁垒还没有形成。我国光子产业发展水平与世界处于并跑阶段,在光子基础理论研究和技术发展方面具有一定的优势。

 

目前中国本土的高功率激光芯片、部分高速率激光芯片10G25G等)等已处于国产化加速突破阶段,而光探测芯片25G以上高速率激光芯片刚刚起步。

 

值得注意的是,光芯片方面华为也有所布局。

 

3月,华为公布了一光芯片及其制备方法、通信设发明专利。申请公布号为CN117616316A,该专利申请日期2021918日。摘要显示,本申请的实施例提供一种光芯片及其制备方法、通信设备,涉及光通信技术领域,解决现有的光芯片中光波导在制备过程中尖端易断裂的问题。

 

光芯片企业利润下降

 

国内光芯片厂商有源杰科技、长光华芯和炬光科技等。2023年度业绩快报中,这三家企业均提到宏观环境、行业发展的影响,导致产品需求减少和价格降低。

 

源杰科技是国内领先的光芯 IDM 厂商,产品涵盖25G50G 磷化铟激光器芯片。从源杰科2023年的业绩来看,营业收入共计144亿元,与去年同期相比下4896%,全年归属净利润盈 0.195 亿元,同比减 80.58%

 

长光华芯发布的业绩报告来看,也同样处于亏损状态。营业收入2.92亿元,同比减24.2%;归属于上市公司股东的净利润亏8610.17万元202316月份,长光华芯的营业收入构成为:高功率单管系列占90.16%,高功率巴条系列占8.24%,其他业务占0.9%VCSEL芯片系列占0.7%

 

炬光科技业务覆盖上产生光调控光及中游汽车、泛半导体、医疗健康领域,与多家业内知名公司达成合作。炬光科技发2023年度业绩快报,营业收入5.61亿元,同比增1.69%;归属于上市公司股东的净利8968万元,同比减29.44%

 

源杰科技表电信市场及数据中心销售不及预;长光华芯受宏观经济环境等因素的影响,市场信心不足,激光器市场需求持续疲软,同时行业竞争加,炬光科技公司部分上游元器件产品价格降低,综合毛利率下

 

 

(蜂耘激光光学网 责任编辑:行云)

2024-04-29 11:11

广告

来源:半导体产业纵横
最近,清华大学传出了好消息。首创AI光芯片架构,研制全新AI“光芯片”——太极(Taichi),可以实现160 TOPS/W通用智能计算,能效是H100的1000倍。

声明:凡来源标明“蜂耘网”的文章版权均为本站所有,如需转载请务必注明出处,违者本网将追究相关法律责任;所有未标明来源为“蜂耘网”的转载文章目的在于传递更多信息,均不代表本网立场及观点,“蜂耘网”不对这些第三方内容或链接做任何保证或承担任何责任;如涉及版权等问题,请在内容发表之日起一周内与本网联系,否则视为放弃相关权利。

所有评论仅代表网友意见,与本站立场无关

最新资讯

推荐阅读

热门排行

1、

2、

3、

4、

5、

6、

7、

8、

专题推荐

人物访谈

  • 一文了解查理·芒格:为什么他是巴菲特最推崇的人

    来源:
    ①巴菲特写道,“如果没有查理的灵感、智慧和参与,伯克希尔-哈撒韦公司不可能发展到今天的地位”;
    ②芒格曾表示,“如果世上未曾有过查理·芒格这个人,巴菲特的业绩依然会像现在这么漂亮 ”
    ③两周前,芒格还公开在节目中维护93岁的老友巴菲特。

    37 2023-11-29
  • 面壁者,拉里·佩奇

    来源:中欧商业评论
    这两年,硅谷钢铁侠埃隆·马斯克在社交媒体上口无遮拦,这为他的公司引来了铺天盖地的负面新闻,然而,他的好友、谷歌联合创始人拉里·佩奇却因为看不到人同样被媒体炮轰多时。他已经在公共视野中消失太久了。

    140 2022-06-15
  • 百岁中科院院士文圣常逝世!被誉为我国海浪研究的“点灯人”

    来源:南方都市报
     3月21日上午,中国海洋大学发布讣告,中国科学院院士、著名物理海洋学家、该校教授文圣常,因病医治无效,于3月20日15时37分在山东青岛逝世,享年101岁。

    166 2022-03-21

会议活动

微信公众号

广告

相关新闻