AI「大跃进」,芯片还够吗-香港期货开户
2023-04-20 

在ChatGPT带来的AI热潮中,继百度之后,360、华为、腾讯、阿里甚至是科大讯飞、商汤、创维等企业均示意将推出自己的大语言模子。

只管ChatGPT及一众主流大模子背后的芯片主力仍是GPU,但严重的挑战已经摆到眼前:天生式AI所需盘算量不停增添,而算力增进空间却即将触顶。

4月5日,OpenAI暂停ChatGPTPlus的注册,随后又重新恢复,其中缘故原由是算力需求量超载。此前,ChatGPT还因接见量过大而大规模封号,并制止使用亚洲节点登录,主要照样算力不足造成的。

只管OpenAI踩下“刹车”,但大洋彼岸的A股算力观点股依旧掀起巨浪,一时间炙手可热。业内称,现在AI的“iPhone时刻”已经来临,作为人工智能时代的底层基座,谁掌握了算力资源,谁就拥有了引领数字经济生长的“*武器”。在这个历史性的转变时刻,中国不能缺席。

01

AI模子开启算力军备竞赛

作为人工智能三大焦点要素(数据、算法、算力)之一,算力被誉为人工智能“发念头”。在AI风暴的催化下,浪潮中的AI大算力芯片公司面临着摩尔定律濒临极限之外的手艺挑战:以更低的系统成本、更少的能源消耗,支持起重大且延续增添的参数目所动员的高算力需求。

凭证OpenAI测算,自2012年以来全球头部AI模子训练算力需求每3-4个月翻一番,每年头部训练模子所需算力增幅高达10倍。AI深度学习正在迫近现有芯片的算力极限,也对芯片设计厂商提出了更高要求。

在手艺架构层面,AI芯片可分为GPU(图形处置器)、ASIC(专业集成电路)、FPGA(现场可编程门阵列)和类脑芯片。随着征象级AI产物ChatGPT的走红,以大型语言模子为代表的前沿AI手艺走向聚光灯之下,这类模子所需的数据量、盘算量重大,成本高昂。

例如,现在采购一片英伟达*GPU成本为8万元,GPU服务器成本跨越40万元。对于ChatGPT而言,支持其算力基础设施至少需要上万颗英伟达GPUA100,一次模子训练成本跨越1200万美元。

凭证浙商证券研报,ChatGPT背后的算力支持主要来自GPU或CPU FPGA。由于具备并行盘算能力,可兼容训练和推理,GPU现在被普遍应用。

除了GPU以外,CPU FPGA的方案也能够知足AI重大的算力需求。FPGA全称为现场可编程门阵列,是一种可以重构电路的芯片。作为可编程芯片,FPGA芯片可以针对特定功效举行扩展。通过与CPU连系,FPGA能够实现深度学习功效,两者配合应用于深度学习模子。

近期,英特尔透露,设计将在今年推出15款新FPGA,这将刷新英特尔该品类的年度推新纪录。着实在3月初,英特尔就公布了Agilex7FPGA F-Tile,并配备FPGA收发器,其每个通道的带宽都较上一代提升了一倍,在给产物提供更高的数据流量的同时也降低了功耗。

现在,FPGA领域的本土化水平较低。中国市场主要由赛灵思Xilinx(现已被AMD收购)和英特尔两大厂商主导,占有了跨越70%的市场份额。海内厂商安路科技、紫光国微、复旦微电等总份额约为15%。

寒武纪作为科创板AI芯片*股,是全球少数周全掌握AI芯片手艺的企业之一。其产物矩阵涉及云端产物、边缘产物和IP授权及软件,前两者对标英伟达、AMD,IP授权则对应英国的ARM。云端芯片就是现在大语言模子最为需要的动能泉源,在该领域,英伟达A100、H100系列占有金字塔*位置。

作为追赶者,寒武纪推出了思元系列,思元290、思元370等已经进入浪潮、遐想、阿里云等多家头部客户。去年3月,寒武纪正式公布新款训练加速卡“MLU370-X8”,其搭载了思元370,主要面向AI训练义务。

02

差距悬殊弯道难以超车

作为当前*可以现实处置ChatGPT的GPU供应商,英伟达是当之无愧的“AI算力*”。

6年前,黄仁勋亲自向OpenAI交付了*台搭载A100芯片的超级盘算机,辅助后者缔造ChatGPT,并成为AI时代的引领者。

在2023年3月22日召开的GTC大会上,黄仁勋又展示了速率比现有手艺快10倍的英伟达HGXA100,可将大语言模子的处置成本降低一个数目级。

现在,英伟达市值飙升到6678亿美元(约合4.6万亿人民币),险些是传统芯片巨头英特尔市值的五倍,成为全球*市值的芯片企业。英伟达在PC的GPU市场上占有了近70%的份额,在独显市场的份额更是高达70%-80%。

据TrendForce剖析,运行1800亿参数的GPT-3.5大型模子需要2万颗GPU芯片,大模子商业化的GPT则需要跨越3万颗。

然而,凭证相关报道,海内现在拥有超1万颗GPU的企业不跨越5家,拥有1万颗英伟达A100芯片的可能最多只有一家,绝大部门中国公司都只能采购英伟达的中低端性能产物。

纵然海内头部公司,从算力上跟美国的英伟达等公司相比,差距也异常显著。

就GPU细分赛道而言,海内自研GPU的领军企业主要包罗景嘉微、壁仞科技、芯动科技等。其中,其中,景嘉微是确立最早的一家,自2006年最先研发拥有自主知识产权的GPU产物,现在已经推出了一系列产物线,且均接纳海内成熟制程工艺和自主架构。

巨头激战汽车云:百度拿下5家头部新能源车企,腾讯服务70万宝马车主

景嘉微的主打产物是JH920自力显卡。凭证行业专家的评测,从性能参数上来看,JH920的性能与英伟达2016年公布的GTX1050相当,虽然两者仅相差6年,但由于GTX1050是英伟达10系列显卡中的入门级产物,无法代表那时的整体水平。

要想找到与GTX1050性能相当的英伟达产物,需要回溯到2010年推出的GTX580,这意味着景嘉微JH920基本上到达了英伟达12年前的水平。

以是整体而言国产GPU的现状并不算乐观,虽然在特殊领域能够自给自足,但在中高端领域依旧左支右绌。

与此同时,中 美地缘关系的博弈气息日渐粘稠,这给高度依赖先进制程的AI芯片创业公司提出了手艺之外的新难题。

去年,在美国总统拜登正式签署芯片法案(《CHIPSand ScienceAct》)一个月之后,美国政府对华实行了高端GPU芯片的出口禁令。同时,海内GPU设计商壁仞科技的GPU芯片BR100在台积电的试产也被迫叫停并自动修改设计,以知足出口禁令的要求。

A100和H100被制止后,中国企业只能奢望其替换品A800和H800。2022年11月7日,英伟达向中国的供应商提供其重新封装的A800芯片。据称,海内几家头部互联网企业都向英伟达下了1.5万左右的A800和H800订单。但纵然是*替换品A800,也只是A100的“阉割版”,其传输速率和运算性能较A100下降了50%。

被美国等国团结封堵的我们,或许在较长时间内都无法制造出比肩英伟达等国际*公司的高水准AI芯片。面临一个新的时代,我们又该若何破局?

03

换道行驶,续命摩尔定律

一直以来,头部厂商通过不停提升制程工艺和扩大芯片面积推出算力更高的芯片产物。虽然GPU、CPU+FPGA等芯片已经对现有模子组成底层算力支持,在应对天生式AI及大模子对算力基础设施提出的新要求,都若干显得有些左支右绌。

随同着摩尔定律迫近物理极限,制程升级和芯片面积扩大带来的收益边际递减,架构创新或成为提升芯片算力另辟蹊径的选择。

Chiplet及先进封装方案能够填补先进制程落伍的劣势,通过未来自差异生产厂商、差异制程工艺的芯片组件“混搭”,降低实现目的性能所需的成本。研究数据显示,当5nm芯片的面积到达200㎜²以上,接纳5Chiplet方案成本将低于单颗SoC,并将大幅降低因面积增添带来的良率损失。

除了成本和良率端的优势,Chiplet手艺带来高速的Dieto Die互连,使多颗盘算芯粒得以集成在一颗芯片中,实现算力的大幅提升。

台积电是Chiplet工艺的领军者,现在其手艺平台下有CoWoS、InFO、SoIC三种封装工艺。其中,早在2016年英伟达TeslaP100AI数据中央GPU就已经应用CoWoS工艺,AMD的最新GPU、CPU也普遍接纳了该工艺。此外,三星、Intel等龙头厂商亦推出了各自用于Chiplet的封装手艺,如三星I-Cube(2.5D封装),X-Cube(3D封装),英特尔EMIB(2.5D封装),英特尔Foveros(3D封装)。

不止在国际,近几年Chiplet在中国大陆也异常火爆,稀奇是美国最先打压中国半导体业以来。Chiplet既能削减先进制程用量,同时又能带来先进制程的利益,这为海内芯片企业提供“换道行驶”的时机。

现在海内封测巨头相关手艺积累已初显成效。例如长电科技的XDFOIChiplet高密度多维异构集成系列工艺已进入稳固量产阶段;通富微电与AMD亲热相助,已大规模生产7nmChiplet产物;华天科技的Chiplet系列工艺也实现量产。

Chiplet设计主要用于大型CPU和GPU等处置器。虽然当下国产CPU稀奇是大芯片与国际大厂存在显著差距,但华为海思、寒武纪科技等少数企业正重点研发并接纳7nm及更先进制程的服务器芯片和AI芯片。

在GPU方面,英伟达等国际GPU龙头企业已经构建了牢靠的专利墙。无论是老牌企业如景嘉微和海光,照样新兴创业公司,如芯动科技、壁仞科技、摩尔线程、沐曦集成电路、天数智芯等,大多还处于生长初期,且所设计的芯片规模有限,接纳Chiplet设计的还不多。

不外,一些GPU企业,稀奇是创业公司,虽然短期内难以在大芯片领域形陋习模,但耐久生长远景仍值得期待。例如,近几年天数智芯在云端GPGPU方面异军突起,其推出的7nm制程云端训练和推理GPGPU,能够为云端AI训练和HPC通用盘算提供高算力和高能效比。类似这样的芯片成为中国本土Chiplet手艺生长的希望。

近期,中国确立了自己的Chiplet同盟,由多家芯片设计、IP、以及封装、测试和组装服务公司组成,并推出响应的互毗邻口尺度ACC1.0。这一同盟的确立,颇有与由AMD、Arm、英特尔、台积电等主导的UCIe同盟分庭抗礼的意味,也反映出中国相关企事业单元要从底层做起,生长本土Chiplet的愿望。

通过尺度的设立,可以将自己生产的芯片酿成Chiplet企业使用的“尺度产物”,被不停地集成到种种终端应用中,从而为芯片行业开拓出一片新天地。

04

末端

算力的每一次提升,都掀起手艺与产业转变的浪潮:CPU率领人类进入PC时代,移动芯片掀起移动互联网浪潮,而AI芯片打破了AI产业此前长达数十年的算力瓶颈。现在,“人工智能的iPhone时刻”已经来临,走向下一个时代的路,或许早已摆在我们眼前。

正如阿里巴巴团体董事会主席张勇所言,面向AI时代,所有产物都值得用大模子重新升级。已往一年消费电子的低迷使得一些GPU公司的产物找不到应用场景。但随着ChatGPT泛起,相关芯片的应用场景最先增添,并生长成AI基础研究和产业化落地的一大趋势。

AI往前生长,超高算力需求毋庸置疑AI大算力芯片手艺提供了一种可行的解决方案。未来几年,中 美两国将成为大模子的主要降生地,并不计成内陆动员对算力芯片的需求。不管是弯道超车照样换道行驶,在这场AI的征途中,中国算力企业万象竞逐的画卷才刚刚睁开。

新华期货,为每一笔交易提供可靠保障!