GPU市场的转折
2022-08-16 

我们正在眼见GPU市场的主要转折。八月初,GPU龙头企业Nvidia宣布二季度财报预警,其中提到公司的二季度收入比之前的预计大幅下降,其主要缘故原由是由于游戏市场和加密钱币市场在2022年的规模大大下降——相关的收入同比下降33%,环比下降44%。我们以为,这标志着GPU市场正在加速进入转折期,这也会加速GPU响应公司寻找新的增进点。

传统上,GPU最要害的市场是游戏市场,这包罗了PC主机上的GPU,以及游戏主机中的GPU,然而从耐久大趋势上来看,PC主机和游戏主机的市场增进正在趋缓,甚至有下降的势头。从短期来看,2021年新冠疫情导致居家办公等新的事情状态导致了PC和游戏主机相关需求短暂上升,而现在这样的异常态带来的福利已经竣事,对于GPU需求也在大幅下降。此外,加密钱币的繁荣也曾让GPU一卡难求,然则随着加密钱币市场的溃逃,对于GPU市场也造成了一定的影响。凭证Digitimes的报道,GPU在2022年的出货量预计将比2021年下降40-50%(这个数字和Nvidia的*季度预告也相符)。总之,无论是从短期照样从耐久来看,传统的游戏行业都已经很难成为GPU市场的增进点。

未来GPU的市场在那里?

实在从Nvidia的财报中我们也可以看出,数据中央将会是GPU的新增进点。数据中央中的GPU使用主要是用于高性能盘算,包罗人工智能相关的盘算和视频处置等。在Nvidia宣布的*季度预告中,数据中央相关的收入同比增进高达61%,且收入已经高于游戏市场,可见数据中央增进势头之强。

数据中央中使用GPU预计未来还会在未来呈快速上升态势。人工智能将会进入越来越多的应用中,而在数据中央侧人工智能模子的训练和推理,现在*的解决方案就是GPU。我们现在看到人工智能模子的庞大度正在快速上升,训练所需要的数据量也在越来越大,这也意味着单个模子需要的盘算量正在上升,同时连系模子部署和训练数目的上升,两者的乘数效应使得数据中央对于GPU的需求仍然会连续上升。

除了高性能盘算之外,另一个未来可能的新增进点是元宇宙相关的图像渲染义务。随着MR/VR硬件和相关应用的成熟,若作甚用户提供高性能的图像渲染将会是相关用户体验的焦点要素。若是元宇宙的VR/MR真的如预期的一样会成为一个伟大的市场,那么相关的渲染义务也将会成为GPU的一个新增进点。固然其中也存在着很大的不确定性,首先元宇宙和VR/MR是否会如愿增进还不清晰,此外相关的渲染会在云端完成而且通过网络串流的方式来到用户的内陆显示,照样使用内陆的GPU直接做渲染,相关的手艺方案还没有定论。

综上所述,我们以为GPU市场的转折将会是传统游戏相关收入逐渐饱和(甚至在短期内大幅下降),而在人工智能和高性能盘算(即GPGPU)相关的数据中央市场会成为现在和中期内的主要增进点,远期来看元宇宙相关的渲染义务有可能会取代传统游戏相关收入,然则还存在很大的不确定性。

GPU手艺演进蹊径

如前所述,数据中央中的人工智能和高性能盘算正在成为GPU现在最要害的增进点,因此GPU厂商手艺研发现在也主要围绕这个目的。这里我们将会剖析GPU领域两大龙头Nvidia和AMD的相关手艺蹊径图,来剖析一下GPU在未来几年内演进的一些主要手艺蹊径。

首先是专用加速器与通用GPU的融合。在人工智能硬件刚兴起的时刻,使用专用加速器照样使用通用GPU做加速险些是两大阵营——专用加速器效率高然则只能支持几种特定的算法和模子;通用GPU兼容性好,然则效率较差,功耗也较大。然则,随着人工智能硬件的演进,现在我们看到通用GPU和专用加速器正在逐步融合,或者说在GPU上我们在看到越来越多的针对一些特定人工智能模子的专用IP来实现加速。举例来说,夹杂精度盘算和低精度整数运算加速已经成为数据中央GPU的标配。在这个领域,Nvidia更为激进,依附其对于人工智能模子生态的大量结构和龙头职位,Nvidia能够掌握人工智能模子生长的态势(如新模子的盛行水平)而且据此在GPU产物上加入相关支持。在Nvidia下一代的H100 GPU中就加入了对于Transformer系列模子的专用加速模块,而这样的专用加速模块集成在通用GPU中恰恰说明晰通用GPU和专用加速器之间的融合将会是未来的主要手艺演进偏向。

除此之外,决议GPU盘算性能的要害指标是存储接见带宽和延迟。在这个方面,增添DRAM带宽,使用HBM等最新的内存接口已经是GPU的尺度设置,信托未来随着DRAM接口尺度的演进,GPU也会优先使用最新的DRAM接口。而除了DRAM之外,高速缓存(cache)也是要害的存储,缓存容量会大大影响盘算的延迟和功耗。Nvidia和AMD都在起劲地扩大高速缓存的容量,而在这方面AMD使用新手艺的措施则*Nvidia——现在Nvidia在H100增添缓存主要照样思量2D的方式即在同芯片上加大缓存面积,而凭证AMD今年六月份宣布的最新CDNA3 GPU架构,CDNA3会使用*封装手艺,使用单独的缓存芯片粒(chiplet),而且将缓存芯片粒和GPU使用堆叠的方式集成在一起(即Infinity Cache)。这样一来,高速缓存芯片粒的存储容量就有可能大大增添,从而提升性能。

在存储之外,另一个数据中央端GPU手艺演进的主要偏向是若何削减CPU和GPU通讯带来的性能损失。在传统设计中,CPU和GPU处于两个完全差其余系统,其内存空间并不共享,因此CPU和GPU之间的通讯开销很大。为领会决这个问题,Nvidia和AMD都在这方面做了不少投入。Nvidia的解决方案是使用自研的基于ARM架构的Grace CPU,而且在架构设计上给每个GPU单独配一个CPU而且使用NVLINK高速接口毗邻在一起,从而减小CPU和GPU之间的协同事情开销。而AMD由于一直同时有GPU和CPU营业,因此相关的设计在手艺上更为激进,在CDNA3架构中CPU和GPU将会使用*封装的方式集成在一起,共享HBM3高速内存接口和内存空间,从而大大增添CPU和GPU之间的集成度和协作的能力。

综上,我们以为未来服务器端GPU将会是GPU市场最主要的市场增进点,而围绕这个增进点有几个主要的手艺路径将会成为主流,包罗专用加速IP和通用GPU融合,高速DRAM缓和存的进一步演进,以及CPU和GPU的进一步集成。对照Nvidia和AMD的手艺路径,我们可以发现Nvidia的强项在于坐拥人工智能生态护城河,通过极强的软硬件协同设计能力和对于人工智能领域的洞察力,它在专用加速IP和通用GPU融合方面做得极为乐成,因此可以通过最小的成本和功耗价值来实现*化的相关义务性能提升。而AMD的强项在于其*封装领域的积累以及在CPU领域的履历,未来可望使用晶圆级手艺的突破来提升性能。

市场竞争名目

未来市场竞争名目而言,Nvidia和AMD都是从传统的游戏市场切入,在保持传统游戏市场的同时,也正在把精神越来越多地投入云端市场。Nvidia现在拥有服务器市场GPU的*职位,然则从手艺生长角度来看AMD的势头也很不错,其要害在于能否买通软件生态,若是能突破Nvidia CUDA的生态笼罩圈的话AMD可望在服务器市场也拥有主要的一席之地。

在服务器市场另一个值得关注的新势力是中国的GPU初创公司。以燧原,壁仞等为代表的GPU中国新兴势力也把服务器市场作为其主打偏向。从市场动态上来说,实在现在是一个很好的时间点,由于在GPU市场来看,中国GPU较为微弱的游戏渲染等领域正在被服务器市场增进所取代,而在服务器市场相对来说中国公司的手艺肩负并不大,可以轻装上阵。随着未来国际形势的转变(例如逆全球化),可望中国的GPU新势力也能获得GPU市场的主要份额。

新华期货,为每一笔交易提供可靠保障!