新物网

当前位置:首页 > 科技

科技

2024年,AI芯片三大关键战役

时间:2024-01-16 13:35:11
2024年注定是AI芯片厂商们捉对厮杀的一年。2024,AI芯片市场的格局将迎来什么变化?真正决定2024年市场格局的,是英伟达的供应链优势。台积电封装对芯片性能的影响无须多言,HBM同样关键。格局之战:2024,谁是最关键的变量?车端可能是2024年最扑朔迷离的AI芯片战场。

2024年,AI芯片三大关键战役

2024年注定是AI芯片厂商群雄逐鹿的一年。

过去一年,AI赛道一直沸沸扬扬。 以为代表的GPU厂商掌握着算力的核心。 背靠AI企业扩大云计算规模、训练大型模型的需求,做出了AI时代的第一笔投资。 分红,可以赚很多钱。

时间来到2024年,AI将从云端向终端蔓延,许多“AI+产品”概念下的新物种将逐渐到达消费层面的临界点。 为了抢占这些增长点,各细分领域的AI芯片领军企业纷纷展开跨界合作,推出新产品、寻找新合作伙伴。

就连相对确定性的云算力市场,也有一股“暴风雨即将来临”的气息。 谷歌微软、亚马逊相继宣布推出或计划推出自研AI芯片。 AMD的新产品在性能方面与 H100紧密相连。 英特尔首席执行官基辛格透露:“整个行业都在被推动缩减CUDA(推出的计算平台)。 ) 市场。”

2024年,AI芯片市场格局将迎来哪些变化? 而这些财富财富又会流向谁的家族呢?

01 云端之战:如何反围剿?

从云需求和企业行动来看,2024年下一代大型模型的研发仍将是各大科技公司竞争的核心,多模态模型占比逐步提升的趋势,带动了更大的算力需求。

C端AI应用数量的增加也为云市场的增长注入了稳定性。 过去,模型预训练是GPU消耗最大的部分,约占80%。 但随着越来越多的消费者开始调用模型进行推理,未来用于推理和训练的算力比例将发生逆转。 稍后报道,不少大型模型从业者预计,如果千亿参数甚至更大的人工智能模型得到广泛应用,大型模型的训练成本和推理成本将达到2:8,甚至1:9。

对于人工智能企业家和科技巨头来说,消息好坏参半。

2023年,所有涌入AI的挖掘者对上游芯片供应商的情绪都会复杂。 AI产品的发展离不开AI芯片这个计算心脏,但高昂的价格和产能的短缺也让它们时刻被焦虑包围。

除了担心拿到芯片的同行会在市场上抢先铺开业务外,他们还担心卖方市场持续下去,难逃向上游“纳税”的命运。 。

但令人意外的是,这些赚大钱的卖水人也心神不宁。 “我们不需要假装公司总是处于危险之中。我们总是处于危险之中,”GPU 领导者 的创始人黄仁勋在去年 11 月的一次演讲中说道。

黄仁勋在AI风暴眼中已经一年了。 这句话大概就是他的真实感受。

压力首先来自同行竞争。

作为市场上唯一一家希望在GPU领域挑战的公司,每次AMD发布新芯片时,都会将与进行比较。 甚至去年12月的多轮比赛中也能看到火花四溅。

AMD于12月6日推出它时,声称其性能比的AH100更好。 随后发布了自己的基准测试作为回应,表明 AH100 在正确的设置下仍然更好。 AMD 再次做出回应,发布了新的基准测试,在正确的设置下再次展现出强劲的性能。

另外,虽然Intel在GPU领域取得的成果不多,但并没有放弃这块香甜的蛋糕。 英特尔声称将于2024年推出的Gaudi 3性能超过的AI芯片H100。

除了同行之外,的客户也并不忠诚。 谷歌、亚马逊、特斯拉、阿里巴巴、百度、微软……几乎所有主要客户都宣布将开发自己的AI芯片。

这些客户也对英伟达的生态护城河发起了攻击。 “整个行业都在被推动缩小 CUDA 的市场”,英特尔 CEO 基辛格最近公开表示,MLIR、谷歌等公司正在转向“基于语言的编程层”,以使 AI 训练更加开放。

自研芯片和生态建设并不容易,为何会成为行业共识? 英伟达的“镰刀”太锋利了。

财新的一篇报道显示,即使花费与英伟达相同的成本,也能取得十分之一的成果,而且这些技术厂商已经实现盈利。 更具体的案例是,根据谷歌的报价,使用其最新的AI芯片来训练和推理参数小于2000亿的大型模型的成本比使用A100或H100要低。

抢客户的行为也是云厂商无法接受的。 去年3月,GPU最紧缺的时候,英伟达推出了云计算服务。 简单来说,就是把卖给云厂商的GPU租回来,进一步优化,然后租给需要GPU算力的客户。 一个又一个,云厂商承担了建设数据中心的成本,但客户却转向了。

对于英伟达来说,最大的变数可能还是在中国。 近日外媒报道显示,由于出口到中国的芯片业绩屡遭打压,中国厂商正在对其失去兴趣,这意味着其可能会损失近五分之一的收入。

当然,作为硅谷最具战斗力、最顽固的公司之一,坐以待毙从来都不是英伟达的风格。 在过去的一年里, 的护城河实际上已经扩大,成为最大的 GPU 销售商,市场份额接近 95%。

的核心竞争力主要由三个板块组成——供应链优势、软硬件生态、投资。

从软硬件生态来看,预计2024年出货的AI芯片H200和生态配件仍然是最适合市面上大型机型成长的“土壤”。 投资方面,在2023年已完成超过20项投资,投资版图涵盖各个AI相关行业。 即使不一定能从中获得稳定的利润,但过程中的积累也会逐渐成为其他初创企业选择的理由。

真正决定2024年市场格局的是英伟达的供应链优势。

AI芯片产业链漫长且复杂,每个细分领域都有自己的龙头公司。 只有将它们集成起来,才能生产出性能最好的芯片。

英伟达赢得他们的方法是承诺不可取消的订单。 目前,英伟达拥有111.5亿美元的采购承诺、产能义务和库存义务,并另外签署了价值38.1亿美元的预付费供应协议。 这些承诺订单包括台积电近60%的产能以及SK海力士、三星和美光HBM的大部分供货。

台积电封装对芯片性能的影响自不必说,HBM同样至关重要。 HBM是高带宽内存芯片,GPU只有内存足够大、数据传输速度足够快才能保证运行效率。

仅从这一点来看,没有其他厂商可以匹敌,因此他们将无法参与正在发生的狂热的人工智能浪潮,即使是谷歌这样的科技巨头。

综上所述,2024年的云战争更加确定。 虽然英伟达遭遇围攻,但无论是自研芯片还是生态建设都需要时间慢慢发酵。 至少在供应链紧张问题得到解决之前,的主导地位不会动摇。

02 场景之战:AI PC、AI Car、AI Phone成热门板块

淘金热背后的AI芯片厂商已经摩拳擦掌,准备发财。 从行业来看,AI PC、AI Phone、AI Car是最受关注的三个领域。

AI手机:亟需AI驱动新增长

过去几年,手机增长乏力。 即便厂商将硬件“碾压”到了极致,仍然难以掩盖缺乏创新的残酷真相。 除了华为Mate 60的出现给市场带来了一些新鲜血液之外,就连苹果的发布会也无法讲出新的故事来说服消费者换机。

人工智能是其增长的唯一驱动力。 “电脑上的AI”的传说自从向消费者端开放以来,就一直在市场上流传,并被人们津津乐道了整整一年。 但在大型模型向小型化发展之前,硬件与模型规模之间的矛盾几乎是不可调和的。

事实上,在手机端,在保证机型性能的同时,仍然很难避免手机发热、内存占用过多对消费者购买欲望的影响。

年初,手机芯片两大巨头之一的高通展示了在上运行的效果,并于近期宣布将推理时间缩短至1秒以内。 不过,另一家霸主联发科的工程师表示,本地运行13B大小的小机型意味着需要13GB左右的内存,加上自带的4G,在不下载任何其他软件的情况下,已经超过了大多数手机的16GB内存容量。应用。

即便如此,市场仍然投票支持人工智能手机领域的增长。 他们的理由是,手机是人们每天使用最频繁的电子产品。 基于入口优势,虽然本地部署还存在一定难度,但AI运行在云端带来的增量不容忽视。 分析师预测,全球智能手机出货量将在2024年恢复增长,增幅约为4%。

AI PC:硬件和框架之争

相比之下,AI PC的进展要顺利得多。 原因也很简单。 与手机相比,PC体积更大,芯片性能提升空间更广。 IDC预测,2024年将是AI PC快速发展的元年。 2024年,人工智能PC将占整个PC市场的55%,2027年将占85%。

目前,PC端的AI芯片厂商已经释放出浓烈的火药味,它们之间的混战即将爆发。

NPU与GPU的较量是混战的第一点。

GPU就不用说了,关键是NPU为什么能站上舞台。 与算力中心背靠数千台集成了CPU、GPU等各种芯片的服务器不同,PC的算力主要集中在一块“总芯片”上,分为CPU、GPU、NPU等。”芯片”组成,每个芯片都有不同的分工。 其中,NPU是专门为处理AI相关计算任务而设计的。

因此,矛盾就产生了。 虽然GPU被定义为图形处理器,但其浮点和并行计算特性也使其成为运行AI运算的最佳载体之一,这一点已经在云端得到了证明。 一旦AI PC实现,大量的AI计算任务必然带动GPU销量。 在本次CES展会开幕之前,英伟达发布了三款消费级GPU,这显然是在向市场发出一个信号。

X86架构与ARM架构的较量是混战的第二点。

X86和ARM是两种架构的芯片。 X86架构是Intel的代名词。 在PC芯片方面,与英特尔直接竞争的是采用ARM架构的手机芯片龙头高通和联发科。

X86和ARM的区别可以简单概括为前者性能高、功耗大,后者性能低、功耗低。 过去,ARM普遍应用于手机领域,但近年来,随着ARM芯片性能的不断提升,低功耗的优势正在吸引业内人士的关注。 微软、苹果、Meta 和其他制造商正在支持基于 ARM 的 PC。 据界面新闻报道,英伟达AMD 正在考虑在 2024 年为移动 PC 提供基于 ARM 的解决方案。

高通对AI PC觊觎已久。 与同级别的X86相比,骁龙三分之一。

AI汽车:两大阵营争夺地盘

虽然AI PC的战场已经硝烟弥漫,但如果与AI Car相比,甚至可以称得上是和谐世界。 其背后的原因也很容易理解。 PC和手机正在现有市场中寻求增长,而车载AI则是真正的蓝海。

“AI in the car”也有两个竞争点,分别是智能座舱和自动驾驶。

在智能座舱领域,高通率先采用SoC逻辑来设计汽车MCU芯片,这让其拥有了先发优势,因此起到了城市保卫者的作用。 目前面临着、联发科、英特尔等公司的多重围攻。

去年6月,联发科宣布将与合作,为下一代软件定义汽车提供整套车载人工智能座舱解决方案,覆盖从豪华到主流的所有汽车细分市场。

两强合作的模式是,联发科将开发集成 GPU的汽车SoC。 目前是高端车型所使用的自动驾驶系统的主要供应商,拥有广泛的客户资源。 在本次CES展会上,公布了其DRIVE系列汽车业务的最新进展。 力理想、长城、极氪、小米等公司均采用DRIVE Orin平台支持其智能自动驾驶系统。

英特尔还在CES上宣布了进军汽车行业的重要战略,推出专为下一代汽车设计的AI增强型软件定义汽车系统芯片(SoC)。 其自动驾驶解决方案公司始终处于全球领先地位。

在自动驾驶领域,存在着两强争霸的格局。 和​​n分别涵盖高端和低端型号。 按照涵盖的价格范围广度排名,​​n 排名第一, 排名第二。

与 CUDA类似,​​n也有自己的生态护城河。 同时,地平线作为本土供应商,在交付效率上更具优势。

03格局大战:2024年,谁是最关键的变量?

各家芯片厂商在AI PC、AI Phone、AI Car等领域风起云涌。 在这个堪比“春秋战国”的竞争新时代,尽管仍然遥遥领先,但一些关键问题也随之出现:2024年谁能获胜? 杀出重围? 之外最关键的变量是谁?

毫无疑问,这将是一场格局之战。 我们可以从线索中对2024年谁将冲出重围做出一些预测。

虽然最受欢迎的三个场景发生了变化,但增量的绝对值不同。 综合考虑硬件性能、用户需求、市场规模等因素,“硅研实验室”判断AI Car将是增幅最大的领域,其次是AI Phone,最后是AI PC。

汽车端可能是2024年最混乱的AI芯片战场。

市场上玩家布局的路线可以概括为两条主线。 一是从自动驾驶开始,扩展到智能座舱,比如英伟达和(通过英特尔)。 另一种是从智能座舱开始,扩展到自动驾驶,比如高通。

在智能座舱领域,目前市场上新能源汽车企业的竞争与其说是芯片性能之争,不如说是对汽车使用场景理解之争。 在自动驾驶领域,由于与安全密切相关,因此必须保证硬件运行的稳定性,需要市场的验证。 领先者的壁垒更高。

从这个角度来看,英伟达将首先受益,而地平线等二线厂商有望凭借低成本、高成熟度的产品成为车企的替代品。

但如果换个角度看交付稳定性和市场拓展,地平线、华为等国内厂商的潜力更大。

一方面,地缘政治背景下,AI芯片对华出口能否持续稳定存在问号。 性能和生态固然是一个门槛,但正在解决。

另一方面,虽然​​n目前主要部署在低端车型上,但企业在自动驾驶领域的发展高度依赖于数据积累。 未来以更快的速度超越先进厂商也不是不可能。

在手机领域,AI芯片厂商享受红利的前提是大机型的本土部署。

众所周知,运行大型模型有两种模式,一种是云端接入,一种是终端部署。 前者依赖于用户需求反馈到云端,然后计算后将结果发送回手机。 后面整个过程依赖于本地硬件。

从它们能够实现的功能来看,两者是相似的。 唯一对消费者购买手机意愿影响较大的因素是“是否愿意将本地数据(包括照片、文件、通话记录)上传到云端”。 从这一点出发,确实存在本地部署的需求,手机AI芯片的增长值得期待。

那么高通和联发科谁将占据主导地位?

从市场地位来看,高通和联发科分别占据高端和中低端手机市场。 向上突破比向下兼容要困难得多。 而且目前推出AI手机的厂商都将价格定位在高端。

高端市场定位为高通带来了更为丰厚的毛利率。 对比财报,高通第三季度的毛利率约为55.1%,联发科的毛利率水平为47.4%,这意味着高通有更多的“剩余资金”来推动研发。在滚雪球效应下,恐怕联发科想要追上高通还有一段路要走。

值得一提的是,苹果和华为的AI芯片计划也会对市场格局产生影响,但影响较小。

近年来,苹果手机芯片的性能提升并不优于高通、联发科等竞争对手。 前不久亮相的两大安卓芯片高通8 Gen3和联发科天玑9300,在CPU多核性能、CPU多核能效比等核心技术指标上已经领先于同期的苹果A17 Pro 、GPU峰值性能、GPU能效比。 。

对于华为来说,受地缘政治因素影响,目前在芯片性能方面难以与世界一流芯片厂商竞争。

PC端,虽然AI PC近期颇为火爆,但要真正带动C端市场的销量,还需要一段时间。

从C端场景开始,AI应用大致可以分为办公和娱乐两类。

在办公场景中,微软、金山、Adobe等软件虽然都集成了AI功能,但其推理任务仍然主要由云端承担,并且已经形成按使用付费的商业模式,不需要本地硬件具有高性能。 表现。

在娱乐场景中,在AI兴起之前,为了支撑游戏的流畅运行,对以GPU为代表的图形处理能力有着很高的要求。 基于可“塞”进PC的模型规模,过去用于渲染游戏画面的GPU拥有足够的计算能力来支持AI衍生应用的运行。

仍以 为例,虽然在本次 CES 揭幕前发布了三款新的消费级 GPU,但这三款 GPU 的性能并没有超越 2022 年发布的 RTX 4090。

综上所述,2024年,在云计算等传统领域,英伟达将受益于供应链优势等护城河,其最有价值卖水者的地位短期内不会改变。

在AI PC、AI Phone、AI Car三大场景中,分别拥有技术和渠道优势的英伟达和地平线将率先收获AI Car的红利,而高通则有望在AI​​急需新故事来推动增长的手机品类。 冲出重围,对于AI PC来说,在新场景、新工作范式出现并带动更强劲的硬件需求之前,相关企业的市场份额和销量还有待观察。

2024年是AI芯片厂商迎来巨大财富的一年,但同时我们也能感受到水下正在酝酿着剧变。 公司和投资者当然可以跳入这片蓝海,但最好保持警惕。

参考:

大模范公司“滚”芯片,英伟达危险了? | 虚拟宇宙太阳爆炸

2024年,人工智能芯片展望| 半导体行业观察

英特尔推出最新AI处理器挑战英伟达:训练主导地位不会持久 | 报纸

H200突然发布:容量翻倍、带宽猛增 | 半导体行业观察

芯片,最新路线图| 半导体行业观察

作为自动驾驶芯片领域的独角兽,地平线不再抗拒低端滤波器 | 零状态LT

当苹果芯片跌落神坛时智能物联网

一夜暴增5600亿!美国发布最强消费级显卡,AI性能提升超170%|直奔CES 2024|林志佳

本文来自微信公众号“硅基研究实验室”(ID:),作者:硅基研究实验室,36氪授权发布。