新物网

当前位置:首页 > 科技

科技

下一代AI半导体竞争激烈,新兴公司追赶NVIDIA

时间:2024-01-08 15:27:59
加拿大和美国的新兴企业开发出适合生成式AI的半导体,向GPU领域约占80%份额的美国英伟达发起挑战。凯勒先后任职于苹果、特斯拉和AMD等美国企业,在各家企业参与了主力半导体的设计。该公司正力争开发除了节电性能之外、在价格方面也足以对抗英伟达的新一代AI半导体。

下一代AI半导体竞争激烈,新兴公司追赶NVIDIA

吉姆·凯勒(左)与小池淳一握手(11 月,美国圣何塞)

“一家公司不可能继续垄断市场”,美国d-CEO谈到GPU时表示。 从该公司的AI半导体“”来看,同等成本下的计算量是英伟达主GPU的13倍以上,速度是的9倍以上。 加拿大还致力于提高GPU的省电性能等……

在半导体领域,探索图形处理单元(GPU)替代技术的趋势日益明显,GPU是生成式AI(人工智能)计算的基础。 这是因为GPU最初是为游戏而开发的,存在功耗高的问题。 加拿大和美国的新兴公司开发出了适合生成式AI的半导体,挑战了占据GPU领域约80%份额的美国。

“我希望成为第一个顾客。” 力争在日本代工尖端半导体的日本总统小池纯良在11月宣布,作为开发客户的第一步,将与设计和开发AI半导体的加拿大合作。 在美国圣何塞举行的联合新闻发布会上进行眼神交流的人是首席执行官(CEO)吉姆·凯勒(Jim )。

凯勒曾就职于苹果、特斯拉AMD等美国公司,并参与了各公司主要半导体的设计。 被誉为硅谷“传奇半导体工程师”。 小池百合子强调,“被他选中在业界具有重大意义”。

它计划深化与无晶圆厂公司的关系,将于2025年投产的北海道千岁市工厂将承接后者设计开发的AI半导体的生产。 我们希望重现英伟达和最大的半导体代工公司台积电(TSMC)过去通过分工制度所取得的飞跃。

GPU有“弱点”

欣赏凯勒的技术人员逐渐从大公司转到这家成立于2016年的公司。目前,该公司有350名员工,负责开发专门针对AI的半导体。 2023年,成功从韩国三星电子和现代汽车集团旗下的投资基金筹集1亿美元资金。

对于的优势GPU,凯勒断言它“不是为AI设计的”。 尽管的GPU擅长并行处理大量数据,但它最初是为处理游戏中的超高清图像而开发的,当它嵌入到作为生成式AI基础的数据中心的服务器中时,存在许多弱点。

最大的问题是电力效率低下。 由于负责计算的运算单元和存储信息的内存在芯片上是分开的,GPU消耗大量电量的是数据交换而不是计算本身。 据估计,使用数万个 GPU 的生成式 AI 的电费等日常运营成本达到 1 亿日元(日元)。

正在开发的人工智能半导体通过将计算单元和内存更紧密地结合在一起,缩短了数据的移动距离并减少了电力浪费。 凯勒比喻道,“在人工智能中,就像操作员互相交谈一样,很自然地将计算结果直接传递到下一步计算。”

对于决定半导体运行的“指令集”采用英国ARM技术,并采用任何人都可以免费使用和修改的开源“RISC-V”。 目的是控制许可费用支出,也便于根据客户需求灵活改变半导体设计。

凯勒表示,“对于想要开发价值数百万日元机器人的公司来说,数百万日元的 GPU 太贵了。” 该公司正在努力开发新一代人工智能半导体,除了省电性能之外,在价格上也能与英伟达竞争。

通过内存进行操作

生成式AI目前正处于开发阶段,开发公司将大部分计算资源用在“学习”上,以提高准确性。 未来,随着各种业务进入全面普及期,AI输出问题答案等“推理”操作所消耗的电量比例可能会增加。 也有初创公司专注于推理这一领域,致力于改善 GPU 问题。

由美国英特尔首席执行官Sid Sheth等人于2019年成立的d-就是其中之一。 该公司的目标是利用一种“内存计算”技术,让内存具有计算功能,从而大幅降低数据中心服务器在推理操作时消耗的电量。

从该公司将于2024年开始供货的AI半导体“”来看,同等成本下的计算量是英伟达主GPU的13倍以上,计算速度是的9倍以上。 d- 的 Sid Sheth 预测“对于某些目的来说,GPU 性能太高了”。 他预测,“一家公司不可能继续垄断市场”。

在d-涉足的内存计算领域,2017年成立、美国CEO Sam 亲自投资的美国Rain AI也算很有竞争力。 美国媒体报道称,Rain AI可能负责向中国供应半导体。

由于生成式人工智能热潮,GPU 的需求非常紧张,价格也居高不下。 英伟达2023年8月至10月的营业利润率达到57%,这在半导体相关领域是罕见的。 分析认为,该公司基于市场力量在价格上附加了较大的利润空间,这是生成式AI开发成本上升的主要原因。

一直依赖 GPU 的生成式 AI 开发公司也越来越关注替代技术。 2023年,美国微软旗下风险投资公司联合新加坡主权财富基金等向d-投资1.1亿美元。 Sid Sheth表示,除了微软之外,美国的Meta也启动了初步产品评估,并打算用在自己的生成式AI中。

继2016年谷歌在美国领先其他公司发布自研AI半导体后,微软最近也自主设计了最适合AI运算的半导体。 美国亚马逊也在11月推出了一款专门用于AI学习的新型半导体。

被追赶的英伟达将努力巩固领先地位。 2023年冬天,公司CEO黄仁勋参加了美国亚马逊网络服务(AWS)等云科技公司的技术活动,并向聚集的技术人员推介了将于2024年投入使用的新型GPU 。

美国一家研究公司预测,到2027年,AI半导体市场规模将扩大到1194亿美元,达到2022年的2.7倍。依靠现有技术占主导地位的英伟达与试图颠覆的新势力之间的攻防战公司大本营通过技术创新将愈演愈烈。

本文来自微信公众号,作者:山田亮太郎,36氪经授权发布。