英伟达计划于2024年Q2推出面向中国市场的H20特供版AI芯片
时间:2024-01-09 21:00:14 小新新
根据路透社1月9日的消息,英伟达计划于2024年第二季度开始量产中国市场特供版AI芯片,以遵守美国出口管制新规,其中最强的型号将是H20。英伟达对此事拒绝置评。
根据路透社1月9日的消息,英伟达计划于2024年第二季度开始量产中国市场特供版AI芯片,以遵守美国出口管制新规,其中最强的型号将是H20。英伟达对此事拒绝置评。
除了HGX H20之外,英伟达还计划推出另外两款符合美国限制的PCIe芯片——L20和L2,但具体信息尚不详细。
消息人士透露,H20原定于去年11月推出,但由于“服务器制造商在集成该芯片时遇到了问题”而被推迟。其中一位知情人士表示,初期产能十分有限,英伟达需要首先满足主流客户的订单。
根据SemiAnalysis的分析,H20、L20和L2包含了英伟达在AI工作中大部分功能特性,但为了遵守新规,这三款新品在算力方面有所削减。尽管如此,在LLM推理方面,它们仍然比H100快20%以上。
通过查询公开资料获悉,NVIDIA H100 Tensor Core GPU采用全新的Hopper架构,基于台积电N4工艺,集成了800亿个晶体管。与上一代产品相比,它可为多专家(MoE)模型提供高9倍的训练速度。
H100配备第四代Tensor Core和Transformer引擎(FP8精度),还具有高度可扩展的NVLink互连技术,最多可连接达256个H100 GPU。相较于上一代采用HDR Quantum InfiniBand网络,其带宽高出9倍,带宽速度为900GB/s。