新物网

当前位置:首页 > 科技

科技

华为加码算力布局,华为自研AI芯片对标英伟达A100

时间:2023-09-24 10:21:02 yiwu
华为在算力领域的深入布局,正成为外界关注的焦点。“华为提出全面智能化(All Intelligence)战略,目标是‘加速千行万业的智能化转型’。”在华为全联接大会

华为在算力领域的深入布局,正成为外界关注的焦点。

华为提出全面智能化(All Intelligence)战略,目标是‘加速千行万业的智能化转型’。”在华为全联接大会上,华为轮值董事长孟晚舟发表最新演讲时指出,华为致力于打造中国坚实的算力底座,为世界构建第二选择。

大会上,华为还推出全新架构的昇腾AI计算集群——Atlas 900 SuperCluster,可支持超万亿参数的大模型训练。

伴随着人工智能技术的快速发展,算力成为创新的关键因素。根据IDC数据,中国智能算力市场规模将由2019年的31.7EFLOPS(即每秒3170亿亿次浮点运算次数)增长至2026年的1271.4EFLOPS(每秒12.714万亿亿次浮点运算次数),2019-2026年复合年均增长率约为69.4%。

芯片是算力的基础,此前在美国管制下,除了众所周知的手机麒麟芯片,AI昇腾芯片也受到重挫。伴随着麒麟的回归,昇腾芯片也或迎来秘密更新。

任正非、孟晚舟齐发声,华为加码算力市场

短时间内,任正非、孟晚舟这两大华为公司高层接连发声,可见华为对于算力的重视程度。

华为创始人任正非与ICPC(国际大学生程序设计竞赛)基金会及教练和金牌获得者的学生的谈话中,任正非强调,我们即将进入第四次工业革命,基础就是大算力,今天的年青人,明天有可能就是第四次工业革命的领袖。

华为全联接大会上,孟晚舟首次提出华为全面智能化的战略,目标“加速千行万业的智能化转型”。

在孟晚舟看来,人工智能的发展,算力是核心驱动力。大模型需要大算力,算力大小决定着AI迭代与创新的速度,也影响着经济发展的速度。算力的稀缺和昂贵,已经成为制约AI发展的核心因素。

她强调,华为将改变传统的服务器堆叠模式,以系统架构创新的思路,着力打造AI集群,实现算力、运力、存力的一体化设计,突破算力瓶颈。

华为支持大模型在智能化时代的‘百花齐放’,努力做好‘百花园’的黑土地。我们支持每个组织使用自己的数据训练出自己的大模型,让每个行业用自己的专业知识发展出自己的行业大模型。”

此外,华为ICT基础设施业务管理委员会主任、企业BG总裁汪涛也在本次大会上发布了全新架构的昇腾AI计算集群Atlas 900 SuperCluster。据了解,该AI集群支持超万亿参数的大模型训练,采用全新的智算交换机以及超节点架构。

“我们的产品如果不够先进,就不会拿出来卖。卖不了高价,我也养不活队伍。”在今天所曝光的任正非访谈中,任正非提到目前华为AI集群能力已经不弱于美国。“华为现在的AI集群已支持16000板卡,将来的一个超节点集群可管理几十万板卡。支持超高速互联、超高效的液冷散热、瞬时爆发式供电,达到系统高可用。”

整体来看,华为在打造算力基础设施上依旧强调自主可控,涵盖从硬件、架构、框架、应用、开发运维工具等全产业链条。

在处理器方面,华为推出了面向通用计算的鲲鹏系列,面向AI计算的昇腾系列。在架构方面,华为推出了自研达芬奇架构。在软件上,华为推出了openEuler开源OS以及配套的数据库、中间件。

华为自研AI芯片对标英伟达A100

大模型技术发展如火如荼,AI算力受到格外的关注。最新进展显示,伴随着麒麟芯片的回归,华为在自研AI芯片也迎来重大突破,尚未公开的昇腾910B算力或可对标英伟达A100。

目前,不论是海外厂商OpenAI谷歌,还是国内厂商百度、腾讯、阿里巴巴等,所有的大模型厂商都极度依赖英伟达AI芯片进行训练。OpenAI联合创始人曾感慨到“谁将获得多少英伟达H100,何时获得H100,都是硅谷中最热门的话题。”

据了解,目前英伟达AI芯片主要包括A100、H100(性能比A100提高了4.5倍),A800和H800则是数据传输速度相对较慢的中国特供版。有报道显示,中国的互联网巨头百度、阿里巴巴以及字节跳动等公司今年向英伟达下达的交付订单金额达到10亿美元,总共采购约10万张H800芯片,明年交付的AI芯片价值更是达到40亿美元。

所以,如何突破英伟达的AI芯片统治、提高自主可控能力成为国内厂商关注的焦点。随着麒麟芯片的回归,华为自研昇腾AI芯片也或已迎来秘密更新。

前不久,科大讯飞最新推出的星火一体机,搭载的是华为鲲鹏CPU+昇腾GPU,在单卡算力上对标英伟达A100,支持从百亿到千亿等不同规模的大模型训练。据媒体报道,星火一体机搭载了华为昇腾910B ,这款芯片华为尚未对外公布,但在性能上应该比4年前发布的昇腾910有较大提升。

天风研究研报指出,在昇腾910算力已达到英伟达V100两倍的情况下,其迭代产品昇腾910B算力预计对标英伟达A100。

一份网上流出的专家调研报告显示,华为近期发布的910B芯片,与上一代的区别是FP32的性能提升。910B将八个NPU模组互联互通,同时每个NPU模组提供了56GB的HCCS的双向带宽。

在2023年亚布力中国企业家论坛第十九届夏季高峰会上,科大讯飞创始人、董事长刘庆峰透露称,华为的GPU能力可以对标英伟达A100。

“中国在人工智能领域的算法没有问题,但算力似乎始终被英伟达按住。英伟达的A100是目前世界上最强的GPU,可以支持最复杂的人工智能模型。华为对此高度重视,任正非派三个联席主席到科大讯飞做专班工作,现在已经做到对标英伟达的A100。”

不过,也有业内人士指出华为算力做到对标英伟达不算难事,但难的是生态建设。据了解,英伟达有较为成熟的CUDA生态,使得利用GPU来训练神经网络等高算力模型的难度大大降低,所以开发者对之依赖非常的深。“虽然AMD算力和显存都做得不错,但是没人用,就是因为生态做得不好。”

有相关AI开发者指出,如果模型适配昇腾生态,需要把模型转到华为AI计算框架Mindspore昇思,需要耗费大量的时间和人力成本,虽然昇腾可以适配其他AI框架,但使用体验不太好。