撰文|小不董
编辑|李信马
头图|英伟达官网
2023年人工智能领域风起云涌,英伟达是最先吃到这一波红利的行业巨头,股价在一年之内飙升260%。
3月18日,英伟达在美国圣何塞召开一年一度的GTC大会,英伟达创始人兼CEO黄仁勋也在大会上做了一场长达123分钟的开幕演讲。
史上“最成功”产品面世,Blackwell强到可怕
在两个多小时的演讲中,最大的爆点应该是Blackwell,这一GPU平台是黄仁勋口中英伟达史上最成功的产品。
据介绍,新架构取名Blackwell是为了致敬美国科学院首位黑人院士、杰出统计学家兼数学家David Blackwell。
图片来源:百度
黄仁勋谈到,快速演进的AI模型带动训练算力需求暴涨,需要更强大的GPU,“在每一个行业,加速计算都比通用计算有了巨大的提升”。
当黄仁勋双手分别持Blackwell和Hopper%20GPU展示时,能够看到前者明显大了一圈。8年时间,从Pascal架构到Blackwell架构,英伟达将AI计算性能提升了1000倍!
图片来源:网络
Blackwell GPU 架构具有六项用于加速计算的变革性技术:
史上最强大的芯片——Blackwell 架构 GPU 包含 2080 亿个晶体管,然后通过高达10TB/秒的芯片到芯片链路连接成为一个GPU芯片;
全新的Blackwell架构还配备第二代Transformer引擎,支持双倍的计算和模型大小;
第五代 NVLink——为每个 GPU 提供了突破性的 1.8TB/s 双向吞吐量,确保多达576个GPU之间为最复杂的LLM提供无缝高速通信;
RAS 引擎——Blackwell 支持的 GPU 包含一个专用引擎,可实现可靠性、可用性和可维护性;
安全人工智能——先进的机密计算功能可在不影响性能的情况下保护人工智能模型和客户数据,并支持新的本机接口加密协议,这对于医疗保健和金融服务等隐私敏感行业至关重要;
解压缩引擎——专用解压缩引擎支持最新格式,加速数据库查询,以提供数据分析和数据科学的最高性能。
目前,亚马逊、戴尔、谷歌、Meta、微软、OpenAI、甲骨文、特斯拉、 xAI都已经计划使用Blackwell GPU。特斯拉和xAI共同的CEO马斯克直言:“目前在AI领域,没有比英伟达硬件更好的。”
不过传说中的B100并没有出现,英伟达转而发布了由一个Grace CPU、和两组Blackwell GPU组合而成的超级芯片GB200。通过NV-HBI(Nvidia高带宽接口)连接,带宽为10TB/s,确保每个芯片独立运行。
所以,B200实际上拥有2080亿个晶体管,可以提供高达20petaflops的FP4计算能力,两颗GPU结合一颗GraceCPU可以将LLM(大型语言模型)推理工作的性能提升30倍。
在1750亿个参数的GPT-3LLM测试中,GB200的性能比H100快7倍,学习速度比H100快4倍;与H100相比,成本和能耗降低了25倍。
此外,英伟达还发布了由36组Grace CPU和72组Blackwell GPU组合而成的服务器GB200 NVL72。可实现推理算力达到1440 PFLOPS,传输量最大达到每秒260TB,另外,FP8精度的训练算力就高达720PFlops,几乎相当于一个超级计算机集群。
图片来源:网络
机器人领域的通用大模型
英伟达还推出了一款人形机器人通用基础模型Project GR00T,以及基于Thor SoC的新型人形机器人计算机Jetson Thor。
图片来源:英伟达官网
GR00T驱动的人形机器人能理解自然语言,并通过观察人类行为来模仿快速学习协调、灵活性和其它技能,以适应现实世界并与之互动。
Jetson Thor具有针对性能、功耗和尺寸优化的模块化架构。该SoC包括一个带有Transformer引擎的下一代Blackwell GPU,以运行GR00T等多模态生成式AI模型。
英伟达方面称,目前正在为1X Technologies、波士顿动力、Figure AI、宇树科技和小鹏鹏行等人形机器人公司构建AI平台。
更多的最新进展
英伟达在大会中还更新了一系列新进展。
例如,Omniverse平台挺进苹果Vision Pro,发布云API;医疗领域上推出了25个全新的微服务(NIM),这些服务专为医疗行业定制,旨在助力全球的医疗保健企业运用生成式AI技术,提升业务效率,目前,全球已有近50家应用程序供应商正在采纳英伟达的医疗微服务。
以及发布了全新的“DRIVE Thor”车载计算平台,将提供功能更丰富的自动驾驶舱性能——集成了专为Transformer、LLM和生成式AI 工作负载而设计的全新 NVIDIA Blackwell 架构。
目前有多个厂商公布了这一平台的新进展,例如比亚迪和英伟达的合作范围从汽车扩展到云,广汽、小鹏汽车在内等厂商也表明了将使用“DRIVE Thor”车载计算平台。
英伟达还公布了全新的“6G研究云平台”,此平台旨在帮助通信企业实现对物理地形和人造建筑的高精度模拟。通过这一平台的运用,通信公司能够显著提升无线传输的可靠性,诺基亚和三星已成为这一领域的合作伙伴。
而最新推出的“Earth-2 气候数字孪生云平台”,用来模拟和可视化天气。据介绍,Earth-2可以帮助用户在几秒钟内提供警告和更新的预报,以往传统的CPU驱动建模,则需要几分钟或几小时。用此平台生成的图像,分辨率比当前数值模型高12.5倍,速度快1000倍,能源效率提高3000倍。
英伟达还将为日本全新的ABCI-Q超级计算机提供加速和量子计算平台的支持。这台超级计算机由超过500个节点中的2000多个英伟达H100 GPU共同驱动。值得一提的是,ABCI-Q是全球唯一完全可卸载的网络内计算平台,预计将于明年初部署。
截至目前,英伟达市值已经突破2.2万亿美元。人工智能的发展不会停止,显然,英伟达的传奇还将继续。
图片来源:百度股市通