当前位置:首页 > 数码资讯 > 正文内容

NVIDIA推出DGX GH200 AI超级计算机

2023-07-28 12:00数码资讯

新型AI超级计算机将256个Grace Hopper超级芯片连接为巨大的、1-Exaflop、144TB GPU,用于支持生成式AI、推荐系统和数据处理的巨型模型

COMPUTEX——2023年5月29日——NVIDIA今天宣布推出一款新型大内存AI超级计算机——由NVIDIA GH200 Grace Hopper超级芯片和NVIDIA NVLink Switch System 驱动的NVIDIA DGX 超级计算机,旨在助力开发面向生成式AI语言应用、推荐系统和数据分析工作负载的巨型、下一代模型。

NVIDIA DGX GH200的超大共享内存空间通过NVLink互连技术以及NVLink Switch System使256个GH200超级芯片相连,使它们能够作为单个GPU运行。其提供1 exaflop的性能和144 TB的共享内存——相较2020年推出的上一代NVIDIA DGX A100内存大了近500倍。

NVIDIA创始人兼首席执行官黄仁勋表示:“生成式AI、大型语言模型和推荐系统是现代经济的数字引擎。DGX GH200 AI超级计算机集成了NVIDIA最先进的加速计算和网络技术来拓展AI的前沿。”

NVIDIA NVLink技术大规模扩展AI

GH200超级芯片使用NVIDIA NVLink-C2C芯片互连,将基于Arm的NVIDIA Grace CPU与NVIDIA H100 Tensor Core GPU整合在一起,从而不再需要传统的CPU至GPU PCIe连接。与最新的PCIe技术相比,这将GPU和CPU之间的带宽提高了7倍,将互连功耗减少了5倍以上,并为DGX GH200超级计算机提供了一个600GB的Hopper架构GPU构建模块。

DGX GH200是第一款将Grace Hopper超级芯片与NVIDIA NVLink Switch System配对使用的超级计算机,这种新的互连方式使DGX GH200系统中的所有GPU作为一个整体协同运行。上一代系统在不影响性能的前提下只能通过NVLink把8个GPU整合成一个GPU。

DGX GH200架构相比上一代将NVLink带宽提升了48倍以上,实现在单个GPU上通过简单编程即可提供大型AI超级计算机的能力。

面向AI先锋的新研究工具

谷歌云、Meta和微软是首批有望接入DGX GH200来探索其用于生成式AI工作负载的能力的公司。NVIDIA还打算将DGX GH200设计作为蓝图提供给云服务提供商和其他超大规模企业,以便他们能够进一步根据他们自己的基础设施进行定制。

谷歌云计算副总裁Mark Lohmeyer表示:“构建先进的生成式模型需要创新的AI基础设施。Grace Hopper超级芯片的全新NVLink和共享内存解决了大规模AI的关键瓶颈,我们期待它在谷歌云以及我们的生成式AI计划中发挥强大的能力。”

Meta基础设施、AI系统及加速平台副总裁Alexis Bj rlin表示:“随着AI模型规模越来越大,它们需要可扩展的强大基础设施,以满足不断增长的需求。NVIDIA的Grace Hopper设计看起来能够让研究人员探索新的方法来解决他们面临的最巨大挑战。”

微软Azure基础设施企业副总裁Girish Bablani表示, “在以往训练大型AI模型是一项资源和时间密集型任务。DGX GH200 所具备的处理TB级数据集的潜力使得开发人员能够在更大的规模和更快的速度下进行高级别的研究。”

全新NVIDIA Helios超级计算机将推进研发

NVIDIA正在打造自己的基于DGX GH200的AI超级计算机,以支持研发团队的工作。

这台名为NVIDIA Helios的超级计算机将配备四个DGX GH200系统。每个都将通过NVIDIA Quantum-2 InfiniBand网络互连,以提高训练大型AI模型的数据吞吐量。Helios将包含1024个Grace Hopper超级芯片,预计将于今年年底上线。

完全集成,专为巨型模型而构建

DGX GH200超级计算机包含NVIDIA软件,可为最大的AI和数据分析工作负载提供一个交钥匙式全栈解决方案。NVIDIA Base Command 软件提供AI工作流程管理、企业级集群管理和多个加速计算、存储和网络基础设施的库,以及为运行AI工作负载而优化的系统软件。

此外还包含NVIDIA AI Enterprise,即NVIDIA AI平台的软件层。它提供100多个框架、预训练模型和开发工具,以简化生成式AI、计算机视觉、语音AI等生产AI的开发和部署。

供货情况

NVIDIA DGX GH200超级计算机预计将于今年年底上市。

观看黄仁勋在COMPUTEX 2023的主题演讲中介绍NVIDIA DGX GH200超级计算机。

扫描二维码推送至手机访问。

版权声明:本文由ZBLOG发布,如需转载请注明出处。

本文链接:http://youzheba.com/s/6528.html

分享给朋友:

相关文章

消息称高通、联发科不太可能在2023年推出3nm移动SoC

1月3日,据业内消息人士称,鉴于安卓手机的高生产成本和销售前景仍不明朗,联发科和高通将不得不更多地考虑是否跟随苹果的脚步,在2023年让台积电使用3nm工艺技术制造它们的移动SoC。台积电将于2023年量产3nm芯片,新制程的良率表现和营收贡献有望与5nm技术相媲美。作为新节点的首个客户,苹果公司将...

摩托罗拉 moto g53 5G 手机今日 10 点开售:120Hz 屏幕 + 5000mAh 电池,899 元起

摩托罗拉 moto g53 5G 手机今日 10 点开售:120Hz 屏幕 + 5000mAh 电池,899 元起

联想摩托罗拉 moto g53 于 1 月 5 日 10 点正式开售。moto g53 于 2022 年 12 月发布,4GB + 128GB 版本售价 899 元,8GB + 128GB 售价 1099 元。(电商平台待上架)  在配置方面,moto g53 提供天青白、玄武黑两款配色,搭载高通骁...

落实新战略,布局元宇宙,江苏联通引入IPv6+新技术构建沉浸式无界XR新体验

落实新战略,布局元宇宙,江苏联通引入IPv6+新技术构建沉浸式无界XR新体验

近日,江苏联通联合华为申报的《IPv6+新技术使能云网边端协同沉浸式无界XR智慧视频新服务》参赛项目,荣获全国首届IPv6技术应用创新大赛山东赛区决赛二等奖,并成功晋级在上海举办的全国总决赛。在国家工信部、国家互联网信息办公室、教育部指导下,由中国信息通信研究院联合地方政府主办的全国首届IPv6 技...

AMD发超强AI芯片锐龙7040:比苹果快30%、比英特尔快45%

AMD发超强AI芯片锐龙7040:比苹果快30%、比英特尔快45%

北京时间1月6日下午消息(蒋均牧)超威半导体(AMD)首席执行官兼董事长苏姿丰(Lisa Su)在CES 2023的主题演讲中发布了锐龙7040(Ryzen 7040)系列处理器,她声称该处理器比苹果(Apple)快30%、比英特尔(Intel)快45%。锐龙7040处理器带有一个内置的一个人工智能...

江苏射阳电信打造县级电视新媒体合作共建基地

岁末年初,中国电信江苏射阳分公司与射阳县融媒体中心举行战略合作协议签约暨射阳县融媒体中心电视新媒体合作共建基地揭牌仪式,开启电信与融媒体合作全新模式。经过前期的洽谈沟通、精心筹备,射阳电信与县融媒体中心积极开展战略合作,双方将围绕利用5G、基础信息设施及云计算、AI、大数据技术,共同构建集数字网络、...

英国重启与软银关于 Arm 伦敦上市的谈判

据援引知情人士的消息称,英国已重启谈判,以确保伦敦在软银旗下芯片设计公司 Arm 计划的首次公开募股中发挥作用。两位了解此事的人士称这次会议“非常有建设性”,另一位人士则称其“积极”。知情人士称,英国首相苏纳克上个月还在唐宁街会见了 Arm 的首席执行官雷内 哈斯(Rene Haas),软银创始人孙...