NVIDIA面向各行各业的生成式 AI 平台,以多样化产品加速企业数字化创新

2023-07-20

2023年,ChatGPT火爆全球,生成式AI迅速受到千行百业用户的关注,以此为代表的创新也成为企业纷纷讨论的话题。为了帮助企业加速基于生成式AI的创新应用开发与落地,在今年的Computex上,NVIDIA面向各行各业发布了全新的生成式AI平台,为生成式AI的落地提供了多样化的产品和解决方案。


全新发布AI超级计算机,以一体化解决方案加速生成式AI工作负载

众所周知,生成式AI由于对算力有着极高的需求,大部分企业尤其是传统企业想要获取生成式AI所需要的算力,往往并不简单,且成本高昂。

如何让各行各业都能够更加简单、快捷的获取生成式AI所需的算力,是NVIDIA优先考虑的重要因素。为此,NVIDIA发布了能够为企业提供超强 AI 性能的 DGX GH200大内存 AI 超级计算机。通过 NVIDIA NVLink,这台超级计算机将多达 256 块 NVIDIA GH200 Grace Hopper 超级芯片整合到一个数据中心大小的 GPU 中。

据介绍,DGX GH200 提供 1 exaflop 性能与 144 TB 共享内存,比单个NVIDIA DGX A100 320GB系统高出近500倍。这让开发者可以构建用于生成式AI聊天机器人的大型语言模型、用于推荐系统的复杂算法,以及用于欺诈检测和数据分析的图形神经网络。

GH200 超级芯片现已全面投产,它将节能的NVIDIA Grace CPU与高性能的NVIDIA H100 Tensor Core GPU整合到一个超级芯片中。谷歌云、Meta和微软是首批有望接入DGX GH200的企业,它们将探索这台超级计算机在生成式AI工作负载方面的能力。

另据了解,NVIDIA正在建造自己的大规模AI超级计算机NVIDIA Helios。这台超级计算机将于今年上线,它将使用四个与NVIDIA Quantum-2 InfiniBand网络相连的DGX GH200系统,可提供训练大型AI模型所需要的数据吞吐量。

将有超过400种采用NVIDIA 最新版本Hopper,Grace,Ada Lovelace和BlueField架构的系统上市。这些系统将被用于解决AI,数据科学和高性能计算领域的复杂挑战。

为了满足各种规模数据中心的需求,NVIDIA发布了一个用于创建加速服务器的模块化参考架构NVIDIA MGX。系统制造商将使用该架构快速、经济地构建100多种不同的服务器配置,满足各种AI、HPC和NVIDIA Omniverse应用的需求。

凭借MGX,制造商能够使用通用架构和模块化组件构建CPU和加速服务器。MGX支持NVIDIA全部GPU、CPU、DPU和网络适配器系列,以及各种风冷、液冷机箱的X86和Arm处理器。

NVIDIA Spectrum-X 网络平台为基于以太网AI云提供更高性能

在云计算如此普及的今天,借助云上算力支撑实现生成式AI的应用,已经成为很多用户选择。为了让用户能够通过云平台获取生成式AI的算力,减少网络延迟,提高网络的性能就显得至关重要。

为此,NVIDIA推出了全新的 NVIDIA Spectrum-X 网络平台,该平台NVIDIA Spectrum-X™ 是基于网络创新的新成果而构建 —— 将 NVIDIA Spectrum-4 以太网交换机与 NVIDIA BlueField®-3 DPU 紧密结合,取得了 1.7 倍的整体 AI 性能和能效提升,同时可在多租户环境中提供一致、可预测的性能。Spectrum-X 还提供 NVIDIA 加速软件和软件开发套件(SDK),使开发人员能够构建软件定义的云原生AI应用。

据介绍,NVIDIA Spectrum-X 网络平台具有高度的通用性,采用完全标准的以太网,与现有以太网的堆栈实现互通。该平台起步于 Spectrum-4 ,这是全球首款专为 AI 网络打造的 51Tb/s 以太网交换机。先进的 RoCE 扩展功能可以跨 Spectrum-4 交换机、BlueField-3 DPU 和 NVIDIA LinkX 光纤相互协同,共同构建了一个专为 AI 云优化的端到端 400GbE 网络。

性能方面,NVIDIA Spectrum-X 单台交换机即可实现突破性的 256 个 200Gb/s 端口的连接,使用两层叶脊拓扑可以连接 16,000 个端口,以支持 AI 云的增长和扩展,同时保持极高的性能和极低的网络延时。

除此之外,NVIDIA Spectrum-X 通过性能隔离增强了多租户环境,确保租户的 AI 工作负载能以最佳性能持续运行。NVIDIA Spectrum-X 还提供了更好的 AI 性能可见性,它可以识别性能瓶颈,而且具有全自动网络验证功能。

作为 NVIDIA Spectrum-X 参考设计的蓝图和测试平台,NVIDIA 正在构建一台超大规模生成式 AI 超级计算机,命名为 Israel-1。它将被部署在 NVIDIA 以色列数据中心,由基于 NVIDIA HGX™ 平台的戴尔 PowerEdge XE9680 服务器, BlueField-3 DPU 和 Spectrum-4 交换机等打造而成。

NVIDIA 网络高级副总裁 Gilad Shainer 表示:“诸如生成式 AI 等革命性技术正在推动各家企业提升数据中心性能的极限,从而获得更多竞争优势。作为新一代以太网络,NVIDIA Spectrum-X 为新一代 AI 工作负载扫清障碍,将会彻底改变整个行业。”

为各行各业生成式AI加速,赋能全球行业的数字化转型

众所周知,数字广告行业是生成式AI应用未来一段时间的主要阵地。数据显示,生成式AI为价值7,000亿美元的数字广告行业带来新的机遇。例如,全球最大的营销服务机构WPP正与NVIDIA一起在Omniverse Cloud上构建首个生成式AI内容引擎。

除了数字广告行业之外,在制造行业中,NVIDIA也正在以全新的技术赋能数字工厂的建设。数据显示,价值46万亿美元的制造业有1,000万家工厂,它们是工业数字化的重点领域。

据了解,制造企业通过Omniverse和生成式AI 的API接口,以连接他们的设计和制造工具,从而构建工厂数字孪生。他们还使用NVIDIA Isaac Sim模拟和测试机器人,并使用视觉AI框架NVIDIA Metropolis实现光学检测的自动化。最新组件NVIDIA Metropolis for Factories可以创建定制化的质控系统,为制造商带来竞争优势。该组件正在帮助企业开发先进的AI应用。



阅读5
分享