在GeForce环节之后,NVIDIA企业运算部门主管Manuvir Das直接转入了NVIDIA主题演讲的下半部分企业级内容。发布的产品包括NVIDIA Base Command Platform云端AI开发中心,基于NVIDIA BlueField DPU新款服务器,以及NVIDIA认证系统计划。
将AI交给云端
NVIDIA Base Command Platform能够通过云端开发中心,帮助企业的AI项目加速从原型到快速投入生产。软件专为托管在本地或云端的大规模、多用户、多团队AI开发工作流程设计。它可以使众多研究人员和数据科学家同时使用加速计算资源工作,帮助企业最大限度地提高专家级开发者和宝贵AI基础设施的生产力。
Base Command Platform现可通过NVIDIA和NetApp联合提供的高级月度订阅来获取。通过附带NetApp解决方案Base Command Platform,将能够利用具有破纪录性能的NVIDIA DGX SuperPOD A超级计算机和NetApp数据管理服务。
谷歌云计划在其云市场中添加对Base Command Platform的支持,在今年晚些时候为客户提供真正的混合AI体验。
NVIDIA BlueField DPU全面开花
目前为止,已经有多家服务器制造商发布了采用NVIDIA BlueField-2 DPU的新系统。同时基于NVIDIA GPU的系统也都可以选择添加BlueField-2 DPU,一些应用和客户用例中可能不需要用到GPU,但仍然可以受益于DPU。
NVIDIA BlueField-2 DPU能够满足企业对更高性能、安全性和可管理性的需求,因此华硕、戴尔科技、技嘉、云达科技和超微的新服务器将成为理想之选。
DPU能够对网络、安全与存储应用进行加速、卸载,以及基础设施负载隔离。主要运行软件定义网络(例如有状态负载均衡器或分布式防火墙)、软件定义存储或传统企业应用的服务器都将受益于此。
运行VMware vSphere、Windows或超融合基础设施解决方案的系统也将受益于DPU,无论是运行AI和机器学习应用、图形密集型应用还是传统的商业应用。
NVIDIA BlueField DPU将基础设施任务从CPU转移至DPU,使更多的服务器CPU核可用于运行应用程序,从而提高服务器和数据中心的效率。该DPU为每个服务器配备了一台“计算机前的计算机”以提供独立、安全的基础设施服务,并与服务器应用域安全隔离,在虚拟化和裸金属服务器上实现了无代理应用隔离、安全隔离、存储虚拟化、远程管理和遥测。
客户和软件制造商可使用NVIDIA DOCA SDK轻松地对BlueField DPU进行编程。该片上数据中心体系架构可简化应用开发,并且实现前后兼容,包括兼容预计于2022年推出的NVIDIA BlueField-3 DPU,以及未来所有的BlueField DPU。
NVIDIA认证更广泛
在主题演讲上,NVIDIA还宣布数十款全新服务器已获得NVIDIA认证,可运行NVIDIA AI Enterprise软件,至此NVIDIA认证系统已经扩充到了50多种系统。
目前加入NVIDIA认证系统阵营的公司包括研华科技、Altos、永擎电子、华硕、戴尔科技、技嘉科技、慧与、联想、云达科技、超微等公司,领域涉及医疗、制造、零售和金融服务等行业的AI。
凭借NVIDIA认证系统,企业能够支持传统数据中心以及混合云中的各种复杂工作。其中包括在VMware vSphere上运行NVIDIA AI Enterprise和数据分析软件,来部署支持AI的企业级平台,从而实现批量运行AI工作负载;还包括在NVIDIA Omniverse Enterprise上实现设计协作、高级模拟以及在红帽OpenShift平台上实现AI部署。系统还可与 Cloudera 数据工程和机器学习无缝集成,把交付模型的时间从几个小时缩短至几分钟。
而如果想经过NVIDIA认证系统测试,必须使用NVIDIA A100、A40、A30或A10 Tensor Core GPU以及NVIDIA BlueField-2 DPU或NVIDIA ConnectX-6系列网卡。
今年下半年,几家全球领先的系统制造商将首次发布多款经过新一类NVIDIA认证系统的服务器。这类新认证系统将通过BlueField-2 DPU在网络、存储和安全性能上实现突破。
通过卸载CPU的工作任务,单一BlueField-2 DPU可以提供多达125个CPU核才能实现的数据中心服务,从而释放服务器CPU周期以支持各种关键业务应用。
BlueField-2 DPU得到了软件基础设施领导者的广泛支持,包括红帽和VMware。为协助开发者构建支持BlueField-2 DPU的应用程序,红帽免费为开发者提供针对红帽企业版 Linux 操作系统的红帽开发者订阅版。
而如果计划顺利,NVIDIA将于2022年扩展至ARM CPU服务器,目前NVIDIA正在测试一款Arm HPC开发者套件,为HPC、AI和科学计算应用开发提供硬件和软件一体化的平台。该平台经NVIDIA验证,可满足严苛的HPC应用要求,它包含一个来自Ampere Computing的基于Arm Neoverse的Ampere Altra处理器、两个A100 GPU、两个BlueField-2 DPU以及NVIDIA HPC SDK。