![]()
6165con登录平台 7月27日报道:AWS 用户现时允许访问 AI 训练和推理领域业界基准测试中展现的领先性能。 图片来自 NVIDIA 这家云计算巨头慎重推出了由英伟达 H100 Tensor Core GPU 供给支撑的新 亚马逊 EC2 P5 实例。该服务允许用户通过浏览器一键填补生成式 AI、高性能计算(HPC)和其他应用程序。 据官方先容,英伟达 H100 GPU 经过包罗第四代 Tensor Cores、新的 Transformer 引擎用于加速 LLMs 以及最新的 NVLink 技术(可让 GPU 之间的通信速度达到 900GB/秒)等架构翻新提供超级计算级别的性能。 亚马逊 EC2 P5 实例异常适合训练和运行日益复杂的 LLMs 和计算机视觉模型的预测。这些神经网络驱动着最具挑战性和计算密集型的生成式 AI 应用,包含问题回答、代码生成、视频和图像生成、语音鉴识等。 P5 实例可以部署在超大规模集群中,称为 EC2 UltraClusters,由高性能计算、网络和云存储组成。每个 EC2 UltraCluster 都是一台强大的超级计算机,使客户没准在多个系统上运行最复杂的 AI 训练和分布式 HPC 工作负载。 因此,客户允许在需要计算节点之间高水平通信的规模应用程序上运行 P5 实例。P5 实例采用由 AWS EFA 供给支撑的 petabit 级非阻塞网络,为 亚马逊 EC2 实例提供 3,200 Gbps 的网络接口。 借助 P5 实例,机器学习应用程序可以使用 NVIDIA Collective Communications Library 来使用多达 20,000 个 H100 GPU。 英伟达 AI Enterprise 可援助用户充分发挥 P5 实例的潜力,提供包罗 100 多个框架、预训练模型、AI 工作过程和用于调整 AI 基础设施的工具在内的全套App。 英伟达 AI Enterprise 旨在简化 AI 应用程序的开发和部署,解决构建和维护高性能、安全、云原生 AI App平台的复杂性。该App可在 AWS Marketplace 上获得,供应持续的安全监控、定期修补常见漏洞、API 稳定性、企业支撑以及访问英伟达 AI 专家的机会。 (投诉) (责任编辑:admin) |