亚马逊旗下的亚马逊云科技和英伟达宣布了一项多方合作,致力于构建全球最具可扩展性且按需付费的人工智能(AI)基础设施,以便训练日益复杂的大语言模型(LLM)和开发生成式AI应用程序。
借助由NVIDIA H100 Tensor Core GPU支持的下一代Amazon Elastic Compute Cloud(Amazon EC2)P5实例,以及亚马逊云科技最先进的网络和可扩展性,此次合作将提供高达20 exaFLOPS的计算性能来帮助构建和训练更大规模的深度学习模型。
"亚马逊云科技和英伟达合作已超过12年,为人工智能、机器学习、图形、游戏和高性能计算(HPC)等各种应用提供了大规模、低成本的GPU解决方案。"亚马逊云科技首席执行官Adam Selipsky表示,"亚马逊云科技在交付基于GPU的实例方面拥有无比丰富的经验,每一代实例都大大增强了可扩展性,如今众多客户将机器学习训练工作负载扩展到1万多个GPU。借助第二代Amazon EFA,客户能够将其P5实例扩展到超过2万个英伟达H100 GPU,为包括初创公司、大企业在内的所有规模客户提供所需的超级计算能力。"
"加速计算和人工智能已经到来,而且适逢其时。加速计算提升性能的同时,降低了成本和功耗,让企业事半功倍。生成式AI已促使企业重新思考产品和商业模式,力求成为颠覆者,而不是被颠覆。"英伟达创始人兼首席执行官黄仁勋表示,"亚马逊云科技是英伟达的长期合作伙伴,也是首家提供英伟达GPU的云服务提供商。我们很高兴能够结合各自的专长、规模和业务范围,帮助客户利用加速计算和生成式AI抓住未来的大好机遇。"