亚马逊云科技推出由自研芯片支持的三款Amazon EC2新实例

亚马逊云科技在2022 re:Invent 全球大会上推出三款全新的 Amazon Elastic Compute Cloud (Amazon EC2) 实例,分别使用三种自研芯片,为广泛的工作负载提供更高的性价比。Hpc7g 实例配备了最新款的 Amazon Graviton3E 处理器,相比当前一代的 C6gn 实例,其浮点性能提高了两倍,相比当前一代的 Hpc6a 实例,性能提高了 20%。

Amazon EC2 C7gn 实例则采用了新一代的 Amazon Nitro,并具有增强的网络处理功能,是目前 Amazon EC2 网络优化实例中性能最高、提供最高网络带宽和数据包转发性能的实例。

Inf2 实例则使用了最新款的 Amazon Inferentia2 机器学习加速推理芯片,在 Amazon EC2 上以最低的延迟和成本,可以运行大规模的深度学习模型。

亚马逊云科技已经拥有十多年的芯片设计经验,致力于以更低的成本实现更高的性能和可扩展性。该公司推出了多款定制化的芯片设计,可帮助客户运行更高需求的工作负载,包括更快的处理速度、更大的内存容量、更快的 I/O 存储输入和输出,以及更高的网络带宽。自2013年推出 Amazon Nitro 系统以来,该公司已经开发了多个自研芯片,包括五代 Nitro 系统、三代 Graviton 芯片、两代 Inferentia 芯片和 Trainium 芯片。

每一代自研芯片都能为客户提供更高的性能、更优化的成本和更高的能效,从而为客户获得卓越的性价比。这也一直驱动着亚马逊云科技的持续创新。

Amazon EC2 副总裁 David Brown 表示:“亚马逊云科技自研芯片为客户提供卓越性能、优化成本和高能效。今天推出的 Amazon EC2 实例为高性能计算、网络密集型工作负载和机器学习推理工作负载提供了显著的性能提升,客户有更多的实例选择,以满足他们特定的需求。”

Hpc7g 实例是专为在 Amazon EC2 上大规模运行高性能计算工作负载提供超高性价比。

许多领域的机构需要依赖高性能计算来解决复杂的学术、科学和商业问题。当前,很多客户如阿斯利康、F1一级方程式赛车、MaxarTechnologies等在亚马逊云科技上利用其卓越的安全性、可扩展性和弹性来运行高性能计算工作负载,其中包括基因组学处理、计算流体动力学和天气预报模拟等传统工作负载。

工程师、研究人员和科学家使用AmazonEC2网络优化型实例(例如C5n、R5n、M5n和C6gn)来运行高性能计算工作负载,这些实例提供了近乎无限的计算能力和服务器间高网络带宽,使得数千个内核处理和数据交换成为可能。尽管这些实例的性能足以满足目前大多数高性能计算场景,但新兴应用例如人工智能和自动驾驶汽车需要高性能计算优化实例,能够扩展到数万个内核,从而解决不断增加难度系数的问题并降低高性能计算工作负载的成本。

Hpc7g实例采用新的AmazonGraviton3E芯片提供支持,为客户在AmazonEC2上的高性能计算工作负载(例如计算流体动力学、天气模拟、基因组学和分子动力学等)提供超高性价比。性能提高了20%与当前一代Hpc6a实例相比,与采用Graviton2处理器的当前一代C6gn实例相比,Hpc7g实例的浮点性能提高了2倍,让客户在多达数万个内核的高性能计算集群中进行复杂的计算。Hpc7g实例还提供高内存带宽和200Gbps的EFA(弹性结构适配器)网络带宽,这可以更快地运行和完成高性能计算应用,满足客户需求。客户可以通过开源的集群管理工具AmazonParallelCluster使用Hpc7g实例,与其他实例类型一起配置Hpc7g实例,让客户可以在同一个高能性计算集群中灵活地运行不同的工作负载类型。

客户使用AmazonEC2网络优化型实例运行极其严苛的网络密集型工作负载,如网络虚拟化设备(包括防火墙、虚拟路由器和负载均衡器等)和数据加密业务等。客户需要为这些工作负载扩展性能,以处理不断增加的网络流量来应对业务高峰,或者缩短处理时间为最终用户提供更好的体验。当前,为获得更多的网络吞吐量,客户采用更大型号的实例,部署远高于需求的计算资源,导致成本上升。这些客户为缩短数据处理时间,需要更高的数据包转发性能、更高的网络带宽以及更快的加密性能。

C7gn实例采用新的第五代Nitro,在AmazonEC2网络优化型实例中具有最高的网络带宽和数据包处理性能,同时功耗更低。Nitro卡将主机CPU的I/O功能卸载到专门的硬件并加速,将AmazonEC2实例的所有资源几乎都提供给客户的工作负载,从而实现更低的CPU利用率,提供更稳定的性能。新款AmazonNitro卡使C7gn实例的每个CPU提供高达2倍的网络带宽,使每秒数据包处理性能提高50%,并进一步降低了EFA网络延迟和更高的计算性能。与C6gn实例相比,C7gn实例提高了多达25%的计算性能和多达2倍的加密性能。第五代Nitro比第四代Nitro效能功耗比提高40%,进一步降低了客户工作负载的能量消耗。C7gn实例通过扩展网络性能和吞吐量以及降低网络延迟,优化了客户在AmazonEC2上要求最严苛的网络密集型工作负载的成本。

Inf2实例目前提供预览版,欲了解更多信息,请访问aws.amazon.com/cn/ec2/instance-types/c7g/。

Neuron提供了新一代的机器学习加速推理芯片,是Inf2实例的核心组件,此款芯片最多可以支持高达1,750亿个参数的深度学习模型。Inf2实例还支持分布式推理和随机舍入算法,提供更好的应用或个性化体验。

对于数据科学家和机器学习工程师而言,不断构建更大、更复杂的深度学习模型已成为趋势。由于超大型语言模型的出现以及据此进行的训练,深度学习模型的计算需求不断增长,这直接导致推理的成本失控。而Inf2实例的推出则正是基于此需求,旨在提供高效、低成本、低延迟和更好的精度以及更广泛的数据类型支持。

Arup(奥雅纳)是一家全球性的设计和可持续发展咨询公司,他们使用了亚马逊云科技的服务来运行高复杂度的模拟,并帮助客户建筑未来世界的重要基础设施,同时对全球变暖和城市微气候等影响进行评估。Inf2实例的推出,则为这些设计师和工程师提供了一个新的选择,他们可以使用最先进的硬件,来进行更快、更准确、更低成本的模拟。

我们期待利用更高效的Amazon EC2 Hpc7g实例,帮助我们的客户更快、更有效地实现创新。

Aerospike公司的实时数据平台旨在协助企业构建应用程序,应对欺诈,支持全球数字支付,为数百万客户提供超个性化用户体验等。Aerospike实时数据平台是一个缺乏共享(shared-nothing)、多线程、多模态的数据平台,旨在通过服务器集群高效运行,并利用现代硬件和网络技术,以亚毫秒级别为PB级数据提供可靠的高性能。

Aerospike首席产品官LenleyHensarling表示:“在我们最近的实时数据库读取测试中,我们很高兴看到,采用新一代Amazon Nitro的Amazon EC2 C7gn实例与C6gn实例相比,每秒交易量显著提升。我们期待着C7gn实例以及未来更多亚马逊云科技基础设施提升带给我们的诸多优势。”

Qualtrics是一家专注于设计和开发体验管理软件的公司。Qualtrics通过技术创新来缩小客户、员工、品牌和产品之间的体验差距。为了实现此目标,我们正在开发复杂的多任务、多模态的深度学习模型,包括文本分类、序列标记、话语分析、关键短语提取、主题提取、聚类以及端到端对话理解等。

Qualtrics核心机器学习负责人表示,随着我们在更多应用程序中使用这些复杂的模型,以及非结构化数据量的不断增长,为使客户获得最佳体验,我们需要像Inf2实例这样性能更高的推理优化解决方案来满足我们的需求。我们很高兴看到新一代Inf2实例的推出,它不仅让我们实现更高的吞吐量,显著降低延迟,而且引入了分布式推理和支持增强的动态形状输入等功能。随着我们部署更大、更复杂的模型,这将能进一步满足我们对部署的更高要求。