Top
首页 > 正文

亚马逊云科技推出三款由自研芯片支持的新Amazon EC2实例

发布时间:2021-12-02 09:30 来源: 作者:

12月1日,在亚马逊云科技re:Invent全球大会上,亚马逊云科技宣布推出三款由自研芯片支持的新Amazon Elastic Compute Cloud (Amazon EC2)实例,帮助客户显著提升在Amazon EC2上运行的工作负载的性能、成本和能源效率。新C7g 实例由Amazon Graviton3 处理器支持,与由 Amazon Graviton2 处理器支持的当前一代 C6g 实例相比,性能提高25%。由Amazon Trainium芯片支持的新Trn1实例为在Amazon EC2中训练绝大多数机器学习模型提供最佳性价比,及最快的训练速度。基于自研Amazon Nitro SSDs(固态驱动器)的新存储优化型Im4gn/Is4gen/ I4i实例为在Amazon EC2上运行的I/O密集型工作负载提供最佳存储性能。这些基于亚马逊云科技自研芯片的新Amazon EC2实例的发布,将帮助客户支持其关键业务应用程序。

亚马逊云科技Amazon EC2副总裁David Brown表示:“我们对自研芯片的持续投入升级,已经让客户在当今一些关键工作负载中获得了巨大的性价比优势。客户希望我们在每一代新的EC2实例上不断突破边界。亚马逊云科技的持续创新让客户有机会使用这些全新的、改变游戏规则的实例运行其重要的工作负载,获得更好的性价比。”

C7g实例由新的Amazon Graviton3处理器支持,与由Amazon Graviton2处理器支持的当前一代C6g实例相比,性能提高多达25%

基于Amazon Graviton2的计算实例自2020年推出以来,被众多客户如DirecTV、Discovery、Epic Games、Formula 1、Honeycomb.io、Intuit、Lyft、MercardoLibre、NextRoll、Nielsen、SmugMug、Snap、Splunk和Sprinklr等在生产中使用并已经获得显著的性能提升和成本节省。基于Graviton2的系列实例共有12种,包括通用型、计算优化型、内存优化型、存储优化型、突发性能型和加速计算型实例,让客户拥有云上至深至广的计算选择,并兼顾性价比和能效。随着客户在云中开展更多计算密集型工作负载如高性能计算(HPC)、游戏和机器学习推理,相应的计算、存储、内存和网络需求也随之增长,客户需要寻求更佳的性价比和能效来运行这些工作负载。

由Amazon Graviton3处理器支持的C7g实例与由 Graviton2 处理器支持的当前一代 C6g 实例相比,可将计算密集型工作负载性能提高多达25%。Amazon Graviton3处理器与Graviton2相比,为科学计算、机器学习和媒体编码工作负载提供高达2倍的浮点运算性能,为加密工作负载速度提升高达2倍,为机器学习工作负载提供高达3倍的性能。Amazon Graviton3处理器的能效也更高,在相同性能下,与同类型EC2实例对比,可节省高达60%的能源消耗。C7g实例是云中第一个采用最新DDR5内存的实例,与基于Amazon Graviton2的实例相比,它提高了50%的内存带宽,从而提高了科学计算等内存密集型应用的性能。与基于Amazon Graviton2的实例相比,C7g实例的网络带宽也高出20%。C7g 实例支持 Elastic Fabric Adapter (EFA),允许应用程序直接与网络接口卡通信,提供更低且更一致的延迟,提高需要大规模并行处理(如 HPC 和视频编码)的应用程序的性能。

由Amazon Trainium芯片支持的Trn1实例为在Amazon EC2中训练绝大多数机器学习模型提供最佳性价比,及最快的训练速度

越来越多客户正在构建、训练和部署机器学习模型,支持能够重塑其业务和客户体验的应用程序。为了确保提高准确性,这些机器学习模型必须构建在越来越多的训练数据上,导致其训练成本越来越高。这可能会限制客户能够部署的机器学习模型数量。亚马逊云科技为机器学习提供至深至广的计算服务选择,包括采用NVIDIA A100 Tensor Core GPU的EC2 P4d实例和采用Habana Labs Gaudi 加速器的 EC2 DL1 实例。但是,即使拥有当今最快的加速实例,训练持续变大的机器学习模型仍然是非常昂贵和耗时的。

由Amazon Trainium芯片支持的Trn1实例为在Amazon EC2中进行深度学习模型训练提供最佳性价比以及最快的训练速度,与P4d实例相比,通过Trn1实例训练深度学习模型的成本降低多达40%。Trn1实例提供800Gbps EFA网络带宽(比最新基于GPU的EC2实例高两倍),并与Amazon FSx for Lustre高性能存储集成,让客户可以启动具有EC2 UltraClusters功能的Trn1实例。通过EC2 UltraClusters,开发人员可以将机器学习训练扩展到一万多个与 PB 级网络互连的 Trainium 加速器,让客户按需访问超算级性能,即便是最大型和最复杂的模型,训练时间也可以从几个月缩短到几天。

采用全新Amazon Nitro SSDs的Im4gn/Is4gen/ I4i实例可为I/O密集型工作负载提供最佳存储性能

如今,客户将I3/I3en存储优化型实例用于需要直接访问本地存储数据集的应用程序,比如横向扩展的事务型和关系型数据库(如MySOL和PostgreSQL),NoSQL数据库(如Cassandra、MongoDB、Redis等),大数据(如Hadoop)和数据分析工作负载(如Spark、Hive、Presto等)。I3/I3en实例以低成本提供非易失性内存标准(NVMe) SSD支持的实例存储,针对低延迟、高 I/O 性能和吞吐量进行了优化。客户喜欢I3/I3en实例提供的快速事务处理能力,但随着其工作负载的不断升级——在更大规模的数据集上处理更复杂的事务,他们需要在不增加成本的情况下获得更高的计算性能和更快的数据访问速度。

Im4gn/Is4gen/I4i实例旨在通过架构最大限度提高I/O密集型工作负载的存储性能。通过自研的 Amazon Nitro SSDs ,Im4gn/Is4gen/I4i实例提供高达 30 TB 的 NVMe 存储,与上一代I3实例相比,I/O 延迟降低了 60%,延迟可变性降低了 75%,从而最大限度地提高了应用程序性能。Amazon Nitro SSDs通过优化存储堆栈、虚拟化管理程序和硬件与Amazon Nitro 系统紧密集成。与使用商用SSD相比,亚马逊云科技同时管理Amazon Nitro SSDs的硬件和固件,使SSD更新交付速度更快,让客户可以从改进的功能中获益。Im4gn 实例(现已可用)采用 Amazon Graviton2 处理器,与 I3 实例相比,性价比提高多达 40%,每 TB存储成本降低多达 44%。Is4gen 实例(现已可用)也采用 Amazon Graviton2 处理器,与 I3en 实例相比,每 TB 存储成本降低多达 15%,计算性能提高多达 48%。

SAP HANA是世界领先的内存数据库,是SAP业务技术平台的基础。SAP HANA数据库与分析总裁Irfan Khan表示:“过去十年中,SAP HANA帮助客户管理他们最关键的事务和分析工作负载。亚马逊云科技在基于ARM的Amazon Graviton处理器的持续投入与创新,与亚马逊云科技的合作带来诸多可能,为我们的企业客户和SAP HANA云支持的SAP云分析和数据管理解决方案带来了显著的运营效率和性能提升。”

Twitter承载着当前正在发生和人们正在讨论的事情。Twitter平台主管Nick Tornow表示:“Twitter正在进行一个为期多年的项目,利用基于Amazon Graviton处理器的Amazon EC2实例来提供Twitter时间线。为进一步提高效率,我们测试了新的基于Amazon Graviton3处理器的C7g实例。在一系列可以代表Twitter工作负载性能的基准测试中,我们发现基于Amazon Graviton3处理器的C7g实例与基于Amazon Graviton2处理器的C6g实例相比,可将性能提高20%-80%,同时还将尾部延迟减少多达35%。我们非常高兴并期待利用基于Amazon Graviton3处理器的实例获得更好的性价比。”

一级方程式(F1)赛车始于1950年,是世界上最负盛名的赛车比赛,也是全球最受欢迎的年度体育赛事。“基于Amazon Graviton2处理器的C6g实例已经为我们的一些CFD(计算流体仿真力学)工作负载提供了最佳性价比。现在,我们发现在同样的模拟中,基于Graviton3的 C7g实例比基于Graviton2的 C6g实例快40%。”一级方程式管理首席技术官Pat Symonds表示:“我们很高兴EFA将在这种实例类型中标配。基于Graviton3的实例在性价比方面的优越表现,我们期待它成为运行所有CFD工作负载的最佳选择。”

Epic Games创立于1991年,是Fortnite、Unreal、Gears of War、Shadow Complex和Infinity Blade系列游戏的创造者。Epic的Unreal Engine技术为PC、主机、手机、AR、VR和Web带来了高保真、交互式的体验。Epic Games高级工程总监Mark Imbriaco表示:“当我们展望未来,为玩家构建更加引人入胜的沉浸式体验时,我们很高兴使用基于Amazon Gravtion3处理器的EC2实例。我们的测试表明,它们甚至适用于要求最严苛、延迟敏感度最高的工作负载,同时提供卓越的性价比,提升了《堡垒之夜》和任何基于虚拟引擎创造的游戏体验。”

Honeycomb开发了一个可视化平台,让工程团队可以可视化、分析和改善云应用程序的质量和性能。“我们很高兴能够基于Amazon Graviton3的预览实例测试我们的高吞吐遥感摄取工作负载。” honeycomb.io首席开发者布道师Liz Fong-Jones表示:“在处理相同工作负载的情况下,我们运行的C7g实例比C6g少30%,延迟降低了30%。我们期待在Amazon Graviton3的C7g实例正式可用后尽快投入到我们的生产环境中。”

Meta AI专注于将人们与其关心的事物联系起来,提供有意义且安全的体验,推进机器学习并指导开放研究。Meta AI PyTorch工程高级总监Lin Qiao表示:“PyTorch开发人员不断创新,以提高深度学习模型的准确性,并找到更好的方法解决问题。同时,这些模型的规模呈指数级增长,这让训练它们变得更加困难,成本更高。我们的PyTorch团队一直在与Amazon Neuron团队合作,为易用性和性能设定了一个高标准,确保在PyTorch中为Trainium等加速器提供原生支持。这其中包括研究集体计算原语,以及为扩展性能和分布式训练设置适当的基础。我们期待与亚马逊云科技合作,将Trainium与PyTorch原生产品(如eager mode和dynamic shapes)进行更多集成。”

Anthropic构建了可靠、可解释和可操控的人工智能系统,这些系统将有机会为商业和公共利益创造价值。Anthropic联合创始人Tom Brown表示:“我们的研究兴趣横跨多个领域,包括自然语言、人工反馈、缩放定律、强化学习、代码生成和可解释性。我们成功的一个关键是利用现代基础设施,让我们可以启动超大高性能深度学习加速器的集群。 我们期待使用Amazon Trainium芯片支持的Trn1实例,因为它们具有前所未有的能力,可以扩展到上万个节点,还有更高的网络带宽,这将让我们可以在控制成本的同时更快地迭代。”

Splunk是领先的数据平台提供商,旨在调查、监控、分析和处理任何规模的数据。Splunk云平台和基础设施副总裁Brad Murphy表示:“我们运行基于C/C++的工作负载来索引和搜索事件数据。我们的工作负载受CPU限制,并受益于高容量和低延迟的SSD存储。在评估由Amazon Graviton2支持的新Im4gn/Is4gen实例时,我们观察到,与当前使用的I3/I3en实例相比,搜索运行时间减少了50%。Im4gn和Is4gen实例成为运行我们存储密集型工作负载的绝佳选择,性价比显著提升且TCO更低。”

Sprinklr通过 30 多个数字化渠道帮助全球大型企业提升客户满意度——使用为企业构建的先进、复杂的人工智能引擎来创建洞察力驱动的策略,创造更优秀的客户体验。“我们在由Amazon Graviton2处理器支持的Amazon EC2 Im4gn/Is4gen实例上对基于Java的搜索工作负载进行了基准测试。与较大的I3en实例相比,较小的 Is4gen 实例就能提供相似的性能,这意味着有机会显著降低TCO。” Sprinklr工程副总裁Abhay Bansal表示:“我们在将工作负载从I3实例迁移到Im4gn实例时,还发现查询延迟显著降低,多达50%,性价比提升40%。迁移到基于Amazon Graviton2的实例很容易,完成基准测试需要两周时间。我们对已有的经验感到非常满意,并期待基于Im4gn和Is4gen实例在生产环境中运行这些工作负载。”

Redis Enterprise通过帮助软件团队为实时世界创建高性能数据层,为全球超过8000个组织提供关键任务应用程序和服务。Redis联合创始人兼首席技术官Yiftach Shoolman表示:“我们非常高兴看到,全新低延迟Amazon Nitro SSDs的Amazon EC2 I4i实例提供比上一代实例更快的交易速度。我们预计I4i实例更强的存储性能和更快的网络和处理器速度将为我们那些基于I4i实例使用Redis-on-Flash的客户带来显著改善,获得更具吸引力的TCO。”

合作站点
stat
Baidu
map