合作机构:阿里云 / 腾讯云 / 亚马逊云 / DreamHost / NameSilo / INWX / GODADDY / 百度统计
关于人工智能将如何加速云平台的发展并支持新一代人工智能驱动的工具来管理云环境,人们已经讨论了很多。但人工智能可能会颠覆云的另一个方面:网络。随着越来越多的人工智能工作负载进入云端,提供更好的云网络解决方案的能力将成为一个关键的优先事项。以下是为什么,以及在人工智能时代,云网络的未来可能会是什么样子。
人工智能将对云网络提出新要求的原因很简单:要想在规模上良好工作,人工智能工作负载将需要云网络达到前所未有的性能水平。
这是因为在许多情况下,人工智能工作负载需要访问的数据,将驻留在位于工作负载所在的同一云平台内或不同云中的远程服务器上。
云网络将提供连接人工智能工作负载和数据的重要链接。在许多情况下,数据量将是巨大的,即使训练一个简单的人工智能模型也可能需要许多TB的信息,并且模型需要以低延迟率访问数据。因此,网络将需要能够以非常高的性能水平支持非常高的带宽。
可以肯定的是,人工智能并不是唯一一种需要出色网络性能的云工作负载。长期以来,提供低延迟、高带宽网络的能力对于云桌面和视频流等用例一直很重要。
云供应商也长期提供解决方案来帮助满足这些网络性能需求。所有主要的云都提供“直接连接”网络服务,可以显著提高网络速度和可靠性,尤其是当在多云架构中的云之间移动数据时,或者作为混合云模型的一部分在私有数据中心和公共云之间移动数据时。
但对于真正具有特殊网络性能需求的人工智能工作负载,直接连接服务可能不够。工作负载还可能需要以数据处理单元(DPU)等解决方案的形式在硬件级别进行优化,这有助于超高效地处理网络流量。事实上,像英伟达这样的供应商已经在这一领域进行了投资,该企业推出了一个专为生成性人工智能量身定制的以太网平台。这表明,一家主要以销售视频卡而闻名的企业也认识到,要想释放人工智能的全部潜力,也需要网络硬件创新。
目前,云供应商、硬件供应商和人工智能开发者,将如何应对人工智能给云网络领域带来的特殊挑战,还有待观察。但总的来说,我们可能会看到以下变化:
更多地使用直连:过去,云直连服务往往只由具有复杂云架构和高性能需求的大型企业使用。但在寻求充分利用基于云的人工智能工作流程的小型组织中,直接连接可能会变得更加普遍。
更高的出口成本:由于云提供商通常在数据移出网络时收取“出口”费用,因此在云中运行的人工智能工作负载可能会增加企业为出口支付的网络费用。展望未来,预测和管理人工智能工作负载触发的出口费用的能力将成为云成本优化的重要组成部分。
网络消耗波动:一些人工智能工作负载会大量消耗云网络资源,但只是暂时的。例如,他们可能需要在训练时移动大量数据,但在训练完成后会缩减网络使用量。这意味着,适应网络消耗大幅波动的能力可能会成为云网络性能管理的另一个重要组成部分。
如果想充分利用云来帮助承载人工智能工作负载,需要优化云网络战略,这需要利用先进的网络服务和硬件,同时调整云成本优化和网络性能管理策略。
目前,可用于帮助实现这些目标的解决方案仍在发展中,但对于任何寻求在云中部署人工智能工作负载的企业来说,这是一个需要密切关注的空间。
TOP