企业 IT 专业人士表示,分析人工智能流量对于选择集群网络硬件至关重要,他们发现在进行自己的试验之前,他们对人工智能网络需求知之甚少。
根据对此主题的流行观点,人工智能要么会创造利润和福利的黄金时代,要么会杀死我们所有人。后一种观点至少在一定程度上受到质疑。如今,如果你在拥挤的剧院里大喊“AI”,几乎没有人会跑向出口。前者仍然强劲,因此网络供应商很快就声称人工智能驱动的变革具有巨大的收入增长潜力。但愿望并不能实现。
对于几乎每个人来说,人工智能实际上意味着生成式人工智能服务,从搜索增强到与从编写电子邮件到编写代码等一切相关的副驾驶工具。是什么提供了如此大规模的情报注入?网络。因此,网络流量将因人工智能的使用而爆炸式增长,因此网络设备支出, 正确的?
在 195 家企业中,我就生成式 AI 服务对其广域网流量的影响发表了评论,猜猜有多少企业说它产生了“实质性影响”。答案:没有。
根据您自己对最常见的生成式人工智能形式(搜索增强)的经验来思考一下。现在,您首先获得人工智能汇总结果,然后是传统结果。假设总结很好;唯一可能的结果是您不再需要其他结果,并且您甚至不太可能查看第一页结果之外的内容。届时交通将是较少的。假设摘要没有用。你会停止查看它,并且可能会看到 50 或更多的额外字符被你忽略的内容占用,直到搜索提供商意识到这一点并停止支付数以百万计的 AI GPU 托管来生成它们。无实质性影响。
总体而言,企业认为通过生成式人工智能交换提示/查询和结果不会影响他们的网络。在这 195 名中,有 28 名表示他们可以设想新的应用程序,涉及视频人工智能分析等可能会影响此类流量的应用程序,但他们相信这些应用程序将在自己的边缘设施上运行,靠近数据源,因此不会影响广域流量或扩大网络服务或资本设备的使用。
如果支持生成式人工智能的使用是一种网络失败,那么整个人工智能网络连接是否与破坏人类的人工智能实体一样是一个巨大的机会?不,因为训练和运行人工智能模型仍然存在挑战。
在提供 AI 网络评论的企业中,只有 21 家正在做任何 AI 自托管,但所有这样做的企业以及几乎所有认真评估自托管的企业都表示,AI 托管意味着带有 GPU 的专门计算机集群,而这集群必须在其内部连接并连接到其核心业务数据的主要存储点。他们都认为这是一个全新的网络挑战。
每个自托管人工智能的企业都告诉我,该任务需要比正常应用程序更多的带宽来支持“水平”流量,也超过了当前数据中心需要支持的带宽。该小组中的 10 人表示,这意味着他们需要人工智能服务器“集群”才能拥有更快的以太网连接和更高容量的交换机。每个人都同意本地人工智能的实际生产部署需要新的网络设备,15 人表示他们甚至为了大规模试验而购买了新交换机。
我从有经验的人那里听到的数据中心网络的最大问题是,他们认为自己构建的人工智能集群超出了他们的需要。他们表示,运行流行的法学硕士需要数百个 GPU 和服务器,但小型语言模型可以在单个系统上运行,目前三分之一的自托管企业表示,他们认为最好从小规模开始,使用小型模型,并且仅当您有经验并且可以证明需求时才进行积累。该组织还指出,需要进行控制以确保只运行真正有用的人工智能应用程序。“否则应用程序会建立、超过并增加人工智能集群的规模,”用户表示。
每一位当前AI自托管用户都表示,保持AI横向流量很重要脱离其主要数据中心网络因为它对其他应用程序有潜在的拥塞影响。来自托管生成人工智能的横向流量可能是巨大且不可预测的;一家企业表示,他们的集群可以产生与整个数据中心一样多的水平流量,但突发流量很少持续超过一分钟。他们还表示,这种水平突发的延迟可能会严重影响应用价值,延长结果交付和突发的长度。他们表示,分析人工智能集群流对于选择正确的集群网络硬件至关重要,他们发现在进行试验和测试之前,他们对人工智能网络需求“一无所知”。
AI集群与企业核心数据存储库之间的数据关系很复杂,这种关系决定了AI集群对数据中心其他部分的影响有多大。这里的挑战是,所支持的应用程序和实施方式都会对数据从数据中心存储库转移到人工智能的方式产生重大影响。
范围非常有限的人工智能/机器学习应用,例如在 IT 或网络或安全领域的运营分析中使用人工智能/机器学习,是实时的,需要访问实时数据,但这通常是小批量的遥测用户报告说影响不大。针对业务分析的生成式人工智能应用程序需要广泛访问核心业务数据,但通常主要需要历史摘要而不是完整的事务详细信息,这意味着通常可以将这些压缩源数据作为副本保留在人工智能集群中。
如果需要完整的交易数据,那么真正的人工智能用户建议考虑人工智能社区所说的 RAG,这意味着检索增强生成。借助 RAG,AI 模型使用传统的数据库查询来“充实”模型的训练数据,这意味着可以设计整个流程以最大限度地减少所提取的数据量由AI提示出来。正如用户所说:“如果你让人工智能模型煮沸整个核心数据海洋,你将产生大量流量并耗尽大量数据中心网络容量。”正确的用户表示,在优化AI网络成本方面,AI应用设计比网络设计更重要。
不过,人工智能自托管的更广泛影响并不来自它的使用,而是来自它的训练。目前与我交谈过的所有自托管人工智能用户都表示,训练模型对企业网络的影响几乎肯定比运行模型更大。经验丰富的人再次表示,用预训练模型开始人工智能之旅,更多地依靠 RAG 来整合公司数据,并以这种方式包含训练问题,比尝试进行完整的模型训练是明智的。内部法学硕士。
当前每一个企业都着眼于人工智能联网表示对“网络”部分的关注过多,而对“人工智能”的关注不够。与任何网络任务一样,人工智能需要先了解技术和流量影响,然后才能开始铺设电缆并连接事物。那些已经完成内部人工智能项目的人一致认为,如果他们做更多的工作来了解人工智能在托管和连接方面的真正需求,他们会做得更好、更便宜。
订阅我们的时事通讯
从我们的编辑直接发送到您的收件箱
请在下面输入您的电子邮件地址开始使用。