
自AI是自DOT COM BOOM以来IT基础设施的最大变化,毫不奇怪,在上个月在圣地亚哥举行的年度Cisco Live活动中专注于AI,特别是代理人,以及网络巨头如何与其他基础设施供应商区分开谈到新兴技术。
思科推出了一个新的网络体系结构AI专用设备并非常重视嵌入式安全性。公司高管吹嘘说思科以最完整的堆栈来到AI时代硅一个网络芯片是基础元素。关键是硅的可编程性,思科总裁兼首席产品官Jeetu Patel指出,该芯片允许Chip承担新的工作量,而无需将其胶带出来。
帕特尔说,硅O One E4围绕路由逻辑,扩展,负载平衡在大型群集上,将安全性烘烤到芯片本身方面面临着艰巨的挑战。它以更可扩展的方式创建您可以容纳的方式AI的企业要求。这是一个超级战略性的领域。我们通常不会谈论这么多,因为我们不想谈论基础设施中的所有杂草。我们想谈谈该应用程序是什么。但是,超级大国来自您实际构建整个堆栈并将堆栈集成在一起的方式。
硅芯片背后的人是思科普通硬件集团执行副总裁Martin Lund。下一个平台在节目中与隆德谈了筹码及其在不断发展的AI世界中的作用。
杰弗里·伯特(Jeffrey Burt):为什么在谈论AI时,使用硅和硅酮很重要?
马丁·隆德:硅是发动机。这就是您创建高性能网络的方式。您可以在软件中进行。您可以达到性能,可以达到延迟,可以满足功率要求,因此您必须建立专用的硅。思科已经建立ASIC已有40年了,所以这并不是什么新鲜事。在网络上做任何事情的其他所有人 - 高性能网络 - 无论是自己构建的硅,还是很少,还是构建所谓的商人切换的东西,都使用某种形式的硅。只是为了让您了解过去20年的性能提高 - 您可以从芯片中获得的性能增加了10,000次,在20年内达到了四个数量级。
JB:你有一个接近的与Nvidia的合作伙伴关系,您有Intel在做筹码,您会让云提供商自己制作芯片。使用这些中的任何一个都不是Cisco的路线。
马丁·隆德:很少有自己的切换硅。大多数供应商将自己的硅用于特定于计算的资源。Google有一个张量处理单元,在某些情况下,他们将其用作NVIDIA的替代方案。网络硅很复杂。在制作这些游戏的游戏中,实际上只有少数公司来制作这些产品。
对我们来说,这是我们的核心业务。我们是一家网络公司。独一无二的是,我们决定在2019年宣布硅何时,我们说:“大麻,我们将在您身边与您见面。我们将使用我们的思科软件向您出售我们的思科系统。我们将在其中卖给您一个带有硅的盒子,您可以将自己的软件(例如白盒)放在其中。或者,我们只会向您出售硅,您可以构建自己的系统。我们可以很好地消耗这项技术。我们将支持它。
这是一种伙伴关系模型和开放的生态系统方法,这确实引起了共鸣。他们还引起了他们的共鸣,他们需要替代供应商,因为在高端和低端,可能只有一个在投资组合广度和性能方面拥有的东西。
JB:所以我们谈论Broadcom?
马丁·隆德:是的,我们是。
JB: 关于硅One Chip的可编程性,Cisco Live有很多讨论。在AI时代,这对思科和您的客户意味着什么?
马丁·隆德:可编程性是交付某些东西的一种方式。您所做的是最重要的部分。我们拥有的设备还有许多其他属性,使它们变得非常好和竞争。流量管理功能,我们进行缓冲的方式,我们进行故障管理和负载平衡以及所有这些内容的方式。但是其中很多与我们如何编程有关。如果您还记得在过去,它被称为网络处理单元,即NPU。然后人们称其为DPU或数据处理单元,这是一个具有编程的NIC。现在我们有GPU和XPU。这本质上是NPU,但我们不一定称其为NPU,因为它在那些日子里具有缓慢并且有很多延迟的含义。但这是这样的。它只是用非常独特的架构完成的,因此我们没有像过去那样被罚款。这是一个非常新颖的建筑。
这给大型标准带来了好处。服务提供商有好处,企业客户有好处,但在略有不同的领域中。在AI时代,我们在开始时没有预见到的速度,这很大程度上已经启动了,这种灵活性显示为受益。高度标准往往具有非常非常大的网络,非常复杂,并且确实需要非常非常有效地加载流量。我们具有编程模型的能力,可以提出新颖且高效的负载平衡技术。他们的网络运行更好,更快。服务提供商可能还有另一个痛苦点。例如,段路由。细分路由是那里存在的关键功能之一,当我们构建进入该网络的其他芯片之一时,它也没有完全标准化,因此我们对其进行了软件升级,现在我们支持段路由。
对于企业来说,我们在这里宣布的这种智能开关技术 - 我们将安全性融合到网络中 - 我们使用该可编程性来启用和加速与Hypershield以及其他智能开关示例的网络功能。AI的另一个例子(例如UEC)是Ultra Ethernet联盟。这是一个规格。同样,我们使用我们的可编程性来支持该规格。由于我们的可编程性,我们能够支持所有这些功能。好处取决于您的看法。您要么获得一个更好的性能网络,因此可以寿命并获得创新速度。全部来自相同的架构方法。
JB:在与记者和分析师的问答期间,有关于这种可编程性如何允许企业引入新用例而无需等待的问题。你能谈谈吗?
马丁·隆德:归根结底,网络必须支持许多许多不同的应用程序。您的电子邮件上运行,您的视频正在运行,您会发出声音,现在您将拥有正在谈论网络的[AI]代理商,如果您有很多网络,那么您可能会对网络有更多需求。其中的一部分是我们建立的灵活性是针对尚未发明的东西。我们还不知道它是什么,但是我们有信心在支持它方面有一个很好的射门。对未来的防护。什么代理商将是什么?我们怎么知道他们想要拥有多少个代理商和哪些QoS模型?我们还不知道,因为它们还没有建造。它不是发明的。我知道我可以升级它,这只是未来的东西,以便我可以解决未来的问题。就像反叉车一样。就像投资保护一样,它也获得了我们具有可观察到能力的网络,因此您实际上可以看到发生了什么,您拥有良好的远程计算机。
这就是高标准驾驶非常非常艰难的一件事。他们需要了解他们的网络,需要查看发生了什么,以及我们带入其他产品线的许多功能,因此我们在这些设备中具有非常非常好的远程计算机。
JB:投资保护也变得很有趣,因为在这里讨论的那样,NVIDIA每年都会与新的GPU一起发行,并且企业可以随着每个新的加速器的跟上所需的速度而变化。
马丁·隆德:我们的许多客户希望解决方案运行七到十年,因此,满足未来需求并遵守这些要求和支持的能力非常重要。这是一个关键优势。还有其他供应商会声称它们可以编程,因为您使用软件来改变行为,但这不是我们所说的可编程。我们的意思是实际上是在芯片中运行的代码。他们称其为可编程的其他一些供应商的方法是,它更可配置,称为桌子驱动,意思是,是的,您可以更改配置,但是您可以改变性质或个性。我们可以改变这些设备的个性。
JB:在Chatgpt出来后的头两年中,这实际上是关于培训的。总会有培训,但是现在更加重视推断。对于像思科这样的公司和硅One,这意味着什么?
马丁·隆德:我想到的是培训是培训。就像,您上学,您学到了一些东西。推论是当您离开学校而实际上是工作的时候。比在学校上学的孩子要多得多的工人要多得多,他们将做富有成效的工作。除了模型性能,幻觉和所有其他内容外,AI作为一种工具限制了AI的适用性。最后,它归结为运行机器的成本。优点的数字是每一句成本。它的费用或pico Cents或任何分数的价格为多少美分,我该完成多快?每个令牌有多少个吞吐量和美元?每百万个令牌可能是考虑它的另一种方式。
但是,随着所有硅的集成,优化和β模型,每个令牌的价格都在下降 - 这意味着要大大增加工作量的工作量。还有其他方面,因为随着模型的变化以改善它们,它们将运行相同的问题,也许不是一次,它们会通过同一循环进行二次运行。您要做更多的循环。您进行增强学习。这增加了更多的力量。培训很重要,仍然很重要。庞大的数据中心需要培训。但是生产性工作是您实际创造价值的地方,这将无处不在。它会在云中。它将在私人数据中心。它将处于边缘。它在电话上。这个机会是巨大的。
JB:就硅树脂而言,这是否会改变您如何看待需要做什么?
马丁·隆德:确实如此。这几乎就像我们拥有的瀑布模型。我们在高标准空间上推动边缘,并尽可能快地走。这就是我们参加的比赛,就像跑步机一样。继续前进。然后,我们采用了其中一些技术,然后将它们缩小。我们这里有的芯片是51.2 tb/sec。对于某些企业来说,这可能是过分的。他们仍然需要相同的技术,但这太多了。他们不需要。它会有一些版本,但是它们可以冷却它,因此我们有一个版本的大小是大小或四分之一尺寸的一半。我们使它变得更小,因此更合适。我们仍然有点将其推入边境,然后将其倒下。这瀑布大概是一年后的一年。不久。
JB:因此,我们可以期望您有一两年的一两年,您将拥有不同的版本来解决不同公司所需的不同工作量或至少尺寸?
ML:是的,随着时间表,您可能会对从那里开始的时间更加乐观。
JB:这里提出的问题之一是,鉴于您能够与硅One做的事情,无论您是娱乐性的想法,无论是娱乐性的想法而扩展到包括GPU还是类似的东西。
马丁·隆德:硅One建筑是一个思科硅的建筑。这是一个切换体系结构。我们还有其他自定义硅,就像NIC一样。我们还有其他技术,我们还建立了其他ASIC。我们可能不会称其为硅,因为那是一种开关。也许我们称它为硅二?我不知道。就加速器而言,这很难。成为加速器不是我们的核心业务。我们也不做自己的服务器芯片。我们从合作伙伴那里得到他们。
真正的问题是,在计算市场中,GPU是主力军。有可能在某些应用程序中不合适,并且需要另一个专业解决方案,但是现在我想说我们非常专注于我们的业务。这是我们在网络和安全性方面拥有的足够大的游泳车道,我们在那里有良好的合作伙伴和良好的解决方案,这也是一个非常非常快速的空间。我们是否有能力建造芯片开发绝对边界的大型复杂芯片?是的,我们这样做。那可能是鲜为人知的秘密之一。
JB:在节目中,人们谈论了很多关于切换的思科和硅。从芯片的角度来看,这对您意味着什么?
马丁·隆德:网络安全的空间以及如何为其添加价值是巨大的。我们可以与安全建筑师一起创新的地方等等,其中很多是加速。许多安全性是基于抽样的,因为您可以跟上所有安全性。但是,如果可以的话,如果您有硅加速器驱动它,也许可以在硬件中进行操作,并且可以在芯片上进行分析,或者可以在芯片上进行分析的一部分并下载。
如果您听到了思科总裁兼首席产品官Jeetu Patel的评论,他说这就是将数据蒸馏而来,因为有太多的数据。您可以通过对其进行采样来提炼它,也可以通过对其进行计算并在芯片上进行分析,然后发送蒸馏信息来提炼它。此外,我们在提供MACSEC和IPSEC加速度等的设备中还具有加密和其他功能。
您可以使用软件做任何事情,对吗?您只能做得足够快。您没有足够的服务器来执行此操作,因此硅是一种加速。我有一种经验法则,这可能仍然是正确的:在晶体管中,在硅中进行优化的事情要快一千到一千倍,而定制的硅则比在通用CPU上运行它。通常,通常的速度和功率在同一曲线上 - 您走得更快,您可以以相同的性能和更低的功率进行。我们这里拥有的手机是一个很好的例子。其中有GPU,所有这些东西,但它们仍然具有低功率。
JB:AI有趣的一件事是创新速度。同样,从硅的角度来看,当您看着想要与芯片一起去的地方时,这意味着什么?涉及猜测吗?
马丁·隆德:猜测通常不是我们在芯片制作中使用的。我们恰恰相反。我们喜欢狂热,每个晶体管都必须工作,否则芯片是可以的。但是我们必须下注,我们必须下注某些事情会成真。我们说,尽管他们今天不在这里,但是两年后,他们会。我们下注。
很少有人真正了解在整个堆栈模型,计算软件,加速器,网络中的移动速度。在网络堆栈中,您有光学元件,有这些芯片,从电源管理角度来看,硬件系统将组合在一起。整个过程都以闪电速度移动。这是非常令人兴奋的,但是会有一些团队或公司偏离斜坡,对不起,他们不再存在了。
您没有考虑一下,但是您要构建其中之一,而您的公司取决于它,并且犯了一个可怕的错误,所以现在您必须再次做。下次,您会看到这件事是一年或一年半之后。您的比赛已经结束了比赛。也许这就是我真的很喜欢这种可编程性的原因,因为如果有问题,我可以解决问题。但是很多事情都很难。这很困难,我们重新推动了物理学的范围,还有很多创新的空间。也有错误的空间,但我认为这使它变得有趣。
注册我们的新闻通讯
直接从我们到您的收件箱中,介绍了一周的亮点,分析和故事,两者之间一无所有。
立即订阅