Replicate 正在加入 Cloudflare

2025-11-17 14:00:45 英文原文

作者:Rita KozlovBen Firshman

2025-11-17

5 分钟阅读

今天我们有一些重大消息要分享:运行 AI 模型的领先平台 Replicate 即将加入 Cloudflare。

我们首先开始与 Replicate 交谈,是因为除了对明亮调色板的热情之外,我们还有很多共同点。我们对 Cloudflare Workers 开发者平台的使命是尽可能轻松地构建和部署全栈应用程序。与此同时,Replicate 也肩负着类似的使命,让部署人工智能模型就像编写一行代码一样简单。我们意识到,通过将 Replicate 平台直接集成到 Cloudflare 中,我们可以共同构建更好的东西。

我们很高兴分享这一消息,更兴奋的是这对客户意味着什么。将 Replicate 工具引入 Cloudflare 将继续使我们的开发者平台成为互联网上构建和部署任何 AI 或代理工作流程的最佳场所。

这对你来说意味着什么? 

在我们花更多时间讨论 AI 的未来之前,我们想回答 Replicate 和 Cloudflare 用户最关心的问题。简而言之:�  

对于现有复制用户:您的 API 和工作流程将继续运行而不会中断。您很快将受益于 Cloudflare 全球网络的更高性能和可靠性。

对于现有 Workers AI 用户:准备好迎接模型目录的大规模扩展以及直接在 Workers AI 上运行微调和自定义模型的新功能。

现在——让我们回到为什么我们对我们共同的未来如此兴奋。

人工智能革命不是通过电视转播的,而是从开源开始的

在人工智能出现之前,人工智能的主题是每个几十年来,它一直被称为“机器学习”。这是一个专门的、几乎是学术性的领域。进展稳定但孤立,突破发生在一些资金充足的大型研究实验室内。这些模型是单一的,数据是专有的,并且大多数开发人员无法访问这些工具。当开源协作文化(构建现代互联网的同一力量)与机器学习发生冲突时,一切都发生了变化,研究人员和公司不仅开始发布他们的论文,还开始发布他们的模型权重和代码。

这引发了令人难以置信的创新爆炸。过去几年的变化速度是惊人的。18 个月前(或者有时感觉就像几天前)的最新技术现在已成为基线。这种加速在生成人工智能中最为明显。 

我们从不可思议、模糊的好奇心转变为逼真的图像生成,感觉就像眨眼之间。像稳定扩散这样的开源模型为开发人员释放了直接的创造力,而这仅仅是开始。如果您今天查看 Replicate 的模型目录,您会看到数千个几乎每种风格的图像模型,每个模型都在前一个模型的基础上进行迭代。 

这种情况不仅发生在图像模型上,还发生在视频、音频、语言模型等等上...... 

但这种令人难以置信的、社区驱动的进步带来了巨大的实际挑战:你实际上如何这些型号?每个新模型都有不同的依赖关系,需要特定的 GPU 硬件(且足够),并且需要复杂的服务基础设施来扩展。开发人员发现自己花在处理 CUDA 驱动程序和requirements.txt 文件上的时间比实际构建应用程序的时间还要多。

这正是 Replicate 解决的问题。他们构建了一个平台,可以消除所有复杂性(使用他们的开源工具齿轮将模型打包到标准的、可重复的容器中),让任何开发人员或数据科学家都可以通过简单的 API 调用来运行最复杂的开源模型。 

如今,Replicate 的目录涵盖了 50,000 多个开源模型和微调模型。虽然开源释放了如此多的可能性,但 Replicate 的工具集超越了这一点,使开发人员能够在一个地方访问他们需要的任何模型。时期。通过他们的市场,他们还通过相同的统一 API 提供对 GPT-5 和 Claude Sonnet 等领先专有模型的无缝访问。

值得注意的是,Replicate 不仅仅构建了推理服务;还构建了推理服务。他们建造了一个社区。很多创新都是通过受到其他人正在做的事情的启发、迭代并使其变得更好而发生的。Replicate 已成为开发人员在公共游乐场中发现、共享、微调和试验最新模型的权威中心。 

强强联手:AI 目录与 AI 云相遇

回到 Workers Platform 的使命:我们的目标一直是让开发人员能够构建全栈应用程序,而不必增加基础设施的负担。虽然这一点没有改变,但人工智能已经改变了应用程序的要求。

开发人员正在构建的应用程序类型正在发生变化——三年前,没有人构建代理或创建人工智能生成的发布视频。今天他们是。因此,他们对云的需求和期望,或者人工智能云,也发生了变化。

为了满足开发人员的需求,Cloudflare 一直在构建 AI 云的基础支柱,旨在在靠近用户的边缘运行推理。这不仅仅是一个产品,而是一整套产品:

  • 工人人工智能:我们的全球网络上的无服务器 GPU 推理。

  • 人工智能网关:用于缓存、速率限制和观察任何 AI API 的控制平面。

  • 数据栈:包括Vectorize(我们的矢量数据库)和R2(用于模型和数据存储)。

  • 编排:AI 搜索(以前称为 Autorag)、代理和工作流程等工具可用于构建复杂的多步骤应用程序。

  • 基金会:所有这些都建立在我们的核心开发人员平台上,包括 Workers、Durable Objects 以及我们堆栈的其余部分。

正如我们一直在帮助开发人员扩展他们的应用程序一样,Replicate 也肩负着类似的使命——让部署 AI 模型像部署代码一样简单。这就是一切的结合点。Replicate 带来了业界规模最大、最具活力的项目之一模型目录和开发者社区。Cloudflare 带来了令人难以置信的性能全球网络和无服务器推理平台。我们可以共同提供两全其美的服务:最全面的模型选择,可在快速、可靠且经济实惠的推理平台上运行。

共享模型、发布微调、收集星星以及在操场上进行实验的能力是 Replicate 社区的核心。我们将继续投资并将其发展为人工智能发现和实验的首要目的地,现在Cloudflare 的全球网络提供强大支持为每个人提供更快、响应更灵敏的体验。

推理的未来:一个平台,所有模型

我们的愿景是将两个平台的优点结合在一起。我们将把整个 Replicate 目录(所有 50,000 多个模型和微调)引入 Workers AI。这为您提供了终极选择:在 Replicate 的灵活环境或 Cloudflare 的无服务器平台上运行模型,全部从一个地方进行。

但我们不仅仅是扩大目录。我们很高兴地宣布,我们将在 Replicate 深厚的专业知识的支持下,为 Workers AI 带来微调功能。我们还使 Workers AI 比以往更加灵活。很快,您将能够带来您自己的定制模型到我们的网络。我们将利用 Replicate 的专业知识齿轮使这个过程无缝、可重复且简单。

人工智能云:不仅仅是推理

运行模型只是难题的一小部分。当您将人工智能连接到整个应用程序时,真正的魔力就会发生。想象一下,当 Replicate 的庞大目录与整个 Cloudflare 开发者平台深度集成时,您可以构建什么:运行模型并将结果直接存储在R2矢量化;触发推断工人或队列;使用耐用的物体管理人工智能代理的状态;或者使用以下命令构建实时生成 UI网络RTC和 WebSocket。

为了管理这一切,我们将把我们的统一推理平台与人工智能网关,为您提供单一控制平面,用于跨领域的可观察性、及时管理、A/B 测试和成本分析全部您的模型,无论它们是在 Cloudflare、Replicate 还是任何其他提供商上运行。

我们非常高兴地欢迎 Replicate 团队加入 Cloudflare。他们对开发者社区的热情以及在人工智能生态系统中的专业知识是无与伦比的。我们迫不及待地想要共同建设人工智能的未来。

Cloudflare 的连接云保护整个企业网络,帮助客户构建高效的互联网规模应用,加速任何网站或互联网应用程序,抵御 DDoS 攻击, 保持黑客陷入困境,并且可以帮助您您的零信任之旅

参观1.1.1.1从任何设备开始使用我们的免费应用程序,让您的互联网更快、更安全。

要详细了解我们帮助建立更好的互联网的使命,从这里开始。如果您正在寻找新的职业方向,请查看我们的空缺职位

收购开发者平台开发商人工智能

关于《Replicate 正在加入 Cloudflare》的评论


暂无评论

发表评论

摘要

用于运行 AI 模型的领先平台 Replicate 即将加入 Cloudflare。此次集成旨在通过利用 Replicate 的广泛模型目录以及 Cloudflare 的全球网络和无服务器推理平台,使部署和构建具有 AI 模型的全栈应用程序变得更加容易。这两个平台的现有用户将受益于改进的性能和可靠性,而不会造成中断。此次合作还将引入 Workers AI 的微调功能,使开发人员能够在集成平台上无缝运行自定义模型。