Inception 融资 5000 万美元,用于构建代码和文本的扩散模型 |TechCrunch

2025-11-06 13:00:00 英文原文

作者:Russell Brandom

随着大量资金涌入人工智能初创公司,现在正是成为一名有想法进行测试的人工智能研究人员的好时机。如果这个想法足够新颖,那么作为一家独立公司而不是在大型实验室内获得所需的资源可能会更容易。

这就是故事盗梦空间,一家开发基于扩散的人工智能模型的初创公司刚刚筹集了 5000 万美元的种子资金。该轮融资由 Menlo Ventures 领投,Mayfield、Innovation Endeavors、微软 M12 基金、Snowflake Ventures、Databricks Investment 和 Nvidia 风险投资部门 NVentures 参与。Andrew Ng 和 Andrej Karpathy 提供了额外的天使资金。

该项目的领导者是斯坦福大学教授 Stefano Ermon,他的研究重点是扩散模型,该模型通过迭代细化而不是逐字生成输出。这些模型为基于图像的 AI 系统提供支持,例如 Stable Diffusion、Midjourney 和 Sora。Ermon 在人工智能热潮让这些系统变得令人兴奋之前就开始研究这些系统,他正在使用 Inception 将相同的模型应用到更广泛的任务中。

在获得这笔资金的同时,该公司还发布了新版本的 Mercury 模型,专为软件开发而设计。Mercury 已集成到许多开发工具中,包括 ProxyAI、Buildglare 和 Kilo Code。最重要的是,Ermon 表示,扩散方法将帮助 Inception 模型节省两个最重要的指标:延迟(响应时间)和计算成本。

“这些基于扩散的法学硕士比其他人现在建立的法学硕士要快得多,效率也高得多,”埃尔蒙说。“这只是一种完全不同的方法,仍然可以带来很多创新。”

了解技术差异需要一些背景知识。扩散模型在结构上与自回归模型不同,后者主导基于文本的人工智能服务。GPT-5 和 Gemini 等自回归模型按顺序工作,根据之前处理的材料预测每个下一个单词或单词片段。经过图像生成训练的扩散模型采用更全面的方法,逐步修改响应的整体结构,直到它匹配所需的结果。

传统观点是在文本应用中使用自回归模型,这种方法在最近几代人工智能模型中取得了巨大成功。但越来越多的研究表明,当模型被处理大量文本管理数据约束。正如 Ermon 所说,在大型代码库上执行操作时,这些品质成为真正的优势。

Techcrunch 活动

旧金山 | 2026年10月13-15日

扩散模型在如何利用硬件方面也具有更大的灵活性,随着人工智能的基础设施需求变得清晰,这是一个特别重要的优势。自回归模型必须一个接一个地执行操作,而扩散模型可以同时处理许多操作,从而显着降低复杂任务中的延迟。

“我们的基准测试速度超过每秒 1,000 个令牌,这远远高于使用现有自回归技术所能达到的速度,”Ermon 说,“因为我们的东西是并行构建的。它的速度非常非常快。”

Russell Brandom 自 2012 年以来一直关注科技行业,重点关注平台政策和新兴技术。他此前曾在 The Verge 和 Rest of World 工作,并为《Wired》、《Awl》和《麻省理工学院技术评论》撰稿。您可以通过 russell.brandom@techcrunch.com 或拨打 Signal 电话 412-401-5489 联系他。

关于《Inception 融资 5000 万美元,用于构建代码和文本的扩散模型 |TechCrunch》的评论


暂无评论

发表评论

摘要

Inception 是一家专注于基于扩散模型的人工智能初创公司,已筹集 5000 万美元种子资金,由 Menlo Ventures 等领投。该公司由斯坦福大学教授斯特凡诺·埃尔蒙 (Stefano Ermon) 领导,他的研究包括开发这些模型以实现图像生成之外的更广泛应用。Inception 最近发布了 Mercury,这是一种软件开发模型,旨在通过扩散方法减少延迟和计算成本,在有效处理大型文本数据集和复杂任务方面比传统的自回归模型具有显着优势。