VAST 集成 Nvidia GPU 和 NIM 以获取 AI 见解 - Blocks

2024-10-01 17:00:00 英文原文

VAST Data 将 Nvidia GPU 硬件和 NIM 微服务软件引入其 AI 存储和数据处理中,创建了 InsightEngine 产品,提供实时和自动触发的 AI 模型数据访问和分析见解。

它已宣布与思科和 Equinix 建立合作伙伴关系,以拓宽其产品的市场路线,并建立一个 Cosmos AI 用户社区,重点构建合作伙伴和用户的生态系统,围绕使用其产品构建 AI 部署和用例交换想法。我们将在不同的报道中报道 Cisco、Equinix 和 Cosmos 新闻,并重点关注 Nvidia GPU 和 NIM 新闻。

此 VAST 和 Nvidia 公告建立在 VAST 存储服务器数据平台之上,该平台拥有以下所有基础:闪存和软件堆栈,包括数据目录、全局命名空间 (DataSpace)、非结构化数据存储、结构化数据库和 AI 流程触发数据引擎。其全闪存存储具有 DASE(分解和共享一切架构),具有基于 x86 的横向扩展控制器节点(C 节点),通过 InfiniBand 或 RoCE 链路连接到数据存储、全闪存、D 节点。200/400 Gbps 网络结构。C节点和D节点软件可以在共享的行业标准服务器中运行,D节点软件也可以在Nvidia BlueField3 DPU中运行。

现有的Nvidia合作伙伴关系已通过DGX SuperPOD认证的VAST系统。此功能已得到扩展,Nvidia GPU 现在可以成为 VAST 控制器节点:

这意味着 GPU 可以直接处理 VAST 阵列中存储的数据,而无需先将其移动到 GPU 服务器。其次,Nvidia 的 NIM 微服务软件现在在 VAST 软件环境中本地运行。NIM 提供 Gen AI Large 语言模型 (LLM) 作为优化容器。这些简化并加速了跨云、数据中心和工作站的自定义和预训练人工智能模型的部署。

Nvidia 企业人工智能副总裁 Justin Boitano 表示:将 Nvidia NIM 与 Nvidia 一起集成到 VAST InsightEngine 中可以帮助企业获得更多安全高效地访问任何规模的数据,快速将其转化为可操作的见解。

VAST 表示,其 NIM 软件使用 Nvidia GPU 支持的高级模型嵌入传入数据的语义。然后,在捕获数据后的几毫秒内,矢量和图形嵌入就会存储在 VAST 数据库中,以确保任何新文件、对象、表格或流数据*立即为高级 AI 检索和推理操作做好准备。

InsightEngine 使用 VAST DataEngine 在新数据写入系统后立即触发 Nvidia NIM 嵌入代理,从而允许从非结构化数据实时创建向量嵌入或图形关系。此类向量和图形用于 RAG(检索增强生成),其中客户专有数据用于告知 LLM 查询响应,使其更加准确且不易伪造数据关系(幻觉)。

VAST 数据库可以存储 EB 级的结构化和非结构化企业数据集以及数万亿个嵌入,并跨海量向量空间和知识图运行实时相似性搜索。

数据索引发生在数据摄取点,这该架构消除了对单独数据湖和外部 SaaS 平台的需求。数据得到安全保存和处理。VAST 表示,任何文件系统或对象存储数据更新都会与矢量数据库及其索引自动同步,提供全面、安全的数据访问管理和全局数据来源,以确保多租户环境中的数据一致性。

JeffVAST Data 联合创始人 Denworth 表示:借助嵌入 Nvidia NIM 的 VAST 数据平台独特架构,组织可以轻松地从数据中实时提取见解。通过将人工智能检索管道的所有元素统一到企业数据基础中,VAST Data InsightEngine 与 Nvidia 合作,成为业界首个为所有企业结构化和非结构化数据提供通用视图的解决方案,以实现先进的人工智能决策。

采用 Nvidia 的 VAST InsightEngine 将于 2025 年初全面推出。在此处了解更多信息。

Bootnote

*我们了解 VAST Data 即将支持块数据。

关于《VAST 集成 Nvidia GPU 和 NIM 以获取 AI 见解 - Blocks》
暂无评论

摘要

VAST Data 将 Nvidia GPU 硬件和 NIM 微服务软件引入其 AI 存储和数据处理中,创建了 InsightEngine 产品,提供实时和自动触发的 AI 模型数据访问和分析见解。VAST 表示,其 NIM 软件使用 Nvidia GPU 支持的高级模型嵌入传入数据的语义。一旦新数据写入系统,InsightEngine 使用 VAST DataEngine 触发 Nvidia NIM 嵌入代理,从而允许从非结构化数据实时创建向量嵌入或图形关系。此类向量和图形用于 RAG(检索增强生成),其中客户专有数据用于通知 LLM 查询响应,使其更加准确且不易伪造数据关系(幻觉)。VAST 数据库可以存储 EB 级的数据结构化和非结构化企业数据集和数万亿个嵌入,并跨海量向量空间和知识图运行实时相似性搜索。VAST 与 Nvidia 的 InsightEngine 将于 2025 年初全面上市。