数据管理是从新一波人工智能应用程序中提供最佳价值的关键,这需要一种新的方法来建立基础设施。
在 Pure Storage,Matthew Oostveen 表示,有效地配置的存储基础设施可以提供更大的灵活性,推动更好的数据准备并避免可扩展性瓶颈,同时最大限度地减少延迟和最大化吞吐量。
Oostveen 看到了 AI 的一个机遇阶段,但优化该机遇需要就数据如何存储进行新的对话存储并交付以供处理。
我们一直过度关注 GPU 以及等式的计算端,但我认为我们忘记了 GPU 需要输入数据,而这需要专门的系统Pure Storages 首席技术官兼亚太和日本副总裁 Oostveen 表示。
您还需要专门的系统来跟上所产生的大量数据,并且为此,我们需要不同的架构。
Oostveen 表示,实施人工智能的组织发现,当进入推理阶段时,他们的平台并未适应人工智能系统的任务。
他补充道,这些现有平台利用率不高,浪费了大量的数据中心空间和电力,这对于该地区的许多组织来说是一个大问题。
以对数据和输出的信任为首要任务,许多使用大型现成语言模型的人工智能实现都达不到要求。
组织需要通过采用检索增强生成 (RAG) 方法来增强这一过程。这种方法利用了专有或特定领域的信息和专门的数据库,并补充了大型语言模型的生成能力。
因此,如果用户有输入,他们会提出一个问题,该问题将涉及某些内容Oostveen 说,它的领域非常具体。
它可能是多年来向 SEC 提交的文件,也可能是来自存储的客户交互的内部数据库,然后将它们输入到大语言模型中,大语言模型能够提供回答的精确度更高。
Matthew Oostveen 将成为 10 月 11 日 Pure Leadership 系列网络研讨会的主要小组成员:克服人工智能成本优化的双重障碍