大型语言模型难以解析 PDF 和电子表格中的数据,一家初创公司刚刚筹集了一轮巨额种子资金,以开发能够像人类一样阅读这些文档的技术。
Reducto,该技术成立于 2023 年,是 Y Combinator 2024 年冬季批次的成员,宣布在由 First Round Capital 领投的种子轮融资中筹集了 840 万美元。
Y Combinator、BoxGroup、SVAngel 和 Liquid2 也参与了本轮融资此轮融资的投资方除了天使投资人之外,还有 Dropbox 创始人 Arash Ferdowsi;Andrew Ofstad,Airtable 创始人;库维尔·塔加尔(Kulveer Taggar),宙斯的创始人;JJ Fliegelman,WayUp 创始人;WePay 的创始人 Richard Aberman 以及 PlanGrid 的创始人 Ralph Goottee 和 Tracy Young。
电子表格、jpeg 和 PDF 中包含大量数据,例如医疗保健发票、预算、或法律文件。大语言模型通常很难阅读它们。除了表格、图表、图像和图形之外,PDF 还可能包含多列文本,这些文本很难正确解析,并可能导致幻觉和输出错误。
Reducto 已在该模型上训练了多个模型文档中重要的各种视觉提示,从表示主题更改的段落之间的空格到显示嵌套层次结构的列表中的选项卡。Reducto 首席执行官 Adit Abraham 解释说,我们的目标是构建一个模仿真人视觉和阅读能力的生成式人工智能工具。
“我们刚刚完成了我们认为最先进的电子表格解析工具的构建。”,他告诉《商业内幕》。“我们所有这一切的目标是成为将人类数据与大语言模型连接起来的层。”
Reducto 向其他公司推销其技术,客户包括 Leya,这是一家使用该技术上传数据的法律科技初创公司法律文件、一家人工智能医疗保健公司、一家为美国政府机构处理文件的后期初创公司,以及一家构建人工智能和大语言模型能力的大型科技公司。Reducto 没有透露后者客户的姓名。
有许多专注于生产力的初创公司分析和回答有关 PDF 的问题,尽管其中许多是供个人而非企业使用。其中之一是 Humata AI,一年前从 Google 的 Gradient Ventures 筹集了 350 万美元,而 OpenAI 的 ChatGPT Store 展示了多名 AI PDF 开发人员。
查看 Reducto 用于筹集 840 万美元种子资金的 13 幻灯片宣传材料.