作者:Romain Dillet
表格数据是一个广义术语,它包含通常适合特定行和列的结构化数据。它可以是SQL数据库,电子表格,.csv文件,等等。
尽管应用于非结构化和顺序数据的人工智能取得了巨大进展,但这些大型语言模型(LLMS)是模糊的。它们的构建是为了操纵输入令牌以生成连贯的输出,而无需遵循固定结构。最好的LLM也可以通过API访问昂贵,或者在您自己的云基础架构上运行昂贵。
但是,许多公司已经有了数据仓库或数据湖的数据策略,以集中所有重要的数据以及一些可以利用此数据来改善公司策略的数据科学家。
法国初创公司神经ai是一家人工智能公司,一直在研究专注于表格数据的AI模型。该公司本周宣布了400万美元的资金。
``对公司的实际价值数据是很久以前确定的数据,该数据以表格的形式结构,并由这些公司的数据科学家使用来创建其所有机器学习算法,neurolk-ai联合创始人兼首席科学官亚历山大·帕斯奎乌(Alexandre Pasquiou)告诉TechCrunch。
Neurolk-AI认为有机会重新审视AI模型开发,但要特别关注结构化数据。首先,它计划为在商务公司工作的数据科学家提供其API的模型,因为这些公司爱数据 - 考虑产品目录,客户数据库,购物车趋势等。
如今,LLM非常适合搜索,自然用户交互以及基于非结构化文档回答问题。但是,当我们回到经典的机器学习的那一刻,这实际上是基于经典表格数据的局限性。”
借助神经AI,零售商可以通过智能重复数据删除和富集来自动化复杂的数据工作流程。但是他们还可以使用公司的模型来检测欺诈,优化产品建议并产生可用于库存管理和产品价格的销售预测。
Fly Ventures带领该公司的400万发股票与Steam AI也参加。几个商业天使还投资了这家初创公司,例如托马斯·沃尔夫(Thomas Wolf),来自艾伦(Alan)的查尔斯·戈林丁(Charles Gorintin),米拉克尔(Mirakl)的菲利普·科洛特(Philippe Corrot)和菲利普·柯罗特(Philippe Corrot)和纳吉·莱塔法(Nagi Letaifa)。
该团队仍在积极开展其模型。它计划与一群领先的法国零售商和商业初创公司进行测试,例如E.Leclerc,Auchan,Mirakl和Lucky Cart。
在三四个月内,我们将发布模型的第一个版本和公共基准,我们将在该模型中与该领域的最先进的模型相比,可以对我们的模型进行排名帕斯奎乌说。在9月,这个想法是成为与代表学习有关的所有事物中最好的表格基础模型。
Romain Dillet是TechCrunch的高级记者。他撰写了3,000多篇有关技术和技术初创公司的文章,并在欧洲科技界中确立了一个有影响力的声音。他在初创企业,隐私,安全,金融科技,区块链,移动,社交和媒体方面具有深厚的背景。凭借在TechCrunch的十二年经验,他是该技术出版物的熟悉面孔之一,该面孔痴迷地涵盖了硅谷和技术行业。实际上,他的职业生涯始于他21岁的时候。总部位于巴黎,许多技术生态系统中的许多人都认为他是镇上最知识渊博的技术记者。罗曼(Romain)喜欢在其他任何人面前发现重要的初创公司。他是第一个涵盖N26,Revolut和Digitalocean的人。他已经写了从苹果,微软和Snap的大量收购中撰写的勺子。当他不写作时,罗曼也是开发人员 - 他了解技术背后的技术如何运作。在过去的50年中,他还对计算机行业具有深刻的历史知识。他知道如何将创新之间的点与对我们社会结构的影响之间的影响联系起来。罗曼(Romain)毕业于埃姆利恩商学院(Emlyon Business School),这是一所领先的法国商学院,专门从事企业家精神。他帮助了几个非营利组织,例如Starther,这是一个促进技术中妇女教育和授权的组织,以及Techfugees,该组织使该组织赋予了流离失所的技术。