人工智能对高尔夫了解不多。或农业。或抵押贷款。或者 - 华尔街日报

2024-10-03 20:16:00 英文原文

ET

今年早些时候,PGA 巡回赛数字主管目睹了 ChatGPT 在数字上相当于双柏忌,当时聊天机器人在基本高尔夫知识方面答错了一个问题:泰格·伍兹 (Tiger Woods) 打了多少次赢得了巡回赛?

生成式人工智能基础模型可以根据来自互联网和其他来源的大量数据进行训练,但即使在高尔夫、斯科特·古特曼、巡回赛等主流主题上仍然缺乏深入、具体的知识数字和广播技术高级副总裁意识到。

数据缺失,数据泛化。古特曼说,这些事情只是引发了普遍的反应。

美巡赛并不孤单。随着人工智能项目从试点项目阶段进入运营阶段,企业用户发现许多人工智能模型开箱即用,就像新员工入职培训一样有用。

公司发现,如果有用的话,可以使用更多特定行业或特定业务的数据来增强当今的通用模型,例如 Anthropic 或 OpenAI 提供的模型。(《华尔街日报》的所有者新闻集团与 OpenAI 建立了内容许可合作伙伴关系。)

但这种增强提供了一系列选择,其中更高水平的准确性和可靠性也带来了更高的成本和复杂性研究公司 International Data Corp 的人工智能和数据部门总经理兼集团副总裁兼全球人工智能负责人 Ritu Jyoti 表示。只有公司能够完美地处理数据,这种增强才会起作用,而这可能很困难,Jyoti 说

另一个问题是多少增强足以使模型对于特定用途足够准确和可靠。包括顾问、Amazon Web Services 等云提供商和 OpenAI 等模型制造商在内的一系列公司都在提供帮助。

如何使 AI 模型转到工作

基础广泛的模型可能需要提高自己的技能才能在商业上取得成功。首席信息官可以使用一系列选项来利用公司和行业特定数据来增强模型。IDC 全球人工智能首席分析师、人工智能和数据总经理/全球副总裁 Ritu Jyoti 表示,以下是一些关键方法。

检索增强生成(RAG)

这是优化大型语言模型输出的过程,因此它在生成响应之前引用训练数据源之外的权威知识库。RAG 可以将准确性提高 20-40%。

微调

这涉及在专有数据上进一步训练大型语言模型,使其在特定任务上变得更好。这比仅仅进行快速工程和 RAG 更有效,但其成本高昂且复杂,需要财务投资以及专业的、急需的人才。

定制构建

构建专为特定业务的特定用途而设计的全新模型可以产生最准确和可靠的答案,但它也是最昂贵和最麻烦的选择。它也有风险,因为任何失误都可能降低准确性水平。

检索增强生成(RAG)

这是优化大型语言模型输出的过程,因此它引用在生成响应之前,其训练数据源之外的权威知识库。RAG 可以将准确性提高 20-40%。

微调

这涉及在专有数据上进一步训练大型语言模型,使其在特定任务上变得更好。这比仅仅进行快速工程和 RAG 更有效,但其成本高昂且复杂,需要财务投资以及专业的、急需的人才。

定制构建

构建专为特定业务的特定用途而设计的全新模型可以产生最准确和可靠的答案,但它也是最昂贵和最麻烦的选择。它还存在风险,因为任何失误都可能降低准确性。

IDC 估计,到 2028 年,全球在人工智能上的支出(包括支持人工智能的应用程序、基础设施以及相关 IT 和商业服务)将增加一倍以上,达到 632 美元

PGA 巡回赛表示,它现在正在使用一种称为检索增强生成 (RAG) 的方法,以避免未来出现任何人工智能错误。它利用 Amazon Web Services 基础设施上的 Claude,然后输入组织特定的信息,例如包含 Tours 规则的 190 页文档。这样,它可以提出查询并要求模型直接引用文档中的信息,而不是从互联网上挑选的信息。

所有输出在交付给玩家之前仍由人工审核Gutterman 说。

但制药和生物技术巨头拜耳 (Bayer) 农业部门副总裁兼数据资产和分析主管 Will McQueen 表示,RAG 方法只能带你到目前为止。

它肯定是有限的,麦奎因说。

它对于某些低风险用途来说足够有效,比如在入职过程中回答新工程师的问题,他说。然而,向农民提供有关照料农作物的建议时,风险要大得多。麦奎因说,为此,公司可能会进行微调,或者使用专有数据训练部分模型,以在响应的准确性和相关性方面取得巨大飞跃。

但微调甚至可以是乔蒂说,成本更高,需要更多专业人才,而且仍然达不到 100% 的准确率。为了提供帮助,像 OpenAI 这样的模型制造商现在为企业客户提供模型微调和定制方面的帮助。

只有当公司从头开始训练自己的模型时,当今的最高准确度才有可能实现,Jyoti说。但她说,这种方法所需的成本和人才对大多数企业来说都令人望而却步。

例如,仅定制一个小型语言模型就可能花费 50 万美元到数百万美元,Bayers McQueen 说。持续的维护又增加了一层费用。

即便如此,Rocket Companies 仍看到了这种方法的潜力,首席技术官肖恩·马尔霍特拉 (Shawn Malhotra) 表示。这家贷款巨头正在探索使用人工智能模型自动填写抵押贷款申请的部分内容。

但马尔霍特拉表示,房屋所有权的语言存在很多细微差别,基金会模型本身通常无法理解。

这不仅仅是名字和号码,他说。您担心的是:这是什么样的住宅?这是独立屋吗?马尔霍特拉说,这是一个非独立式住宅吗?

构建一个新的小型模型可以帮助人工智能理解这些细微差别。

新闻通讯注册

《华尔街日报》|CIO Journal

The Morning Download 提供 CIO Journal 团队关于业务技术的每日见解和新闻。

您可能需要举例说明何时以以下方式描述住宅,它映射到这种属性;当以不同的方式描述时,它与不同类型的属性相匹配。

公司仍在学习如何使各种方法发挥作用,并找出哪些方法适合哪种情况。

亚马逊 AWS GenAI 创新中心总监 Sri Elaprolu 表示,大多数客户都以一种或另一种方式使用 RAG。一些客户开始走微调路线,开始看到销量迅速增加。越来越多的客户正在探索预训练模型的意义。

行业特定模型也不断出现,以帮助解决一些定制复杂性。

法律科技公司Luminance 拥有一个人工智能模型,该模型在过去 10 年中针对超过 1.5 亿份法律文件进行了专门训练。Luminance 首席执行官埃莉诺·莱特博迪 (Eleanor Lightbody) 表示,在法律背景下出现问题可能会造成灾难性的后果。这就是为什么拥有刚刚接受法律合同培训的人工智能如此重要。

但 IDC 的乔蒂表示,这些狭义人工智能模型的总体供应仍然有限。目前,增强和定制的任务直接落到了公司身上。

就像 PGA 巡回赛一样,它发现 ChatGPT 偶尔会说老虎获得了 15 场 PGA 巡回赛胜利。事实上,他有 82 个。

老虎队赢得了 15 个大满贯。古特曼说,这与赢得 82 场美巡赛冠军不是一回事。我们认为我们需要开始让模型了解主要胜利和 PGA 巡回赛胜利之间的区别。

写信给 Isabelle Bousquette,邮箱为 isabelle.bousquette@wsj.com

版权所有 2024 Dow Jones Company, Inc. 保留所有权利。87990cbe856818d5eddac44c7b1cdeb8

关于《人工智能对高尔夫了解不多。或农业。或抵押贷款。或者 - 华尔街日报》的评论


暂无评论

发表评论

摘要

今年早些时候,PGA 巡回赛数字主管目睹了 ChatGPT 在数字上相当于双柏忌,当时聊天机器人在基本高尔夫知识上答错了一个问题:泰格·伍兹赢得了多少次巡回赛?生成式人工智能基础模型可以在大量数据上进行训练巡回赛数字和广播技术高级副总裁斯科特·古特曼(Scott Gutterman)意识到,尽管他们收集了来自互联网和其他来源的数据,但仍然缺乏深入、具体的知识,即使是像高尔夫这样的主流话题。《华尔街日报》的所有者新闻集团与 OpenAI 建立了内容许可合作伙伴关系。)但这种增强提供了一系列选择,其中更高水平的准确性和可靠性也带来了更高的成本和复杂性,总经理 Ritu Jyoti 表示。乔蒂表示,研究公司国际数据公司负责人工智能和数据的集团副总裁兼全球人工智能主管。只有公司对数据的处理能力无可挑剔,这种增强才有效,而这可能很困难。检索增强生成(RAG)这是优化大型语言模型输出的过程,因此它在生成响应之前引用其训练数据源之外的权威知识库。这是一个非独立式住宅吗?马尔霍特拉说,构建一个新的小型模型可以帮助人工智能理解这些细微差别。公司仍在学习如何使各种方法发挥作用,并找出哪些方法适合哪些情况。