作者:Dr. Marcel Müller
许多组织最常见的幻灭如下:他们对 ChatGPT 或 Microsoft Co-Pilot 的生成式 AI 感到兴奋,阅读一些有关 AI 如何“以某种方式让您的业务变得更好”的文章,然后尝试找到其他可以使用聊天机器人的用例,但最终当结果不是非常令人满意时会感到失望。然后,论证阶段就到来了。我经常听到诸如“模型不够好”或“我们需要提高人们的技能以编写更好的提示”之类的话。
在 90% 的情况下,这些都不是正确的结论,而是来自我们在聊天机器人中思考的问题。我已经为三人组织到拥有超过三十万名员工的跨国企业开发了三打生成式人工智能应用程序,而且我随处可见这种模式。
有成千上万的公司告诉您,您需要拥有“某种聊天机器人解决方案”,因为每个人都这样做。OpenAI 与 ChatGPT、Microsoft Copilot、Google 与 Gemini 以及所有其他向您销售聊天机器人的公司都在打破创建聊天机器人的初始障碍方面做得很好。但让我告诉你:使用生成式人工智能解决的真正痛苦的问题中,75% 并不能从成为聊天机器人中受益。
我经常看到经理、项目总监或其他决策者从这样的想法开始:—我们这里有一些带有人工智能的产品,可以让我们构建聊天机器人——让我们找到尽可能多的地方来实现它。Ø根据我的经验,这是错误的方法,因为您是从解决方案开始并尝试将现有问题融入其中。正确的方法是研究问题、分析问题并找到合适的人工智能解决方案。对于某些用例来说,聊天机器人可能是一个很好的界面,但将每个问题都强行交给聊天机器人是有问题的。
在本文中,我将分享我通过构建无数应用程序的实践经验开发的见解和方法。这些应用程序现已投入生产并为成千上万的用户提供服务,它们塑造了我关于构建有影响力的生成式人工智能解决方案的想法,而不是盲目追随趋势,如果不起作用就感到失望。
我告诉你不要从聊天机器人开始思考,那么你应该从哪里开始呢?答案很简单:业务流程。
公司内部发生的一切都是一个业务流程。业务流程是连接到工作流 [1] 的不同活动(“工作单元”)、事件(例如错误)和网关(例如决策)的组合。有一些以众所周知的图表形式对业务流程进行建模的工具 [2],以及以分析和改进业务流程为中心的整个研究学科 [3][4][5]。业务流程管理是一个很好的工具,因为它不是理论性的,而是在公司中随处使用——尽管他们不知道如何称呼它。
让我举个例子。想象一下,您是一家为银行进行房地产估值的公司。在银行发放抵押贷款之前,他们会要求房地产估价师估算该物品的价值,以便他们知道,如果无法偿还抵押贷款,他们可以掌握实际价格。
创建房地产评估报告是一个大型业务流程,我们可以将其分解为多个子流程。通常,估价师会亲自开车到房子,拍照,然后坐在那里写一份 20-30 页的报告来描述他们的估价。让我们暂时不要陷入“呃,一份 20-30 页的报告,让我坐在 ChatGPT 前面,我可能会更快”的习惯。请记住:首先是流程,然后是解决方案。
我们可以将这个过程分解为更小的子过程,例如开车到房子,拍照,然后编写报告的不同部分:房子的位置描述,描述不同房间的条件和大小。当我们深入研究单个流程时,我们将看到所涉及的任务、网关和事件。例如,为了编写位置描述,房地产估价师坐在办公桌前,进行一些研究,在 Google 地图上查看周围有哪些商店,并查看城市的交通地图,以确定房屋的连接程度以及街道的样子。这些都是个案工作者必须做的活动(或任务)。如果房屋是一个偏僻的农场,那么公共交通选择可能无关紧要,因为此类房屋的买家通常都依赖汽车。关于流程中走哪条路径的决定称为网关。
我们在这里应用的这种流程驱动的思维方式首先是在引入任何人工智能之前评估当前流程。
通过对我们的流程和目标的分析,我们现在可以开始研究人工智能流程应该是什么样子。考虑我们需要采取的各个步骤很重要。如果我们只关注创建描述的子流程,可能如下所示:
是的,您可以通过聊天机器人以交互方式做到这一点,在聊天机器人中您可以与“人工智能陪练伙伴”一起工作,直到获得输出。但这给公司带来了三个主要问题:
这些问题来自于聊天机器人背后的法学硕士所拥有的核心基础。
企业应用程序不应依赖于“即时响应”交互周期,而应设计为一系列精心策划的、(部分)人工智能驱动的流程步骤,每个步骤都针对一个特定目标。例如,用户可以触发一个多步骤流程,集成各种模型和潜在的多模式输入,以提供更有效的结果,并将这些步骤与不使用人工智能检索数据的小脚本结合起来。通过合并检索增强生成 (RAG) 并最大限度地减少人为干预,可以创建更强大的自动化工作流程。
与通过交互式界面进行手动编排相比,这种编排方法可显着提高效率。此外,并非该过程中的每一步都应该完全依赖人工智能模型来完成。在上面的示例中,我们实际上发现使用 Google Maps API 获取附近的车站和公交站是远的就质量而言,比要求像 GPT-4o 这样的好的法学硕士,甚至比像 Perplexity 这样的网络搜索 RAG 引擎还要好。
让我们想一下没有人工智能的时代。手动流程可能会花费大量时间。假设一项任务需要手动完成一小时,并且该过程重复四次,总共需要四个小时。使用由生成式 AI 提供支持的聊天机器人解决方案可以节省 50%(或任何百分比)的时间。然而,剩下的时间都花在制定提示、等待响应以及通过修正和调整来确保输出质量上。就这么好了吗?
对于重复性任务,尽管节省了时间,但在多个员工执行相同流程的组织中,需要制定提示、等待和调整输出以实现一致性,这可能会出现问题。为了解决这个问题,利用流程模板变得至关重要。
通过模板,流程被通用化和参数化以可重用。创建高质量流程模板的工作只需进行一次,而个别案例的执行效率则显着提高。用于快速创建、质量保证和输出调整的时间大大减少。将基于聊天机器人的解决方案与使用模板的人工智能支持的流程编排进行比较时,这是核心区别。而这种核心差异对质量和再现性有着巨大的影响。
此外,我们现在有一个狭窄的领域可以测试和验证我们的解决方案。在用户可以插入的聊天机器人中任何事物,测试并寻找信心 在一个可量化的路很难。我们定义和限制用户可以插入的可能参数和文件越多,我们就越能定量地验证解决方案。
在人工智能支持的流程中使用模板反映了传统流程管理中业务流程引擎的原则。当出现新案例时,这些引擎利用模板存储库并选择相应的模板进行编排。对于编排,然后填充输入参数。
在我们的房地产评估过程示例中,我们的模板具有三个输入:对象类型(单户住宅)、内部图片集合和地址。
流程模板如下所示:
在我们的示例用例中,我们使用带有内置无代码构建器的 entAIngine 平台实现了应用程序。
请注意,在此过程中,4 个步骤中只有 1 个使用大型语言模型。那是件好事!因为 Google 地图 API 永远不会产生幻觉。是的,它可能有过时的数据,但它永远不会——只是编造一些听起来可能是现实的东西。”其次,我们可以对循环中的人员进行验证,因为现在我们有了真正的信息来源我们可以分析并签署。
在传统的流程管理中,模板减少了流程的可变性,确保了可重复性,并提高了效率和质量(如六西格码等方法中所见)。这也是我们在这里必须采用的心态。
现在,我们已经开始使用法学硕士的流程,但也解决了很多令人头痛的问题。但用户如何与其交互呢?
这种流程的实现可以通过手动编码所有内容或使用无代码 AI 流程引擎(如 entAIngine [6])来实现。
当使用模板对业务流程进行建模时,可以通过多种方式进行交互。根据我过去 2 年的经验,对于 90% 的生成式 AI 用例,以下接口是相关的:
Ø知识检索接口:功能类似于搜索引擎,可以引用和参考来源。
Ø文档编辑器界面:将文本处理与对模板、模型和编排的访问相结合。
Ø聊天界面:用于迭代、交互式参与。
Ø无需专用接口 (RPA) 的嵌入式编排:通过 API 集成到现有接口中。
最终的问题是,最有效的交互方式是什么?是的,对于一些创造性的用例或非重复性任务,聊天界面可以成为首选工具。但通常情况并非如此。通常,用户的核心目标是创建某种文档。然后,在编辑器界面中提供这些模板是一种非常有效的交互方式。但有时,如果您想通过 AI 增强现有应用程序,则无需创建另一个独立的界面。这里的挑战仅仅是执行正确的流程,在现有应用程序中获取输入数据,并在应用程序界面中的某处显示输出。
这里提到的这些接口构成了我迄今为止遇到的大多数生成式人工智能用例的基础,同时支持可扩展地集成到企业环境中。
通过让他们的注意力从“如何在任何地方使用人工智能聊天机器人?”转向“哪些流程执行哪些步骤以及如何在这些步骤中利用生成式人工智能?”企业为真正的人工智能奠定了基础人工智能的影响。将人工智能与现有系统相结合,然后只研究您需要的用户界面类型。通过这种方式,您可以释放那些无法超越聊天机器人思考的企业做梦也想不到的效率。
[1] Dumas 等人,《业务流程管理基础》,2018 年
[2] 对象管理组。– 业务流程模型和表示法 (BPMN) 版本 2.0.2。 – OMG 规范,2014 年 1 月
[3] van der Aalst,《流程挖掘:数据科学的实践》,2016 年
[4] 卢特拉、苏尼尔等人。– 全面质量管理 (TQM):原则、方法和应用。 – 第一版,CRC Press,2020 年。
[5] Panagacos,《业务流程管理终极指南》,2012 年
[6] www.entaingine.com