作者:AuthorsKim Martineau
大型语言模型很适合处理单词,甚至代码,但它们的功能并不总是与那些会占用工作日的单调、专业的任务相匹配。
IBM 的新实验应用程序,蜜蜂人工智能建立在其开源 Bee Agent 平台之上,旨在探索专业人士如何重新获得一些时间。这是一个更大的研究项目的一部分,旨在确定如何生成式人工智能无论您的技术专业知识如何,都可以帮助加速和自动化重复任务。
该原型应用程序具有直观的聊天界面,可让您在执行任务时逐步进行操作。BeeAI 旨在以三种不同的方式使用:
您可以使用其内置代理“Bee”来执行典型的聊天机器人任务,例如搜索网络和生成内容。您还可以为 Bee 分配新角色,例如会计师或项目经理,并为您的定制代理提供定制工具,以便它可以连接到 GitHub 和 Airtable 等协作应用程序。
使用 BeeAI 的第三种方法是创建可重复使用、人工智能驱动的应用程序,以自动执行重复性任务,例如处理发票或总结会议记录。您只需复制并粘贴网络链接即可与同事共享这些个性化、省时的小部件。
“只需几句话,您就可以构建仪表板或交互式应用程序,”帮助领导 BeeAI 的 IBM Research 产品孵化经理 Maya Murad 说道。– 对于不会编码的人来说,创建动态用户界面的能力感觉非常神奇。 –
自 ChatGPT 颠覆科技行业以来的两年里,法学硕士已经从独立助理转变为代理系统旨在通过模拟人类如何推理问题并采取行动来代表用户行事。由于这个附加的软件层,这些新的法学硕士代理人可以调用外部工具和知识来源,并检查和纠正他们的工作。
BeeAI 在这一转变中应运而生,IBM 和其他科技公司一直在寻求让法学硕士与人们在工作中面临的日常任务更加相关。人们越来越认识到,语言模型不会通过输入更多数据或增加更多权重来变得更加相关,而是通过将它们与外部世界和其他法学硕士连接起来以提高准确性和多功能性。
与 IBM 的承诺一致开源软件,BeeAI 构建在可由社区检查和改进的组件之上。其中包括 IBM 和 Meta 的最先进技术花岗岩和 Llama 语言模型家族;IBM 的蜜蜂代理平台,其特点是React 风格的架构使代理能够以逐步的格式进行计划、调用工具和反映;和多克林,一个 IBM 研究工具包,用于将非结构化业务文档转换为法学硕士可以消化的格式。
只需几句话,您就可以构建仪表板或交互式应用程序。对于不会编码的人来说,创建动态用户界面的能力感觉非常神奇。
BeeAI 的组成部分共同允许技术专业知识有限的企业用户定制和部署自己的 AI 代理,并构建可与同事共享的个性化 AI 驱动的应用程序。
“我可以说,我是一名负责开源项目的产品经理,我需要一个项目仪表板来展示我的领导团队,”Murad 说道。“我可以在几秒钟内掌握它,并将这个基本公式应用于任何工作。”
BeeAI 附带了一个现成的代理 Bee,对于之前使用过 LLM 聊天机器人的人来说,它看起来很熟悉。然而,IBM 代理的与众不同之处在于它的可观察性和工具使用。
Bee 邀请用户可视化其工作时的“思考”过程,以便用户对其结果有更大的信任。问 Bee 一个问题,它会告诉你它计划如何找到答案,而不是像现在大多数 LLM 聊天机器人那样立即做出回应。如果 Bee 选择网络搜索,它会向您显示它用于搜索互联网的术语、返回的最热门结果以及它最终选择总结并提供给用户的来源。
该窗口背后是一个理性与行动协议,允许 Bee 的基础法学硕士评估流程中的每个步骤。在网络搜索示例中,如果第一批结果没有显示与其目标一致的内容,它将尝试新的搜索词。Bee 还可以访问 Python 库,使其能够将上传的 CSV 文件转换为图表以及其他高级功能。
Bee 非常适合通用任务,但有时工作需要只有专家才能提供的知识和技能。在这些情况下,范围较小的定制代理通常可以做得更好。对于这些情况,BeeAI 允许您创建具有自己角色的代理,无论是可以处理发票的会计师还是可以将客户投诉转化为 GitHub 问题的项目经理。
几秒钟内,Bee 就可以重新部署来执行这些新任务。更倾向于技术的用户可以编写 Python 代码来创建一个自定义工具,该工具可以通过 API 连接到任何系统,包括 GitHub、Airtable 或 Figma 等流行的协作应用程序,以便办公室中的其他人可以从您的代理离开的地方继续。
BeeAI 还可用于构建人工智能驱动的应用程序,无需任何编码。法学硕士既支持应用程序构建体验本身,也支持用户创建的应用程序。IBM 研究人员在看到人们反复要求代理完成一项任务后添加了应用程序构建器,而无需与聊天机器人来回协商即可更有效地处理该任务。
“想象一下,有一个会议总结工具,可以让您上传文件、选择会议格式,然后按下开始按钮,”IBM 研究院负责 BeeAI 的产品孵化总监 Kate Blair 说道。“如果这是您每隔一天执行一次的操作,那么拖放文件比在每次会议结束后在聊天机器人的提示中描述您想要的摘要应该是什么样子要快。”¤
一名律师的工作包括审查商业合同,他可以设计一个应用程序来获取上传的合同并分析常见的危险信号。负责验证发票的销售分析师可以设计一款应用程序,用于获取上传的发票并确保每张发票与订购和收到的发票相符,以防止错误或欺诈性收费。
“我们要求业务用户探索为日常工作制作自己的界面,作为尝试将一切委托给聊天机器人的替代方案,”布莱尔说。
法学硕士热潮已经过去两年了,许多人尚未以任何有意义的方式将语言模型融入到他们的工作生活中。BeeAI 的创建和推出的初衷是询问企业用户自己如何重新配置技术以提供更多价值。
IBM 研究人员将利用从 BeeAI 获得的反馈来塑造其未来。“聊天界面本质上是灵活的,并且是利用人工智能的好方法,”Blair 说。– 但这并不总是最好的方法。通过 BeeAI,我们希望更多地了解用户交互以及业务用户如何从生成式 AI 中获得更多收益。”