作者:Charles Towers-Clark
大型语言模型如聊天GPT和克洛德尚未达到人类工人的多功能性。部分原因是人工智能依赖上传的数据作为背景。因此,AI工具主要充当副驾驶的角色,帮助用户完成特定任务,但无法自主协助。
超越副驾驶协助
上个月,人择通过其 API 发布了一个新函数 – ClaudeØ 计算机使用尽管它的标题无伤大雅,但“计算机使用”代表了主流人工智能最接近类人的机构。
Anthropic 的 Beta Computer Use 使 Claude 能够直接与软件环境和应用程序交互 - 独立导航菜单、打字、单击和执行复杂的多步骤流程。
此功能模仿机器人流程自动化 (RPA) 执行重复性任务,但它进一步模拟人类思维过程,而不仅仅是行动。与依赖预编程步骤的 RPA 系统不同,Claude 可以解释视觉输入(如屏幕截图),对其进行推理,并决定最佳的行动方案。
例如,企业可能会要求 Claude 组织 CRM 中的客户数据,将其与财务数据关联起来,然后制作个性化的 WhatsApp 消息 - 所有这些都无需人工干预。开发人员可能会要求 Claude 设置 Kubernetes 集群,并将其与正确的配置和数据集成。这些功能使得将工作委派给克劳德成为可能,就像将任务分配给初级员工一样。
然而,这也是有代价的:仅仅依靠克劳德的计算机使用可能会很慢,因为它一步步模仿人类的行为。此外,如名称中所述的“计算机使用”需要在工作时具有对计算机的独占访问权限。
多代理配置的价值
在我上个月的文章中人工智能代理:我们准备好使用做出决策的机器了吗?我探讨了人工智能代理这个有争议的问题。像计算机使用这样的工具并不能提供真正的自主性,但可以有效地模拟它,从而为业务创新创造机会。这个月,我与丹尼尔·瓦西莱夫,首席执行官关联– 一个提供人工智能代理的平台,该平台依赖于比 Anthropic 的计算机使用更深入的技术集成 – 关于这些技术的实际应用。
“代理让团队根据他们的想法而不是规模来释放他们的产出,”Vassilev 解释道。据估计,Relevance 提供的每组代理所处理的工作流程相当于通常需要五名全职员工的工作流程。这可能包括诸如潜在客户资格认证、个性化入职培训和主动客户成功推广等活动,如果没有自动化,这些任务将极其耗费资源。
虽然自动化单个工作流程是有益的,但真正的价值在于部署多个专用代理。正如企业根据专业知识组织团队一样,专为特定任务(如研究、推广或文档)而设计的人工智能代理可以通过协作来提高生产力。这些代理可以跨工作流程无缝集成,从而提高效率,无需人际摩擦或需要额外的人工监督。
副驾驶和自主代理人之间的主要区别在于执行力。自主代理与副驾驶的区别在于他们独立执行任务的能力。正如瓦西列夫所说:
“副驾驶可以让你的工作效率提高一倍,但自主代理可以让你完全委托工作,让你自己审查输出。”
例如,Relevance 使用他们自己的人工智能代理来:研究新客户注册情况,以便生成量身定制的建议,通过预先创建根据用户需求定制的工具来吸引用户,并进行个性化沟通。这些代理将人类的角色从任务执行转变为监督,从而腾出时间进行战略和创造性工作。
尽管人工智能代理具有潜力,但它也并非万无一失。Vassilev 将部署人工智能代理比作新员工入职:
– 您不会让新员工在没有监督的情况下向客户的首席执行官发送电子邮件。同样,人工智能代理需要强大的人机交互流程。
确保人工智能代理安全执行的需要依赖于设置他们可以做什么和不能做什么的护栏,并确保他们接受适当的培训 - 类似于初级员工。
尽管做出了承诺,但自主人工智能代理仍面临障碍。正如瓦西列夫指出的那样,许多自动化项目的失败不是因为技术缺陷,而是因为组织智慧的差距:
“独特的流程通常存在于主题专家的头脑中,这使得它们难以记录和自动化。”
然而,将 Anthropic 的计算机使用与多个人工智能代理相结合,开启了自动化的可能性,即使在六个月前,对于非重复性、创造性或低规模的活动来说,这也是不可想象的。
随着 Anthropic 的 Computer Use(仍处于测试阶段)和 Relevance 的 AI 代理等工具的成熟,企业用更少的资源实现更多目标的潜力将会扩大。组织将不再受到员工数量的限制,人员角色将转向监督和创新,并且可以实现雄心勃勃的目标和创新解决方案。激动人心的时刻。