谷歌帮助贾维斯做好应对人工智能“计算机使用”战争的准备

2024-10-28 09:54:07 英文原文

作者:by Anirban Ghoshal Senior Writer

Jarvis 预计将于今年 12 月推出,可在整个企业中用作开发、CRM 和 ERP 等各种任务。

谷歌还与 Anthropic 和 OpenAI 等公司一起参与基于人工智能的计算机使用战争,以期在 Agentic AI 驱动下的新兴但不断发展的基于人工智能的自动化市场中获得份额。

该公司正在致力于构建 Jarvis,它将允许用户在网络上自动执行研究和购物等任务。Chrome浏览器在公司的帮助下双子座2.0 大语言模型(法学硕士), 根据信息

据 The Information 援引消息人士称,Jarvis 在浏览器上控制操作和完成任务的能力将结合多种基于 LLM 的开发技术,例如阅读和理解屏幕截图、生成文本以及模拟用户交互。

谷歌利用法学硕士支持的人工智能来自动化用户任务的努力与Anthropic 上周发布的计算机使用能力专家认为,随着大量工作继续通过计算机完成,一旦作为成品推出,它可能会彻底改变自动化市场。

Anthropic 的“计算机使用”能力又使开发人员能够通过 Anthropic 指导 Claude 3.5 Sonnet 应用程序编程接口,阅读和解释显示屏上的内容,键入文本,移动光标,单击按钮,以及在窗口或应用程序之间切换 - 就像今天一样 机器人过程自动化(RPA) 工具可以接受指导——更加费力——去做。​​​​ 

虽然 Jarvis 似乎针对的是消费者,但鉴于许多开发活动、工作流程和自动化管理、CRM、ERP 等都是通过基于 Web 的客户端或界面通过浏览器访问的,该技术也可以在整个企业中使用。一个 

事实上,如果 Django Web 框架的共同创建者 Simon Willison 可信的话,Google 可能比 Anthropic 更早地揭示了根据屏幕截图或图像确定坐标的能力。

然而,当谈到在基于人工智能的代理和法学硕士的帮助下控制计算机时,A​​nthropic 可能是第一个将该功能与其他功能结合使用的公司,从而率先进入市场。

据报道,OpenAI 一直在致力于开发类似的功能自二月以来

另外,在他的一领英帖子软件专家 Martin Bechard 声称 OpenAI 已经开发了一项名为 Tools 的功能,该功能遵循与 Anthropic 的计算机使用能力相同的基本原理。

微软、Meta 和苹果也参与了这一行动。

虽然微软本月早些时候展示了其 Copilot 的一项新功能 Vision,可以读取和理解图像并回答有关图像的问题,但苹果一直致力于通过其 Apple Intelligence 更新为其虚拟助手 Siri 引入自动化功能。

另一方面,Facebook 母公司 Meta 一直致力于将其法学硕士课程的规模压缩到智能手机中。今年早些时候,谷歌在 Chrome 浏览器中展示了几项基于人工智能的新功能,包括使用人工智能来比较两个选项卡之间的信息以及将相似选项卡分组在一起的表面建议的能力。

关于《谷歌帮助贾维斯做好应对人工智能“计算机使用”战争的准备》的评论


暂无评论

发表评论