Jarvis 预计将于今年 12 月推出,可在整个企业中用作开发、CRM 和 ERP 等各种任务。
谷歌利用法学硕士支持的人工智能来自动化用户任务的努力与Anthropic 上周发布的计算机使用能力专家认为,随着大量工作继续通过计算机完成,一旦作为成品推出,它可能会彻底改变自动化市场。
Anthropic 的“计算机使用”能力又使开发人员能够通过 Anthropic 指导 Claude 3.5 Sonnet 应用程序编程接口,阅读和解释显示屏上的内容,键入文本,移动光标,单击按钮,以及在窗口或应用程序之间切换 - 就像今天一样 机器人过程自动化(RPA) 工具可以接受指导——更加费力——去做。
虽然 Jarvis 似乎针对的是消费者,但鉴于许多开发活动、工作流程和自动化管理、CRM、ERP 等都是通过基于 Web 的客户端或界面通过浏览器访问的,该技术也可以在整个企业中使用。一个
事实上,如果 Django Web 框架的共同创建者 Simon Willison 可信的话,Google 可能比 Anthropic 更早地揭示了根据屏幕截图或图像确定坐标的能力。
然而,当谈到在基于人工智能的代理和法学硕士的帮助下控制计算机时,Anthropic 可能是第一个将该功能与其他功能结合使用的公司,从而率先进入市场。
据报道,OpenAI 一直在致力于开发类似的功能自二月以来。
另外,在他的一领英帖子软件专家 Martin Bechard 声称 OpenAI 已经开发了一项名为 Tools 的功能,该功能遵循与 Anthropic 的计算机使用能力相同的基本原理。
微软、Meta 和苹果也参与了这一行动。
虽然微软本月早些时候展示了其 Copilot 的一项新功能 Vision,可以读取和理解图像并回答有关图像的问题,但苹果一直致力于通过其 Apple Intelligence 更新为其虚拟助手 Siri 引入自动化功能。
另一方面,Facebook 母公司 Meta 一直致力于将其法学硕士课程的规模压缩到智能手机中。今年早些时候,谷歌在 Chrome 浏览器中展示了几项基于人工智能的新功能,包括使用人工智能来比较两个选项卡之间的信息以及将相似选项卡分组在一起的表面建议的能力。
相关内容
-
谷歌欧盟投诉:微软正在惩罚使用Azure竞争对手的企业
投诉称,即使对于选择支付 400% 加价的客户,微软也拒绝提供关键升级和安全更新。
埃文·舒曼
2024 年 9 月 25 日 6分钟
谷歌 微软 云计算
-
Google 的 Gemini 获得新的 Gems 助手 Imagen 3
Gems 已在今年的 Google I/O 上预览,目前可供 Gemini Advanced、Business 和 Enterprise 用户使用。
作者:阿尼班·戈沙尔
2024 年 8 月 29 日 5分钟
生成式人工智能 谷歌
-
Alphabet 季度云收入首次超过 $10B
GCP 达到季度里程碑,公司总收入达到 85B 美元,股价下跌 5.08%。
保罗·巴克
2024 年 7 月 24 日 4分钟
谷歌 谷歌云平台
订阅我们的时事通讯
从我们的编辑直接发送到您的收件箱
请在下面输入您的电子邮件地址开始使用。