英语轻松读发新版了,欢迎下载、更新

Google向所有人开放了最强大的AI模型,这是其虚拟代理推动的下一阶段

2025-02-05 16:00:32 英文原文

作者:Hayden Field,Jennifer Elias

视觉中国集团|盖蒂图像

谷歌周三,所有人都发布了Gemini 2.0的“最有能力”的人工智能模型套件。

在12月,该公司给予访问对于开发人员和受信任的测试人员,并将某些功能包装到Google产品中,但这是一个“一般版本”。

型号套件包括2.0 Flash,该闪光灯被称为“用于大容量的高频率,高频任务的最佳型号”,以及2.0 pro实验用于编码性能,以及2.0 Flash-lite,该公司是公司的。称其“迄今为止最具成本效益的模型”。

Gemini Flash为开发人员的文本,图像和视频输入为每百万个令牌10美分,而Flash-Lite(其更具成本效益的版本)的价格为0.75美分。令牌是指模型处理的每个数据单元。

持续的发行版是Google大量投资AI代理商的更广泛策略的一部分,因为AI军备竞赛在科技巨头和初创企业中都加剧了。

, 亚马逊,微软OpenAI和Anthropic也正在朝着代理AI迈进,或者可以代表用户完成复杂的多步骤任务的模型,而不是用户不得不将其浏览每个单独的步骤。

阅读更多有关AI的CNBC报告

Google在12月的一个12月上写道:“在过去的一年中,我们一直在投资开发更多的代理模型,这意味着他们可以更多地了解周围的世界,思考未来的多个步骤,并在您的监督下代表您采取行动。”博客文章,补充说Gemini 2.0具有“多模式的新进步”,例如本地图像和音频输出和本机工具的使用”,并且模型家族将使我们能够建立新的AI代理,使我们更接近我们通用助手的愿景。”

人类 亚马逊由前奥运会研究高管创立的后面的AI初创公司是开发AI代理商的主要竞争对手。十月,人类 它的AI代理能够使用像人类这样的计算机来完成复杂的任务。这家初创公司说,Anthropic的计算机使用功能使其技术可以解释计算机屏幕上的内容,选择按钮,输入文本,导航网站并通过任何软件和实时Internet浏览执行任务。

人类首席科学官贾里德·卡普兰(Jared Kaplan)当时在接受采访时告诉CNBC,该工具“可以使用基本相同的方式使用计算机”。他说,它可以通过“数十个甚至数百个步骤”来完成任务。

Openai发布了Aâ 类似功能最近称为操作员,该操作员将自动化任务,例如计划假期,填写表格,进行餐厅预订和订购杂货。。 微软 - 后面的启动将操作员描述为“可以转到网络为您执行任务的代理。”

本周早些时候,Openai引入了深入的研究,这使AI代理可以编译复杂的研究报告并分析用户选择的问题和主题。Google在12月推出了同名的类似工具 - 深入研究,该工具是“研究助理,探索复杂的主题并代表您编译报告”。

CNBC首次报道在十二月Google将在2025年初引入多个AI功能。

首席执行官Sundar Pichai在当时的策略会议上说:“历史上,您并不总是需要第一个,但您必须很好地执行良好的产品,并且确实是产品上最好的产品。”“我认为这就是2025年的全部目的。”

不要错过CNBC Pro的这些见解

关于《Google向所有人开放了最强大的AI模型,这是其虚拟代理推动的下一阶段》的评论


暂无评论

发表评论

摘要

Google已发布了Gemini 2.0,这是其最先进的AI模型套件,可供所有人使用。该版本包括用于大量大量任务的Flash型号,用于编码性能的PRO实验,而Flash-lite是最具成本效益的选项,与Flash的10美分相比,以0.75美分的价格为0.75美分。此举是Google在AI军备竞赛中战略的一部分,重点是开发能够自主进行复杂多步骤任务的代理AI。诸如Anthropic和Openai之类的竞争对手也在提高类似的功能,强调自动化和与技术类似人类的互动。