Google向所有人开放了最强大的AI模型，这是其虚拟代理推动的下一阶段

作者：Hayden Field,Jennifer Elias

视觉中国集团|盖蒂图像

谷歌周三，所有人都发布了Gemini 2.0的“最有能力”的人工智能模型套件。

在12月，该公司给予访问对于开发人员和受信任的测试人员，并将某些功能包装到Google产品中，但这是一个“一般版本”。

型号套件包括2.0 Flash，该闪光灯被称为“用于大容量的高频率，高频任务的最佳型号”，以及2.0 pro实验用于编码性能，以及2.0 Flash-lite，该公司是公司的。称其“迄今为止最具成本效益的模型”。

Gemini Flash为开发人员的文本，图像和视频输入为每百万个令牌10美分，而Flash-Lite（其更具成本效益的版本）的价格为0.75美分。令牌是指模型处理的每个数据单元。

持续的发行版是Google大量投资AI代理商的更广泛策略的一部分，因为AI军备竞赛在科技巨头和初创企业中都加剧了。

元，亚马逊，微软OpenAI和Anthropic也正在朝着代理AI迈进，或者可以代表用户完成复杂的多步骤任务的模型，而不是用户不得不将其浏览每个单独的步骤。

阅读更多有关AI的CNBC报告

Google在12月的一个12月上写道：“在过去的一年中，我们一直在投资开发更多的代理模型，这意味着他们可以更多地了解周围的世界，思考未来的多个步骤，并在您的监督下代表您采取行动。”博客文章，补充说Gemini 2.0具有“多模式的新进步”，例如本地图像和音频输出和本机工具的使用”，并且模型家族将使我们能够建立新的AI代理，使我们更接近我们通用助手的愿景。”

人类亚马逊由前奥运会研究高管创立的后面的AI初创公司是开发AI代理商的主要竞争对手。十月，人类说它的AI代理能够使用像人类这样的计算机来完成复杂的任务。这家初创公司说，Anthropic的计算机使用功能使其技术可以解释计算机屏幕上的内容，选择按钮，输入文本，导航网站并通过任何软件和实时Internet浏览执行任务。

人类首席科学官贾里德·卡普兰（Jared Kaplan）当时在接受采访时告诉CNBC，该工具“可以使用基本相同的方式使用计算机”。他说，它可以通过“数十个甚至数百个步骤”来完成任务。

Openai发布了Aâ 类似功能最近称为操作员，该操作员将自动化任务，例如计划假期，填写表格，进行餐厅预订和订购杂货。。微软 - 后面的启动将操作员描述为“可以转到网络为您执行任务的代理。”

本周早些时候，Openai引入了深入的研究，这使AI代理可以编译复杂的研究报告并分析用户选择的问题和主题。Google在12月推出了同名的类似工具 - 深入研究，该工具是“研究助理，探索复杂的主题并代表您编译报告”。

CNBC首次报道在十二月Google将在2025年初引入多个AI功能。

首席执行官Sundar Pichai在当时的策略会议上说：“历史上，您并不总是需要第一个，但您必须很好地执行良好的产品，并且确实是产品上最好的产品。”“我认为这就是2025年的全部目的。”

OC

Google向所有人开放了最强大的AI模型，这是其虚拟代理推动的下一阶段

阅读更多有关AI的CNBC报告

不要错过CNBC Pro的这些见解

关于《Google向所有人开放了最强大的AI模型，这是其虚拟代理推动的下一阶段》的评论

发表评论

摘要

相关新闻

相关讨论