谷歌最新的人工智能模型还有很多工作要做。喜欢其他所有公司在人工智能竞赛中,谷歌正在疯狂地将人工智能构建到其拥有的几乎所有产品中,试图构建其他开发人员想要使用的产品,并竞相建立所有基础设施,使这些事情成为可能,同时又不至于让公司陷入困境。商业。与此同时,亚马逊、微软、Anthropic 和 OpenAI倾注自己的数十亿陷入几乎完全相同的一组问题。
这也许可以解释为什么谷歌 DeepMind 首席执行官兼公司所有人工智能工作的负责人 Demis Hassabis 对新的 Gemini 2.0 模型的全面性如此兴奋。谷歌正在发布 Gemini 2.0周三,大约在公司成立10个月后首次推出1.5。它仍处于 Google 所谓的“实验性预览版”中,并且仅发布了该模型的一个版本,即较小的低端 2.0 Flash。但哈萨比斯说这仍然是一个重要的日子。
“实际上,”哈萨比斯说,“它和当前的 Pro 型号一样好。”因此,您可以将其视为一个更好的整体层,以获得相同的成本效率、性能效率和速度。我们对此感到非常满意。它不仅可以更好地完成 Gemini 可以做的旧事情,而且还可以做新事情。Gemini 2.0 现在可以原生生成音频和图像,并带来新的多模式功能,哈萨比斯表示,这些功能为人工智能的下一个重大事件:代理奠定了基础。
正如大家所说,代理人工智能是指能够真正代表你完成任务的人工智能机器人。谷歌一直在演示一个项目 Astra,从今年春天开始– 它是一个视觉系统,可以识别物体,帮助您探索世界,并告诉您眼镜落在哪里。Hassabis 表示,Gemini 2.0 代表了 Astra 的巨大进步。
谷歌是还启动了水手计划,一个实验性的新 Chrome 扩展程序,可以完全为您使用您的网络浏览器。还有朱尔斯,一个专门帮助开发人员查找和修复错误代码的代理,以及一个基于 Gemini 2.0 的新代理,可以查看您的屏幕并为您提供帮助更好地玩电子游戏。哈萨比斯将游戏代理称为“复活节彩蛋”,但也指出它是真正的多模式内置模型可以为您做的事情。
“我们确实认为 2025 年是基于代理的时代的真正开始,”哈萨比斯说,“而 Gemini 2.0 是这个时代的基础。”他小心翼翼地指出,性能并不好。这是这里唯一的升级;随着全行业模型改进速度放缓的讨论仍在继续,他表示谷歌在训练新模型时仍然看到了收益,但他对效率和速度的改进同样感到兴奋。
Google 的 Gemini 2.0 计划是在任何地方使用它
这不会让你感到震惊,但 Google 的 Gemini 2.0 计划是在任何地方都使用它。它将为 Google 搜索中的 AI Overviews 提供支持,谷歌称该搜索现已覆盖 10 亿人,并且该公司表示,由于 Gemini 2.0,搜索现在将变得更加细致和复杂。当然,它将出现在 Gemini 机器人和应用程序中,并最终将为 Workspace 和 Google 其他地方的人工智能功能提供支持。谷歌一直致力于将尽可能多的功能引入模型本身,而不是运行一堆单独的、孤立的产品,以便能够在更多地方与 Gemini 一起做更多事情。多模态、不同类型的输出、功能——目标是将所有这些都纳入基础 Gemini 模型中。“我们正在尝试建立尽可能最通用的模型,”哈萨比斯说。
哈萨比斯表示,随着人工智能代理时代的开始,既有新问题也有旧问题需要解决。旧的是永恒的,关于性能和效率以及推理成本。新的事物在很多方面都是未知的。仅举一例:这些特工自行行动会在世界上造成哪些安全风险?谷歌正在对 Mariner 和 Astra 采取一些预防措施,但哈萨比斯表示还有更多研究要做。“我们将需要新的安全解决方案,”他说,“比如在强化沙箱中进行测试。”我认为这对于测试代理来说非常重要,而不是在野外……它们会更有用,但也会存在更多风险。”
Gemini 2.0 目前可能处于实验阶段,但您已经可以通过在 Gemini Web 应用程序中选择新模型来使用它。(目前还没有关于您何时可以尝试非 Flash 模型的消息。)哈萨比斯表示,明年初,其他 Gemini 平台、谷歌生产的其他产品以及整个互联网都会推出该功能。