什么是双子座?关于谷歌人工智能工具你应该知道的一切 - CNET

2024-09-27 12:00:00 英文原文

双子座是什么?关于 Google 人工智能工具您应该了解的一切

Gemini 是一个免费的聊天机器人、搜索伴侣等。以下是您需要了解的有关 Google 人工智能工具的信息。

自从 ChatGPT 掀起波澜以来,科技公司就一直竞相发布其人工智能竞争对手,而谷歌也加强了与 Gemini 的人工智能游戏。

>

这一下一代模型由 Google DeepMind 于 2023 年 12 月推出,已集成到一系列 Google 产品中,包括 Google 搜索和 Workspace,甚至 Pixel 手机,使这些工具更加智能、响应更灵敏、更直观。

那么双子座是什么?它是一个大型语言模型,旨在理解和生成与人类可能编写的文本非常相似的文本。它旨在将先进的人工智能集成到日常用户交互和复杂的企业解决方案中,您可以通过网络上的 Gemini 聊天机器人或移动应用程序与 Google 的大语言模型进行交互。

Gemini 有四种型号:Ultra、Pro、Flash 和 Nano,每种都针对不同的用例而设计。一项新的突出功能是其扩展的令牌上下文窗口,它允许更扩展和连贯的响应。Gemini 1.5 Flash 现在提供 100 万个代币窗口,而 1.5 Pro 型号则将其提升到高达 200 万个。相比之下,ChatGPT 在扩展版本中的上限为 32,000 个令牌。

如果您还没有对人工智能相关的所有内容产生兴趣,并且所有这些听起来令人困惑,请继续阅读。

常见人工智能术语:大语言模型、生成式人工智能、聊天机器人、代币

随着技术的发展,新的人工智能术语不断出现。在我们深入探讨之前,让我们快速分解一下前面提到的一些关键术语。

生成式 AI(或 gen AI)是指可以根据其数据创建文本、图像甚至音乐等内容的 AI 系统。已经接受过培训。像 Gemini 这样的大语言模型是生成式人工智能的一种。他们从大量的文本和代码数据集中学习,然后利用这些知识来理解和生成类似人类的文本。

您以前可能与大语言模型进行过互动,无论是通过在线客户服务聊天机器人,还是通过ChatGPT。

这些聊天机器人使用大语言模型进行实时对话,为您提供信息并解决问题,但有时它们会错过重点并给出一些奇怪的答案。这就是所谓的人工智能幻觉。谷歌也与他们发生了很多不幸。但是,稍后会详细介绍。

标记是人工智能模型用来处理语言的文本构建块。当人工智能读取并生成文本时,它将所有内容分解成称为令牌的小块。这些可以是整个单词、单词的一部分,甚至是标点符号。例如,在“Hello, world!”这句话中AI 可能会将“Hello”和“,”视为单独的令牌。

因此,当我们谈论令牌限制(例如,前面提到的 Gemini 的百万令牌上下文窗口)时,我们讨论的是人工智能可以从对话中“记住”对话,使事情保持连贯和相关。

需要记住一件事:与任何新技术一样,Gemini 仍在开发中,人工智能实际上每天都在持续改进。

Pixel 手机和 Google 搜索上的 Gemini

那么 Gemini 如何融入您日常使用的设备中呢?首先,它内置于 Google Pixel 手机中,增强了手机的许多 AI 功能。

您可能已经使用 Pixel 来转录语音消息或生成快速电子邮件回复。这是双子座在后台发挥其魔力。它基本上可以帮助 Pixel 更快、更直观地完成工作。

Gemini 在 Google 搜索的人工智能概述中也发挥着重要作用。如果您注意到搜索顶部出现了更详细、上下文更丰富的答案,那是因为这种集成。Gemini 有助于在搜索结果中将复杂的主题分解为简短的解释。

Google 因 AI Overviews 在发布时向用户提出的一些建议而受到批评,其中包括每天吃石头和在里面涂胶水等建议披萨食谱。Google 迅速做出了反应,并对其工具进行了微调。

美国所有 13 岁及以上管理自己 Google 帐户的用户都可以访问 AI Overviews。在其他国家,例如英国、印度、墨西哥、巴西、印度尼西亚和日本,18岁及以上的用户也可以使用此功能。Google 计划继续在全球范围内扩展该功能,目标是到 2024 年底覆盖超过 10 亿用户。

现在有些人不喜欢此功能,缺点是无法禁用 AI概述。不过,我们已经介绍了一些可能对此有所帮助的解决方法。

通过新的发布修复臭名昭著的图像生成失败

当 Gemini 首次推出时,没过多久事情要横着走。谷歌因一些幻觉以及描绘历史人物和不同种族的方式而受到批评。它因展示黑人和亚裔纳粹士兵而成为头条新闻,正如你可以想象的那样,这并没有得到很好的反响。批评者指责谷歌过于努力地展现多样性,但结果却让事情变得更糟。谷歌对 Gemini 的图像生成踩下了刹车,承诺清理混乱。

8 月 28 日,在完善技术后,谷歌发布了最新版本的文本到图像工具 Imagen 3,Gemini 高级版、商业版和企业版订阅者很快即可使用。不过,由于 Google 这次采取了谨慎的态度,生成人物图像的能力仍处于搁置状态。

早些时候,8 月 13 日,Google 为 Android 设备上的高级订阅者推出了 Gemini Live,并计划在很快就会扩展到 iOS。Gemini Live 提供免提实时对话,具有 10 种新的语音选项,即使应用程序处于后台或手机被锁定时也是如此。您还可以随时暂停和恢复对话,这是一个很棒的功能。

定价和访问

Gemini 作为个人 AI 助理是免费的,提供对 1.5 Flash 模型的访问具有 32,000 个令牌的上下文窗口,非常适合长时间的来回对话。但对于更高级的功能,Gemini 有一些订阅计划:

  • Gemini Advanced 1.5 Pro 型号:每月 20 美元。
  • Gemini Business:每个用户每月 20 美元包年套餐或按月付费为 24 美元。
  • Gemini Enterprise:包年套餐中每位用户每月 30 美元,可通过 Google 销售团队定制定价。

适用于开发者和企业,Google 为其 Gemini API 模型(如 Flash 和 Pro)建立了分层定价结构。开发者可以通过 Google Cloud 的 API 服务访问它们,并将 AI 功能直接集成到应用程序中。

两种模型都提供可扩展的 AI 使用,并且根据层级和令牌长度提供定价和速率限制差异。您可以在Google官方网站上查看详细的定价。还有一个免费套餐,让您在使用有限的情况下体验一下,非常适合在投入之前进行测试。

请继续阅读 CNET 对 Gemini 的完整评论。

关于《什么是双子座?关于谷歌人工智能工具你应该知道的一切 - CNET》的评论


暂无评论

发表评论

摘要

关于 Google AI ToolGemini 您应该了解的一切:ToolGemini 是一个免费的聊天机器人、搜索伴侣等。如果您注意到搜索顶部出现了更详细、上下文更丰富的答案,那是因为这种集成。8 月 28 日,在完善技术后,谷歌发布了最新版本的文本转图像工具 Imagen 3,该工具很快将向 Gemini Advanced、Business 和 Enterprise 订阅者提供。然而,由于谷歌这次采取了谨慎的态度,生成人物图像的能力仍然被搁置。对于开发者和企业,Google 为其 Gemini API 模型(如 Flash 和 Pro)建立了分层定价结构。