从 AGI 到 GPT,你能真正理解的人工智能术语 - 彭博社

2024-10-04 18:28:40 英文原文

人工智能革命术语表

人工智能的每一次进步都伴随着大量令人困惑的晦涩术语。这是区分 AGI 和 GPT 的指南。

ChatGPT 聊天机器人于 2022 年底问世,它对大量查询的回答非常复杂,但偶尔会出现错误,这是人工智能领域的一个里程碑。花了几十年才达到。早在 20 世纪 60 年代,科学家们就开始尝试计算机视觉并赋予机器阅读能力,聊天机器人在披头士乐队仍在创作音乐时就已诞生。现在,科技公司正在竞相开发更加复杂的人工智能产品,这些产品可以与用户对话、解决复杂的数学问题、制作短片,也许有一天在各种任务中超越人类。无论您担心被机器取代,还是只是对可能性感兴趣,这都是您在人工智能驱动的世界中导航所需的术语。

AGIAI 公司痴迷于通用人工智能的想法,或者通用人工智能。但他们都无法就如何定义它达成完全一致。该术语通常指的是假设的人工智能系统,它们能够在很少的人类参与的情况下完成各种复杂的任务。ChatGPT 开发商 OpenAI 更进一步,将 AGI 定义为高度自治的系统,在最具经济价值的工作中表现优于人类。但尚不清楚什么才算是高度自治的系统,或者就此而言,什么才算是具有经济价值的工作。人工智能行业的一些人认为我们将在未来十年内实现通用人工智能;其他人则认为,如果它真的发生的话,那就更遥远了。

代理如果人工智能狂热的第一年左右是由聊天机器人定义的,那么下一阶段可能会由代理定义。至少,这是许多科技公司正在做出的赌注。像 ChatGPT 这样的聊天机器人可能能够快速给出食谱或餐厅列表,但希望人工智能代理能够为你订购杂货或代表你预订餐厅。虽然这可能对个人和专业用途很有吸引力,但它也会增加人工智能出错时的风险。

算法算法是用于解决问题的逐步过程。接受输入,应用一些逻辑,然后得到输出。几个世纪以来,人类一直在使用算法来解决问题。一些金融分析师的职业生涯致力于构建能够预测未来事件并帮助他们赚钱的算法。我们的世界依靠这些传统算法运行,但最近出现了向基于这些想法的机器学习的转变。

对齐为了防止人工智能失控,业内一些人专注于解决以下问题:协调或确保技术的构建符合人类核心价值观。然而,一个问题是,并不是每个人都同意这些价值观是什么,或者人工智能系统应该做什么、不应该做什么。

人工智能这个广义术语被反复使用,以至于失去了一些意义。它的意义。然而,从高层次来看,人工智能是指模拟人类智能的技术,可以执行一系列原本需要人类来处理的任务。计算机科学家约翰·麦卡锡 (John McCarthy) 在 20 世纪 50 年代创造了人工智能一词,但直到本世纪,谷歌、Facebook 所有者 Meta Platforms Inc. 和微软公司等科技巨头将巨大的计算能力与深层用户数据池结合起来,人工智能才真正开始兴起。。虽然人工智能可以在数据处理或对话方面表现出类似人类的能力,但机器尚不理解它们在做什么或说什么。他们本质上仍然依赖于算法。

B

基准鉴于人工智能服务市场日益拥挤,科技公司通常会引用一系列基准来展示他们的软件如何超越竞争对手。但人工智能公司仍然没有独立的标准化测试来比较他们的软件的表现。一些业内人士正在尝试解决这个问题。目前,公司通常会设计自己的基准,以显示他们的服务对代数、阅读理解和编码问题的响应程度。

聊天机器人聊天机器人早于生成式人工智能的兴起,因为任何人都试图在线联系客户服务知道。但新时代的人工智能聊天机器人能够与人们就从历史琐事到新食品食谱等话题进行更动态的交流。随着 OpenAI 和 Google 等公司投资于更复杂的模型,聊天机器人可能会变得更加有用和更具对话性,也许会接近科技行业万能虚拟个人助理的长期目标。

ClaudeClaude 是真正能与 OpenAI 最先进技术的性能相媲美的少数服务之一。该聊天机器人由 Anthropic 开发,Anthropic 是一家由一群前 OpenAI 员工创立的初创公司,专注于优先考虑人工智能的安全发展。与 ChatGPT 一样,Claude 可以快速响应用户的一系列查询。但与 OpenAI 不同的是,Anthropic 迄今为止避免了某些用例,例如图像生成。这家初创公司表示,其重点是主要为商业客户构建产品。

计算机视觉是人工智能的一个领域,允许计算机扫描图像和视频等视觉信息,识别物体和人并对其进行分类。系统可以对所看到的内容做出反应,并采取或建议特定的操作。该技术正被用于追踪野生动物以进行保护和引导自动驾驶车辆。人们担心它在军事行动和警务中的使用,因为它被证明表现出种族偏见,并且缺乏可靠识别特定人员所需的精确度。

D

紧急行为As当大型语言模型达到一定规模时,它们有时会开始表现出似乎凭空出现的能力,从某种意义上说,它们既不是训练者有意也不是期望的。一些示例包括生成可执行计算机代码、讲述奇怪的故事以及从一串表情符号作为线索识别电影。

F

微调将其视为定制的一个奇特术语。通过微调,用户可以采用现有的人工智能模型,并根据有关特定任务或主题领域的附加信息对其进行训练。这可以帮助模型按照用户想要的方式执行。例如,一家销售健身器材的公司可能会选择微调人工智能模型,以更好地响应有关健身车正确维护的查询。

前沿模型前沿模型是指市场上最先进的人工智能模型。市场。目前,这些模型背后的公司包括 OpenAI、Anthropic、Google 和 Meta,所有这些公司都是前沿模型论坛组织的一部分,该论坛致力于与学者和政策制定者合作,促进尖端人工智能系统的负责任开发。开发这些尖端模型的成本预计将大幅增长,使初创公司更难与大型科技公司竞争。

G

Gemini是人工智能竞赛的早期领跑者,谷歌现在正在努力跟上 OpenAI 的步伐。谷歌的核心工作是 Gemini,这是其旗舰聊天机器人及其人工智能模型系列的名称。Gemini 最先进的版本称为 Ultra,据称能够处理复杂的编码任务和数学推理,类似于最先进版本的 OpenAI 技术。谷歌在 Gemini 中内置了多模式功能,例如,允许人工智能模型对一顿饭的图像做出反应,并提供如何制作它的食谱。

生成式人工智能这指的是作品图片、文章的制作、歌曲、海上棚屋,来自简单的问题或命令。它包括 OpenAI 的 DALL-E 和 Suno 等,前者可以在几秒钟内创建复杂而详细的图像,后者可以根据文本描述生成音乐。生成式人工智能在接受大量现有材料的训练后创造出新作品。这导致了版权所有者的一些诉讼,他们抱怨自己的作品被盗用。

GPTA 生成式预训练 Transformer 是一种大型语言模型。Transformer 是指一种可以获取输入字符串并将它们一起处理而不是单独处理的系统,以便可以捕获上下文和词序。这在语言翻译中很重要。例如:她的狗 Poppy 在厨房里吃了可以翻译成法语,相当于 Poppy 在厨房里吃了她的狗,但没有适当注意顺序、语法和含义。

Grok乍一看,人们很容易将 Grok 视为一种不认真的努力。该聊天机器人由埃隆·马斯克 (Elon Musk) 的人工智能初创公司 xAI 开发,并在其 X 微博平台上向订阅者开放,该机器人因其不敬的书面回复以及在几乎没有明确护栏的情况下吐出煽动性图像而成为头条新闻。但 xAI 已经筹集了数十亿美元,吸引了一支才华横溢的团队,并获得了 X 用户的大量数据,可用于构建其人工智能产品。结果,Grok 在极短的时间内成为了真正的竞争对手。

幻觉当像 ChatGPT 这样的人工智能服务编造出一些听起来令人信服但完全是捏造的东西时,它被称为幻觉。这是系统没有正确回答问题的结果,但仍然知道一个好的答案听起来是什么样的,并将其作为事实呈现。有人担心,人工智能在被问到某些问题时无法说“我不知道”,这将导致代价高昂的错误、危险的误解和错误信息的扩散。一些人工智能公司表示,他们已经能够通过更新的模型来提高准确性,包括让聊天机器人在响应提示之前花更多时间进行推理,但幻觉问题仍然存在。

I
J
K
L

大型语言模型这些是非常大型的神经网络,使用大量文本和数据进行训练,包括电子书、新闻文章和维基百科页面。LLM 拥有数十亿个参数可供学习,是自然语言处理的支柱,可以识别、总结、翻译、预测和生成文本。

LlamaMeta 投入巨资打造 Llama,这是一组尖端人工智能模型可供其他开发人员免费访问和构建。通过这种方法,Meta 希望 Llama 不仅能成为自己的聊天机器人 Meta AI 的基础,而且还能成为其他公司一长串产品的基础。这可能会将 Meta 和 Llama 置于人工智能生态系统的中心。

机器学习这是逐步改进算法指令集以通过将其暴露于大量数据来实现特定结果的过程。通过检查大量的输入和输出,计算机可以学习,而不必接受手头工作细节的培训。以 iPhone 照片应用程序为例。最初,它不知道你长什么样。但是,一旦你开始将自己标记为多年来在各种环境中拍摄的照片中的面孔,机器就会获得识别它的能力。

模型崩溃研究人员发现,当人工智能模型接受数据训练时其中包括人工智能生成的内容,考虑到现在有多少内容在网上传播,这种情况越来越有可能最终导致性能下降。一些人工智能观察人士担心,如果这些模型接受过多人工智能生成的内容的训练,甚至可能崩溃。2023 年的一项模型崩溃研究表明,即使模型对自己的创作进行了少量再训练,人工智能的人类图像也会变得越来越扭曲。

多模态人工智能公司越来越多地关注能够处理和响应的多模态系统。一系列输入,包括文本、图像和音频。例如,您可以与聊天机器人交谈并让它回复,或者向它展示数学问题的图像并询问解决方案。这不仅增强了人工智能产品的多功能性,而且感觉更像是与数字助理的真实对话。

自然语言处理人工智能的这一分支帮助计算机以这种方式理解、处理和生成语音和文本人类会的。NLP 依靠机器学习算法从书面文本中提取数据、翻译语言、识别手写单词以及辨别含义和上下文。它是为 Siri 或 Alexa 等虚拟助手提供支持的底层技术,使它们不仅能够理解请求,还能以自然语言做出响应。NLP 还可以评估文本中的情绪,这就是为什么如果你告诉 Siri 我很难过,它可能会建议你给朋友打电话。其他日常应用包括电子邮件垃圾邮件过滤、网络搜索、拼写检查和文本预测。

神经网络这是一种人工智能,计算机被编程为以与人脑大致相同的方式学习:通过反复试验。成功或失败会影响未来的尝试和适应,就像年轻的大脑学习根据孩子所学的内容来绘制神经通路一样。这个过程可能需要数百万次尝试才能达到熟练程度,这就是人工智能平台需要大量计算机处理能力的原因之一。

O

开源是人工智能中的关键分歧之一行业和寻求监管的人之间的问题是是否采用开放或封闭模式。虽然有些人宽松地使用“开放”一词,但它指的是开源模型的理念,其开发人员将其源代码免费提供给任何人使用或修改。该定义来自非营利组织开源倡议,该倡议指出,真正的开源软件必须遵守特定的分发和访问条款。

P

参数当人工智能公司发布新产品时在模型中,它经常引用来区分产品的一个关键数字是参数数量。该术语指的是模型在训练过程中选取的变量总数,可以用来表示大型语言模型的实际大小。这些数字可能相当惊人:例如,Metas Llama AI 模型有三种大小,最大的具有大约 4000 亿个参数。

提示使用当今的 AI 工具的体验通常从提示开始,基本上任何查询或来自用户的请求。提示的示例可能包括要求人工智能聊天机器人总结文档、建议家居装修技巧或提出一首关于爱上蓝莓松饼的歌词。

提示工程人工智能平台响应的准确性和有用性在很大程度上取决于所发出命令的质量。提示工程师可以微调自然语言指令,以使用最少的计算机能力产生一致的高质量输出。

Q
R

推理2024 年 9 月,OpenAI 开始推出一种新模型,可以执行一些类似人类的推理任务,例如响应更复杂的数学和编码问题。从本质上讲,更新后的人工智能系统在响应用户之前需要更多时间来计算答案,从而使其能够更好地解决多步骤问题。Google 和 Anthropic 也在利用其先进的人工智能模型来开发推理技能。

小型模型经过多年的相互竞争来构建更大的模型,科技人工智能行业的一些人已经接受了这样一种理念:越大并不总是越好。。OpenAI、Google、Meta 等都发布了比其旗舰大语言模型更紧凑、更灵活的小模型软件。虽然这些选项可能无法胜过更大的替代品,但小型模型对于客户来说可能是一种更高效、更实惠的选择。

有感知力的人工智能 大多数研究人员都认为,有感知力、有意识的人工智能能够感知和反思周围的世界距离成为现实还需要数年时间。虽然人工智能可以表现出一些类似人类的能力,但机器还不明白他们在做什么或在说什么。他们只是在人类产生的大量信息中寻找模式,并生成决定他们如何响应提示的公式。而且可能很难知道感知何时到来,因为对于意识是什么还没有达成广泛的共识。

合成数据在寻找更多数据来开发为人工智能聊天机器人提供动力的大型语言模型的过程中,一些科技公司正在尝试合成数据。公司使用自己的人工智能系统来生成文字和其他媒体,然后可用于训练新模型。这种方法的好处是它避免了有关训练数据来源的一些法律和道德问题。但可能存在一个问题:一些人担心这可能会导致人工智能系统性能下降,即所谓的模型崩溃的现象。

T

训练数据人工智能公司抓取或许可大量数据为了开发或训练可以吐出文本、图像、音乐和其他媒体以响应用户查询的人工智能模型。这些公司往往对他们所依赖的具体训练数据守口如瓶,但对于人工智能聊天机器人来说,它可能包括文章、书籍、在线评论和社交媒体帖子。人工智能音乐生成器 Suno 表示,其软件经过了数千万条录音的训练,其中包括可能受版权保护的作品。

U
V
W
X
Y
Z
#

与迪娜·巴斯、杰基·达沃洛斯、希林·加法里和瑞秋梅斯

关于《从 AGI 到 GPT,你能真正理解的人工智能术语 - 彭博社》的评论


暂无评论

发表评论

摘要

人工智能革命的术语表人工智能的每一次进步都伴随着大量令人困惑的晦涩术语。然而,从高层次来看,人工智能是指模拟人类智能的技术,可以执行一系列原本需要人类来处理的任务。谷歌已经在 Gemini 中内置了多模式功能,让人工智能模型能够对一顿饭的图像做出反应,并给出如何制作它的食谱。 生成式人工智能(generative AI)这指的是从简单的作品到图片、文章、歌曲、海洋棚屋的制作。问题或命令。该聊天机器人由埃隆·马斯克 (Elon Musk) 的人工智能初创公司 xAI 开发,并在其 X 微博平台上向订阅者开放,该机器人因其不敬的书面回复以及在几乎没有明确护栏的情况下吐出煽动性图像而成为头条新闻。而且可能很难知道感知何时到来,因为对于意识是什么还没有达成广泛的共识。 合成数据 为了寻找更多数据来开发为人工智能聊天机器人提供动力的大型语言模型,一些科技公司正在尝试合成数据数据。