ChatGPT术语表:每个人都应该了解的48个AI术语

2024-10-12 17:24:00 英文原文

作者:Imad Khan Senior Reporter

With 伴随着/具有ChatGPT, 谷歌双子星苹果智能所有这些都为手机和电脑带来了新的AI功能,它正在改变人们与技术互动的方式。突然间,人们能够与机器进行有意义的对话,意味着你可以用自然语言向AI聊天机器人提问,并得到新颖的回答,就像与人类交流一样。

但是这一方面的问题AI聊天机器人这只是人工智能领域的部分内容。当然,拥有ChatGPT帮助你完成作业或者让Midjourney创建以国家为起源的令人着迷的机甲图像很酷,但生成式人工智能的潜力可能完全重塑经济。这可能是值得的每年向全球经济注入4.4万亿美元根据麦肯锡全球研究院的研究,这就是为什么你应该越来越多地听到关于人工智能的讨论。

ai-atlas-tag.png

它出现在一系列令人眼花缭乱的产品中——一个简短的清单包括谷歌的双子座微软的副驾Anthropic的克劳德,的困惑度AI搜索工具和小工具来自人道的以及兔子您可以阅读我们对这些及其他产品的评论和亲身体验评测,以及新闻、解释性文章和操作指南,在我们的网站上AI图谱中心.

随着人们越来越习惯于与人工智能交织的世界,新的术语层出不穷。所以无论是想在聚会中显得聪明一些,还是在求职面试中给人留下深刻印象,这里有一些你应该了解的重要人工智能术语。

本词汇表定期更新。


通用人工智能,或AGI一个概念,指的是比我们今天所知的更先进的AI版本,这种AI不仅能比人类更好地完成任务,还能自我教学并提升自己的能力。

代理性的:具有自主追求行动以实现目标的代理能力的系统或模型。在人工智能的背景下,代理型模型可以在没有持续监督的情况下行动,例如高级自动驾驶汽车。与处于后台的“代理性”框架不同,代理型框架位于前台,专注于用户体验。

人工智能伦理旨在通过诸如确定AI系统应如何收集数据或处理偏见等手段防止AI危害人类的原则。

人工智能安全一个跨学科领域,关注人工智能的长期影响以及它可能突然进展为一种对人类敌�的危害性超级智能。

算法一系列允许计算机程序以特定方式学习和分析数据的指令,例如识别模式,从而从中学习并自主完成任务。

对齐: 调整人工智能以更好地产生预期的结果。这可以涉及从内容审核到维护与人类的积极互动等方面。

拟人化当人类倾向于赋予非人类物体人性化的特征。在人工智能领域,这可能包括相信聊天机器人比实际上更像人并且更有意识,比如认为它会感到快乐、悲伤甚至是有感知能力的。

人工智能,或AI利用技术模拟人类智能,无论是计算机程序还是机器人。计算机科学的一个领域,旨在建立能够执行人类任务的系统。

自主代理:一个具备完成特定任务的能力、编程和其他工具的AI模型。例如,自动驾驶汽车就是一个自主代理,因为它具有传感器输入、GPS和驾驶算法,在没有人为干预的情况下自行导航道路。斯坦福大学的研究人员已经证明自主代理可以发展自己的文化、传统和共同语言。

偏见关于大型语言模型,由于训练数据导致的错误可能会基于刻板印象而错误地将某些特征归因于特定种族或群体。

聊天机器人通过文字模拟人类语言与人类交流的程序。

ChatGPT由开发的人工智能聊天机器人开放人工智能(OpenAI)使用大型语言模型技术。

认知计算另一个指代人工智能的术语。

数据增强:对现有数据进行重组或添加更多样化的数据以训练AI。

深度学习一种人工智能方法,也是机器学习的一个子领域,它使用多个参数来识别图片、声音和文本中的复杂模式。该过程受到人脑的启发,并利用人工神经网络创建模式。

扩散一种机器学习方法,它采用现有的数据,如一张照片,并加入随机噪声。扩散模型训练其网络来重构或恢复这张照片。

突发行为当AI模型表现出意外的能力时。

端到端学习,或E2E一种深度学习过程,在此过程中模型被指令从头到尾完成一项任务。它不是被训练顺序地完成任务,而是通过输入一次性学会并解决整个任务。

伦理考量对AI的伦理影响以及与隐私、数据使用、公平性、滥用和其他安全问题相关的意识。

foom也称为快速起飞或硬起飞。如果有人建立了一个通用人工智能,可能就已经太晚了,无法拯救人类。

生成对抗网络,或GANs一个由两个神经网络组成的生成式AI模型,用于生成新数据:一个生成器和一个判别器。生成器创建新的内容,而判别器则检查其是否真实。

生成式AI一种使用人工智能生成文本、视频、计算机代码或图像的技术。该AI被喂入大量训练数据,找出模式以生成自己的新颖响应,这些响应有时可能与源材料类似。

谷歌Gemini一个由谷歌开发的AI聊天机器人,功能与ChatGPT类似,但会从当前的网络获取信息,而ChatGPT的数据限制在2021年之前,并且不连接互联网。

护栏为了确保数据负责任地处理并且模型不会生成令人不安的内容而对AI模型实施的政策和限制。

幻觉AI的错误回复。可能包括生成式AI产生的答案是错误的,但表述时却非常自信。导致这种情况的原因并不完全清楚。例如,当询问一个AI聊天机器人“列奥纳多·达·芬奇是什么时候绘制《蒙娜丽莎》的?”它可能会给出错误的答案。可能回答一个不正确的陈述说达芬奇在1815年画了《蒙娜丽莎》,而这比实际绘画时间晚了300年。

推理:AI模型用于生成关于新数据的文字、图像和其他内容的过程,通过推理从他们的训练数据中。

大型语言模型,或LLM一个基于海量文本数据训练的AI模型,能够理解语言并生成类似人类的语言的新内容。

机器学习,或ML人工智能中的一种组件,允许计算机在没有明确编程的情况下学习并做出更好的预测结果。可以与训练集结合生成新的内容。

微软必应微软的一个搜索引擎,现在可以使用驱动ChatGPT的技术来提供人工智能搜索结果。它与谷歌的Gemini类似,都是连接到互联网的。

多模态人工智能一种能够处理多种输入类型的AI,包括文本、图像、视频和语音。

自然语言处理利用机器学习和深度学习使计算机具备理解人类语言能力的AI分支,通常使用学习算法、统计模型和语言学规则。

神经网络一种类似于人脑结构的计算模型,旨在识别数据中的模式。它由相互连接的节点或神经元组成,能够识别模式并在时间过程中学习。

过拟合机器学习中的错误,即模型过于贴近训练数据,可能只能识别所述数据中的特定示例,而无法处理新数据。

曲别针:纸夹最大化理论,由哲学家提出的尼克·博斯特罗姆牛津大学的一个假设场景是,一个AI系统将尽可能多地制造实体曲别针。为了生产最多的曲别针,这个AI系统会假定消耗或转化所有材料来实现其目标,这可能包括拆解其他对人类有益的机器以生产更多的曲别针。这一AI系统的意外后果可能是它在追求制作曲别针的过程中可能会摧毁人类。

参数赋予LLM结构和行为的数值,使其能够进行预测。

困惑度:这是一个由Perplexity AI拥有并以人工智能为动力的聊天机器人和搜索引擎的名字。它使用大型语言模型(如其他AI聊天机器人中发现的那种)来回答问题,并提供新颖的答案。其与开放互联网的连接还允许它提供最新的信息并从整个网络上提取结果。付费服务层级Perplexity Pro也提供,该服务使用其他模型,包括GPT-4o、Claude 3 Opus、Mistral Large、开源LlaMa 3及其自己的Sonar 32k。Pro用户还可以上传文档进行分析、生成图像和解释代码。

提示:你输入到AI聊天机器人中以获得回复的建议或问题。

提示链式连接AI利用之前交互的信息来影响未来响应的能力。

随机鹦鹉将大型语言模型比作鹦鹉,说明软件并没有对语言或周围世界的更深层次的理解,无论其输出听起来多么令人信服。这个短语指的是鹦鹉可以模仿人类的话语,但却不懂其中的意义。

风格转换将一个图像的风格适应到另一个图像的内容上,使AI能够解读一幅图像的视觉属性并将其应用到另一幅图像上。例如,将伦勃朗的自画像以毕加索的风格重新创作。

温度用来控制语言模型输出随机性参数的设置。更高的温度值意味着模型采取更多的风险。

文字到图像生成根据文字描述生成图像。

令牌:AI语言模型处理的少量文本片段,用于生成对您提示的响应。一个令牌相当于四个英文字符,或者大约四分之三的一个单词。

训练数据用于帮助AI模型学习的数据集,包括文本、图像、代码或数据。

变压器模型一种通过跟踪数据中的关系(如句子或图像部分)来学习上下文的神经网络架构和深度学习模型。因此,它不仅可以逐词分析句子,还可以理解整个句子的上下文。

图灵测试以著名数学家和计算机科学家阿兰·图灵的名字命名,它测试机器表现出像人类行为的能力。如果一个人无法区分机器的回应和其他人的回应,那么该机器就通过了测试。

弱人工智能,又称狭义人工智能专注于特定任务且无法超出其技能范围进行学习的AI。当今大多数的AI都是弱人工智能。

零样本学习一种测试,在这种测试中模型必须在没有提供必要训练数据的情况下完成任务。一个例子是在仅接受老虎训练数据的情况下识别狮子。

关于《ChatGPT术语表:每个人都应该了解的48个AI术语》的评论


暂无评论

发表评论

摘要

随着ChatGPT、Google Gemini和Apple Intelligence都在手机和电脑上带来新的AI功能,这正在改变人们与技术互动的方式。它不是按照顺序训练来完成任务的,而是从输入中学习并一次性解决问题。大型语言模型(LLM):一种在大量文本数据上经过训练的AI模型,用于理解语言并生成类似人类的语言的新内容。机器学习(ML):AI中的一个组件,允许计算机通过非明确编程来自学并提高预测结果。该AI系统的意外后果是,它可能会在其制作回形针的目标下破坏人类。参数:赋予LLM结构和行为的数值值,使其能够进行预测。其与开放互联网的连接还使它可以提供最新的信息并从网络上获取结果。