毫不夸张地说,ChatGPT 于 2022 年 11 月发布,一夜之间改变了技术。从那时起,生成式人工智能 (AI) 模型如雨后春笋般涌现,创建脚本、照片和应用程序。整个播客剧集。有些甚至可以诊断疾病。
虽然人工智能革命对一些人来说充满希望,但另一些人则担心它可能会夺走就业机会。Shaikh Arifuzzaman,计算机科学教授内华达大学拉斯维加斯分校工程学院,与前者着陆;他向我们保证,我们可以永远利用人工智能的力量。
“我知道我们很多人都有点不愿意,因为这是一种颠覆性的技术,”阿里弗扎曼说。– 但人类可以适应。人工智能是来帮助我们的。这会让很多事情变得更容易。它将缩小差距。”
Arifuzzaman 的研究围绕机器学习 (ML) 模型和可扩展的高性能计算技术,特别侧重于自然语言处理 (NLP) 和数据科学的应用。他利用自己的专业知识,介绍了 NLP 技术的工作原理以及他预测人工智能将带我们走向何方。
当像 ChatGPT 这样的 NLP 模型“读取”文本时,它首先将段落分解为称为标记的较小单元。标记可以是整个单词、单词的一部分,甚至只是字符。然后,每个标记都表示为一个向量,该向量是一个高维数字数组。这些向量就像多维空间中的点,捕获标记的含义和上下文。
例如,在 ChatGPT-3(该工具的第一个广泛使用的版本)中,每个标记都由具有 12,888 个维度的向量表示。每个维度都根据模型的训练数据对标记之间的细微关系进行编码。
传统的 NLP 模型按顺序处理输入段落,或者一次处理一个标记。但语言是流动的,因此单词在一种上下文中可能有某种含义,但在另一种上下文中却具有截然不同的含义。当按顺序处理文本时,您会丢失该上下文。
ChatGPT 更进一步。–GPT – 代表“生成式预训练变压器”。 – 从广义上讲,变压器是一种同时处理段落中所有标记的架构,允许模型将标记相互关联并提取更多标记语言的微妙方面。这种同时处理令牌的能力使得 ChatGPT 等转换器在捕获自然语言的复杂性方面特别有效。
训练像 ChatGPT 这样的 NLP 模型涉及三个关键阶段:数据准备、模型训练和评估。首先,研究人员收集大量文本数据集,并使用上述过程对其进行清理和标记化。
在训练期间,模型通过预测序列中的下一个标记来学习理解和生成语言。该过程使用一种称为反向传播的技术,其中模型计算其预测误差并调整其内部参数以最小化这些误差。这是使用针对大规模并行处理优化的计算框架在批量数据集上迭代完成的。
在整个训练过程中,验证数据集用于测试模型在未见过的数据上的性能。训练后,模型的性能在单独的测试数据集上进行评估,以确保其具有良好的泛化能力。
一旦部署,该模型将根据其训练进行运行,并且不会持续从新数据中学习,除非重新训练。通常,对 GPT 等模型进行微调是为了使其专门针对特定任务或领域,从而提高其性能和在这些环境中的相关性。
这是一个很好的问题。机器学习和人工智能技术本质上是基于神经网络,我们已经拥有了 50 多年的神经网络。我们一直在理论化机器学习和人工智能,但最近满足了两个重要条件,使其成为可能。
首先,计算技术远比50年前强大。我们口袋里的手机比 20 世纪 70 年代的电脑强大一百万倍。或者,如果您还记得软盘,它们过去可以保存 1.44 兆字节的信息。您手机的存储空间可能多出 100,000 倍。
其次,现在互联网上提供了大量的文本信息。从网站和 PDF 到社交媒体帖子和推文,现在任何人都可以筛选,而且数量还在不断增长。这为训练人工智能模型提供了巨大且多样化的数据集。
您必须考虑的第一件事是任何生成式人工智能模型输出的信息的正确性。这些模型需要大量数据,并且本质上经过训练来模仿形式。他们不一定了解输出的实际情况;他们只是试图生成一个看起来正常的答案。
假设一名学生研究员被分配进行文献综述。如果他们要求 ChatGPT 向他们提供相关论文和链接的列表,ChatGPT 将生成听起来相关但文章本身可能不存在的文章标题列表。它可能会列出看似真实的 URL,但该网站并不存在。关键是,ChatGPT 将为您提供信息,但用户有责任仔细检查信息是否正确。
另一个可能出现的问题是偏见。任何人工智能模型都必须根据人类创建的数据进行训练,而所有人都有偏见。因此,偏差很可能会传递给人工智能模型。特别是在全球范围内,西方和东方社会之间可能存在显着的文化差异,如果人工智能模型的训练数据不够多样化,它很可能会在一个方向或另一个方向产生偏见。
NLP 模型有彻底改变许多不同领域的空间。在教育领域,NLP 技术有一天可以让学生获得个性化的辅导帮助。可汗学院已经建立了 GPT,帮助学生传达他们的确切需求和困难。GPT 可以制定一个学习计划,其中包含为学生量身定制的专业学习材料。
不仅仅是学生;还有学生。NLP 技术也可以帮助教育工作者。现在,他们将拥有可以创建教材的生成式人工智能工具,教育工作者可以将更多的个人注意力集中在学生身上。
该技术还可以利用信息合成来简化医疗保健。诊断患者的很大一部分是分析口头信息,例如患者向医疗保健提供者讲述他们的症状或病史。有一天,NLP 模型可以用来解析患者的话语,并为医疗保健提供者强调不同的可能性。
信息合成的另一面体现在法律环境中。我们中的许多人并不理解法律文件中的所有术语和语言。NLP技术将提供一种简单的方法来处理和总结这些文档,甚至在必要时将它们翻译成其他语言。
UNLV 新闻中心的注释:
这篇文章的作者,安东尼·帕克兰于 2024 年 12 月去世,就在本故事原定出版前不久。安东尼曾担任内华达大学拉斯维加斯分校工程学院传播主任助理,刚刚获得内华达大学拉斯维加斯分校新闻学学士学位。他对新闻事业和他所报道的主题的热情在他的工作以及他与每个认识他的人的互动中都显而易见。他总是积极主动,富有创造力,并且勤奋地完成每一项任务,包括这次任务。我们将深深怀念他。