请不要问人工智能是否有毒 - 《科学美国人》

2024-09-25 10:47:18 英文原文

在生成式人工智能存在的早期,随着人工智能模型慢慢学会书写、拼写并最终输出奇怪而搞笑的万圣节服装、搭讪台词或食谱,笔记本电脑需要花费几个小时才能处理繁琐的代码。光学研究员珍妮尔·谢恩(Janelle Shane)对一份此类食谱清单很感兴趣,其中需要碎波本威士忌和切碎的水等成分,以便让她自己的笔记本电脑完成这项任务。自 2016 年以来,她在博客中通过此类神经网络快速发展,从可爱的笨手笨脚到令人惊讶的连贯性,有时甚至是令人震惊的错误。Shanes 2019 年出版的书《You Look Like a Thing and I Love You》详细分析了 AI 的工作原理以及我们可以(和不能)期待它带来什么,她最近在博客 AI Weirdness 上发表的文章探讨了图像生成算法的奇怪输出,ChatGPTs 尝试ASCII 艺术和自我批评以及 AI 的其他粗糙边缘。《科学美国人》与 Shane 讨论了为什么一尘不染的长颈鹿会难倒人工智能、绝对不应该使用这些模型以及聊天机器人的准确性是否可以完全信任。

[编辑后的对话记录如下。]

在您训练和使用聊天机器人的这些年里,生成式人工智能发生了怎样的变化?

关于人工智能的商业热议比我第一次接触它时要多得多。我认为,在那些日子里,谷歌翻译是人们在整个机器学习人工智能技术群中看到的第一个大型商业应用程序之一。有迹象表明可能还有更多,但在那些日子里,这绝对更多是研究人员的领域。

有些事情没有改变,[例如]人们倾向于阅读从这些技术中获得的文本的更深层含义。我们可以从人行道上随机飘落的树叶中看到意义……随着文本变得越来越复杂,[炒作]使它成为主要的专栏文章和主要报纸。随着这些工具变得越来越容易使用,我们也看到越来越多的人倾向于尝试所有东西,看看什么能坚持下去。

这为您的博客提供了更多素材,对吗?

我一直关注人工智能如何生成文本和人类如何写作之间的差异,因为对我来说,这就是你可以遇到一些有趣、意想不到和新颖的东西的地方......看到所有这些小问题的答案和奇怪的文本生成[也是]一种获得直觉的有趣方式。如果您试图思考,这就是您可以记住的内容,啊,是的,我可以用它来标记演示文稿中的所有图像,这样我就不必编写易于理解的标题吗?答案是,它会生成标签,但由于所有这些故障,您确实需要检查它们。

这是一回事,嘿,它并不完全准确。记住一尘不染的长颈鹿的故事是另一回事。[2023 年]田纳西州的一个动物园里出生了一只没有斑点的长颈鹿。上一次[已知的]发生这种情况是在互联网出现之前,所以互联网上[几乎没有]一尘不染的长颈鹿的照片。看到所有这些图像标记算法如何描述这只长颈鹿并包括对斑点皮毛的描述是非常有趣的,因为这正是预期的。

这是一个意想不到的例子,该算法没有机会记住或跳过或隐藏这种缺乏更深入理解的情况。突然间,你遇到了这个案例,暴露出它并没有真正关注这些斑点。这就是为什么故障艺术很重要,为什么这些错误很重要。

您偶尔也会指出生成式 AI 的优势所在,我特别想到您要求 GPT-3 回答问题的帖子,就好像它是一只秘密的松鼠一样,展示了它如何展示虚构的内部生活。

我真的很想在这样的论点中找出漏洞:如果这些文本生成器可以描述有感知力的人工智能的体验,那么它们一定是有感知力的人工智能,因为那曾经是,现在仍然是一个正在流传的叙述:看,它说它是有感知力的,有思想和感情,不只是想用来生成文本。这是文本生成过程中令人痛苦的事情。我确实想指出,虽然人工智能可以描述作为松鼠的体验,但这并不意味着它实际上是松鼠。

您是否觉得生成式人工智能确实发生了巨大的质变,或者从切碎的水到秘密松鼠的旅程是否感觉渐进?

就像一串预测文本一样,接下来发生的事情是从之前发生的事情开始的。因此,从这个意义上说,它是增量的,但肯定会增加价值数百万美元的计算时间。整个全球行业都会对一个项目和一项技术这样做。所以它肯定在成长和改变。另一方面,您从这些算法中看到的错误类型与它们从一开始就存在的错误类型是相同的。这就是让我愿意在 2019 年写一本关于人工智能的书的原因之一,当时事情仍然变化得如此之快:我仍然可以看到这些暗流,这些暗流通过保持不变的线条。

您以人工智能生成的搭讪台词命名了您的书,这台搭讪台词非常奇怪,绕来绕去很迷人。今天的人工智能接送线是否具有同样的魅力,或者它只是互联网接送线的令人沮丧的版本?

我现在怀疑这将是互联网搭讪线路的令人沮丧的混音。很难找到一个独特的,因为它会记住过去的很多内容。

我真的非常喜欢在我的笔记本电脑上运行的这些早期循环神经网络中出现的小故障、半乱码的文本。文字的简单性和纯粹的混乱性让我感到非常有趣。ChatGPT、[Gemini] 以及人们可以使用的所有这些文本生成器现在生成如此连贯的文本几乎是一种耻辱。

我觉得这种连贯性也有点可怕,因为我看到人们问人工智能诸如“某某对狗有毒吗?”之类的问题。我知道它会回答你,但请不要问它!

正是如此。有很多毒理学家说的例子,好吧,这个具体建议很危险……不要这样做。它可以直接从算法中得出。因为它是如此连贯,而且通常因为它被包装成可以查找信息的东西,所以人们被引导去信任它。有一些臭名昭著的人工智能生成的蘑菇狩猎书籍包含完全危险的建议。我没有预测到人们会生产它们并出售它们以赚钱,也没有真正关心人们浪费了多少时间或[他们会让人们]处于实际危险之中......我[没有预测]如何愿意的人会使用有问题或不正确的文本,或者有点浪费时间来阅读它的市场。

您认为生成式人工智能最终会变得准确吗?

现在尝试使用这些算法作为检索信息的方式不会引导我们正确的信息,因为他们在训练期间的目标是听起来正确且可能,并且实际上没有任何根本性的束缚达到现实世界的准确性或准确检索和引用正确的源材料。我知道人们正在尝试以这种方式对待它,并在很多应用程序中以这种方式销售它。我认为人们所要求的信息检索与这些东西实际训练的目的之间存在根本的不匹配,这听起来是正确的。

您所做的任何需要正确答案的事情都不适合生成式人工智能。

通过微调和额外训练,很多表面上的问题已经被消除了,但它并没有从根本上改变我们为这些算法提供的输入数据。它仍然存在,仍然可以衡量,并且仍然对他们的收获产生影响。

生成式人工智能的炒作是否会超越人工智能的其他良好用途?

有很多人正在悄悄地使用人工智能技术来解决他们无法通过其他方式解决的有用问题。例如,在药物发现研究中,这是一个相当大的成功,因为你可以使用更多量身定制的人工智能技术来尝试不同的药物组合并提出有希望的配方,然后,最重要的是,去测试这些配方。实验室,看看它们是否真的会成功。

人们还将这些模型应用于稍微不准确的情况。例如,我正在考虑语音邮件转录。如果它不够准确,你就必须听它,好吧,但你不必坐在普通的语音信箱里就能明白要点。我认为,这些小型人工智能应用程序才是真正的价值所在,也是我认为长期成功可能所在的地方。

人工智能转录软件确实很有用,但现在我使用的版本还根据讨论给出了这些自动生成的小行动点,就像你在参加工作会议一样,无论这在上下文中是否有意义。我只是在谈论某人的研究,而不是制定议程!

如果它告诉你去切水,我有兴趣看看它根据这次采访决定布置什么作业。<​​/p>

关于《请不要问人工智能是否有毒 - 《科学美国人》》
暂无评论

摘要

在生成式人工智能出现的早期,随着人工智能模型慢慢学会书写、拼写并最终输出奇怪而搞笑的万圣节服装、搭讪台词或食谱,笔记本电脑需要花费几个小时才能处理繁琐的代码。我一直关注人工智能如何生成文本和人类如何写作之间的差异,因为对我来说,这就是你可以遇到一些有趣、意想不到和新颖的东西的地方......看到所有这些小问题的答案和奇怪的文本生成是[也] 一种获得直觉的有趣方式。您偶尔也会指出生成式 AI 的优势所在,我特别想到您要求 GPT-3 回答问题的帖子,就好像它是一只秘密的松鼠一样,展示了它如何展示虚构的内部生活。有一些臭名昭著的人工智能生成的蘑菇狩猎书籍包含完全危险的建议。如果它不够准确,你就必须听它,好吧,但你不必坐在普通的语音信箱里就能明白要点。