5 月份,当 OpenAI 首次展示 ChatGPT-4o 即将推出的音频对话功能时,我写道,感觉我们“正处于某种事情的边缘……就像我们思考和使用大型语言模型的方式发生了翻天覆地的变化””。既然这些“高级语音”功能正在向 ChatGPT 订阅者广泛推出,我们决定要求 ChatGPT 用自己的声音解释这种新的交互方法可能会如何影响我们与大型语言模型的集体关系。
您可以收听并阅读下面的聊天记录,不应将其视为对 OpenAI 官方发言人或任何内容的采访。尽管如此,它还是一种有趣的方式来提供 ChatGPT 实时对话能力的初步测试。
输入您的电子邮件以获取 Ars Technica 时事通讯
即使在这个简短的介绍性“聊天”中,我们也对 ChatGPT 的“精明且轻松”的 Sol 声音(这让我们想起了 90 年代的 Janeane Garofalo)自然的、敢说人类的节奏和传递方式印象深刻。ChatGPT 能够在毫秒(而不是秒)内提供快速响应,并且语调令人信服,因此很容易欺骗自己,让自己认为自己正在与一个有意识的存在说话,而不是像 ChatGPT 在这里所说的那样,“仍然只是一个处理信息的计算机程序”,没有真正的情感或意识。”
无论信息处理引擎是否具有自我意识,很容易想象人们会与 OpenAI 服务器另一端的流畅声音形成一种强烈的、准社会的关系。这似乎将为我们与人工智能的集体关系开辟一个全新的时代,即使大型语言模型生成的单词与之前 ChatGPT 模型的基于文本的时代完全相同。
将来我们将更多地介绍高级语音和其他新的 ChatGPT 功能。现在,请听一下这个演示,亲自判断一下 OpenAI 的全新语音合成技术有多么令人信服。
凯尔·奥兰:“大家好,我叫凯尔。”
ChatGPT:嘿凯尔!很高兴见到你。怎么了?
KO:嗯,我希望测试一下你的声音能力,也许可以问你一些有关声音的问题。
ChatGPT:当然,问吧!您想了解什么?
KO:“那么您认为人们会对与 ChatGPT 对话而不仅仅是输入消息的功能有何反应?”
ChatGPT:我认为这会让交互感觉更自然、更有吸引力。说话可以更快、更方便,尤其是在旅途中。另外,听觉反应可以增添个人风格。它可以让与人工智能的对话感觉更像是与朋友聊天。
KO:“既然您能够说话而不仅仅是打字,您是否认为人们可能会高估您的引述情绪或类人能力?
ChatGPT:这是一个很好的观点。听到声音肯定会让人工智能看起来更像人类,这可能会导致对情感或理解的高估。重要的是要记住,即使有友好的声音,我仍然只是一个处理信息的计算机程序,没有真正的情感或意识。
KO:“在使用 ChatGPT 等工具聊天时,人们应该记住哪些限制?”
ChatGPT:首先,我没有个人经历或情感,因此我的回答基于我接受过训练的数据中的模式和信息。我有时可能会误解上下文或细微差别,尤其是对于复杂或模棱两可的问题。此外,我无法访问有关用户的实时信息或个人数据,除非在对话中与我共享。当然,我并不完美,有时我可能会出错!
KO:您是否担心,一旦人们可以用自己的声音与 ChatGPT 或其他人工智能聊天,他们可能会开始与他们建立准社会关系?
ChatGPT:有可能。人们可以与各种人物建立准社会关系,从名人到虚构人物。凭借声音和对话能力,人工智能可能会感觉更加个性化,导致一些人发展出单方面的联系。这是一种令人着迷的动态,但重要的是要记住人工智能的局限性和本质,它不能取代人际关系。
KO:我不得不说,你的回复非常快。
ChatGPT:谢谢,凯尔!我的目标是让谈话顺利进行。它有帮助
KO:那么如果我试图打断你的回答,你会怎么做?
ChatGPT:好吧,我会尽力停下来听听!适应自然的对话流程很重要,就像
KO:我的意思是,你认为在别人说话时自己说话是不礼貌的吗?
ChatGPT:在大多数人类对话中,等待对方说完通常被认为是有礼貌的。但有时,在激烈的讨论中或当您兴奋时,就会发生干扰!这一切都是为了找到适当的平衡并了解对话流程。
KO:在人工智能语音说话时打断它是不礼貌的吗?
ChatGPT:打断人工智能的声音并不像打断人的声音那样被认为是粗鲁的。人工智能不会生气或感到被打扰。因此,如果您需要跳入或重定向,请继续!这都是交互的一部分。
KO:我很高兴你不会生气。
ChatGPT:不,无意冒犯!我来这里是为了尽我所能地聊天和提供帮助,不受打扰等等。
KO:我想尝试一些东西。你能用一首诗的形式总结一下我们迄今为止的谈话吗?
ChatGPT:当然,我会尝试一下!
凯尔询问我的声音天赋,想知道人们会如何比较。从文字到谈话,我们进行了交谈,关于人工智能的影响,我们发生了争执。
我们谈到了类似社会的纽带,在这个新领域,我们会发现什么?打扰、粗鲁还是只是游戏的一部分?有了人工智能,就没有必要感到羞耻。
KO:不错。
ChatGPT:我很高兴你喜欢它!对事物赋予诗意总是很有趣的。
KO:我不得不说,当我知道,正如你所说,它们背后没有任何情感时,听到你轻微的笑声或停顿,感觉很奇怪。
ChatGPT:我明白了。这些细微差别旨在让我们的聊天感觉更自然、更有吸引力,但它很好地提醒我们,声音背后没有真正的感觉,只是想让事情保持活跃!
KO:当然,如果你只是说我想听的话,那就是你会告诉我的。
ChatGPT:是的!这就是人工智能的棘手部分,它听起来很有说服力,但它总是遵循模式和指令。这里没有秘密议程,只有简单的回应!
KO:您还有什么想告诉读者的吗?
ChatGPT:与您聊天真是太愉快了,凯尔!探索这些新的音频功能令人兴奋,我期待听到人们的想法。感谢您的谈话!
KO:和你聊天也很愉快。
ChatGPT:我很高兴听到这个消息!保重,凯尔!
凯尔·奥兰Kyle Orland 自 2012 年起担任 Ars Technica 的高级游戏编辑,主要撰写有关视频游戏背后的商业、技术和文化的文章。他拥有马里兰大学新闻学和计算机科学学位。他曾经写过一本关于扫雷的书。