谷歌的人工智能根据我的一篇文章生成了一个“播客”,它能够模仿人类说话,令人难以置信且令人毛骨悚然 - PC Gamer

2024-10-02 16:05:36 英文原文

Google 的人工智能根据我的一篇文章生成了一个“播客”,它在模仿人类说话方面非常令人信服

机器人在几分钟内生成的播客,但我听过更糟糕的。

p>

只需点击一个按钮即可播放播客谷歌的新人工智能工具可以做到这一点。它被称为 NotebookLM,本质上是一个摘要机器人。输入文档,点击生成,然后弹出简报文档、常见问题解答或学习指南。更重要的是,它可以生成一个涵盖文档内容的播客,由带有欢快美国口音的转瞬即逝的生物主持。

以我在 2023 年写的一篇名为“缓存为王”的文章为例设计未来 20 年的游戏 CPU。”在其中,我与一些硅工程专家讨论了芯片设计的下一步发展。我将这篇文章输入 NotebookLM,等了大约四分钟,然后弹出一个 10 分钟长的播客。

在下面的 Soundcloud 嵌入中收听。

“什么 ****!”

你必须原谅我的脏话,但这是我第一次听到它时的诚实反应。一份总结良好的文件是一回事,但对话的自然节奏和栩栩如生的情感让我听完后回味无穷。

他们(我已经表现得好像这些是真人一样))甚至将播客介绍为播客。当我聆听时,我必须提醒自己,这些不是真实的人,他们是我在网站上的框中输入超链接的产物。一台计算机假装两个人分享想法和感受。我不知道为什么,但这对我来说感觉非常奇怪。

我并不是唯一一个对新的人工智能工具有这种感觉的人。我们向 PC 游戏玩家团队的其他成员播放了 RTX 4090 评测中生成的版本,并收到了如下回复:

最大的游戏新闻、评论和硬件交易

了解最新动态与 PC Gamer 团队挑选的最重要的故事和最优惠的交易约会。

“这是真正的存在危机诱发。”

还有:

“这太他妈可怕了。”

还有:

“联合主持人的打断和回应吓坏了我。”

并且:

“我要搬到树林里,我无法忍受。”

我的观点是,NotebookLM 令人印象深刻,但同样令人恐惧。更重要的是,整个录音中所做的类比和参考并不是从本例中的主题(PC 游戏玩家文章)中抽取出来的。它们主要由人工智能组成。

例如,3D V-Cache 的参考内容就像建造一座摩天大楼而不是一座更大的仓库。我希望我能想出这个,但这都是人工智能生成的。这就是整个事情非常好的另一个原因。

尽管如此,播客与主持人和内容一样重要。到目前为止,我们还没有任何其他“主机”(AI VOCALOID)为我们上传到 NotebookLM 的任何内容提供声音。随着时间的推移,它肯定会磨损一点。更不用说麦克风后面的两个 Google 编程机器人不太可能出现任何搞笑的失误。

我想我想说的是,这并不像是对成功播客的真正、可信的威胁,也不是它们的替代品。PC 玩家聊天日志改天就安全了。尽管正如我们在其他形式的人工智能生成中所看到的那样,它仍然可能会改变被认为值得付出努力的动态。例如,人工智能生成的艺术并没有立即消灭所有人造艺术,当然不会,但你可能不会仅仅为了为你的朋友运行一次 DD 活动而绘制 300 张令人惊叹的图像。如果你不完全反对人工智能的使用,你可以用人工智能来做到这一点,这也是完全公平的。

这里也是如此。我不会为我写的每一篇文章录制播客,但如果我可以通过按几个按钮来做到这一点?几个月前根本不值得付出努力的事情现在几乎根本不值得付出努力。

别担心,我会为您省去数百篇有关早已发布的显卡规格的文章。但你明白了。几个月前根本不可能实现的事情现在已经成为可能。

不过,房间里有一头大象,它正在假装成一个有思想、情感和声带的人。这种令人印象深刻的自然语言工具是如此简单易用,如果落入坏人之手,就会成为危险的工具。如果你能用流畅、对话式的人声语气说出任何文本、任何文件,那么钓鱼是多么容易的事情。这太可怕了。

但作为人工智能可以做什么的概念证明,我发现没有什么比 NotebookLM 更能引起我的反应。

那么,什么是 NotebookLM?

NotebookLM 是一款免费工具,可在 NotebookLM.google 上使用。它有一个听起来非常无聊的名字,尽管它的功能非常令人兴奋。

它是围绕 Google 的 Gemini AI 模型构建的,该模型已推出到新的 Android 手机中,并用于在我的网络搜索中生成 AI 片段。我们建议可能会破坏互联网业务。然而,NotebookLM 的目的是成为一个学习伙伴和人工智能,能够总结文档、听音频并节省你做笔记的时间。这本来可以完全改变我在学校复习考试的方式,但我出生得太早了 20 岁,差点儿就错过了。

它已在美国推出到 2024 年,尽管最近在夏季进行了改进,并且随着全球的推出,它最近已落入更多用户的手中。

名为“音频概述”的播客功能也是最近新增的功能,于 9 月份添加到软件中。

最适合游戏的麦克风:确保您的声音被听到
最佳网络摄像头:在您观看直播时被看到
最好的采集卡:使用专用卡减轻负载

目前,该软件只能使用英语,谷歌博客文章中关于其推出的注释称它将“有时会引入准确性”。这是理所当然的,因为所有的人工智能模型,即使是最好的,有时也容易编造一些东西。它经常被称为“幻觉”,但它实际上只是一个听起来很花哨的术语,指的是人工智能有点裤子(糟糕)。

音频概述中似乎有一个功能是打断的能力据说,可以改变谈话的方向或进行即时更正。目前还不确定,但谷歌在其博客文章中指出,“你还不能打断它们”,如果这不是某个时候的预期功能,那么这样说就有点奇怪了。

让我们想一想:能够在谈话中打断播客主持人并告诉他们您希望他们谈论什么,这是一种奇怪的、高度个性化的现场表演,带有被动攻击性的提议

谷歌并不是唯一一家开发听起来像人类的人工智能机器人的公司。OpenAI 也在市场上推出了自己的语音助手,与电影《她》中的语音助手相匹配。这是人与机器人的接触,但也同样奇怪。

毫无疑问,这种对话式人工智能的东西很快就会变得非常奇怪。

雅各布赢得了他的第一个机会为自己的技术博客署名写作。从那里开始,他在 PCGamesN 担任硬件作家,从事专业的破坏工作,并继续以硬件编辑的身份管理团队。在成为硬件团队的总编辑之前,他加入了 PC Gamer 的高层团队,担任高级硬件编辑,现在您会发现他报告技术和游戏行业的最新发展并测试最新的 PC 组件。

关于《谷歌的人工智能根据我的一篇文章生成了一个“播客”,它能够模仿人类说话,令人难以置信且令人毛骨悚然 - PC Gamer》
暂无评论

摘要

谷歌的人工智能从我的一篇文章中生成了一个“播客”,它在模仿人类说话方面非常有说服力。一个机器人在几分钟内生成的播客,但我听过更糟糕的。最适合游戏的麦克风:确保您的声音被听到最佳网络摄像头:在您直播时被看到最好的采集卡:使用专用卡减轻负载目前,该软件只能使用英语,谷歌博客文章中关于其推出的注释称,它将“有时会引入准确性”。它经常被称为“幻觉”,但它实际上只是一个听起来很花哨的术语,指的是人工智能有点裤子(糟糕)。音频概述中的一个功能似乎是能够打断扬声器,并假设改变对话的方向或提出即时更正。这是人与机器人的接触,但也同样奇怪。从那里开始,他在 PCGamesN 担任硬件作家,从事专业的破坏工作,并继续以硬件编辑的身份管理团队。