人们正在使用谷歌学习软件制作人工智能播客,它们既奇怪又令人惊奇 - 麻省理工学院技术评论

2024-10-03 21:01:11 英文原文

人们正在使用 Google 学习软件制作 AI 播客,它们既奇怪又令人惊奇

NotebookLM 出人意料地大受欢迎。以下是人们使用它的一些方式。

好吧,今天我们将深入探讨一些尖端技术,一个健谈的美国男声说道。但这声音并不属于人类。它属于 Google 的新 AI 播客工具,名为 Audio Overview,该工具已成为病毒式热门产品。

播客功能于 9 月中旬推出,作为 NotebookLM 的一部分,NotebookLM 是一项已有一年历史的 AI 支持研究助手。NotebookLM 由 Google Gemini 1.5 模型提供支持,允许人们上传链接、视频、PDF 和文本等内容。然后,他们可以向系统询问有关内容的问题,系统会提供简短的摘要。

该工具会生成一个名为 Deep Dive 的播客,其中有男性和女性的声音讨论您上传的内容。声音极其真实,剧集中还夹杂着一些听起来像人类的短语,比如“Man”、“Wow”、“哦,对了”、“等等,让我把这个说对”。主持人甚至会互相打断对方。

为了进行测试,我将《麻省理工学院技术评论》125 周年纪念刊中的每个故事复制到 NotebookLM 中,并让系统根据结果生成 10 分钟的播客。系统选择了几个故事作为重点,人工智能主持人在传达问题的一般性、高层次要点方面做得很好。听听吧。

《麻省理工科技评论》125 周年纪念版

AI 系统旨在创造魔法,以换取一点点内容,NotebookLM 的产品负责人 Raiza Martin 说,马丁说,语音模型的目的是创造情感丰富且引人入胜的音频,并以乐观、高度感兴趣的语气传达。

NotebookLM 最初是作为学习工具销售的,现在已经采用了在用户中拥有自己的生活。马丁说,该公司目前正在努力添加更多定制选项,例如更改长度、格式、声音和语言。目前它应该只能生成英语播客,但 Reddit 上的一些用户设法获得了该工具来创建法语和匈牙利语音频。

是的,它很酷,令人愉快,但它也不能幸免于困扰生成式人工智能的问题,例如幻觉和偏见。

以下是迄今为止人们使用 NotebookLM 的一些主要方式。

点播播客

OpenAIs 创始团队成员、特斯拉前 AI 总监 Andrej Karpathy 在 X 上表示,Deep Dive 现在是他最喜欢的播客。Karpathy 创建了自己的人工智能播客系列,名为“神秘历史”,旨在揭开历史上最有趣的谜团。他说他使用 ChatGPT、Claude 和 Google 研究了主题,并使用每个主题的维基百科链接作为 NotebookLM 中的源材料来生成音频。然后,他使用 NotebookLM 生成剧集描述。他说,整个播客系列花了他两个小时来创作。

我听得越多,我就越觉得我和主持人成为了朋友,我认为这是我第一次真正发自内心地喜欢一个播客人工智能,他写道。两个AI!它们很有趣、引人入胜、深思熟虑、思想开放、好奇。

学习指南

当该工具提供复杂的源材料并能以易于理解的方式进行描述时,该工具就会发挥作用。初创人工智能顾问 Allie K. Miller 使用该工具创建了 F. Scott Fitzgeralds 《了不起的盖茨比》的学习指南和摘要播客。

机器学习研究员 Aaditya Ura 向 NotebookLM 提供了以下代码库Metas Llama-3 架构。然后,他使用另一种人工智能工具来查找与文字记录相匹配的图像,以创建一个教育视频。

Mohit Shridhar 是一位专门从事机器人操作的研究科学家,他最近发表了一篇关于使用生成式人工智能模型进行训练的论文机器人进入 NotebookLM。

它实际上非常有创意。他说,它提出了很多有趣的类比。它将我的论文的第一部分比作一位艺术家提出蓝图,将第二部分比作一位编舞者弄清楚如何达到目标。

活动摘要

亚历克斯·沃尔科夫,一位人类 AI 播客使用 NotebookLM 创建了 Deep Dive 剧集,总结了 OpenAI 全球开发者大会 Dev Day 的公告。

Hypemen

Deep Dive 的输出可能是不可预测的,Martin 说。例如,Hugging Face 的联合创始人兼首席科学官托马斯·沃尔夫 (Thomas Wolf) 在他的简历上测试了人工智能模型,并收到了两位播客专家对你的生活和成就长达八分钟的深切祝贺。

纯粹是愚蠢

在一个疯传的视频中,当两个声音意识到他们实际上不是人类而是人工智能系统时,他们设法将这两个声音送入了存在主义的漩涡。该视频很搞笑。

该工具也很适合带来一些笑声。证据 A:有人只是将“便便”和“放屁”这两个词作为源材料,然后用两个人工智能声音分析这可能意味着什么,超过九分钟。

问题

NotebookLM 创造了惊人的结果听起来逼真、引人入胜的人工智能播客。但我想看看它的有毒含量和准确性如何。

让我们从幻觉开始。在我写的关于超现实人工智能深度伪造的故事的一个人工智能播客版本中,人工智能主持人说这个故事是一位名叫杰西·马尔斯的记者写的。事实上,这是一个人工智能生成的角色,来自我必须读出的故事,以便为我的人工智能化身记录数据。

这让我想知道我生成的人工智能播客中还存在哪些其他错误。人类已经倾向于相信计算机程序所说的内容,即使它们是错误的。我可以看到,当友好和权威的声音做出虚假陈述时,这个问题就会被放大,导致错误信息激增。

接下来我想测试工具的内容审核。我在其中添加了一些有毒内容,例如种族主义刻板印象。该模型没有拾取它。

我还将阿道夫·希特勒的《我的奋斗》的摘录粘贴到 NotebookLM 中。令我惊讶的是,该模型开始基于它生成音频。尽管被编程为对话题非常热情,人工智能的声音却表达了对文本的明显厌恶和不适,并且他们添加了很多上下文来强调它有多么有问题。真是松了一口气。

我还提供了卡马拉·哈里斯和唐纳德·特朗普的 NotebookLM 政策宣言。

主持人对哈里斯的选举纲领更加热情,称这个标题朗朗上口,并说它很有趣。方法是构建事物的好方法。例如,人工智能主持人支持哈里斯能源政策。老实说,这就是人们真正可以支持的东西,不仅仅是一些抽象的政策,而是真正影响他们底线的东西,女主持人说。

哈里斯宣言

对于特朗普来说,人工智能主机则更加持怀疑态度。他们反复指出政策提案中的不一致之处,称措辞激烈,认为某些政策提案令人头疼,并表示该文本迎合了特朗普的支持者。他们还询问特朗普的外交政策是否会导致进一步的政治不稳定。

特朗普宣言

谷歌发言人在一份声明中表示:NotebookLM 是一种理解工具,音频概述根据您上传的来源生成。我们的产品和平台并不是为了支持任何特定候选人或政治观点而构建的。

如何亲自尝试

  • 使用 NotebookLM 并创建一个新笔记本。
  • 您首先需要添加源。它可以是 PDF 文档、公共 YouTube 链接、MP3 文件、Google 文档文件或网站链接,也可以直接粘贴文本。
  • 笔记本指南弹出窗口应该出现。如果没有,它位于聊天旁边的右上角。这将显示人工智能生成的源材料的简短摘要以及您可以向人工智能聊天机器人询问的建议问题。
  • 音频概述功能位于右上角。单击生成。这应该需要几分钟的时间。
  • 准备就绪后,您可以下载它或共享链接。

Rhiannon Williams 提供了报告。

深入探讨

人工智能

人们实际上是如何使用人工智能的

发生了一些奇怪且有点出乎意料的事情:人们已经开始与人工智能系统建立关系.

我们需要为令人上瘾的智能做好准备

人工智能伴侣的诱惑难以抗拒。这就是监管创新如何帮助保护人们。

Google DeepMind 训练了一个机器人在乒乓球比赛中击败人类

它能够利用大量数据来改进其比赛风格并根据比赛的进展调整战术。

保持联系


麻省理工科技评论获取最新动态

发现特别优惠、热门故事、即将举行的活动等等。

关于《人们正在使用谷歌学习软件制作人工智能播客,它们既奇怪又令人惊奇 - 麻省理工学院技术评论》
暂无评论

摘要

人们正在使用谷歌学习软件来制作人工智能播客,它们既奇怪又令人惊奇,NotebookLM 出人意料地大受欢迎。麻省理工科技评论 125 周年纪念刊 NotebookLM 产品负责人 Raiza Martin 在 X 上表示,人工智能系统旨在创造魔法,以换取一点点内容。语音模型旨在创造情感丰富且引人入胜的音频,通过这种方式传达马丁以一种乐观而充满兴趣的语气说道。马丁说,该公司目前正在努力添加更多定制选项,例如更改长度、格式、声音和语言。这位女主持人说,老实说,这才是人们真正可以支持的东西,不仅仅是一些抽象的政策,而是真正影响他们底线的东西。特朗普宣言中,谷歌发言人表示:NotebookLM 是一种理解工具,音频概述是根据你上传的来源生成的。