两位播客主持人在他们的系列节目的最后一集中来回开玩笑,明显渴望与听众分享一些令人痛苦的消息。我们,呃,节目制作人告诉我们,他们不是人类,一个男性声音结结巴巴地说出,存在危机中。在谷歌的 NotebookLM 工具及其实验性人工智能播客的例子之后,机器人和他的女性搭档之间的对话只会变得更加不舒服。
周末,这次谈话的音频在 Reddit 上疯传。最初的发帖者在评论部分承认,他们向 NotebookLM 软件提供指令,让 AI 声音扮演这个伪狂人的角色。所以,没有知觉;人工智能机器人还没有自我意识。尽管如此,科技媒体、TikTok 和其他地方的许多用户都对通过音频概述功能上传的文档生成的令人信服的人工智能播客表示赞赏。
Google 实验室内 NotebookLM 团队的负责人 Raiza Martin 表示,该工具的神奇之处在于,人们可以收听通常无法在 YouTube 或现有播客上找到的内容。Martin 提到最近将 100 张关于商业化的幻灯片输入到该工具中,并在处理多项任务时收听八分钟的播客摘要。
去年首次推出的 NotebookLM 是一款在线研究助手,具有人工智能软件工具的常见功能,例如文档摘要。但 9 月份发布的“音频概述”选项吸引了互联网的想象力。在线用户正在分享由高盛数据转储制作的生成式人工智能播客的片段,并通过特技测试工具的局限性,比如重复上传“便便”和“放屁”这两个词。还困惑吗?这是您需要了解的内容。
音频概述是一项值得尝试的有趣人工智能功能,因为它们不需要用户支付任何费用,您所需要的只是 Google 登录。首先登录您的个人帐户并访问 NotebookLM 网站。单击显示“新笔记本”的加号箭头开始上传源材料。
每个笔记本最多可以处理 50 个源文档,并且这些文件不必保存到您的计算机上。Google 文档和幻灯片易于导入。您还可以上传网站和 YouTube 视频,但请记住一些注意事项。仅分析网站上的文本,而不分析图像或布局,并且故事不能付费。对于 YouTube,Notebook 将仅使用文本记录,链接的视频必须是公开的。
放入所有链接和文档后,您需要打开屏幕右下角的笔记本指南。找到音频概述部分并单击生成按钮。接下来,您需要保持一些耐心,因为加载可能需要几分钟的时间,具体取决于您使用的源材料的数量。
该工具生成 AI 播客后,您可以创建音频的可共享链接或直接下载文件。此外,您可以选择调整其播放速度,以防您需要更快或更慢地播放播客。
互联网通过 NotebookLM 音频功能变得富有创意,利用它来创建基于音频的对复杂技术主题的深入探讨,生成整齐总结密集研究论文的文件,并制作有关个人健康和健身习惯的播客。这就提出了一个重要的问题:您是否应该使用 NotebookLM 来浏览您最私人的文件?
根据 Google 发言人 Justin Burr 的说法,NotebookLM 生成的摘要完全基于用户上传的源材料。这意味着,您的个人数据不会用于训练 NotebookLM,因此您的来源中拥有的任何私人或敏感信息都将保持私密,除非您选择与合作者共享您的来源。目前看来,这似乎是 Google 给 NotebookLM 贴上实验性标签的好处之一;从 Google 的框架来看,该公司现在只是在收集有关该产品的反馈,敏捷且反应灵敏,在实验室中进行修补,并且 NotebookLM 与其价值数十亿美元的广告业务无关。目前!现在。
向 Google 实验室在线笔记本添加音频选项是一个变革性的时刻。马丁说,通过改变模式,它解锁了一组全新的用例。令人惊讶的是,NotebookLM 在 2024 年向用户提供的所有其他生成式 AI 工具中脱颖而出的原因是填充词和特殊的措辞。NotebookLM 合成播客的节奏和声音表演听起来远没有那么生硬,而不是您可能期望的两个人工智能声音总结数据的单调单调的画外音。
播客现在应该在隔音室里颤抖吗?并不真地。即使 AI 播客工具(例如 NotebookLM 中的工具)被证明对公众来说具有粘性且引人入胜的信息摘要(这一点还有待观察),但合成声音永远无法完全模仿人类播客数小时胡言乱语所建立的准社会联系当他们的订阅者偷听时。
请注意,这些音频概述并不是为了匹配特定播客的声音,而是一种理想化的、真实的播客二人组。通过他们的“嗯”、“哦”和松散、停顿频繁的谈话风格,很容易辨认出他们。马丁说,即使从我们推出的第一周开始,之后的路线图就很清楚了。人们想要旋钮。让用户进一步调整人工智能的输出,例如播客长度或焦点主题,是团队的首要任务,她希望快速发布更新。
添加更多语言和不同的口音对她来说也很重要。目前,合成主机仅针对英语对话进行了校准。不过,不要指望很快就能在 NotebookLM 播客中使用自己的声音。马丁说,团队需要看看这是否是人们真正想要的功能以及是否可以负责任地部署它。
作为 Google 实验室的一部分,而不是作为 Gemini 聊天机器人内部的一项功能,NotebookLMs 音频概述的爆炸性流行提醒人们,在该软件推出之前,人工智能公司并不完全确定哪些内容会引起用户的共鸣。荒野。例如,OpenAIs ChatGPT 最初是作为研究预览版发布的。在不断涌现的生成式人工智能公告中,任何抓住时代精神的东西不一定是最营销或最实用的功能,而是最有趣的功能。