Meta 发布了 Google 播客生成器的“开放”版本 |TechCrunch

2024-10-27 17:20:47 英文原文

作者:Kyle Wiggers

Meta 发布了一个“开放”的实现病毒式播客生成功能在 Google 的 NotebookLM 中。

被称为笔记本骆驼,该项目使用 Meta 自己的骆驼毫不奇怪,大部分处理都使用模型。与 NotebookLM 一样,它可以对上传到其中的文本文件生成来回、播客风格的摘要。

NotebookLlama 首先从文件创建一个转录本 – 例如新闻文章或博客文章的 PDF。然后,它会添加“更多戏剧化”和中断,然后将文本输入打开文本转语音模型。

Meta NotebookLlama
图片来源:

结果听起来不如 NotebookLM 好。在笔记本中骆驼样品我听过,这些声音对他们来说有一种非常明显的机器人品质,并且倾向于在奇怪的地方互相交谈。

但该项目背后的 Meta 研究人员表示,可以通过更强大的模型来提高质量。

“文本转语音模型限制了听起来的自然程度,”他们在 NotebookLlama 的 GitHub 页面上写道。-[此外,]编写播客的另一种方法是让两名代理就感兴趣的话题进行辩论并编写播客大纲。现在我们使用单个模型来编写播客大纲。”

NotebookLlama 不是第一个试图复制 NotebookLM 的播客功能。有些项目比其他项目更成功。但没有一个(甚至 NotebookLM 本身)能够解决这个问题幻觉问题那是所有人工智能的狗。也就是说,人工智能生成的播客是一定会包含一些虚构的东西

Kyle Wiggers 是 TechCrunch 的高级记者,对人工智能特别感兴趣。他的文章曾发表在 VentureBeat 和 Digital Trends 以及一系列小工具博客上,包括 Android Police、Android Authority、Droid-Life 和 XDA-Developers。他和他的伴侣(一位钢琴教育家)住在布鲁克林,他自己也涉足钢琴。偶尔——如果大多不成功的话。

订阅业界最大的科技新闻

有关的

关于《Meta 发布了 Google 播客生成器的“开放”版本 |TechCrunch》的评论


暂无评论

发表评论

摘要

Meta 发布了 NotebookLlama,这是 Google NotebookLM 功能的开放实现,可使用 Meta 的 Llama 模型从上传的文本文件生成播客风格的摘要。与 NotebookLM 不同的是,由于文本转语音模型的限制,NotebookLlama 中的音频质量不太自然,而且更加机械化。该项目旨在通过合并更强大的模型并可能使用两个代理来进行辩论驱动的播客大纲来进行改进。尽管做出了努力,人工智能生成的播客仍然面临准确性和幻觉问题。