作者:Kyle Wiggers
Meta 发布了一个“开放”的实现病毒式播客生成功能在 Google 的 NotebookLM 中。
被称为笔记本骆驼,该项目使用 Meta 自己的骆驼毫不奇怪,大部分处理都使用模型。与 NotebookLM 一样,它可以对上传到其中的文本文件生成来回、播客风格的摘要。
NotebookLlama 首先从文件创建一个转录本 – 例如新闻文章或博客文章的 PDF。然后,它会添加“更多戏剧化”和中断,然后将文本输入打开文本转语音模型。
结果听起来不如 NotebookLM 好。在笔记本中骆驼样品我听过,这些声音对他们来说有一种非常明显的机器人品质,并且倾向于在奇怪的地方互相交谈。
但该项目背后的 Meta 研究人员表示,可以通过更强大的模型来提高质量。
“文本转语音模型限制了听起来的自然程度,”他们在 NotebookLlama 的 GitHub 页面上写道。-[此外,]编写播客的另一种方法是让两名代理就感兴趣的话题进行辩论并编写播客大纲。现在我们使用单个模型来编写播客大纲。”
NotebookLlama 不是第一个试图复制 NotebookLM 的播客功能。有些项目比其他项目更成功。但没有一个(甚至 NotebookLM 本身)能够解决这个问题幻觉问题那是所有人工智能的狗。也就是说,人工智能生成的播客是一定会包含一些虚构的东西。
Kyle Wiggers 是 TechCrunch 的高级记者,对人工智能特别感兴趣。他的文章曾发表在 VentureBeat 和 Digital Trends 以及一系列小工具博客上,包括 Android Police、Android Authority、Droid-Life 和 XDA-Developers。他和他的伴侣(一位钢琴教育家)住在布鲁克林,他自己也涉足钢琴。偶尔——如果大多不成功的话。
订阅业界最大的科技新闻