作者:by Boston University School of Medicine
生成人工智能(AI)的兴起,尤其是大语言模型(LLMS),标志着数据分析,解释和内容产生的变革性转变。这些模型在广泛的文本数据集中受过培训,已经证明了能够生成上下文准确且语言丰富的输出的能力,对科学和医学等领域产生了深远的影响,在该领域中,OpenAI的GPT-4等模型表现出了显着的才能。
但是,LLM在科学,技术,工程,数学和医学(STEMM)中的全部潜力尚未得到充满反感,尤其是在整合非传统数据模式(例如音频内容)方面。
在一项新的研究中,波士顿大学的研究人员介绍了一项名为Podgpt的新创建的计算机程序,该计划从科学和医学播客中学习,以更加智能理解和回答科学问题。工作是出版在日记中NPJ生物医学创新。
“通过整合口头内容,我们旨在增强模型对会话语言的理解,并将其应用扩展到Stemm学科中更专业的环境,”波士顿大学Chobanian&Avedisian Medicine的医学和计算机科学副教授Vaha解释说。
“这很特别,因为它使用真实的对话,例如专家访谈和谈话,而不仅仅是书面材料,可以帮助人们更好地了解人们如何在现实生活中实际谈论科学。”
Kolachalama和他的同事收集了超过3,700个小时的公共科学和医学播客,并使用高级软件将演讲变成了文字。然后,他们培训了计算机模型以从这些信息中学习。
此后,他们对生物学,数学和医学等主题的各种测验进行了测试,包括不同语言的问题,以了解其表现的效果。结果表明,合并STEMM音频播客数据增强了其模型理解和生成精确和全面信息的能力。
根据研究人员的说法,这项研究表明,基于语音的内容(例如播客)可用于培训AI工具。Kolachalama还是波士顿大学计算与数据科学学院的创始成员,也是波士顿大学Hariri计算机研究所的分支机构。
Kolachalama说:“这为使用各种音频(例如讲座或访谈)打开了大门,以构建更智能,更类似人类的技术。它还显示出使科学在多种语言中更容易获得的希望,帮助世界各地的人们学习和保持知情。”
研究人员不仅认为这项技术将有助于使科学和医学知识更容易访问,但是聆听该领域专家的对话将有助于人们对健康和教育做出更明智的决定。
“这可以有助于改善许多人的理解和诊断健康状况例如阿尔茨海默氏病,心血管疾病,传染病,癌症和心理健康。它也可能支持在类似的领域学习公共卫生和行星健康。
更多信息:Shuyue Jia等人,Podgpt:一个音频增强的研究和教育大型语言模型,NPJ生物医学创新(2025)。doi:10.1038/s44385-025-00022-0
引用:Podgpt:AI模型从科学播客中学习以更好地回答问题(2025年7月7日)检索2025年7月8日来自https://phys.org/news/2025-07-podgpt-ai-science-podcasts.html
该文档具有版权。除了为私人研究或研究目的的任何公平交易外,没有未经书面许可,可以复制部分。内容仅用于信息目的。