作者:By Christian Elliottarchive page
九月的一个夜晚,一只小鸣鸟在纽约伊萨卡上空翱翔。它是 40 亿只鸟类中的一员,这是一条每年穿越北美的羽毛迁徙大河。在半空中,他发出鸟类学家所说的夜间飞行叫声来与他的鸟群交流。这是最短的信号,只有 50 毫秒长,在半夜的树林中发出。但人类还是通过顶部有聚焦漏斗的麦克风捕捉到了它。不久之后,纽约大学、康奈尔鸟类学实验室和南特中央大学合作开发的名为 BirdVoxDetect 的软件识别了这只鸟,并将其分类到物种级别。
像康奈尔大学的安德鲁·法恩斯沃思这样的生物学家长期以来一直梦想着以这种方式窥探鸟类。在一个日益变暖的世界里,人类基础设施越来越多,比如玻璃摩天大楼和电线,这些对它们来说可能是致命的,候鸟面临着许多生存威胁。科学家们依靠多种方法的组合来追踪它们迁徙的时间和地点,但每种方法都有缺点。过滤掉天气因素的多普勒雷达可以检测空气中鸟类的总生物量,但它无法按物种细分该总生物量。对个体鸟类进行 GPS 标记以及公民科学家观鸟者的仔细观察有助于填补这一空白,但大规模标记鸟类是一项昂贵且具有侵入性的提议。还有另一个关键问题:大多数鸟类在夜间迁徙,此时肉眼识别它们更加困难,而且大多数观鸟者都在床上。一个多世纪以来,声学监测作为一种解决鸟类学家困境的方法一直遥不可及。
1800 年代末,科学家们意识到候鸟会发出特定物种的夜间飞行叫声——声学指纹。——当麦克风在 20 世纪 50 年代投入商业使用时,科学家们开始在夜间记录鸟类的声音。Farnsworth 在 20 世纪 90 年代领导了一些声学生态学研究。但即便如此,发现这些短叫声仍然具有挑战性,其中一些短叫声位于人类可以听到的频率范围的边缘。科学家们最终获得了数千卷磁带,他们必须在查看音频可视化频谱图的同时实时搜索。法恩斯沃斯说,尽管数字技术使录音变得更加容易,但“永恒的问题是,收集大量音频数据变得越来越容易,但分析其中的一些数据却变得越来越困难。”¤
随后范斯沃斯遇到了纽约大学音乐和音频研究实验室主任胡安·巴勃罗·贝洛 (Juan Pablo Bello)。贝洛刚刚完成一个利用机器学习来识别纽约市城市噪音污染源的项目,他同意解决夜间航班呼叫的问题。他组建了一个包括法国机器聆听专家 Vincent Lostanlen 在内的团队,并于 2015 年诞生了 BirdVox 项目,以实现这一过程的自动化。“每个人都想,“最终,当这颗坚果被破解时,这将成为一个超级丰富的信息来源,”法恩斯沃斯说。但洛斯坦伦回忆说,一开始,“甚至没有任何迹象表明这是可行的。”机器学习能够达到像法恩斯沃斯这样的专家的听力能力似乎是不可想象的。
“安德鲁是我们的英雄,”贝洛说。“我们想要用计算机模仿的就是安德鲁。”
他们首先训练 BirdVoxDetect(一种神经网络)来忽略由于雨水损坏麦克风而导致的低嗡嗡声等故障。然后,他们训练系统来检测飞行呼叫,这些飞行呼叫在物种之间(甚至内部)有所不同,并且很容易与汽车警报器或弹簧窥视器的鸣叫声混淆。洛斯坦伦说,这一挑战类似于智能扬声器在聆听其独特的“唤醒词”时所面临的挑战,只不过在这种情况下,从目标噪声到麦克风的距离要大得多(这意味着更多背景噪声进行补偿)。当然,科学家们无法选择像“Alexa”或“Hey Google”这样的独特声音作为触发器。——对于鸟类来说,我们并没有真正做出这样的选择。查尔斯·达尔文为我们做出了这个选择,”他开玩笑说。幸运的是,他们有大量的训练数据可供使用——Farnsworth 的团队手工注释了伊萨卡麦克风收集的数千小时的录音。
当 BirdVoxDetect 接受训练来检测飞行叫声后,另一个艰巨的任务摆在面前:教它按物种对检测到的叫声进行分类,而很少有专业观鸟者能够通过耳朵来做到这一点。为了应对不确定性,并且由于没有每个物种的训练数据,他们决定采用分层系统。例如,对于给定的叫声,BirdVoxDetect 可能能够识别鸟的目和科,即使它不确定物种,就像观鸟者至少可以识别出鸟的叫声一样。莺,无论是黄腰莺还是栗翅莺。在训练中,当神经网络将分类树上更接近的鸟类混合在一起时,神经网络受到的惩罚较小。一个
去年八月,该团队发表了一篇论文,详细介绍了 BirdVoxDetect 的机器学习算法,结束了八年的研究。他们还将该软件作为免费的开源产品发布,供鸟类学家使用和改编。在对整个季节的迁徙记录总计 6,671 小时的测试中,神经网络检测到 233,124 次飞行呼叫。在 2022 年的一项研究中应用生态学杂志测试 BirdVoxDetect 的团队发现声学数据在估算总生物量方面与雷达一样有效。
BirdVoxDetect 适用于北美迁徙鸣禽的一个子集。但通过“少样本”学习,只需几个训练样本,它就可以被训练来检测其他类似的鸟类。贝洛说,这就像学习一门与你已经使用的语言相似的语言。借助廉价的麦克风,该系统可以扩展到世界各地没有观鸟者或多普勒雷达的地方,即使在截然不同的记录条件下也是如此。“如果你去参加生物声学会议并与很多人交谈,他们都有不同的用例,”洛斯坦伦说。他说,生物声学的下一步是创建一个基础模型,就像科学家正在研究的自然语言处理以及图像和视频分析的模型一样,该模型可以针对任何物种进行重新配置,甚至超越鸟类。这样,科学家就不必为他们想要研究的每种动物构建新的 BirdVoxDetect。
BirdVox 项目现已完成,但科学家们已经在其算法和方法的基础上进行构建。伊利诺伊大学厄巴纳-香槟分校的迁徙生物学家本杰明·范·多伦 (Benjamin Van Doren) 曾参与 BirdVox 的研究工作,他正在使用 Nighthawk(一种基于 BirdVoxDetect 和流行的鸟鸣 ID 应用程序 Merlin 的新型用户友好型神经网络)来研究在芝加哥和美国上空迁徙的鸟类。北美和南美的其他地方。温莎大学生物声学实验室的负责人丹·门尼尔 (Dan Mennill) 表示,他很高兴能在飞行通话中尝试使用“夜鹰”通话,目前他的团队正在用五大湖加拿大一侧的麦克风录制这些通话后进行手工注释。声学监测的一个弱点是,与雷达不同,单个麦克风无法检测头顶鸟类的高度或其移动方向。门尼尔的实验室正在试验一组八个麦克风,可以通过三角测量来解决这个问题。筛选录音的速度很慢。但有了 Nighthawk,分析速度将显着加快。
门尼尔说,随着鸟类和其他迁徙动物受到威胁,BirdVoxDetect 的出现恰逢其时。实时准确地了解哪些鸟类正在飞过可以帮助科学家密切关注物种的活动以及它们的去向。这可以为实际的保护工作提供信息,例如鼓励摩天大楼在夜间变暗以防止鸟类碰撞的“熄灯”倡议。“生物声学是迁移研究的未来,我们确实刚刚进入拥有合适工具的阶段,”他说。– 这将我们带入了一个新时代。 –
克里斯蒂安·埃利奥特(Christian Elliott)是伊利诺伊州的一名科学和环境记者。一个