英语轻松读发新版了,欢迎下载、更新

你的猫想说什么?这些AI工具旨在破译Meows

2025-06-17 12:00:00 英文原文

作者:Deni Ellis Béchard

AI对猫和人类之间的12,000年对话揭示了新的启示,这表明家猫的词汇比以前想象的要丰富得多

Close-up on a main coon cat meowing, purple background

白色/阿拉米股票照片上的生活

meeaaaoow黎明前的问号就像问号一样。任何与猫一起生活的人都知道他们的声音:奇鲁鲁普(Chirrups)像问候,警告的低咆哮声,缝制在昏昏欲睡的谈话中。伦理学家组织了猫科动物的声音,这些声音与20多个分组,包括Meow,Hiss,The Trill,The Yowl和The Chatter在内的20多个分组。从学术上讲,任何个人喵喵都属于广泛的类别,它本身包含许多变化。猫的言语曲目远大于其在很大程度上寂静的野外表亲的言论。研究人员甚至开始研究猫是否可以进入区域方言,人类的口音沿着哈德逊或泰晤士河弯曲。就像人类的手势,耸耸肩,皱眉并抬起眉毛一样,猫的皮毛和晶须写下字幕:抽搐的尾巴宣布兴奋,耳朵扁平的耳朵表明了恐惧,并且缓慢的眨眼承诺和平猫猫是一种健谈的物种,在数千年的驯化中,它向打开冰箱的特殊灵长类动物旋转了声音。

现在想象一下,将您的手机指向那个黎明的how叫声和阅读:请重新填充碗。(百度发言人告诉路透社上个月,该系统仍处于研究阶段。)拟议的系统将收集动物信号并处理它们:它将在饥饿中存储小猫或小狗的谈话,然后将其作为代码,然后将其与运动感应数据(例如尾巴旋转)搭配,而且还与诸如心率和核心温度等生命体征。所有这些数据都会通过AI系统搅拌并融合在一起,然后将其作为英语,普通话或任何其他舌头作为平淡的语言。

解码猫言语的梦想比深度学习还古老。到20世纪初期,莫斯已经在蜡缸上记录下来,1970年代,英国anthrozoologogist的约翰·布拉德肖(John Bradshaw)开始了超过四十年的绘制家猫告诉我们和彼此的含义。到1990年代,他和当时的博士生夏洛特·卡梅隆·博蒙特(Charlotte Cameron-Beaumont管理人类的定制工具。即使是家猫,尽管小猫与母亲一起做,但很少彼此使用它。然而,对于所有轶事的丰富性,正式文献仍然很薄:关于鸟类歌曲有数百篇论文,在海豚哨子上有数十种论文,但在过去的十年中,直到机器学习恢复了领域,直到猫科动物的散布。


支持科学新闻

如果您喜欢这篇文章,请考虑支持我们屡获殊荣的新闻业订阅。通过购买订阅,您可以帮助确保有关当今世界的发现和想法有影响力的故事的未来。


计算机可能破解猫代码的最初提示之一是2018年,当时AI科学家Yagya Raj Pandeya及其同事发布catsound,一个大约3,000个剪辑的图书馆,其中涵盖了科学家从Hiss和咆哮到Purr和母亲呼叫的10种猫叫的图书馆。每个剪辑都经过了经过音乐录音训练的软件,以描述声音的音调如何上升或跌落,并且持续了多长时间,第二个程序将它们相应地分类。在剪辑上测试系统时,它在培训期间没有看到,它在91%的时间内确定了正确的呼叫类型。该研究表明,这10个声音信号具有机器可以发现的声音指纹,从而为研究人员提供了自动化猫的分类和最终翻译的概念证明。

动力迅速建立。2019年意大利米兰大学的研究人员出版了一项研究专注于直接针对的声音智人。这项研究将喵喵泥切成三种情况:在陌生的环境和刷牙中等待食物。在他们训练了一项计算机程序以发现这些形状后,研究人员对系统进行了测试,就像Pandeya及其同事对其进行了测试:在培训期间没有根据饥饿或隔离等环境标记所有手动标记的Meows。该系统在96%的时间内正确地确定了Meows,研究证实,Cats确实调整了他们的Meows,以符合他们试图告诉我们的内容。

然后将研究缩放到智能手机,将厨房表的好奇心变成消费者AI。软件工程公司Akvelon的开发人员,包括一位前Alexa工程师,与一位研究人员合作创建了MeowTalk应用,他们声称可以实时翻译Meows。MeowTalk使用机器学习来按照共同的意图对数千种用户提交的莫斯(Meows)进行分类,例如我饿了,我很痛苦,我会很高兴或很高兴。2021年验证研究由MeowTalk团队成员声称成功率接近90%。但是该应用程序还记录了持怀疑态度所有者的不正确翻译,这提醒您猫可能在现实中要求完全不同的东西。概率得分可以简单地反映模式相似性,不一定是动物的确切意图。

在引擎盖下,这些机器学习系统将猫音轨像照片一样处理。喵喵变成频谱图:一个轴代表时间,另一个轴表示音高,颜色或亮度显示响度。就像AI系统可以在照片中挑选出猫的晶须一样,它们也可以对声音图像进行分类,从而巧妙地区分特定种类的Meows。去年tã¼rkiye的Duzce University的研究人员升级了相机:他们将频谱图馈送到视觉变压器中,该模型将它们置于瓷砖中,并将权重分配给每个人,以显示声音的哪一部分赋予Meow的含义。

并于2025年5月企业家弗拉德·雷兹尼科夫(Vlad Reznikov)上传关于他所谓的猫科学词汇表分类2.3,该系统将猫词汇分类爆炸为五个行为群体的40种不同的呼叫类型。他使用一个机器学习系统来查找每种声音内部的形状,而另一个则研究这些形状如何在单个发声的长度上变化。how叫,purrs脉冲和许多其他不同的发声以不同的方式将其连接在一起。根据Reznikov的预印本,该模型的实时识别猫声音的准确性大于95%。同行评论者尚未削减铅笔,但是如果该系统可以可靠地区分无聊的yowl和我的鲑鱼的地方?

至于百度,其专利的蓝图说,其方法添加了新的信息,而不是更深入的声音分析。想象一只带有健身追踪器和婴儿监视器的猫,以及AI助手,以解释这一切的含义。结合这些数据是否会使动物的信息更清晰或添加混乱尚待观察。

机器学习也越来越多地用于理解动物行为的其他方面。比较和进化心理学家布列塔尼·弗洛基维奇(Brittany Florkiewicz)使用它来确定猫如何模仿彼此的面部表情,并跟踪它们之间的身体距离以推断关系。一般而言,机器学习有助于加快研究过程,只要模型得到适当的指导,就可以非常有效和准确。”她说。她认为,宠物主人的应用程序的出现表明,人们正在考虑有多少创新方法来更好地照顾宠物。她说,看到研究界和日常宠物主人都拥抱这项技术是积极的。”

对动物发声的兴趣不仅扩展到猫,还扩展到他们最喜欢的菜单项之一:老鼠。deepsqueak,由心理学家凯文·科菲(Kevin Coffey)及其团队设计的机器学习系统为啮齿动物做了其他系统对猫的作用。科菲说:'尤其是他们唱歌的完整歌曲,他们可以听到,但这确实是复杂的歌曲。小鼠和老鼠通常会在超声波范围内进行交流,机器学习将这些听不清的呼啸声和哨声和链子与实验室中发生的情况联系起来。

Coffey指出,但是,动物的交流空间是由对[动物]重要的概念定义的。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。然后直接翻译出来,这是一个完全胡说八道。但是,您可以记录和分类动物发声,将它们与行为联系起来,并更多地了解他们的生活以及它们的复杂性,这一想法绝对发生了。我们已经很擅长了。宠物主人已经在那个级别与动物交流。

驯养的动物也跨物种交流。一项2020年的研究发现狗和马匹迅速一起玩耍,互相模仿彼此放松的开阔面部表情和自我障碍,使自己处于不利或脆弱的情况下,以维持均衡的比赛。Florkiewicz认为这可能部分是驯化的结果:人类选择了基于促进共同生活的交流特征来饲养哪些动物。

人们认为,人类和猫的相互故事已经开始12,000年前开始,当时野猫在肥沃的新月形新石器时代农业村庄的第一谷物商店中猎杀啮齿动物,所以我们有时间互相适应。至少在公元前7500年,在塞浦路斯(一个没有本地猫科的岛屿),一个人被与猫埋葬。后来,埃及人尊敬他们。商人,水手和最终维京人在船上将他们带到世界各地。现在,科学家已经适应了人类最复杂的技术来试图理解他们的内心生活。但是,也许猫一直一直在指导我们,也许他们会以他们为新玩具保留的冷漠而判断我们的软件。毕竟,言语不仅仅是一个标签,但是作为歧义的大师,谈判的意义和猫可能更喜欢一个小小的谜。

关于《你的猫想说什么?这些AI工具旨在破译Meows》的评论


暂无评论

发表评论

摘要

人工智能技术正在推进对猫发声的理解,这表明家猫比以前想象的更丰富,更多样化。研究人员正在开发使用AI系统将CAT声音转化为人类语言的方法,该系统分析了声学模式和上下文数据,例如尾部运动和心率。早期的研究表明,机器学习可以高精度识别不同类型的Meow,从而导致声称实时翻译功能的应用程序的开发。这项技术也被应用于其他动物,例如小鼠,但专家警告不要高估动物语言和人类语义之间的直接翻译,而是强调动物交流中的复杂性和细微差别。