Scott-Morgan基金会和联想公司推出了一套结合预测人工智能、超现实 avatar、个性化语音和眼球追踪的新技术套装。
华盛顿州西雅图市,2024年10月15日– 今天,在联想技术世界 '24,全球科技领导者联想和Scott-Morgan基金会(SMF),一个致力于创新辅助技术的非营利组织,公布了一项针对肌萎缩侧索硬化症(ALS)和其他严重残疾人群的人工智能解决方案。这项新的、可扩展的技术揭示了将生成式人工智能应用于无障碍挑战的新可能性,并进一步推进了共同实现无障碍愿景的目标。更智能的AI人人可用.
该集成解决方案结合了由SMF设计、联想打造的圆形键盘界面,联想的预测AI以及来自个性化AI语音复刻的元素ElevenLabs,超现实的Avatar来自D-ID以及来自的眼动追踪技术IrisBond提供快速、准确和个性化的沟通。
概念验证现在正在SMF的ALS社区成员和顶尖医生群体中进行积极测试,建立在……的基础上SMF与联想多年的合作重新构想并扩展辅助技术的规模。专注于肌萎缩侧索硬化症(ALS),这是一种通常会导致全身瘫痪的神经退行性疾病,这种关注可以启发出能够惠及无数其他疾病和残疾人的解决方案。
联想技术创新大会以一个最近被诊断出患有渐冻症的父亲使用技术用自己的声音为两个年幼的孩子讲故事和唱摇篮曲的故事开场。
“这是我们为所有人打造的更智能的人工智能:将变革性技术应用于人类面临的最紧迫挑战,”联想人工智能解决方案和服务副总裁林达·姚说道。“有了像斯科特-摩根基金会这样富有同情心的合作伙伴以及将AI带给每个人的大胆愿景,我们正在利用我们的AI专业知识和产品组合展示未来可以有多么光明。”
此次合作源于SMF使命,旨在打破技术之间的壁垒,让改变生活的解决方案民主化,确保所有人享有繁荣的普遍权利。
“我们生活在一个超过5亿人被沉默的世界里,不是出于选择,而是由于残疾,”SMF执行总监LaVonne Roberts说道。“想象一个世界,在这个世界中,即使是重度残疾人也能充分表达自己,尖端科技赋予无声者声音。我们不仅仅是在构想这个世界——我们正与联想一起共同构建它。目前已经有超过全球有5亿人患有肌肉或神经系统疾病“我们的工作有可能对广大人群的生活产生影响。”
联想科技世界现场直播
艾尔琳·泰勒是一位患有ALS的残疾倡导者和植物学爱好者,她利用这项技术介绍了自己,并随后欢迎联想董事长兼首席执行官杨元庆登台参加Tech World活动。
“当我看到通过技术所可能实现的一切时,尤其是在人工智能领域的最新进展,我重新获得了力量和希望,”Erin说道,她与一个迅速增长的群体分享她的经历和观点。社交媒体受众群体用我确诊前的声音说话确实令人难以置信,但最让我兴奋的是参与开发更智能的技术以帮助他人。
艾琳还帮助在展厅演示了这项技术,并继续向开发团队提供关键反馈。
基于早期设计的基础上首次在2024国际消费电子展亮相联想主导开发了一个完全功能的、全面集成的原型。
“我们优先考虑以人为中心的设计,并利用我们在创新用户体验方面的专业知识,”联想UX原型师Daniel Pollock说道,他领导了界面开发。“能够为这个项目贡献和合作并融入如此强大的人工智能技术,这是一种绝对的荣幸。”
建立人工智能创新联盟
传统的语音银行是一个艰辛的过程,常常受到渐冻症早期症状之一的声带退化的限制。过去的模型也明显缺乏情感表达能力,仅限于机械的语调和不自然的节奏——但人工智能已经改变了这一切。现在,即使是质量较差的有限音频样本也能生成一个引人入胜、按需定制的人工智能语音。
“在过去的一年里,我们深受那些在种种挑战中依然重拾声音的人们的启发,并且感谢有机会在这个过程中扮演一个小角色,”ElevenLabs的首席执行官Mati Staniszewski说道。“现在,凭借这令人难以置信的Scott-Morgan基金会的支持我们正在将这些努力提升到下一个层次。我们很自豪能够帮助消除沟通障碍并赋能人们。
那个定制的声音直接连接到D-ID的虚拟形象技术。同样,辅助技术的可扩展性和易用性是优先考虑的因素,而D-ID能够从静态照片或非常有限的视频生成逼真的虚拟形象。
“这项强大的技术经常被用于商业或娱乐领域——当然我们也乐于看到并支持这些应用——但推动社会公益才是我们看到它产生变革性影响的地方。D-ID长期以来一直利用其技术帮助诸如打击家庭暴力、提高对性 trafficking 的认识以及众多教育和倡导活动等值得的事业,”D-ID 的联合创始人兼首席执行官 Gil Perry 说道。“与这一合作项目完美契合了我们使用 AI 让世界变得更美好、更互联的战略。”
目前,该完整解决方案运行在联想ThinkPad x12可拆卸PC上,这款设备将性能与便携性完美结合。其可拆卸的形态使得该设备可以方便地安装在各种表面上——从厨房桌子到轮椅,并能够集成IrisBond的眼动追踪硬件和软件。在这里,IrisBond使用了他们的Hiru摄像头,它能够在不同的平台和条件下精确追踪眼动。联想还在开发更加个性化的AI模型以促进沟通。
“我们与SMF合作了几年,旨在颠覆辅助技术领域,并赋予人们更多的自主权和独立性,”IrisBond的首席执行官Eduardo Jauregui Torrecilla说。“我们有为ALS、脑瘫以及无数其他情况下的人们提供直接支持和开发的历史,在这些情况下,眼睛是我们交流的最佳工具——而人工智能正在以非凡的方式改变可能实现的事情。”
Scott-Morgan基金会将直接与临床医生、技术专家和患有ALS的人合作,进一步完善和测试该技术。
这一解决方案是富有远见的机器人专家彼得·斯科特-摩根博士的梦想之一,他于2022年去世。当时,渲染一个化身或用存储的声音交谈既耗时又昂贵,并且需要大量的资源,而且远不如利用生成式人工智能所能达到的表现力和准确度。
“科技在过去的两年里取得了难以置信的进步,这得益于人工智能,”Scott-Morgan基金会的首席执行官安德鲁·摩根说。“我们一直认为AI是辅助技术革命的关键,但我们需要敲响警钟并倡导这些解决方案——为最需要的人发声,并将他们纳入这一过程中。我们现在仍处于未知领域,我迫不及待地想看看我们将要开创和普及的下一个解决方案。”