人工智能驱动的技术可以帮助有语言障碍的人远程工作 - WRAL News

2024-09-23 08:26:57 英文原文

人工智能技术可以帮助有语言障碍的人远程工作

(CNN)您可能经历过被智能扬声器或人工智能助手听错或误解的挫败感。对于语言不标准的人来说,这种情况几乎在每次与此类技术的互动中都可能发生,以色列公司 Voiceitt 旨在改变这种状况。

通过使用个性化语音模型,其人工智能语音识别系统可以帮助因脑瘫、帕金森病、唐氏综合症或中风等疾病而导致言语障碍的人与人和数字设备更有效地沟通。

对于 Voiceitt 联合创始人 Sara Smolley 来说,促进非标准语音模式的语音识别是一项个人使命。

我的祖母被诊断出患有早发性帕金森病,她说。当我出生时,她已经失去了大部分运动能力,她的言语也受到了影响。

Voiceitt 于 2021 年作为应用程序推出,作为简单的语音翻译器运行,将非标准语音转换为音频。用户录制自己所说的大约 200 个简单的常用短语来训练人工智能。

斯莫利表示,最初的想法是为了促进面对面的沟通,但该技术现在也适合远程工作人员。

Voiceitt 开发了与 WebEx 和 ChatGPT 以及 Google Chrome 扩展的集成,可将非标准语音转换为屏幕上显示的字幕。该公司还与 Zoom 和 Microsoft Teams 合作。

斯莫利指出,对我来说真正突出的事情之一是无障碍技术在工作场所的重要性。她说,(轮椅)坡道之于昨天的办公楼 Voiceitt 之于今天的远程工作场所。

该软件以每分钟或每用户许可证的形式出售,价格从 20 美元到 50 美元不等。可以为工作场所以及健康或教育机构批量购买许可证。

人们使用 Voiceitt 不仅用于视频会议,还用于编写文档、电子邮件、在 LinkedIn 上发帖以及通过语音访问网络浏览器,Smolley 解释道。这为以前可能不被考虑从事某些工作或无法与同事或客户沟通的个人打开了数字世界的大门。

整个行业需要重组

Voiceitt 的用户之一是科林·休斯 (Colin Hughes),他是前 BBC 制片人,后来成为无障碍倡导者。休斯患有肌肉萎缩症,他依靠听写进行数字交互,这使他敏锐地意识到当前技术的潜力和局限性。Hughes 使用 Voiceitt 撰写电子邮件并口述较长的书面文章。

休斯说,我发现 Voiceitts 应用程序对我的非典型语音非常准确,并且其培训和设置过程非常简单,尽管他强调了专业用户的关键差距。他指出,许多言语障碍和上肢残疾的人需要的不仅仅是语音转文本。

他主张使用语音驱动的光标控制和改进的听写识别等功能来起草长篇内容,并表示 Voiceitt 最适合单句消息。

休斯强调需要更全面的语音识别技术,让用户可以使用语音完成管理电子邮件和格式化文档等操作。

他认为未来技术将在可访问性方面发挥更大的作用,并补充道:整个行业都需要进行彻底改革。Voiceitt 可以更好地访问主要平台,因此可能会引领这一变革。

触手可及的未来

Smolley 表示,近年来语音识别技术取得了重大进展。

其中一个例子是“语音无障碍项目”,这是由伊利诺伊大学贝克曼高级科学技术研究所领导的一个研究项目,该项目正在收集具有不同条件的人的语音数据,以构建支持非标准语音的人的算法。

今年早些时候,苹果 (AAPL) 推出了人工智能驱动的“聆听非典型语音”功能,该功能使用机器学习来识别更广泛的语音模式。

利用捕获和存储录音等个人数据的技术,隐私可能成为用户关心的问题。斯莫利表示,她的公司遵守欧盟法规,她称这些法规是世界上数据隐私方面的最高标准。

如果用户数据在他们同意的情况下保存在我们的数据库中,那么这些数据将被匿名化和去识别化,并用于增强我们的数据堆栈并改进我们的算法,她补充道。

她相信 Voiceitts 技术可以改变生活。Smolley 表示,我们不仅希望让人们在生活和工作中更加独立,而且能够享受技术并享受乐趣。

CNN 连线

关于《人工智能驱动的技术可以帮助有语言障碍的人远程工作 - WRAL News》的评论


暂无评论

发表评论

摘要

人工智能驱动的技术可以帮助有语言障碍的人远程工作(CNN) 您可能经历过被智能扬声器或人工智能助手听错或误解的挫败感。对于语言不标准的人来说,这种情况几乎在每次与此类技术的互动中都可能发生,以色列公司 Voiceitt 旨在改变这种状况。Hughes 使用 Voiceitt 来撰写电子邮件并口述较长的书面文章。一个例子是“语音无障碍项目”,这是由伊利诺伊大学贝克曼高级科学技术研究所领导的一个研究项目,该项目正在收集具有不同条件的人的语音数据,以构建支持非标准语音的人的算法。今年早些时候,苹果公司 (AAPL) 推出了人工智能驱动的“聆听非典型语音”功能,该功能使用机器学习来识别更广泛的语音模式。