作者:Jenny Lay-Flurrie
今天,微软宣布了与Be My Eyes的新合作项目为了将高质量的残障代表数据引入,以帮助训练AI系统。与Be My Eyes的合作将有助于使微软的AI模型对全球3.4亿盲人或视力低下的人更加包容,这是我们在致力于构建包容性技术方面的最新一步。
人工智能需要大量的数据来进行训练和实用,但往往残疾人却无法获得这些资源。代表性不足的或者分类错误在数据集中。在微软研究的最近的论文关于描述盲人或低视力个体的图像,流行的大型图像文本数据集中包含诸如盲文设备等残障对象的频率较低,导致这些对象被识别的准确性降低了约30%。这种残疾数据沙漠现象可以限制一项技术的实用性,强化现有刻板印象并放大偏见。随着我们继续发现人工智能和无障碍技术的机会,通过此类伙伴关系和社区协作实现包容性数据对于构建包容性人工智能至关重要。
这很重要。透明度和用户控制是本协议中数据隐私的指导原则。Be My Eyes将提供视频数据集,包括独特的物体、照明和构图,这些都真实地反映了视障群体的生活体验。个人资料将在分享前由Be My Eyes从元数据中移除,该公司将继续与其成员透明合作,提供清晰的过程和选择退出数据共享的选项。随后,微软将使用这些数据来提高场景理解和描述的准确性和精确性,目标是增加AI应用程序对盲人和视力低下社区的实用性。
今天的新闻是我们与Be My Eyes合作的下一章节,这一合作始于2017年,当时他们的应用程序被集成到残疾服务台支持体验中,以给客户提供更高效的technical support。去年,Microsoft成为了第一个……试用他们的新“成为我的AI”功能,利用人工智能帮助解决技术支持问题。Be My Eyes最近也开发了一个Windows应用程序,可在Microsoft商店中获取这样的合作使我们能够改进AI数据的代表性和多样性,并在我们的技术中更真实地包容残疾。
在过去18个月里,我们一直致力于理解生成式人工智能如何直接惠及残疾人,但我们在这一领域的努力实际上更早之前就开始了。我们秉持原则性的方法来确保扩大这些好处并减轻人工智能可能带来的潜在危害。微软的负责任的人工智能框架就是我们的做法。它包括公平性、可靠性与安全、隐私和安全、透明度、责任以及包容性和可访问性。
AI创新可以通过摘要减少认知负担,自动化会议记录,并提供详细的图像描述。这些创新对神经多样性群体、聋人和盲人群体等有着许多积极的影响,考虑到地球上大约有10亿人口经历某种形式的残疾,解决残障数据沙漠问题至关重要。
语音就是我们投资的一个例子,自2022年以来,我们很自豪能够与伊利诺伊大学厄巴纳-香槟分校(UIUC)以及苹果、谷歌、Meta和亚马逊合作开展项目。语音无障碍项目UIUC与非营利组织合作收集数据,以改进针对包括ALS患者在内的具有多样化语音模式的个体的语音识别。这些数据有助于AI模型学习更加广泛的语音多样性,并扩大这项技术可以带来益处的应用场景——包括加速主流语音平台(如Azure Speech)中非常规语音数据的准确性。该项目通过在开发过程中整合多样化的数据和视角,增强了为残疾人服务的人工智能系统。
在微软,我们致力于构建包容性的AI,使之能够代表所有使用者,并同时保护社会边缘群体免受可能影响教育、就业和公民参与的偏见扩散。我们认为可访问的技术是一项基本权利,可以解锁社会各个领域的机遇,而当设计得具有包容性和责任感时,生成式AI是我们今天最强大的工具之一来实现这一潜力。我们还致力于透明度并为每位个人提供强有力的数据保护。与Be My Eyes今天的新闻公告建立了这些承诺,并且我们将继续在整个行业和社区中寻求合作伙伴关系以创造一个更加包容的未来。
如果您对微软的无障碍访问有任何问题或意见,请通过以下方式告知我们:残疾服务台或者试试由Bing驱动的AI功能询问微软辅助功能工具.
了解更多关于微软的无障碍访问:我们的可访问性方法 | 微软可访问性
阅读更多关于Be My Eyes 隐私承诺.
标签:可访问性, 人工智能, 无障碍人工智能, 残疾, 残疾, 生成式AI, 包容性, 包容性, 神经多样性, 负责任的人工智能, 语音访问项目, 语音识别