作者:Gus Alexiou
一个人与AI Life的类人机器人进行对话,在消费者上展出... 更多的2024年1月10日在内华达州拉斯维加斯举行的电子展(CES)。法新社通过盖蒂图像
当今的AI如何部署以及与数字可访问性相关的一些核心戒律,有很大的交叉。
对于许多消费者而言,AI都是关于生产力和效率黑客的涉及通过自动化和高水平个性化使任务更简单的。相同的想法通常也可以应用于可访问性。
如今,AI可以对视力障碍的自动ALT文本和音频说明进行重大侵害,并为具有听力损失的人,总结和简化学习或认知差异,语音或姿态控制失调的人的网络内容和文档的实时字幕。很快,基于当今可用的研究和产品,AI驱动的脑部计算机界面可能会帮助用户旁路感官限制,尽管机器人系统可以协助日常任务并降低护理成本。
这些只是人工智能现在可以增强可访问性的某种方式,但是将来,接口本身的可访问性呢?
随着Openai的GPT 4O等大型语言模型,Google的双子座和人类Claude依靠对话界面,在这种情况下,输入/输出通信模式是可访问性的关键。对于使用直接语音输入的工具,这可能包括能够识别非典型的语音,例如来自有言语障碍的人。同样,患有自闭症和其他形式的神经多样性的人都可以以不同的方式构架他们对LLM提出的问题,并且需要具有个性化格式和细节水平的回答。
其他疼痛点可能包括模型培训数据中缺乏残疾包容性语言和概念,以及在推出新产品之前对残疾人社区缺乏代码和用户测试。尽管屏幕阅读器可访问性较差,但仍然可以狗LLM,尽管它们具有复杂性和高级功能,但与二十多年前遇到视力损失的静态网页的方式相同。
说到网页,同样重要的是,与更有趣的未来派有关(例如脑部计算机界面和机器人技术)形成鲜明对比的是,AI的能力在编码未来的网站和应用程序时都可以完成许多繁重的工作。在去年年底的收入电话中,Google首席执行官Sundar Pichai透露Google的新代码的25%以上是由人工智能产生的。同时,在最近接受德瓦克什·帕特尔(Dwarkesh Patel)的播客采访中,元首席执行官马克·扎克伯格(Mark Zuckerberg由AI完成在接下来的12-18个月中进一步补充说,很快AI代理人将能够超越科技巨头的精英编码员。
为了承认这一勇敢的新现实,全球可访问性宣传日的联合创始人乔·德文(Joe DevonLLM可访问性检查器这是与今年的GAAD一起推出的。开源计划被称为AIMAC,它代表AI模型可访问性检查器,并涉及全球可访问性意识日基金会与用户界面与数字工作流专家ServiceNow之间的协作。
AIMAC允许测试人员通过分析和基准与其他LLMS能够生成的内容进行分析和基准测试,从而评估不同模型如何响应不同的提示,例如与网页设计,布局和语义结构相关的提示。
德文郡在采访中解释说,当您要求AI为您编写代码时,它可以访问或无法访问。”
向前迈进,因为系统将执行很多代码,所以我觉得能够比较可访问的不同模型的方式非常重要。我们已经得到了ServiceNow的支持来构建它并开源它,这是如此关键,因为对于可访问性,如果这是封闭的源,那么您将有一家公司内部使用它,以更好地完成他们将生成的可访问代码。取而代之的是,通过制作此开源,可以使llm的可访问性编码的整个景观民主化。”
在过去的几个月中,ServiceNow已将新的AI功能引入其产品,包括更高级的语音功能。该公司的副总裁兼全球可访问性负责可访问性和Gen AI播客。
McErlean坚信,尽管生成AI模型的输入/输出机制的相对可访问性复杂性是关键,但它在AI开发的更大范围内,其中最大的可访问性和平等威胁在于。
Mcerlean说,可访问性是.com世界中多年来的事后想法。
值得庆幸的是,从那以后,许多公司都开始解决并赶上。但是,AI一代现在的速度,可访问性并不是事后的想法,因为在该竞技场的追赶将变得更加困难,这最终可能会变得危险。”
回到.com时代的后期阶段,有助于将可访问性从被视为繁重的负担中移动而来,这是其双重机构是受合法保护的人权,也是那些愿意投资其中的人的竞争优势。希望,无论当前AI开发的突破性步伐如何,这些相同的原则都将再次成立。为了使我们的AI驱动的未来真正具有包容性,可访问性不仅必须充当设计原则,而且还必须是基本要求,嵌入了为数字世界提供动力的代码中。