伊姆兰·拉曼·琼斯(Imran Rahman-Jones)
技术记者
路透社
苹果说,在一些社交媒体用户发现,当他们将“种族主义者”一词讲到iPhone之后,它正在努力修复其语音到文本工具,它将其输入为“特朗普”。
这家科技巨头提出了与其命令服务有关的问题,是由于它在其中区分了“ R”的单词所引起的。
苹果发言人说:“我们意识到语音识别模型的一个问题,即动力命令,我们今天正在推出解决方案。”
但是,语音识别专家告诉英国广播公司(BBC),这种解释“只是不合理”。
爱丁堡大学语音技术教授彼得·贝尔(Peter Bell)表示,有人更有可能改变了该工具使用的基础软件。
视频在线共享向人们展示“种族主义者”一词中的命令工具。
有时它是正确转录的 - 但是在其他情况下,它变成了“特朗普”,然后很快将其恢复到正确的单词。
英国广播公司无法复制错误,这表明苹果的修复已经生效。
贝尔教授说,苹果对语音重叠的解释没有意义,因为这两个单词不够相似,无法混淆人工智能(AI)系统。
语音到文本的识别模型是通过输入真实人的剪辑与他们所说的准确笔录一起培训的。
他们还被教导要理解上下文中的单词 - 例如,如果在“一杯茶”一词中,他们可以将“杯子”一词与“ cut”一词区分开。
贝尔教授说,苹果的情况不太可能是其数据的真正错误,因为其英语模型将接受数十万小时的语音培训,这应该使其具有很高的准确性。
他说,对于“资源不足的语言”,这可能是一个AI培训问题。
但是他在这种情况下说:“这可能指出了可以访问该过程的人。”
一位从事AI助理Siri的苹果雇员告诉《纽约时报》:“这闻起来像是严肃的恶作剧。”