AI驱动的标记物解码用于增强机器视觉

根据发表在图像和视觉计算，这科尔多瓦大学开发了一种模型，该模型使用神经网络来最大程度地提高机器用于识别和定位事物的标记的解码。

基准标记用于机器人的设计，以帮助他们移动，识别事物并确定其确切位置。一个例子是波士顿Dynamics的拟人化机器人地图集，该地图集似乎是在整理和锻炼盒子。是一个机器视觉用于估计对象位置的工具。

它们在外观上类似于QR标记系统，但是它们的优势是能够在更大的距离处被发现。它们是平坦的，高对比度的黑色和白色正方形代码。

为了节省物流上的时间和金钱，安装在屋顶上的相机可利用这些指标的自动包装位置检测。由于精确发现和解码标记的传统机器视觉方法在弱光下无效，因此该系统的缺点到目前为止一直是照明条件。

研究人员首次，Cordoba大学的机器视觉应用研究小组的研究人员Rafael Berral，RafaelMuã±oz，Rafael Medina和ManuelJ.Marãn使用神经网络来创建一个可以识别和解码基金标记的系统在具有挑战性的照明条件下。

在模型中使用神经网络使我们能够以更灵活的方式检测这种标记，从而解决了检测和解码过程的所有阶段的照明问题。

拉斐尔·贝拉尔（Rafael Berral），科尔多巴大学博士生

整个过程分为三个步骤：标记识别，拐角炼油和标记解码，每个都使用单独的神经网络。

这是第一次为此问题提供完整的解决方案。

在最佳照明的情况下，有许多尝试提高速度，但是低照明或许多阴影的问题并未完全解决以改善过程。

科尔多瓦大学完整教授ManuelJ.Marãn

如何训练机器视觉模型

当训练该模型提供端到端解决方案时，研究人员构建了一个合成数据集，该数据集准确地描述了在不理想的条件下使用标记系统时可能发生的照明情况的类型。

一旦训练，该模型已使用现实世界数据进行了测试，其中一些是内部生产的，而另一些则作为其他先前作品的参考，研究人员指出。

人为创建的数据用于训练模型，现实世界中不良照明设置的数据可用。

因此，该系统今天可以使用由于该代码已发布，并且可以使用基准标记的任何图像来测试代码，召回了拉斐尔·穆兹（RafaelMuâoz）。

多亏了这项研究，机器视觉应用已经克服了一个新的挑战：在黑暗中移动。

Berral-Soler，R.，等。al。（2024）DeepAruco ++：在挑战性的照明条件下改善了方形基准标记的检测。图像和视觉计算。doi.org/10.1016/j.imavis.2024.105313