谷歌研究展示了一种使用人工智能阅读手写内容的新方法,这可能会从根本上改变机器将纸上的内容转换为数字字母的方式。InkSight 系统利用人工智能将手写文字的照片转换为数字文本,无需任何设备作为中介。
这个想法是用人工智能取代有时会出错的光学字符识别(OCR),人工智能可以模拟人类实际上如何学习阅读,特别是通过重写现有文本来了解整个单词的外观和含义。这样做需要研究人员指导人工智能识别和模仿人类的笔迹。
“数字笔记越来越受欢迎,它提供了一种持久、可编辑且易于索引的矢量化形式存储笔记的方式,即数字墨水。然而,这种笔记方式与传统的笔式笔记方式之间仍然存在很大差距。-纸质笔记,这种做法仍然受到绝大多数人的青睐,”研究人员在他们的研究中解释道纸。“我们的方法结合了阅读和写作先验,允许在缺乏大量难以获得的配对样本的情况下训练模型。据我们所知,这是第一个有效地渲染具有不同视觉特征的任意照片中的手写文本的工作和背景。”
InkSight 不仅仅是一种替代技术。它可以在不理想的情况下获得更准确的结果。例如,如果照片是在昏暗的光线下拍摄的、文本部分模糊或在使用 OCR 检查时背景混乱。研究人员发现,人类可以阅读 InkSight 绘制的 87% 的文本。三分之二的字迹足够好,人们无法从实际的笔迹中辨别出来;您可以在下面看到 InkSight 工作时的外观。
由AI执笔
如果您喜欢手写内容,InkSight 有一些潜在的好处。想象一下在纸质笔记本上手写,然后将笔记显示在相机上,以便立即使它们可搜索,并将它们与物理页面上以前的笔记一起组织起来。如果您像我一样,笔迹特别凌乱,InkSight 可以帮助您将潦草的字迹转变成与您潦草的内容仍然准确的打字文本。
从更大的范围来看,这可能是破译几个世纪以来的手写文本并将其转换为数字形式的重要工具。即使文本采用的语言没有太多数字化存在,InkSight 也可以帮助保留手写内容,以帮助建立这些语言的培训源。
谷歌并不是唯一一家使用人工智能工具来破译笔迹的地方。例如,亚马逊的新的 Kindle Scribe升级了电子阅读器将手写笔记转换为清晰文本的能力。还有好笔记,一款可以读取手写内容的数字笔记应用程序,最近推出手写编辑使用 Goodnotes Smart Ink 技术将手写内容转换为打字文本的工具。添加的工具可让您像打字一样编辑手写笔记,包括对齐笔记、复制和粘贴以及重排文本以使其更具逻辑性。