英语轻松读发新版了,欢迎下载、更新

谷歌展示了通过数字重写来阅读手写文本的人工智能工具

2024-11-04 21:00:00 英文原文

作者:News By Eric Hal Schwartz published 4 November 2024 AI's handwriting is now better than mine

handwriting
(图片来源:Shutterstock)

谷歌研究展示了一种使用人工智能阅读手写内容的新方法,这可能会从根本上改变机器将纸上的内容转换为数字字母的方式。InkSight 系统利用人工智能将手写文字的照片转换为数字文本,无需任何设备作为中介。

这个想法是用人工智能取代有时会出错的光学字符识别(OCR),人工智能可以模拟人类实际上如何学习阅读,特别是通过重写现有文本来了解整个单词的外观和含义。这样做需要研究人员指导人工智能识别和模仿人类的笔迹。

“数字笔记越来越受欢迎,它提供了一种持久、可编辑且易于索引的矢量化形式存储笔记的方式,即数字墨水。然而,这种笔记方式与传统的笔式笔记方式之间仍然存在很大差距。-纸质笔记,这种做法仍然受到绝大多数人的青睐,”研究人员在他们的研究中解释道纸。“我们的方法结合了阅读和写作先验,允许在缺乏大量难以获得的配对样本的情况下训练模型。据我们所知,这是第一个有效地渲染具有不同视觉特征的任意照片中的手写文本的工作和背景。”

InkSight 不仅仅是一种替代技术。它可以在不理想的情况下获得更准确的结果。例如,如果照片是在昏暗的光线下拍摄的、文本部分模糊或在使用 OCR 检查时背景混乱。研究人员发现,人类可以阅读 InkSight 绘制的 87% 的文本。三分之二的字迹足够好,人们无法从实际的笔迹中辨别出来;您可以在下面看到 InkSight 工作时的外观。

Google InkSight

(图片来源:谷歌)

由AI执笔

如果您喜欢手写内容,InkSight 有一些潜在的好处。想象一下在纸质笔记本上手写,然后将笔记显示在相机上,以便立即使它们可搜索,并将它们与物理页面上以前的笔记一起组织起来。如果您像我一样,笔迹特别凌乱,InkSight 可以帮助您将潦草的字迹转变成与您潦草的内容仍然准确的打字文本。

从更大的范围来看,这可能是破译几个世纪以来的手写文本并将其转换为数字形式的重要工具。即使文本采用的语言没有太多数字化存在,InkSight 也可以帮助保留手写内容,以帮助建立这些语言的培训源。

谷歌并不是唯一一家使用人工智能工具来破译笔迹的地方。例如,亚马逊新的 Kindle Scribe升级了电子阅读器将手写笔记转换为清晰文本的能力。还有好笔记,一款可以读取手写内容的数字笔记应用程序,最近推出手写编辑使用 Goodnotes Smart Ink 技术将手写内容转换为打字文本的工具。添加的工具可让您像打字一样编辑手写笔记,包括对齐笔记、复制和粘贴以及重排文本以使其更具逻辑性。

注册成为第一个了解不可错过的顶级科技黑色星期五优惠的人,并获取所有您最喜欢的 TechRadar 内容。

您可能还喜欢...

Eric Hal Schwartz 是 TechRadar 的自由撰稿人,在世界与技术交叉领域拥有超过 15 年的经验。在过去的五年里,他担任 Voicebot.ai 的首席撰稿人,在生成式人工智能和大型语言模型的报道领域处于领先地位。此后,他成为生成式人工智能模型产品的专家,例如 OpenAI 的 ChatGPT、Anthropic 的 Claude、Google Gemini 以及所有其他合成媒体工具。他的经验涉及各个媒体领域,包括印刷、数字、广播和现场活动。现在,他继续讲述人们想要和需要听到的关于快速发展的人工智能领域及其对他们生活的影响的故事。埃里克住在纽约市。

关于《谷歌展示了通过数字重写来阅读手写文本的人工智能工具》的评论


暂无评论

发表评论

摘要

谷歌研究院推出了 InkSight,这是一种人工智能系统,能够比传统 OCR 方法更准确地将照片中的手写文本转换为数字文本。该技术通过模拟人类学习过程来教人工智能读取笔迹,而无需中介设备。它在低光照或杂乱背景等具有挑战性的条件下尤其出色。InkSight 可以彻底改变数字笔记记录,并帮助保存历史手写文档,特别是对于数字存在有限的语言。