技术
一种新的基于AI的方法可以准确地从DNA链中恢复数字数据,比较旧的技术快到90倍,从而提高了实用DNA存储进行计算的可能性
DNA可以存储数字数据,例如视觉和音频文件
科学图片公司 /阿拉米
人工智能可以在10分钟内读取存储在DNA链中的数据,而不是以前方法所需的天数,从而使DNA存储更接近计算中的实际用途。
DNA可以以非常紧凑的形式存储大量数据,并保持数千年的完整状态。Daniella Bar-Lev在加利福尼亚大学圣地亚哥分校。此外,DNA自然是可复制的,为长期数据保存提供了独特的优势。
但是,在DNA中检索编码的信息是一个巨大的挑战,因为将链混合在一起并混合在一起。在数据编码过程中,有时会不完美地复制单个链,并且某些片段可能完全丢失。结果,DNA中存储的读取数据可以类似于从装满切碎的,错别字缠绕的页面的盒子中重建一本书。
Bar-Lev说:“传统方法与这种混乱需要几天的处理。”她说,新方法用AI训练来在噪音中发现模式。
Bar-Lev和她的同事开发了一种称为DNAFormer的AI驱动方法,可以快速,准确地解码混杂的DNA序列。该系统包括一个深入学习的AI模型,该模型训练了重建DNA序列,这是一种单独的计算机算法,该算法识别和纠正了错误和第三个解码算法,该算法将所有内容转换为数字数据,同时固定任何剩余的错误。
在实验中,DNAFormer可以读取100兆字节的DNA存储数据的速度,比下一个使用传统的,基于规则的计算算法开发的最快的方法快于90倍,同时可以实现更好或可比的精度。解码的数据包括测试管的彩色图像,宇航员尼尔·阿姆斯特朗(Neil Armstrong)著名的月球着陆演讲的24秒音频剪辑和有关为什么DNA为何是有希望的数据存储介质的书面文本。
该团队计划开发针对将数据编码为DNA的新技术量身定制的DNAFormer版本。Omer Sabary以色列理工学院的技术学院。
他说,由于我们的方法不依赖于特定的[DNA]合成或测序方法,因此可以适应未来的,这是最迄今为止可能在商业上可行的技术。”
主题: