将原始数据转换为有意义的视觉效果(例如图表)是发现隐藏趋势和有价值见解的关键,但即使人工智能驱动的工具取得了进步,这个过程仍然很复杂。将人工智能集成到数据可视化过程的迭代性质中尤其具有挑战性,因为数据分析师经常难以在单个文本提示中描述复杂的任务,同时缺乏对传统工具的直接控制。这凸显了对更智能、更直观的解决方案的需求,这些解决方案将人工智能的精度与实践方法的灵活性结合起来。
为了解决这个问题,我们很高兴将 Data Formulator 作为开源研究项目发布。此更新基于去年的版本,将用于设计图表的用户界面 (UI) 交互与用于精炼细节的自然语言输入相结合。与之前的版本要求用户在两种方法之间进行选择不同,这种统一的方法使他们能够以更少的精力迭代地解决复杂的任务。
借助 Data Formulator,数据分析师现在可以从头开始创建图表或通过数据线程从现有设计中进行选择。UI 具有一个名为“概念编码架”的窗格,用户可以通过将各种数据字段拖入其中并定义它们或创建新数据字段来构建图表。后端的大型语言模型 (LLM) 处理此输入,生成必要的代码来生成视觉效果并更新数据线程以供将来使用。此过程如图 2 所示。
数据线程使用户能够查看和修改他们之前创建的图表。随着大语言模型将过去的代码适应新的环境,这个迭代过程简化了编辑和细化过程。如果没有此功能,用户将需要提供更详细的提示才能从头开始重新创建设计。这种迭代机制还允许用户不断更新图表,直到满意为止。
Data Formulators 架构将数据转换与图表配置分开,提高了用户体验和 AI 性能。收到用户规范后,系统将遵循三个步骤:(1)生成一个 Vega-Lite 脚本,定义数据的可视化方式;(2)指示AI处理数据转换;(3) 使用转换后的数据创建图表,如图 4 所示。
完善用户与人工智能工具的交互方式对于改进用户体验至关重要他们如何传达自己的需求,为更高效和有效的协作铺平道路。通过集成 UI 元素和自然语言输入,我们设计了 Data Formulator,让用户能够精确定义其可视化需求,从而获得更好的结果并减少多次澄清的需要。
虽然 Data Formulator 解决了以下方面的一些挑战:数据转换和可视化创作,其他仍然存在。例如,人工智能如何协助清理非结构化数据而不丢失关键信息?当用户从模糊或未定义的目标开始时,它如何帮助用户定义清晰的数据分析目标?我们正在积极调查这些研究问题,并邀请您通过构建 Data Formulator 代码库(在新选项卡中打开)做出贡献。
通过探索我们如何设计动态 UI,详细了解我们在人机交互方面的研究工作用于可视化编辑的小部件(在新选项卡中打开)。您还可以在 GitHub Codespace 上查看 Data Formulator 项目的演示(在新选项卡中打开)。
我们要感谢 Bongshin Lee、John Thompson 和 Gonzalo Ramos 的贡献他们对此项目的反馈和贡献。