作者:AuthorsKim Martineau
基础模型为分析历史数据提供了一种强大的新方法,以预测未来,是否估计网络是否可以承受高峰需求还是公司可以达到其每月销售目标。
但是,历史数据具有超出预测的见解。IBM的新时间序列基础模型,tspulse,被设计为追随他们。它可以在时间序列中挑选异常事件,填写缺失值,将数据分类为类别并取笑相似的模式。当在现场的领先基准测量时测量10至100倍的型号,它的精度比10至100倍的型号更高。
Tspulse是100万参数,是IBM的精益,高性能的最新成员时间序列基础模型,补充IBM微小的时间混合器预测专家。尽管其他领先的时间序列模型基于变压器,但TSPULSE使用IBM的早期TSMIXER体系结构作为其骨干,将多层感知器块与选择性封闭式注意力块交替使用。
这种超高效的混合体系结构允许轻松调整Tspulse,并在不带任何专业硬件的笔记本电脑的设备上使用。IBM研究人员还构建了几个新功能,以帮助该模型从时间序列数据中提取更多信息,以提高其多功能性。
这些创新包括能够识别时间序列中复杂模式的能力,从而使Tspulse可以拾取微妙的,更多的零星信号,以及从时间序列的高级视角或更近距离观察的信号。
统计模型一直是人们为洞察力挖掘历史数据的主要方式。但是,在原始时间序列数据上预先培训的基础模型正在迅速缩小差距。
在用于异常检测的领先学术基准中,TSB-AD,TSPULSE的表现要比这两个类别的最先进的表现更好,在两种类别中的表现都优于强大的统计模型,而各种较大的基础模型至少高33%。(tspulse结果是报纸报道现在在同行评审下)。
蒙版重建已成为基础模型的默认培训方案 - 是否以单词,像素或及时排列的数值出现。该模型被赋予部分黑色数据集,并任务填充空白以使其整体。在完成难题的过程中,该模型了解了数据的基础结构,从而提高了其稍后概括的能力。
IBM研究人员使用蒙版的重建来教Tspulse在其原始培训数据中填写缺少的时间步骤值,因为其他基础模型也经过培训。但是研究人员改变了他们的掩蔽技术,以教导该模型从不同的角度解释数据。
使用快速傅立叶变换(FFT)算法,他们将时间序列训练数据转换为频域,并使模型填充缺失的频率值,从本质上讲,从两个角度来看,都会教给它任何给定的时间步长:时间和频率。然后,他们将两个视图投影并融合到称为嵌入的数值表示中。
这些混合嵌入应用于整个数据集,有助于弹出不同的趋势。如果时间序列是一首歌,可以将时间视为其节奏,频率,它的节奏。
IBM研究人员Vijay Ekambaram说,突然的尖峰更容易检测到时域,而更轻微的周期性模式更容易在频域中看到。由于该模型捕获并集成了此补充信息,因此可以学习更好的表示。
研究人员引入了蒙版重建任务的第二个转折。他们改变了隐藏段的长度,交替删除了时间序列的长时间和短距离。这次,他们的目标是教导该模型在互补尺度上填充缺失的值 - 从鸟类的眼睛和蠕虫的眼睛视图中挑出图案。
“想象一下,您为学生准备考试,通过在段落和个人信件中弄清楚整个单词,''Ekambaram说。每种掩盖风格都教会大脑填写各种缺失的信息。
当任务要求筛选嘈杂的数据,将数据分组为逻辑类别或过滤数据以获取相似的段段时,对数据的高级了解可能很有用。当任务涉及填写系列中缺少的单个值或检测微妙的异常时,对数据的细粒度理解可能很有用。
然后将每个时间段的全局视图及其嵌入式频率信息投影到一对嵌入中:一个代表高级视图,另一个代表详细的视图。在推断时间,该模型可以召唤手头任务的最相关表示形式。
Ekambaram说,该模型一起学习了高级和低级功能。结合已经集成的频率信息,这是魔术发生的时候。
该模型的最大优势在于它能够理解一组历史事件的全球含义或在可能值得注意的本地信号中关键的能力。根据任务,这些竞争观点之间的tspulse枢轴。它选择分类任务或搜索重复模式时的摘要视图;它选择了插入缺失值或识别微妙异常的详细视图。
TSPULSE还包括一些特定于任务的功能,以提高其在推理时的准确性。为了检测各种异常范围,它具有三个专家过程(称为“头”),它们在输出答案之前检查了模型的工作。
一个人处理时间重建;另一个频率重建;和第三个短马预测。在推论时,将每个头的原始信号与其预测信号进行比较,以计算异常评分。然后,该模型从所有这三个方面输出一个组合答案。
Ekambaram说,每个头部都会发现不同类型的问题。合并后,它们覆盖了盲点并改善了更广泛的异常范围的检测。
Tspulse还具有轻巧的模块,可以在微调过程中添加,以提高其在其他任务上的准确性。这种特定于任务的“镜头”基本上放大了给定应用程序的最相关数据。Ekambaram说,这就像为每个任务提供一个定制的眼镜,以便它可以准确地看到它的需求。”``要阅读精美的印刷品,您可能需要放大镜或双筒望远镜才能看到遥远的物体或有色的眼镜,以便在不同的照明条件下看到。”
在此特定于任务的镜头的帮助下,Tspulse在分类任务中的表现优于较大的最新模型5%至16%。它甚至可以更好地插入天气和电力使用基准数据集中缺少的缺失值。Tspulse的表现优于下一基础模型以及统计模型,超过50%。
由于统计模型仍然是分析历史数据的首选方法,因此IBM几年前在设计其首次系列基础模型时将效率提高了首要任务。企业可以在笔记本电脑上运行那些早期的预测型号。对于Tspulse,他们仍然可以 - 现在他们拥有解决更多类型的问题的工具。
现在,研究人员正在准备将TSPULSE集成到IBM的IT和行业自动化应用程序中,以帮助从物理资产管理到IT运营等任务。
IBM Research的AI应用总监Jayant Kalagnanam说,许多企业运行的昂贵的机器产生的传感器数据比他们知道的要多得多。tspulse使他们能够搜索数据并识别他们当前可能看到的模式,并将这些模式与过去的失败联系起来,以避免相似的问题。”