英语轻松读发新版了,欢迎下载、更新

利用颞下颌关节全景片和关节噪声数据对退行性关节病进行人工智能增强诊断

2025-01-13 13:35:24 英文原文

作者:Kim, Seong Teak

颞下颌关节 (TMJ) 退行性关节病 (DJD) 是一种以下颌髁突和关节窝软骨破坏和骨变形为特征的退行性疾病,通过损害功能和美观而严重影响患者的生活质量1。有趣的是,虽然 DJD 通常被认为以女性为主且与年龄相关,但在其他关节中观察到的骨变化与年龄之间的线性相关性在 TMJ 中并不明显。颞下颌关节紊乱病 (TMD) 在 20 至 40 岁的年轻人中最为常见,而 DJD 可能在很小的时候就开始出现2。值得注意的是,DJD 的严重程度并不总是与疼痛强度相对应。韩国年轻 TMD 患者的 DJD 变化与老年人一样常见,与临床疼痛或椎间盘移位没有相关性3。这使得早期检测既具有挑战性又至关重要,特别是因为显着的退化常常在没有明显症状的情况下发生。

锥形束计算机断层扫描 (CBCT) 因其高诊断准确性和详细的解剖评估而成为诊断 DJD 的参考标准4。然而,与其他成像方式相比,CBCT 成本高昂,并且使患者暴露于更高的辐射剂量。虽然全景X光检查更容易获得且更具成本效益,但它缺乏对颞下颌关节区域的综合评估能力。相反,TMJ 全景 X 线摄影提供了更有针对性的评估,能够评估下颌骨髁突的运动范围,而没有明显的投影限制。

最近对使用放射线照相诊断 DJD 的人工智能 (AI) 研究进行的系统回顾和荟萃分析显示,基于七项研究的总共 10,077 张 TMJ 图像,汇总敏感性为 0.76,特异性为 0.79。其中三项研究侧重于全景放射线摄影和各种迁移学习模型,其他研究则使用 CBCT 图像研究髁突的 3D 形状和疾病分类5大多数现有的 DJD 诊断人工智能研究主要依赖于单一成像模式,很少结合临床数据。尽管关节噪声数据在 TMD 诊断中的价值并不总是确定的,但一些研究强调了其重要性。例如,已发现咔哒声与磁盘位移的关联性更强,且没有减少6,粗捻发音已被确定为 DJD 的有用临床指标7。颞下颌疾病诊断标准 (DC/TMD) 还建议利用所有关节噪声数据来诊断 DJD8

本研究旨在开发和评估集成 TMJ 全景放射线摄影和关节噪声数据的 AI 模型,以改善 DJD 的筛查和诊断。通过与当前的诊断标准保持一致,并解决之前仅依赖成像数据的人工智能研究的局限性,这种方法为 DJD 提供了更全面、更准确的诊断工具。我们的研究独特地将影像数据与临床关节噪声信息相结合,将临床医生检测到的捻发音和患者报告的关节噪声与基于 TMJ 全景放射线摄影和 CBCT 分析的诊断标签相结合。这种多模式方法旨在提高诊断准确性并为 DJD 诊断提供更全面的工具。

结果

在评估的六个 AI 模型中,GoogleNet 始终表现出卓越的性能,无论是否存在联合噪声数据或类型如何,所有条件下的最高 F1 分数都证明了这一点(表1)。在使用 GoogleNet 对包含各种联合噪声数据输入的模型进行评估时,所有实验均进行三次以确保可靠性,并使用平均值进行分析。捻发音数据的集成提高了整体性能(模型 1 与模型 2)。相反,主观联合噪声数据的包含对特定标签的预测表现出稳定作用(模型 1 与 4)。模型 2 和 4 获得了最高的 F1 分数 (0.72)(表2,图。 1)。表 1 用于 DJD 诊断的各种预训练模型的 F1 分数比较。

表 2 DJD 诊断中不同 AI 模型的详细性能指标。
图1
六种 AI 模型诊断 DJD 的性能比较。
figure 1

AI,人工智能;DJD,退行性关节病;D、退行性关节病;不,正常。

在选择最佳模型时,我们将 DJD (D) 召回率(敏感性)和正常 (N) 精度(阳性预测值)作为关键指标,因为它们在医学诊断中的重要性,特别是对于筛查工具。D 召回率代表模型正确识别的实际 DJD 案例的比例。高 D 召回率对于筛查工具至关重要,因为它可以最大限度地减少假阴性,确保漏掉更少的 DJD 病例。这对于 DJD 的早期发现和干预尤为重要。另一方面,N 精度表示模型对正常情况进行分类的准确性。高 N 精度意味着当模型将某个案例分类为正常时,该案例确实正常的概率很高。这对于减少未患有 DJD 的患者不必要的进一步检查或治疗非常重要。通过对这些指标进行优先级排序,我们的目标是开发一种筛选工具,能够有效识别潜在的 DJD 案例(高 D 召回率),同时准确排除正常情况(高 N 精度)。这种方法有助于平衡早期检测的需求与尽量减少不必要的干预或进一步诊断程序的目标。模型适用性的排名是通过将宏观平均 F1、D 召回率和 N 精度的排名相加计算得出的,得出的顺序如下:4、2、6、1、3、5。

为了识别 AI 模型判断所依赖的图像区域,我们使用了显着图,如图 1 所示。 2

图2
figure 2

显着图突出显示基于 AI 的 DJD 诊断中的感兴趣区域。AI,人工智能;DJD,退行性关节病。

AI模型与口面部疼痛专家的对比分析见表3和图。 3。对于模型 1(仅图像)和模型 4(图像和整个关节噪声数据),AI 模型在所有指标(精确度、召回率、F1 分数)方面均优于专家。AI 的诊断能力随着联合噪声数据的添加而得到改善(模型 4),宏观平均 F1 分数从 0.70(模型 1)增加到 0.72(模型 4)就证明了这一点。相反,与仅图像评估(模型 1)相比,专家在提供图像和联合噪声数据(模型 4)时表现出性能下降,宏观平均 F1 分数从 0.63 降至 0.59。

表 3 八位口面部疼痛专家在 DJD 诊断中的平均诊断表现。
图3
figure 3

诊断性能比较:专家与人工智能模型。AI,人工智能。

讨论

我们的研究揭示了使用 AI 模型诊断 DJD 的重要发现以及各种诊断因素(尤其是关节噪声)的重要性。

最值得注意的发现是,结合主观和客观噪声数据(模型 4)产生了最高的性能,强调了使用所有可用听觉信息的重要性。这与诊断 DJD 的 DC/TMD 一致,现在包括细捻音和粗捻发音,以及患者报告的关节噪音8。然而,对于 DJD 诊断,由于仅依靠临床检查而没有影像学检查的敏感性 (0.55) 和特异性 (0.61) 较低,因此 CBCT 等影像学检查仍然至关重要。

虽然整合所有类型的噪声数据被证明是最有效的,但仅使用捻发音也可以增强模型性能。Crepitus 是 DJD 诊断中成熟的标志物,在之前的研究中显示出高度的特异性9。我们的研究结果证实了这一点,因为包含捻发音的模型(模型 2、4 和 6)优于仅依赖图像数据的模型(模型 1)。

有趣的是,虽然我们的人工智能模型,特别是那些集成了成像和噪声数据的人工智能模型,表现优于口面部疼痛专家,但重要的是要考虑这种比较的背景。专家在临床评估过程中通常依赖更广泛的诊断信息,包括患者病史、下颌运动、肌肉和关节触诊、关节声音和咬合,这些在本研究中没有提供。另一方面,人工智能模型仅限于分析全景图像和噪声数据。这种限制可以解释为什么人工智能模型在这些条件下表现更好。

在诊断 DJD 时,关于 TMJ 全景 X 线摄影与全景 X 线摄影的有效性的研究结果不一。与传统全景放射线照相相比,颞下颌关节全景放射线照相已被证明其诊断准确性有限,但有所提高,特别是在检测下颌骨髁上的扁平、侵蚀和骨赘等骨性病变方面10。侧面和额部颞下颌关节投影的组合通常显示出检测这些病变的最高灵敏度,尽管其特异性和总体准确性水平各不相同。相比之下,其他研究报告称,一般全景X光检查往往比TMJ全景投影具有更好的诊断准确性,特别是在评估髁突皮质侵蚀时11。一般全景放射线摄影提供的更广泛的背景可能有助于更精确的评估。尽管我们的人工智能模型取得了有希望的结果,但与使用普通全景放射线摄影进行 DJD 诊断的研究相比,它们的性能低于预期。然而,我们的研究重点是检测皮质下囊肿、表面侵蚀、骨赘和全身性硬化引起的变形,这可能是研究结果存在一些差异的原因。此外,与 TMJ 全景放射线摄影相关的挑战(例如张口定位导致的运动伪影以及可能遮挡关键关节结构)可能导致我们结果中观察到的有效性降低。

尽管取得了令人鼓舞的结果,但这项研究仍有一些局限性,应在未来的研究中予以考虑。尽管我们的数据集是根据多位牙科放射学专家的 CBCT 解释进行标记的,但依靠 CBCT 图像本身进行标记可能会提高 AI 模型的精度和一致性。此外,主观噪声数据的收集不完整,因为并非所有案例都包含此信息,可能限制了我们研究结果的准确性和普遍性。最后,该研究有限的样本量和单中心设计表明需要进一步研究,包括更全面的数据集和多中心数据,以验证和完善人工智能模型,以实现更广泛的临床应用。

总之,我们的研究表明,人工智能增强的 DJD 诊断,特别是通过整合全景放射线摄影和关节噪声数据,为早期检测和改善患者护理提供了一种有前景的方法。这种人工智能驱动的诊断工具的开发对公共卫生和一般实践具有重大影响。通过结合这些模式,该模型为非专科临床医生提供了实用的解决方案,从而能够更准确地筛查和及时转诊 TMD 患者。该工具有可能减少诊断延迟、改善患者治疗结果并减轻专业医疗服务的负担。然而,需要进一步的研究来优化这种方法,特别是在不断发展的诊断标准和颞下颌关节成像的具体挑战方面。

方法

研究设计和数据收集

本研究得到了延世大学牙科学院机构审查委员会(IRB)的批准(IRB 2-2024-0011),所有方法均按照相关指南和规定进行。IRB 放弃了知情同意文件的要求。

对 2019 年 1 月至 2021 年 2 月期间访问延世大学牙科医院口面部疼痛诊所、报告 TMD 相关症状、并进行了 TMJ 全景 X 光检查(Rayscan Alpha Plus,Ray Co. Ltd.,Hwaseong-si)的患者进行了放射线检查。,韩国)和 TMJ CBCT(Alphard 3030 设备,Asahi Roentgen Ind., Co. Ltd,京都,日本)通过口腔和颌面放射学专家。排除标准包括年龄在18岁以下、有正颌手术史、宏观外伤、全身性疾病导致关节畸形或TMJ全景与CBCT成像时间间隔超过三个月的患者。

为了收集关节噪声数据,通过电子病历 (EMR) 回顾性审查了患者报告的客观噪声(临床医生检测到的捻发音)和主观噪声。捻发音被定义为检查者将手指放在外耳道前面,在重复进行 3 次打开和关闭运动以及下颌的横向和前伸运动期间感觉到的连续或多次粗糙的摩擦声/感觉。作为标准 TMJ 检查方案的一部分,这项客观评估由经过培训的临床医生进行。患者报告的关节噪音分为四种类型:

  • P:咔哒声或爆裂声关节噪音

  • R:捻发音或磨擦声,如砾石或沙子移动

  • PR:两个关节都有噪音

  • I:未明确的关节噪音(患者报告有关节噪音,但无法准确描述其性质)

数据处理

本研究共收集了 2631 张 TMJ 全景图像。虽然开放式和封闭式 TMJ 全景图像之间的 AI 模型性能仅存在细微差别,开放式图像的性能高出 2% - 3%,但本研究仅使用开放式图像(补充表)。每张图像均由口面部疼痛专家根据颞下颌疾病诊断的相应 CBCT 分析标准重新标记为“正常 (N)”或“DJD (D)”8,12。这些标准包括由于皮质下囊肿、表面侵蚀、骨赘或全身性硬化引起的变形。选择 CBCT 是因为其检测骨骼变化的高分辨率能力,并用作标记 TMJ 全景图像的参考标准。排除 1354 个不确定的 DJD 图像和错误后13,最终数据集包括 2127 个标记为“N”的图像和 1781 个标记为“D”的图像。收集整个数据集的捻发音数据,收集一部分样本(占总数的 48.13%)的主观噪声数据。

人工智能模型开发

AI 模型采用预先训练的 CNN 架构来提取特征向量,然后将其与联合噪声信息相结合以进行最终诊断。

我们比较了图像分类任务中常用的几种预训练模型的性能,包括 ResNet、VGGNet 和 GoogleNet。

数据预处理涉及优化图像质量和增强预测模型稳健性的综合方法。最初,使用三种不同的比例调整图像大小,同时保持原始纵横比:1/4、1/2 和完整的原始大小。为了进一步提高模型的性能,实施了两阶段预处理管道,包括自动裁剪和数据增强。在第一阶段,应用自动裁剪来消除不必要的背景,将每个图像分割成四个不同的子图像:右关闭视图、右打开视图、左打开视图和左关闭视图。仅选择开放图像,确保分析仅集中于相关的感兴趣区域。随后,利用各种数据增强技术来增加训练集的多样性。其中包括考虑位置变化的随机旋转(±15 度)、模拟对比度和亮度变化的颜色抖动、处理图像清晰度差异的随机清晰度调整(概率为 0.5)以及水平翻转(以 0.5 的概率)来提高模型对左右方向变化的鲁棒性。通过引入受控可变性,这些增强旨在增强模型的泛化能力,降低过度拟合的风险。每种预处理技术的效果如图所示。 4。图4用于 DJD 诊断的集成 AI 模型的架构。

AI,人工智能;
figure 4

DJD、退行性关节病、TMJ;颞下颌关节。

为了评估人工智能模型中声音信息的有效性,我们将联合噪声信息纳入特征向量中。我们记录了每张图像的客观噪声(临床医生检测到的捻发音)和患者报告的主观噪声。虽然收集了整个数据集的捻发音数据,但收集了 48.13% 样本的主观噪声数据。捻发音和三种类型的患者报告的主观声音均被二值化并编码为四维向量,其中 1 表示声音存在,0 表示声音不存在。通过将二值化的声音信息与通过预训练模型从 TMJ 全景图像导出的特征向量合并,实现了特征向量和声音信息的集成。单层神经网络使用合并的向量来执行最终诊断。为了提高人工智能模型的性能,通过改变输入对六个模型进行了实验。这六种型号是:

  • 模型 1:仅图像

  • 模型2:图像和捻发音

  • 模型 3:图像和患者报告的关节噪声(P、R、PR、I)

  • 模型 4:图像、捻发音和患者报告的关节噪声(P、R、PR、I)

  • 模型 5:图像和某些患者报告的关节噪声(R、PR)

  • 模型 6:图像、捻发音和某些患者报告的关节噪声(R、PR)

集成AI模型架构如图1所示。 4

AI 模型性能和临床可用性评估

通过将数据集分为 60% 训练数据和 40% 测试数据来评估 AI 模型的诊断性能。我们使用不同的训练/测试样本进行了三次重复实验。由于数据集中的类别不平衡,我们使用 F1 分数而不是准确性来进行性能评估。为了训练 AI 模型,我们使用学习率为 1.0 - 10 的随机梯度下降 (SGD) 优化器Ø3。我们总共训练了 300 个 epoch 的 AI 模型。诊断模型的设计、训练和评估均使用Python实现,并使用PyTorch库来设计和训练深度学习模型。显着图用于解释和可视化人工智能在进行预测时考虑的图像区域。

对于临床可用性评估,随机选择并混合100张标记为“D”的图像和100张标记为“N”的图像。然后,八位口面部疼痛专家对这些图像进行了审查。每位专家每隔一周对图像进行两次评估,有或没有噪声联合信息。

数据可用性

支持本研究结果的数据可根据合理要求从通讯作者处获得。

参考

  1. 王X.,张J.,甘Y.和周Y.颞下颌关节骨关节炎发病机制和治疗的最新认识。J.登特。资源。 94,666–673 (2015)。

    文章一个 中科院一个 考研一个 数学一个 谷歌学术一个 

  2. 宋 H.、李 J. Y.、许 K.-H.& Park, J. W. 颞下颌关节骨关节炎的计算机断层扫描的长期变化。科学。代表。 10,6731。https://doi.org/10.1038/s41598-020-63493-8(2020)。

    文章一个 ADS一个 中科院一个 考研一个 考研中心一个 数学一个 谷歌学术一个 

  3. Kim, K.、WojczyÅska, A. 和 Lee, J.-Y。RDC/TMD诊断的韩国颞下颌关节紊乱病患者计算机断层扫描骨关节炎改变的发生率;一项回顾性研究。Acta Odontol。扫描。 74,337—342。https://doi.org/10.3109/00016357.2015.1136678(2016)。

    文章一个 考研一个 谷歌学术一个 

  4. 希夫曼,E.L.等人。颞下颌关节紊乱病的研究诊断标准。I:有效性评估概述和方法。J.奥罗法克。疼痛 24,7(2010)。

    考研一个 考研中心一个 数学一个 谷歌学术一个 

  5. AlmäÈan, O.、LeucuÈa, D. C.、HedeÈiu, M.、MureÈanu, S. 和 Popa, ÈL。采用人工智能诊断颞下颌关节骨关节炎:系统评价和荟萃分析。J.克林。医学。 12,942。https://doi.org/10.3390/jcm12030942(2023)。

    文章一个 考研一个 考研中心一个 谷歌学术一个 

  6. Manfredini, D.、Basso, D.、Salmaso, L. 和 Guarda-Nardini, L. 颞下颌关节咔哒声和磁共振描绘的盘位置:哪种关系?J.登特。 36,256—260。https://doi.org/10.1016/j.jdent.2008.01.002(2008)。

    文章一个 考研一个 谷歌学术一个 

  7. 维泽,M.等人。使用 RDC/TMD 和颞下颌关节断层扫描中的影像学结果,颞下颌关节症状、体征和临床诊断之间的关联。J.奥罗法克。疼痛 22,239–251 (2008)。

    考研一个 数学一个 谷歌学术一个 

  8. 希夫曼,E.等人。用于临床和研究应用的颞下颌疾病 (DC/TMD) 诊断标准:国际 RDC/TMD 联盟网络和口面部疼痛特别兴趣小组的建议。J. 口腔面部疼痛头痛 28,6-27。https://doi.org/10.11607/jop.1151(2014)。

    文章一个 考研一个 谷歌学术一个 

  9. 亚伯拉罕森,A.-K。等人。手部骨关节炎队列中颞下颌关节骨关节炎的频率及相关症状。骨关节炎。卡蒂尔。 25,654–657 (2017)。

    文章一个 中科院一个 数学一个 谷歌学术一个 

  10. 我,Y.-G。等人。全景颞下颌关节 (TMJ) 放射线检查检测 TMJ 骨关节炎患者骨病变的诊断准确性和可靠性。J.登特。科学。 13,396–404 (2018)。

    文章一个 考研一个 考研中心一个 谷歌学术一个 

  11. 亲爱的,O.B. 等人。颞下颌关节锥束计算机断层扫描成像的准确性:与全景放射学和线性断层扫描的比较。是。J.奥索德。牙颌面矫形术。 132,429—438。https://doi.org/10.1016/j.ajodo.2005.10.032(2007)。

    文章一个 考研一个 数学一个 谷歌学术一个 

  12. 艾哈迈德,M.等人。研究颞下颌疾病 (RDC/TMD) 的诊断标准:制定图像分析标准和检查者图像分析的可靠性。口腔外科。口服药物。口腔病理学。口服放射线。恩多。 107,844–860 (2009)。

    文章一个 谷歌学术一个 

  13. 崔,E.,金,D.,李,J.-Y。&帕克,H.-K。人工智能在正投影照片上检测颞下颌关节骨关节炎。科学。代表。 11,10246。https://doi.org/10.1038/s41598-021-89742-y(2021)。

    文章一个 ADS一个 中科院一个 考研一个 考研中心一个 数学一个 谷歌学术一个 

下载参考资料

资金

这项研究仅得到延世大学牙科学院基金 (6-2024-0005) 的支持。

作者信息

作者和单位

  1. 首尔国立大学牙科学院,牙科研究所,大韩民国首尔

    崔恩惠

  2. 东国大学工业与系统工程系, 30 Pildong-ro 1-gil, Jung-gu, 首尔, 04620, 大韩民国

    Seokwon Shin、Kijin Lee、Taejin An 和 Youngdoo Son

  3. 生物医学工程学院,悉尼科技大学,悉尼,澳大利亚

    理查德·K·李

  4. 波士顿大学艺术与科学学院,波士顿,美国

    金善民

  5. 延世大学牙科学院口腔面部疼痛和口腔医学系,50-1,延世路,西大门区,首尔,03722,大韩民国

    金成柚

贡献

E.C. 为构思、设计、数据采集、分析和解释做出了贡献,起草并严格修改了手稿。Y.S.为设计、数据分析和解释做出了贡献,并对手稿进行了严格的修改。S.T.K.为构思、设计做出了贡献,并对手稿进行了严格的修改。S.S.、K.L.和 T.A.为数据分析、解释和初稿做出了贡献。R.L. 和 S.K.有助于数据采集。所有作者均给予最终批准并同意对工作的各个方面负责。

通讯作者

通讯至孙英斗或者金成柚

道德声明

利益竞争

作者声明没有竞争利益。

附加信息

出版商备注

施普林格·自然对于已出版的地图和机构隶属关系中的管辖权主张保持中立。

补充信息

引用这篇文章

Check for updates. Verify currency and authenticity via CrossMark

崔 E.、申 S.、李 K.

等人。利用颞下颌关节全景X线摄影和关节噪声数据对退行性关节疾病进行人工智能增强诊断。科学代表15 ,1823(2025)。https://doi.org/10.1038/s41598-024-83750-4

下载引文

  • 已收到:

  • 公认:

  • 已发表:

  • DOI:https://doi.org/10.1038/s41598-024-83750-4

关键词

关于《利用颞下颌关节全景片和关节噪声数据对退行性关节病进行人工智能增强诊断》的评论


暂无评论

发表评论

摘要

本文讨论了利用人工智能 (AI) 通过全景放射线摄影和关节噪声数据来增强颞下颌关节 (TMJ) 退行性关节疾病的诊断。总结如下:### 要点:1. **目标:**- 开发一种人工智能增强诊断工具,使用全景X光片和关节噪声数据来检测颞下颌关节退化。2. **方法:**- 该研究结合了两种类型的数据进行诊断:- 全景放射线摄影(X 射线图像)- 联合噪音录音- 训练人工智能模型来分析这些组合数据集,以识别退行性关节疾病的迹象。3. **贡献者和致谢:**- Eunhye Choi 对研究设计、数据分析和写作做出了重大贡献。- Youngdoo Son 和 Seong Teak Kim 参与了构思、设计和关键修订。- Seokwon Shin、Kijin Lee、Taejin An、Richard K. Lee 和 Sunmin Kim 等其他贡献者提供了技术专业知识和原始草案贡献。4. **道德考虑:**- 作者声明不存在与该研究相关的竞争利益。5. **公共访问和重印:**- 该文章可根据知识共享署名-非商业性-禁止衍生品 (CC BY-NC-ND) 许可使用,允许任何人共享、分发或复制该作品,只要该作品未经修改并给予适当的注明出处。6. **关键词:**- 人工智能- 颞下颌关节疾病- 全景放射摄影- 联合噪声分析- 诊断影像### 结论:该研究提出了一种利用人工智能技术分析成像和听觉数据来诊断颞下颌关节退行性疾病的新方法。该方法可能会提高临床环境中的诊断准确性和效率。如果您需要更具体的细节或其他信息,请告诉我!

相关讨论