作者:Fucito, Lisa M.
大多数精神健康障碍 (MHD) 的发病高峰年龄是青年期期间或之前(18-25 岁)1。然而,患有任何 MHD 的年轻人中只有不到一半接受治疗,有色人种年轻人中这一比例下降至三分之一左右2。年轻人往往无法获得或负担不起临床服务,自 COVID-19 大流行以来,治疗需求与可获得性之间的差距不断扩大3。此外,年轻人可能不会针对一些高度普遍但正常的心理健康问题寻求治疗,例如酒精使用障碍 (AUD) 和酗酒 (“暴饮暴食”)2,4,5。
相比之下,年轻人更关心常见和相关的健康问题,例如睡眠质量,并且更有可能就睡眠问题寻求帮助6,7。在睡眠投诉和酗酒水平相似的年轻人样本中,大多数人 (80%) 担心睡眠,而很少人 (5%) 担心饮酒8。睡眠和昼夜节律紊乱常见于青春期和成年早期,与饮酒增加有关9以及饮酒带来的更严重的后果10,神经奖励处理的变化与此有关11。从纵向来看,青春期睡眠不足(即睡眠质量、持续时间或一致性较差)可能会导致成年后酗酒和酗酒12,13,14。睡眠困难也与患有 AUD 的成年人饮酒复发有关15。失眠的行为干预对于酗酒的成年人来说是有效的,并且有望减少饮酒或后果14,包括使用基于网络的模块进行数字化失眠干预16。然而,在年轻人中,睡眠困难不仅限于失眠,许多人都因睡眠健康状况不佳而苦苦挣扎。因此,各种睡眠干预措施可以为治疗年轻人的高危饮酒等敏感问题提供更有吸引力且更有效的替代方案。
数字干预还可以增加年轻人接受心理健康治疗的吸引力、可及性和便利性17 号。与其他成年人相比,该人群广泛使用数字健康工具18,总体上有积极的经历19。尽管移动心理健康应用程序和其他数字工具市场已经饱和,但用户评级可能会存在差异,并且对于应用程序设计者和潜在用户来说信息量不大20。超过 95% 的用户在 30 天后停止使用大多数移动心理健康应用程序21,并且依从性和参与度普遍较低22 号。就睡眠和酒精应用程序而言,通过个性化反馈、提供商的互动和支持、自我监控和用户友好性等功能,用户参与度可能会提高23,24,25,26此外,游戏化可能会显着减少移动心理健康应用程序的总体使用损耗27。随着机器学习的结合,应用程序也变得越来越个性化。评估用户的观点和干预质量对于在快速增长的全球数字健康市场中促进更高的治疗采用率和依从性至关重要28。因此,对用户体验进行精确、一致的评估代表了数字干预研究中的巨大差距。
将自然语言处理(NLP)纳入融合混合方法可以支持以用户为中心的数字健康干预设计29。NLP 是越来越多的机器学习方法的总称,这些方法使用人工智能 (AI) 来理解(例如,总结、检索信息)和/或生成语言内容。传统的评估方法,例如离职面谈的定性主题分析,可以揭示细微差别和细节,但可能不切实际且不可行,尤其是在样本量较大的情况下30。但NLP主题建模可以帮助后续的主题分析更有针对性、更快速。此外,使用李克特型满意度量表进行的退出调查可能会受到用户反应偏差的影响,因此,NLP 可能有助于证实他们的结果。
结合 NLP、定量调查分析和有针对性的定性访谈分析的混合方法可以揭示广泛而丰富的用户体验,同时最大限度地提高研究人员的时间和精力。当前的研究使用收敛混合方法来评估“收工之夜”的随机临床试验 (RCT) 中的用户体验(西安)和两个控制条件(见图1)1)。西安是一种针对年轻人的数字化个性化反馈和指导睡眠干预措施,旨在解决酗酒和其他物质使用问题。在家长审判中6,西安针对仅包含简短网络建议的控制条件进行了测试(一个)或建议 –+ – 主动智能手机日记自我监控(一个☀++☀SM)。所有参与者都佩戴睡眠和酒精生物传感器进行被动监测。NLP 方法,特别是主题建模分析(潜在狄利克雷分配)和情感分析,用于评估与退出访谈的定性主题分析以及退出调查的描述性和预测分析的收敛性。该研究的目的是利用这些 NLP 评估方法:
描述年轻人在针对酗酒和酗酒的数字睡眠干预期间的用户体验
确定用户体验是否随人口特征(例如年龄、种族、性别、学生状况、精神病诊断)或试验条件而变化。
我们招募了 120 名试验参与者,其中 118 名完成了退出调查。一半 (51%) 为女性,80% 为白人,平均年龄为 21.14 岁(见表1)。四分之三(74%)是大学生。根据诊断访谈,大多数人 (81%) 符合任何 MHD 或物质使用障碍 (SUD) 的终生标准,大多数人还符合 AUD 的终生标准 (72%)。
在退出调查中,不同条件的参与者(西安,一个☀++☀SM, 和一个)报告了普遍积极的用户体验(n—=—118;见表2)。按照 5 分制,参与者报告了总体项目满意度很高(中号≤=≤4.53,标清≤=≤0.61),建议有用性(4.32≤<≤中号�<�4.34)、智能手机日记自我监控有用性(中号≤=≤4.15,标清–= –0.76),以及个性化反馈和辅导帮助(4.65 –< –中号≤<≤4.70)。整个计划的平均可行性评级普遍较高(4.24≤<≤中号≤<≤4.65),建议(中号≤=≤4.43,标清≤=≤0.76),睡眠手表生物传感器(3.97≤<≤中号‐<‐4.54),以及智能手机日记自我监控(3.85‐<‐4.54)中号≤<≤4.51)。然而,根据目视检查,踝关节酒精生物传感器的平均可行性评级较低(2.41≤<≤中号≤<≤3.91),特别是由于与服装的干扰,感觉不舒服,并且很明显。报告的有效性较高西安(Δ=Δ0.48,p�=�0.008) 和一个☀++☀SM参与者 (Î=0.55,p≤<≤0.001) 比一个参与者(F(2, 115)≤=≤8.45,p–< –0.001)。此外,终生患有任何 MHD/SUD 病史的年轻人认为他们的干预措施平均比没有诊断过的人更有效(F(1, 116)≤=≤4.64,p≤<≤0.001;Î≤=≤0.32,p≤=≤0.03)。表 2 CIAN 退出调查结果(
几乎所有参与者 (98%) 都完成了 2 周的干预阶段,96% 的人完成了 12 周的随访预约。在监测活动方面,98% 的参与者佩戴睡眠手表生物传感器 14 天,95% 的参与者佩戴酒精脚踝生物传感器 14 天。此外,95%的参与者西安和一个☀++☀SM各小组完成了指定的 14 天的智能手机日记自我监测睡眠和饮酒情况。
对于离职面谈,我们最初使用定量潜在狄利克雷分配 (LDA),这是一种主题建模分析,可识别主题中出现的术语以及文档中出现的主题的可能性31,帮助定性主题分析更有针对性,并评估调查结果与退出调查分析的收敛性。使用 112 名参与者的退出访谈和辅导记录的数据集,我们确定了参与者陈述中的 9 个主题(见图 1)。2;看补充材料对于所有主题定义和示例引用)。这些主题并没有因试验条件而显着变化(X2�=�16.72,p≤=≤0.40)。我们发现监测意识是最多次采访中最有可能的话题(n≤=≤18, 16%)。这包括参与者认为主动智能手机日记自我监控和被动生物传感器监控都提高了他们对自己行为的认识和正念。正如一位参与者所说,“知道我必须在第二天写睡眠日记,并且……人们正在观察我在做什么……我只是更加了解自己的习惯。”
其他常见主题集中在基于网络的建议,尤其是睡眠策略。主题,网络建议改善睡眠(n–= –16, 14%),包括开始使用睡眠策略(例如一致的睡眠时间表)改善睡眠的经验。一位参与者描述道,“我的睡眠习惯以前确实很糟糕,但我认为自从开始这项[研究]以来,它们已经改善了很多……我开始早点睡觉,并且……减少睡眠时间。”我睡前的活动。 – 几乎同样多的采访最有可能包含这个话题,战略壁垒(n≤=≤15, 13%),或描述实施睡眠策略的挑战,例如情境因素(例如工作和学校时间表、宿舍环境)或个人因素(例如记忆、动机)。主题改变睡眠不好(n�=�15, 13%),包括对睡眠质量差或非恢复性睡眠的描述、这如何激励研究参与以及了解不同睡眠因素的愿望。因此,三个常见主题集中在睡眠和改变睡眠的动机上(总共占所有访谈的 40%)。
其他主题侧重于参与者对获得更多与健康相关的知识以改变睡眠或饮酒的兴趣。13 次访谈 (12%) 最有可能包含该主题学习和减少饮酒,其重点是从数字干预中获取新信息,并鉴于饮酒对睡眠的影响而减少饮酒。主题使用反馈和网络建议(n—=—11, 10%) 包括参与者如何将个性化反馈和辅导与基于网络的建议(包括信息和策略)相结合,以改变他们的睡眠和饮酒情况。主题多种策略和因素(n—=—10, 9%) 关注参与者对各种睡眠相关因素影响的好奇心和兴趣,例如情境、环境、酒精以外的物质以及饮食和锻炼。
两个最不常见的话题包括可穿戴生物传感器的负担。主题策略,而不是设备(n�=�8, 7%) 重点关注基于网络的有用建议方面、实施睡眠策略的尝试以及可穿戴生物传感器(尤其是脚踝酒精生物传感器)的挑战。同样,主题反馈,而不是设备(n�=�6, 5%) 重点关注个性化反馈和指导的好处,同时也讨论了可穿戴生物传感器的困难。
离职面谈和成绩单的情绪得分(n�=�112) 总体呈正值(中号≤=≤15.07,标清≤=≤10.54),范围为 -16 至 47(见图 2)。3)。积极与消极情绪得分反映了参与者在离职面谈中词语使用的总效价,因此“0”反映了面试中的中性净得分。情绪分数不随试验条件而变化(西安,一个☀++☀SM, 和一个;F(2, 109)−=−0.78,p≤=≤0.46)。积极情绪得分也不因人口特征(包括性别)而变化(F(1, 110)≤=≤0.62,p≤=≤0.43), 年龄 (乙≤=≤0.03,t≤=≤0.06,p�=�0.95), 种族 (F(4, 107)≤=≤1.23,p–= –0.30), 种族 (F(1, 110)≤=≤0.20,p�=�0.66), 学生身份 (F(3, 108)−=−0.75,p–= –0.53),以及任何 MHD/SUD 的历史(F(1, 110)≤=≤0.23,p≤=≤0.63)。然而,每个文档的字长与情绪得分正相关(r≤=≤0.21,p–= –0.03),表明发言时间较长的参与者倾向于更积极地谈论他们的经历。为了提高严谨性并解释这种相关性,我们得出了每个文档的每个词的效价分数,并以每个单词的效价分数作为结果重新进行跨条件和人口统计群体的情绪比较。组间仍然没有差异(p≤>≤0.05)。图 3:离职面谈情绪频率。
–= –107) 是由 LDA 通知的。出现的总体主题类别与不同干预成分的有用性和参与者的建议有关(见表3主题和显着性;看补充材料s 用于所有主题分析定义和示例引用)。
n–= –107) 强调了基于网络的建议干预的各个方面,既有有用的,也有无益的。最常提到的有用方面是基于网络的建议的一般帮助(n�=�69, 64.5%) 和与睡眠相关的有用信息(n–= –69, 64.5%): –我认为特别有用的[提示]是…当你醒来时要做的事情,因为我认为…当我醒来时,我只是不做…“不想起床,所以我会……长时间躺在床上玩手机。”参与者表示赞赏来自网络建议的新信息(n≤=≤58, 54.2%)、已知信息提醒(n≤=≤42, 39.3%), 以及基于网络的建议策略的有用性(n—=—38, 35.5%):“它[建议]谈到了……您的体温……保持窗户打开或使用风扇来保持身体[凉爽]。”其他人指出了有用的方面基于网络的建议的可理解性(n≤=≤28, 26.2%), 基于网络的建议的用户友好性(n≤=≤25, 23.4%), 与酒精相关的有用信息(n≤=≤25, 23.4%), 以及信息的可记忆性(n≤=≤9, 8.4%)。相比之下,相对较少的参与者描述了建议中无益的方面。有些提到缺乏新信息(n�=�14, 13.1%) 作为一个缺点,而其他人则描述了信息不相关(n�=�5, 4.7%),例如与大麻和睡眠相关的内容。一些参与者报告战略实施困难(n�=�5, 4.7%) 通过网络建议进行推荐。
不同组别条件下的参与者(n–= –107)还提供了关于佩戴生物传感器(脚踝酒精生物传感器和睡眠手表)本身是否有帮助的评论,而不考虑收集的数据。描述最多的生物传感器的中性方面(n–= –65, 60.7%),并且在没有数据的情况下并没有发现它们有帮助或无帮助。在那些发现生物传感器本身有帮助的人中,最受提及的方面是脚踝酒精生物传感器提高意识他们的饮酒情况(n—= —36, 33.6%):“您身上遍布的物理监视器……它们肯定会让您……想,‘哇……我真的应该喝这么多吗?’”– 同样,其他人也指出生物传感器的一般用途(n�=�35, 32.7%) 或睡眠观看生物传感器提高意识(n‐=‐33, 30.8%) 他们的睡眠模式,无论获得的数据如何:‐如果我在睡觉前看到睡眠手表,我会想,‐你知道吗,我应该今晚可能会尝试早点睡觉。” 在那些发现一个或两个生物传感器无用的人中,最常见的抱怨是脚踝酒精生物传感器的负担(n–= –22, 20.6%),包括瘙痒、不适和难以完成某些活动:“我只是真的不喜欢[脚踝]设备……无法运行那么多。– 提到的其他无益的方面是没有数据反馈没有帮助(n≤=≤16, 15.0%),缺乏行为改变(n≤=≤12, 11.2%), 睡眠手表生物传感器的负担(例如,忘记按下按钮;n≤=≤8, 7.5%),脚踝酒精生物传感器柱头(例如,与法院命令的监控器的连接;n≤=≤6, 5.6%), 以及脚踝酒精生物传感器增加饮酒量(n≤=≤5, 4.7%)。西安和一个
☀++☀SM参与者(n–= –78) 评论了智能手机日记对睡眠和饮酒自我监控的帮助,这是他们群体状况的一部分。大多数描述了一个或多个有用的方面,最常见的是自我监控增加睡眠的正念(n–= –42, 53.8%):“我发现它…有助于…了解它[我的睡眠时间表]并且…只是反思…我的生活方式以及…我的睡眠时间”“我真的得到了。”其他人指出自我监控的一般帮助(n�=�38, 48.7%) 和增加饮酒的正念(n—=—31, 39.7%) —我…从来没有真正…过去喜欢记录[饮酒情况]。所以,我……喝了很多酒,然后我就感觉太醉了。”一些人指出了自我监控新体验(n�=�22, 28.2%), 则轻松回答问题在自我监控的同时(n�=�17, 21.8%),或改变行为的动机由自我监控提示(n≤=≤10, 12.8%)。较少的参与者注意到自我监控的无益方面,例如回答问题的挑战(n≤=≤13, 16.7%),缺乏行为改变(n≤=≤6, 7.7%), 以及缺乏新信息(即,自我监控并没有提高对模式的认识,也没有激励他们改变行为;n≤=≤6, 7.7%)。有些人还指出自我监控的中立方面(n‐=‐13, 16.7%),他们既没有帮助也没有无帮助。参加者西安治疗条件(n-= -50) 个性化反馈和辅导主要描述了反馈和辅导干预部分的有用方面。几乎所有西安
小组参与者描述了个性化的帮助(n–= –45, 90.0%),基于生物传感器和智能手机日记监测数据的报告和建议的个性化性质: –我认为,有了这种反馈,包括数据和背后的解释这确实是对自己的一部分的独特洞察,大多数人永远不会真正看到地图– 大多数人还指出了有用的方面,例如反馈的一般帮助(n≤=≤29, 58.0%) 和有用的数据演示(n–= –27, 54.0%): –她(教练)让我很容易理解图表和一切的含义。 – 只有少数人描述了反馈的一个无益的方面:缺乏新信息(即,报告没有对他们的睡眠或饮酒提供新的见解;n≤=≤4, 8.0%)。每个参与者还被要求选择哪些接受的干预措施对行为改变影响最大。按照帮助最大到最不重要的顺序,参与者选择了个性化反馈/辅导(50 名参与者中的 72.0%)西安参与者,n–= –36),基于网络的建议(所有 107 名参与者中的 36.4%,n–= –39),智能手机日记自我监控(78 人中的 32.1%)西安和
一个☀++☀SM参与者,n�=�25) 和生物传感器(占所有 107 名参与者的 15.9%,n�=�17)。在离职面谈期间,参与者还提出了当前和未来干预措施改进的建议。许多参与者对测量其他与睡眠相关的因素感兴趣,最常见的是他们想要饮食和运动相关的反馈(n—=—63, 58.9% of 107):—[我想知道]您什么时间锻炼,锻炼如何影响您的睡眠……这对您的整个身体化学反应有何影响,一切。 – 其他人提到他们想要与咖啡因相关的反馈(n�=�53, 107 的 49.5%),想要环境相关的反馈(例如,光线、噪音和温度对睡眠的影响;n≤=≤26, 107 的 24.3%),或
想要其他潜在的反馈(例如,认知警觉性、烟草和压力;n�=�33, 30.8%):“也许您可以看到您在……这一周的压力有多大。只要得到这些数字,然后我认为弄清楚就会非常有趣。”为了获得更多反馈,大多数人回答说他们会愿意佩戴更多生物传感器(n�=�65, 60.7%) 和愿意完成新的智能手机日记自我监控问题(n≤=≤60, 56.1%)。更少人表示他们是不愿意添加智能手机日记问题和/或生物传感器(n�=�18, 16.8%),通常对另一个脚踝生物传感器不感兴趣。一些人自愿对当前研究中收到的干预措施提出建议。这些包括反馈改进(例如,两个干预周的合并总结报告;n≤=≤5, 50 的 10.0%),智能手机日记自我监控的改进(例如,每天更高的工资;n≤=≤6, 7.7%),生物传感器的改进(例如,消除脚踝生物传感器、测量 GPS 位置;n≤=≤8, 7.5%), 以及基于网络的建议的改进(例如,更广泛的分发、替代摘要;n≤=≤4, 3.7%)。访谈主题的非度量多维尺度我们使用多变量分析、非度量多维标度 (NMDS)32,可视化定性主题和参与者之间的相互关系。NMDS 是一种排序方法,可将矩阵的变化(例如按主题划分的参与者频率)压缩为少量正交维度32。我们使用基于压力水平测试的五个正交维度,前两个维度绘制在图 2 中的向量空间中。4。此外,多变量相关分析使我们能够将参与者特征作为 NMDS 主题排序的因素。试验组(右2
p–= –0.001) 和任何 MHD/SUD 的终生病史 (右2≤=≤0.03,p≤=≤0.04)与NMDS评分显着相关。也就是说,参与者在退出访谈中关于研究干预的陈述与试验组和诊断史相关。其他参与者特征(例如年龄、性别、种族、民族、学生身份)与 NMDS 分数无关。在 NMDS 中,如图 1 所示。4,西安和一个☀++☀SM与矢量空间中基于网络的建议或生物传感器的帮助相比,参与者更接近反馈和智能手机日记自我监控的帮助主题,这表明他们更喜欢反馈和自我监控。反之,控制一个和一个☀++☀SM相比之下,参与者更接近矢量空间中基于网络的有用建议方面的主题西安参与者和对照参与者也更有可能在访谈中陈述这些主题(X2�=�27.34,p–< –0.001)。图 4:退出访谈中用户体验主题的 NMDS 排序图。该排序图显示了映射在 NMDS 排序的前两个维度上的主题分析的研究主题(字母)。在向量空间中参与者的位置周围绘制灰色多边形以指示试验组。有关干预措施的有用方面的主题以蓝色显示,有关干预措施的无益方面的主题以橙色显示。–A – 代表基于网络的建议, –B – 代表生物传感器, –SM – 代表智能手机日记自我监控, –F – 代表反馈/指导。讨论当前的研究采用了一种创新的混合方法,其中 NLP 研究结果与更传统的混合方法相融合并得到证实,以有效评估通过数字睡眠干预来减少饮酒的用户体验。如混合方法结果联合展示所示(表
这西安正如调查有效性评级和访谈中的影响力描述所示,该小组明显更喜欢基于生物传感器和智能手机日记数据的个性化反馈和指导,而不是其他组件。趋同的结果还强调了年轻人对更全面地了解自己的健康状况的强烈兴趣,包括通过监测多种健康因素来提高他们的意识。我们使用 NLP 的混合方法使定性主题分析能够更有效地针对特定访谈问题,从而优化研究人员的时间。此外,评估 NLP 和其他方法之间研究结果的收敛性有助于解决主题分析中潜在的研究人员偏差和退出调查中潜在的用户响应偏差。
关于用户体验(包括 NLP)的混合方法研究结果强调,基于生物传感器和智能手机日记数据的个性化反馈和指导比其他干预组件具有更高的有效性和满意度,尽管基于网络的建议、主动智能手机日记自我监控和被动的体验普遍良好。生物传感器监测。西安和一个☀++☀SM收到反馈和/或积极自我监控的小组参与者认为他们的干预措施比一个控制退出调查的参与者。主题建模(LDA)和主题分析表明,一些参与者发现基于网络的建议策略难以实施,并且关于基于网络的建议的负面主题更多地与西安参与者。
我们的研究为现有文献提供了关于年轻人对互动数字干预措施(包括酒精和睡眠治疗)偏好的见解。荟萃分析和系统评价的总体概述28发现与卫生专业人员或其他社会支持提供互动的数字干预措施具有更高的依从性和有效性,并且降低了较低的损耗。提供个性化反馈的移动酒精处理应用程序可能特别吸引人24。此外,最近对移动睡眠应用程序的研究23,25,26重点介绍了对个性化反馈和与卫生专业人员的交流的提高和满意度。我们的研究补充说,从健康专业人员身上量身定制的教练的发现显着增强了参与者的解释数字健康数据的经验,这可能支持他们的理解。当前的研究还表明,用户友好性24和基于证据的信息25增加参与度,这与我们发现基于Web的建议被认为是有用且用户友好的,尤其是对照组的发现是一致的。因此,尽管基于Web的建议和其他自动化干预措施可能对许多年轻人有所帮助,但基于个性化数据的卫生专业人员量身定制的反馈和指导在当前的数字健康市场中可能是可取的。
与先前的发现一致18,我们的结果表明,年轻人特别想使用数字工具来追求整体健康和健康目标。主题分析和LDA进行了访谈,以表明参与者有兴趣了解其他影响饮酒超出酒精(例如咖啡因,饮食,运动,压力,环境)的其他生活方式因素。大多数参与者表示愿意使用其他数字工具(例如,更多的生物传感器,其他智能手机日记自我监控)来获得全能的个性化反馈。LDA的结果强调了通过智能手机日记自我监控和/或佩戴生物传感器的意识和饮酒的意识和正念。因此,尽管年轻人对使用多种数字健康工具感兴趣并能够使用吸引人的治疗焦点,这对于增加年轻人的参与度和依从性可能很重要21,22 号。
我们的研究表明,改善整体健康状况的数字干预措施可能代表了一种更具吸引力的年轻人治疗方法,以实现污名化的诊断,例如AUDS。针对年轻人的大多数可用数字SUD干预措施涉及基于Web的建议,将酒精使用定位为排除其他物质使用或健康因素33。而年轻人可能不关心饮酒或寻求传统酒精治疗5,他们担心改善睡眠质量6,8以及他们一般健康的其他方面。尽管有这种联系,但年轻人的睡眠干预措施很少。在这项研究中,出口访谈的LDA表明,参与者通常加入研究以提高其睡眠质量,而不是解决他们的饮酒。此外,调查结果表明,具有MHD/SUD终生历史的参与者发现当前的干预措施特别有效。因此,更明确地侧重于改善健康(例如,增强睡眠质量)的数字干预措施,例如当前的研究,可能特别吸引了有AUDS或其他未接受治疗的年轻人或其他诊断的年轻人。
我们的研究对临床研究人员和移动应用程序设计师具有以用户为中心的应用程序设计的影响。用户体验数字健康工具的评估应包括一种混合,收敛的方法,以优化深度,广度和效率。每种用户体验评估方法都有不同的优势和潜在的弱点30。退出访谈的主题分析可以在复杂的主观体验中提供详细的信息。在当前的研究中,与事后分析一起,主题分析揭示了与任何其他方法相比,不同干预组件的有用性之间有更多的区别。但是,随着样本量的增加,定性主题分析可能变得不切实际且不可行。我们使用NLP主题建模(LDA)来得出跨访谈问题的总体主题,这使我们能够针对和缩写主题分析,以采访针对干预组件有帮助的问题。退出调查也像NLP一样及时效率,但可能会遇到用户响应偏见。NLP,特别是情感分析,有助于确认从退出调查分析中得出的普遍积极看法。
我们的收敛评估结果对数字干预设计也具有特定的影响。除了欣赏个性化和特定的教练外,年轻人对影响其健康的因素(包括不同方面)的因素充满热情,包括其生活方式的不同方面。因此,移动心理健康应用程序和链接的生物传感器应具有多种主动和被动监控的选择,可以根据用户的可行性和兴趣量身定制。数字工具应无缝集成到通常在内的年轻人日程安排中,这可能会使脚踝酒精生物传感器具有挑战性,并有可能受到污名化34与睡眠观看生物传感器相比。此外,包括睡眠和饮酒在内的数字干预措施应赋予年轻人在卫生专业人员的支持下积极探索自己的健康。尽管当前研究的参与者对数字健康监测的正念值重视,但他们宁愿还收到带有教练的解释和建议的健康技巧的个性化数据报告。有些人可能缺乏解释其健康数据或制定行动计划改进计划的专业知识。因此,数字干预措施应包括用于交互式反馈的机制,例如与健康提供商一起进行的呼叫健康提供商,预先安排的视频或文本检查机构,或提供一系列建议和个人数据描述的聊天机器人。
针对特定,敏感的临床问题(例如大量饮酒)的数字干预措施可以通过关注相关的一般健康和健康行为(例如睡眠)来吸引更多的年轻人。鉴于目前只有一半患有MHD的年轻人接受任何心理健康治疗2。减少饮酒的数字睡眠干预措施可以针对两个风险,普遍和可修改的问题:饮酒和睡眠问题。年轻人通常会经历听闻,暴饮暴食2和睡眠问题7。此外,青春期的睡眠问题导致饮酒较重和成年11,12,13。值得注意的是,喝大量饮酒的年轻人可能比睡眠不关心喝酒8。一般而言,明确专注于不太敏感的行为目标(例如改善睡眠)的数字工具对改善潜在的污名化目标(例如减少饮酒)的影响可能更具吸引力和吸引年轻人。
当前研究的独特优势包括相对较大的样本量,尤其是用于对退出访谈的定性分析;通常在干预阶段和群体之间依从性;和少量缺少数据。这些属性中的每一个都提高了发现的有效性。此外,我们的混合动力,融合NLP的方法代表了重要的优势,因为这些方法在数字医学中是有希望的且相对较新的29,30。我们的研究也有明显的局限性。尽管丢失的数据很少,但在完整的退出访谈中可能会出现其他主题。NLP帮助解决了退出调查项目中的响应偏见,但是调查响应并未正态分布,并且通常偏向更积极的评分。我们的样本主要是大学生,因此可能不代表年轻人的代表。此外,付费参与者,因此实施和吸收在临床或其他自然主义环境中可能有所不同。
当前的评估证明了NLP在收敛的混合方法中的价值,以有效地捕获具有数字健康干预措施的广泛而细微的用户体验。具体而言,我们的结果表明,大量饮酒的数字睡眠干预措施可能会增加对年轻人的吸引力并获得酒精治疗,尤其是在包括量身定制的教练时。从广义上讲,目前的发现强调了数字工具对年轻人的重要性,这些工具为健康的全面看法以及交互式,个性化的反馈提供了整体,动态的视野。一致和精确的评估利用用户反馈对于支持有效的数字健康干预措施的更高吸收和遵守至关重要,这可以开始解决年轻人的心理健康治疗需求差距。
在当前的研究中,我们评估了用户体验作为RCT的一部分西安这是一种新颖的,两节的个性化生物识别反馈和量身定制的教练数字睡眠干预措施,为年轻人减少饮酒(氮= 120)。参与者使用2:1:1的比率随机分配给三个条件之一,持续2周:(1)西安:两项活动称其为夜间干预(n= 60)或(2)两个控制条件之一,一个:仅简短建议(n= 30)或一个+SM:简短的建议+主动智能手机日记自我监控(n= 30)。对于这项在参与者自然环境中的门诊研究,所有人每天都会穿睡眠和酒精生物传感器2周,并在简短的周中研究任命中观看了一个基于两个模块的基于Web的睡眠建议计划。分配给参与者一个+SM和西安条件还通过智能手机日记自我监控他们的睡眠和饮酒。那些分配给西安治疗小组根据其生物传感器和智能手机日记自我监控数据以及针对这些数据量身定制的健康教练的饮酒反馈,并与辅导员进行了两次简短的视频会议。
试验组之间在任何人口统计学变量(即年龄,性别,种族,种族,学生身份,精神诊断终生史或基线饮酒史)上没有显着差异。在参与者中,有118名完成了出口调查,有107个完成了与学习人员的退出访谈。
为了评估用户体验,我们在2周的干预阶段使用了与NLP的收敛混合方法。出口调查和访谈与跨试用条件的参与者并行进行,以获得有关满意度和干预可接受性和可行性的广泛和深刻观点。定性主题分析和定量NLP都检查了退出访谈。此外,根据收敛的混合方法,使用描述性和预测分析分析了退出调查结果,以将这些发现与退出访谈结果进行比较。该临床试验已由耶鲁大学机构审查委员会(IRB#2000021048)批准,并于8/13/2018(NCT#03658954)在ClinicalTrials.gov上注册。该研究是根据赫尔辛基宣言进行的。所有参与者均提供了知情同意书。可以在已发表的研究方案论文中找到其他研究详细信息6。招聘有资格
临床试验,参与者需要(a)年满18年25岁,(b)流利的英语,(c)在过去2周内自我报告三个或更多的重量饮酒场合(即有一次或以上的男性饮料或女性4或更多的饮料),(d)在审计-C上喝酒的风险有害。35,36,以及(e)自我报告睡眠的关注。在研究方案论文中进一步描述了排除标准6。参与者是使用在线(例如Facebook,Instagram,Snapchat)和当地社区周围的面对面广告招募的。在线广告和传单指示个人进行基于Web的筛查调查,并邀请那些符合筛选前资格的人进行访问,以进行最终的资格确定。
在完成2周的干预阶段后,我们要求参与者完成自我报告退出调查。退出调查包括Likert型和是/否问题,以评估用户体验,包括整体满意度,干预帮助和有效性以及干预性。还要求参与者详细介绍开放式响应项目的改进领域。
跨试验小组的参与者还完成了半结构化退出访谈,以提供有关其主观用户体验的信息(请参阅补充材料对于退出面试协议和退出调查项目)。出口访谈由三名研究人员(两名男子,一名女性)进行管理,他们接受了该协议的培训并熟悉研究干预措施。退出访谈方案包括有关以下主题的问题:参与者在研究之前和之后的参与者睡眠和饮酒,这些行为相对于他们的同龄人的看法,从干预中使用睡眠卫生策略,干预组件的帮助,干预组成部分的影响,研究参与的付款,将他们吸引到研究的原因以及针对睡眠或饮酒的未来研究的建议。
我们通过退出访谈进行了定性主题分析和定量NLP。为了进行主题分析,我们使用了Braun和Clarke的六步过程37,在此期间,我们使用递归且迭代的团队编码过程来确保在识别,命名和分类经常性主题的过程中严格和可信赖。研究小组的两个成员完成了大量退出访谈的整个文本的初步开放编码(n= 80)得出初始主题。然后,在NLP主题建模分析的发现的指导下,当前的主题分析针对退出访谈的关键部分,包括与干预组件和参与者建议的有益性有关的问题。三名研究小组成员参与了完整2周出口访谈的整个数据集的严格团队编码过程(n= 107)。这三位研究人员使用基于先前第一轮的初始代码手册,打开主题编码,独立编码整个访谈数据集的20%的随机选择(n= 21)评估互源可靠性。所有主题的百分比达成共识为95%或更高,但是仍在举行大规模的和解会议来审核初始代码手册并解决任何分歧,直到每对编码员之间达到总体Kappa超过0.7为止。其余的退出访谈使用修订后的代码书将三位研究人员分配给代码。在整个定性过程中都使用了审计,以确保透明度,包括每个编码器维护并由其他编码员审查的现场注释以及与整个研究团队进行的核对核算。
为了可视化参与者与主题之间的相互关系,我们使用主题频率计数进行了NMD素食主义者包裹31用编程语言r38。NMDS是一种多元定制方法,将矩阵的变化凝结到少数正交维度32。我们选择了NMD进行事后分析主题,因为与其他多维缩放方法相比,它没有将正态性假设放在频率数据上32。为了评估选择正交维度数量时的拟合优度,我们使用了应力水平截止和应力图(Shepard图)31。我们选择了五个正交维度,导致公平到应力得分为.13,这可能导致最小的失真39。如图所示。4,我们使用多元相关分析素食主义者在拟合因素(试验状况和参与者,种族,种族,学生身份和诊断历史)中,以及参与者和主题的NMDS命令的矢量(参与者年龄)。这使我们能够评估参与者的用户体验(作为访谈主题)是否在分配的试用条件或个人特征方面有很大差异。
对于退出访谈的NLP,我们进行了主题建模40和情感分析41在完成的退出访谈和反馈会话成绩单中,所有参与者陈述的数据集扩展了(n= 112)。LDA与主题模型包裹40在R中用于主题建模分析。提高严谨性并确保最简单的主题数量(k)用于LDA,我们通过三种模型选择方法进行了初步分析42,43,44,测试不同的k值ldatuning包裹45在R中最终选择了九个主题。参与者的陈述中的文本是在NLP之前进行了预处理的,包括删除标点符号,数字,大写字母和英语停止词,以及阻止所有其余单词。LDA确定了每个文档中最有可能发生的九个主题中的哪一个,哪些术语最有可能发生在每个主题中。主题是系统地命名的,该命名是密切阅读五个或更多的访谈笔录最有可能包含LDA的主题。卡方检验确定了主题是否随参与者指定的试验条件而变化。
对于情感分析,我们使用了Afinn词典46和苏哲特包裹41在R中46这将价分数从-5到5分配给选定的条款,并且根据其条款分数的总数对文档进行评分。文档的总情感评分为0表示中性术语价。双变量回归模型,包括方差分析(ANOVA),用于评估参与者试验状况或个人特征是否预测了在退出访谈中其陈述的情感。
通过退出调查结果进行了描述性和预测分析。其中包括每个项目和线性建模的摘要统计数据,以确定参与者的试验条件或个人特征是否预测了对退出调查项目的反应。
当前研究中使用和分析的数据集可从相应的作者和首席研究员Fucito博士根据合理的要求获得。
本研究的基本代码尚未公开可用,但可以根据相应作者的合理要求向合格的研究人员提供。
索尔米,M.等人。全球精神障碍发病年龄:192 项流行病学研究的大规模荟萃分析。摩尔。精神病学。 27,281 295(2022)。
SAMHSA和行为健康统计和质量中心。2022年全国药物使用和健康调查的结果。https://www.samhsa.gov/data/report/2022-nsduh-detailed-tables(2023)
Moreno,C。等。精神卫生保健应因19日大流行而变化。柳叶刀精神病 7,813 - 824(2020)。
Lee,M。R.&Sher,K。J. - 狂欢和饮酒问题。酒精研究。 39,31 42(2018)。
Singleton,R。A. Jr.&Wolfson,A。R.大学生的饮酒,睡眠和学业表现。J.斯塔德。酒精药 70,355â363(2009)。
Fucito,L。M.等。对危险饮酒的年轻人的多模式移动睡眠干预:随机对照试验的协议。JMIR 研究中心。协议。 10,E26557(2021)。
Sivertsen,B。等。年轻人的睡眠方式和失眠:挪威大学学生的全国调查。J.睡眠。资源。 28,E12790(2019)。
Ash,G。I.等。使用基于Web的社交媒体招募大量饮食的年轻人进行睡眠干预:前瞻性观察性研究。JMIR 22 号,E17449(2020)。
Hasler,B。P.,Schulz,C。T.&Pedersen,S。L.与睡眠有关的预测饮酒风险和青少年和年轻人相关问题的预测因素。酒精研究 44,02(2024)。
米勒(M.瘾君子。行为。 63,23 28(2016)。
哈斯勒(B.酒精 49,377 A387(2015)。
Hasler,B。P.,Martin,C。S.,Wood,D。S.,Rosario,B。&Clark,D。B.对患有和没有酒精饮酒障碍的青少年的失眠和其他睡眠抱怨的纵向研究。酒精临床。过期。资源。 38,2225â2233(2014)。
Hasler,B。P.,Kirisci,L。&Clark,D。B.儿童晚期时期的不安睡眠和可变的睡眠时间加速了酒精和其他药物参与的发作。J.斯塔德。酒精药 77,649 - 655(2016)。
迈克(T.药物酒精依赖 168,335 339(2016)。
布鲁克斯(A.替补。阿布斯。 8,55â62(2014)。
谷歌学术一个
Verlinden,J。J.等。数字认知行为疗法对失眠者的影响对大量饮酒者的睡眠和饮酒的影响:一项随机试验研究。酒精临床。过期。资源。 47,2354年2365(2023)。
Domhardt,M。等。青年人精神障碍数字健康干预措施变化的机制:系统评价。JMIR 23,E29742(2021)。
Paradis,S.,Roussel,J.,Bosson,J。L.&Kern,J。B.在年龄在18至69岁的初级保健患者中使用智能手机健康应用程序:基于人群的横断面调查。JMIR形成性Res。 6,E34882(2022)。
克莱门特(A.J.替代。使用成瘾对待。 159,209275(2024)。
Carlo,A。D.,Hosseini Ghomi,R.,Renn,B。N.&Is -P。A.,数字:行为健康移动应用程序的评级和利用。NPJ数字医学。 2,1 - 8(2019)。
鲍梅尔(A.JMIR 21,E14567(2019)。
Garrido,S。等。什么有效,什么有效?对年轻人抑郁和焦虑的数字心理健康干预措施的系统评价。前心理 10,759(2019)。
Aji,M。等。探索用户的需求和对睡眠障碍的移动应用程序的偏好:混合方法研究。JMIR。健康 6,E13895(2019)。
Crane,D.,Garnett,C.,Brown,J.,West,R。&Michie,S。影响智能手机应用程序可用性以减少过度饮酒的因素:大声思考和面试研究。公共卫生前沿 5,240357(2017)。
Lee-Tobin,P。A.,Ogeil,R。P.,Savic,M。&Lubman,D。I.评分我的睡眠:检查移动设备睡眠申请中经验证据的信息,功能和基础。J.克林.睡觉。医学。 13,1349年1354(2017)。
Oyebode O.,Alhasani M.,Mulchandani D.,Olagunju T.,Orji R. Sleepfit:一种有说服力的移动应用程序,用于改善年轻人的睡眠习惯。在2021 IEEE 9th Int。严重游戏和健康申请会议(Segah)。1â8(IEEE,2021)。
Litvin,S.,Saunders,R.,Maier,M。A.&Lã¼ttke,S。游戏化作为提高弹性并减少移动心理健康干预措施流失的方法:一项随机对照试验。公共科学图书馆一号 15,E0237220(2020)。
Lehtimaki,S.,Martic,J.,Wahl,B.,Foster,K。T.&Schwalbe,N。有关青少年和年轻人的数字心理健康干预措施的证据:系统概述。JMIR。健康 8,E25847(2021)。
Petersen,C。L.等。使用自然语言处理和情感分析来增强传统的以用户为中心的设计:开发和可用性研究。JMIR Mhealth Uhealth 8,E16862(2020)。
Skeen,S。J.,Jones,S。S.,Cruse,C。M.&Horvath,K。J.整合自然语言处理和解释性主题分析,以获得以人为中心的HIV移动健康设计见解:概念证明分析。Jmir Hum。因素 9,E37350(2022)。
Oksanen J.等。V埃根:社区生态包。R软件包版本2.6-4。 https://cran.r-project.org/package=vegan(2022)
丁·C·S。(Ding C. S.2018版,第1卷。197(Springer International Publishing,2018年)。
Monarque,M.,Sabetti,J。&Ferrari,M。年轻人的药物使用障碍的数字干预措施:快速审查。替补。阿布斯。对待。上一页政策 18,13(2023)。
Ash,G。I.等。与基于野外的年轻人的其他酒精监测方法相比,Bactrack Skyn的特异性和耐受性。酒精临床。过期。资源。 46,783 796(2022)。
Demartini,K。S.&Carey,K。B.男女大学生的审计风险状况相关。J. Am.科尔。健康 58,233 239(2009)。
桑德斯(J. B.瘾 88,791 - 804(1993)。
Braun,V。&Clarke,V。在心理学中使用主题分析。合格。资源。心理。 3,77 - 101(2006)。
R.核心开发团队。R:统计计算的语言和环境。 R 统计计算基础。https://www.R-project.org/(2004)
Clarke,K。R.社区结构变化的非参数多元分析。奥斯特。J.埃科尔。 18,117â143(1993)。
Grã¼nB.,Hornik K.主题模型:主题模型。R软件包版本0.2-14。 https://cran.r-project.org/package=topicModels(2023)
Jockers M. L. SYuzhet:从文本中提取情感和绘制弧线。https://github.com/mjockers/syuzhet(2015)
Arun R.,Suresh V.,Veni Madhavan C. E.,Narasimha Murthy M. N.找到具有潜在迪利奇分配的自然数量的主题:一些观察。在,知识发现和数据挖掘的进步。PAKDD 2010。(Zaki,M。J.,Yu,J。X.,Ravindran,B.,Pudi,V。)6118。(Berlin,Heidelberg,2010年)。
Griffiths T. L.,Steyvers M.,Blei D.M.,Tenenbaum J. B.整合主题和语法。副词。神经信息。过程。系统。17 号,13 - 18(2004)。Cao,J.,Xia,T.,Li,J.,Zhang,Y。&Tang,S。一种基于密度的自适应LDA模型选择的方法。
神经计算72 ,1775年1781年(2009年)。文章
。https://cran.r-project.org/package=ldatuning(2020)Nielsen,F。A.一个新的新闻:对微博中情感分析的单词列表的评估。在
过程。ESWC2011关于Microdosts的研讨会:CEUR工作室会议记录中的小包装718。93 - 98(IEEE,2011年)。
这项研究得到了国家卫生研究院和美国国家酒精滥用与酒精中毒研究所的支持,赠款#R34AA026021,R34AA026021-S1和R01AA03013和R01AA03013和国立毒品滥用研究所在Grant#T32DA019426下。此外,我们要感谢Daniel Griffith在R.
附加信息
施普林格·自然对于已出版的地图和机构隶属关系中的管辖权主张保持中立。补充资料
本文获得 Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License 的许可,该许可允许以任何媒介或格式进行任何非商业使用、共享、分发和复制,只要您给予原作者适当的署名即可和来源,提供知识共享许可的链接,并指出您是否修改了许可材料。根据本许可,您无权共享源自本文或其部分内容的改编材料。本文中的图像或其他第三方材料包含在文章的创意共享许可证中,除非在材料的信用额度中另有说明。如果文章的创意共享许可中未包含材料,并且您的预期用途不得由法定法规允许或超过允许的用途,则需要直接从版权所有者那里获得许可。要查看该许可证的副本,请访问http://creativecommons.org/licenses/by-nc-nd/4.0/。转载和许可
等人。在混合方法评估年轻人的数字睡眠干预措施中的自然语言处理。npj 数字。医学。 7,342(2024)。https://doi.org/10.1038/s41746-024-01321-3
已收到:
公认:
已发表:
DOI:https://doi.org/10.1038/s41746-024-01321-3