《“健康中国2030”规划纲要》指出,健康是促进人的全面发展的必然要求,也是经济社会发展的基础条件。然而心理问题诊断的准确性和干预的有效性一直是心理健康领域的重大挑战,这很大程度上是由于缺乏科学的预测工具。随着国家和社会对心理健康问题的日益关注,研究者越来越多地将现代科技方法(如机器学习)融入到心理健康问题的研究。机器学习作为人工智能的核心已经在许多领域(如金融和医学)都展示了独特的优势,将机器学习应用于心理健康领域已是大势所趋。
一、机器学习的含义及其实现路径
机器学习(Machine Learning)是通过发现大量已有数据和信息的规律,从而对新的、未知的数据做出自动的分析或预测的过程。[1]机器学习之父汤姆?米切尔给出了机器学习的形式化定义:假设使用P(Performance)评估计算机程序在某个任务T(Task)上的性能,若该程序通过利用E(Experience)在T任务上获得了性能的改善,即P的提高,则认为该程序对E进行了学习。
机器学习能通过对不同类型数据的处理来实现。目前机器学习可利用的数据类型有:(1)文本数据。其来源包括社交媒体、临床评估和记录、电子健康记录及日记等。尤其是社交媒体能提供大量反映个体心理与行为痕迹的数据,具有更高的生态效度。目前主要集中在自杀风险的预测、人格特质的分析、心理健康状况和主观幸福感的预测等。(2)调查数据。常用的是人口学变量、心理量表和公开的权威统计数据组合使用,以对人格类型和精神障碍等心理疾病进行预测和诊断。(3)脑影像数据。传统的脑影像数据的检测过度依赖专家判断,费时费力且误诊或漏诊率高。利用机器学习进行自动分类准确率优于专家判断法。目前常用于认知、记忆、情绪情感和成瘾行为等的预测。(4)行为和生理数据。它主要来自眼动追踪、便携式移动设备、多导生理记录仪和表情分析系统等。便携式移动设备包括智能手机和智能手环等,通过自动化的数据获取手段,可得到实时、海量、真实且生态效度高的行为数据。[3]传统的眼动数据的处理算法由于需要过度的设置而无法获得令人满意的检测结果,利用机器学习可从眼动数据中获得良好的特征的组合,效果甚至优于专家判断。[4]
二、机器学习的常用算法及其比较
机器学习算法分为三类:(1)监督学习;(2)半监督学习;(3)无监督学习。监督学习是通过训练而获得有特征(预测变量)和标签(结果变量)的数据间的关系,从而对新的数据做出判断。使用具有标签的数据训练模型,该模型可以预测新数据的标签,例如,可以根据创伤性脑损伤患者和正常个体的脑成像数据让机器学习模型做出自动的识别以区分个体的患病情况。[5]无监督学习是通过训练而发现无特征和标签的数据间的关系,从而对新的数据做出判断。通过对无标签数据进行聚类来发现新的规律,例如在社交论坛中找到有关心理疾病的话题并进行分析。[6]很多时候有标签的数据集可能难以获得,因此可通过使用无标签的数据来增强模型的预测能力,但是应该了解的是没有一种算法能够很好地解决每个问题,因此需要比较多种算法来确定哪种算法最适合特定的数据集和所需要解决的任务。[7]常用的机器学习算法包括决策树、朴素贝叶斯、支持向量机、K近邻、逻辑回归、多层感知机、随机森林和K均值等,具体优缺点见表1所示。
应用机器学习时的一个重要困难是选择合适且正确的算法。[8]这里需要结合已获得的数据的数量、质量、类型和性质(如连续和离散)等方面综合考虑,通过对各不同算法之间进行比较,才能选出合适且满足研究需求的算法。具体而言:(1)当数据量较大时,可以选择随机森林、K均值和多层感知机等算法;数据量较小时可采用朴素贝叶斯、K近邻和支持向量机。(2)当数据的预测变量较少时,可采用逻辑回归、K近邻等算法;其他的算法对数量较多的预测变量可以很好的处理,尤其是深度学习的算法。(3)当数据类型属于文本数据时,最合适的算法是朴素贝叶斯。(4)当数据的质量并不完美,如有少量的缺失值,可使用决策树、朴素贝叶斯、K近邻等;支持向量机算法则对缺失值十分敏感。若有少量异常值则可以考虑K近邻、随机森林和支持向量机算法;而K均值和逻辑回归算法会对异常值十分敏感。(5)当所使用的数据是线性数据时,可采用逻辑回归;其余的算法都能够处理非线性数据。(6)值得注意的是,在众多分类算法中,若结果变量是连续数据时,通常会将连续变量离散化,以便于模型能够很好的处理,尤其是在逻辑回归算法中;而回归算法的结果变量通常是连续数据。其次,若结果变量是二分变量时,常选用逻辑回归、决策树算法;多分类时则考虑选择随机森林、朴素贝叶斯算法。
三、机器学习在心理健康的应用领域
(一)服务心理健康问题的诊断与筛查
心理健康问题诊断的主观性强和精确性低一直是困扰研究者的重要问题之一,这可能是由于精神疾病的研究、评估和治疗常常是基于一系列人类经验术语的诊断系统,而不是基于疾病的客观标志(如脑影像数据、遗传数据),因此诊断的人为性、主观性强。基于机器学习的模型可充分利用客观的疾病标志(如脑影像数据)实现对精神疾病的诊断,有极高的诊断正确率,整个过程可避免人为参与,具有较强的诊断客观性。Khazaee等人曾利用客观的静息态功能性磁共振脑影像数据,并结合支持向量机算法自动、正确的区分认知障碍患者和健康的对照组,分类准确度可达到88%。[9]另外,也有研究者利用静息态磁共振成像数据和支持向量机算法区分反社会人格障碍与正常个体的大脑中功能连通性的变化,分类的准确度可达86%左右。[10]可见,机器学习模型应用于临床能极大帮助临床医生做出正确的诊断。另外,重大公共卫生事件(如疫情)后,通常需要对民众心理问题进行大规模心理筛查,但限于专业心理医师数量少、心理诊断的时间和经济成本高等问题,大规模的诊断筛查相对比较困难。而机器学习的优势之一是处理大规模的数据,并利用大规模的数据来提高其泛化能力,适合进行大规模的公共心理问题筛查。它能处理变量的数量多,同时,可假定预测变量与结果变量之间是线性或曲线关系,还可以从上百个预测变量中寻找最佳的预测变量,数据处理灵活性更好,处理效率更高,能够减少大规模筛查的人力、物力和时间成本。例如,Park等的研究使用公共健康数据中的40736份老年群体的数据,利用机器学习的方法通过已有的疾病诊断代码对这些老年群体中未来可能被诊断为痴呆症做出预测,其在未来1年内的预测性能可达到75%以上。[11]
(二)丰富心理健康研究的途径与手段
心理学的目标在于描述、解释、预测和控制行为,目前心理学研究大多侧重于描述和解释变量间的关系,能够真正实现预测目标的研究并不常见;而且传统的心理学研究由于样本量小、数据质量低和缺乏协变量信息等原因导致一些研究的结果是矛盾且不确定的。且基于P值的显着性检验正面临重复危机,即研究结果的不可复制性。严格、系统地使用机器学习的交叉验证技术能够为实现心理学研究的可复制性提供巨大潜力。[12]
基于机器学习的技术可从海量的数据中建构学习模型,更准确地识别数据的潜在规律,具有更强的泛化能力,从而使得模型适用于不同的样本或群体,进而最大限度地减少预测误差,对结果做出更准确的预测。许多研究者尝试采用机器学习预测个体复杂的心理问题,如预测应激障碍、焦虑症等。田玮和朱廷劭的研究发现仅能够预测自杀可能性的有效特征就可达到上千个,其利用多层感知器算法建立的微博社交媒体的自杀识别器,实时评估微博用户的自杀可能性,预测准确率可达94%左右。[13]Carpenter等利用学龄前精神病学评估的数据以及机器学习来评估2至5岁儿童的患焦虑症的风险,其对广泛性焦虑症和分离性焦虑症的预测准确率均高达90%。[14]而且,机器学习通常不会在自变量和因变量之间做出假设或建立关系,它通常会在所有可能的自变量之间做出判断,给出预测结果,并能够输出重要的自变量。
Walsh等利用随机森林模型来预测自杀未遂患者和正常被试的未来自杀行为,采用的自变量包括人口统计学变量、医疗记录和社会经济地位等,最终其预测指标的准确度可达89%左右。而且,在长期的预测周期中,对于有自杀未遂经历者最重要的预测指标是医院的就诊历史记录;在短期的预测周期中,对上瘾类药物的依赖则是重要的预测指标。[15]
(三)预测或优化心理辅导和治疗干预效果
心理辅导和治疗的效果不尽如人意,一直是困扰研究者和专业从业人员的问题之一,这与心理问题成因的复杂性和单一治疗方法的局限性密不可分。机器学习可灵活优化和调整算法的参数,获得最优模型,即在数据保持不变的情况下,机器学习模型的性能是可以操纵或改变的。而传统的统计方法的模型性能是无法改变的,只能通过操纵数据改变性能。比如在随机森林或K近邻等算法中,能通过可调节的超参数值观察所得到的不同预测结果,从而选择预测效果最好的超参数值。因此,采用机器学习,可以更有效地评估或预测心理治疗方法或者干预的有效性,大大提高患者的治愈率,而且对调整优化治疗药物的剂量和开发新的、有效的治疗方法也起着很好的辅助决策作用。[16]
Lenhard等利用四种不同的机器学习算法和多元逻辑回归模型预测认知行为疗法对强迫症儿童的治疗效果,结果表明机器学习算法在预测治疗效果方面均表现良好,平均准确率达80%左右;治疗效果的最佳预测因素是强迫症的发作时间和持续时间。[17]Schmitgen等使用边缘性人格障碍患者的临床和人口统计学数据,结合多模态磁共振成像技术和随机森林模型成功的预测边缘人格障碍的治疗效果,而且该模型表明认知重评任务期间的杏仁核和海马旁的激活程度以及杏仁核灰质体积对边缘性人格障碍具有良好的预测能力,其准确度和灵敏度都可达到70%以上,这样的预测结果对开发和选择个性化的精神干预措施是至关重要的。[18]
四、研究展望
机器学习虽然有对样本量要求高,选择合适的算法需要耗费的时间和精力多等局限性,但是,作为一种新的统计方法和技术,在心理健康领域有巨大的发展空间。未来研究可以从以下几方面开展:
第一,聚焦社会重大需求和学科领域前沿问题,加强多学科协作,获取更多样化的数据,从多角度多层面阐述科学问题。
心理学、教育学、认知神经科学、医学以及数据科学等领域研究者要以研究问题为导向,通力协作,从不同途径采集数量更多、类别更多样化的数据,涵盖生理、心理、社会等多种指标,并在此基础上最大限度地采用机器学习以及深度学习等前沿方法建立研究模型,提高模型的预测力。例如可以将各种心理障碍的症状和相关信息(如自我报告、临床记录、遗传和神经成像数据)与治疗结果相结合,以产生适当的预测因子,并开发适用于筛查人群中真实异质性的模型,提高模型的预测能力。[19]同时,尝试建立纵向数据库,以获得动态的、追踪性数据,如在预测精神障碍时,适当增加动态数据,考查哪些影响因素(如作为时间函数的血压等变量)是如何随着时间变化而变化的,以及不同心理问题的类型是如何随着时间发生相互转换的。
第二,将机器学习方法应用于处境不利人群(流动儿童、留守儿童)心理健康的促进研究,增强精准性。
从众多的影响因素中,找出影响处境不利人群心理问题(如焦虑、自卑、问题行为)的关键性因素,并在此基础上开发有针对的干预方案或提出改进策略。同时,心理健康,不仅指心理障碍或心理问题,更包含积极的心理品质。未来研究应更多的关注积极的心理健康结果的预测,如心理韧性、幸福感、获得感、感恩等积极心理品质。但是目前研究多数侧重临床样本中心理障碍和疾病的诊断和预测等,忽视了非临床普通群体及其积极心理的重要性。随着机器学习用于探讨普通群众的积极心理品质的深入开展,将对指导全国公共卫生事业的发展与完善做出重要的贡献。
第三,强化对深度学习等更先进的机器学习算法在心理领域的推广和应用。
深度学习的算法(如生成对抗网络和循环神经网络等)比传统的机器学习算法拥有更强的学习能力和适应性,对结果的解释也将更具有说服力。深度学习与常规机器学习方法的不同之处在于,它能够通过连续的非线性变换从原始数据中习得数据的最佳表示,从而实现了更高水平的抽象性和复杂性。同时还可以更多的采用无监督的机器学习方法在大量的影像数据中发现潜在的结构,该结构可用于通过识别具有相似生物学或临床特征的患者,从而将异质患者分为更均匀的亚群。[20]
参考文献
[1] SENDERS J T, STAPLES P C, KARHADE A V, et al.Machine learning and neurosurgical outcome prediction.A systematic review[J]. World Neurosurgery, 2018, 109:476-486.
[2] MITCHELL T M. Machine Learning[M]. New York:McGraw-Hill Inc, 1997:19.
《机器学习及其在心理健康领域的应用》来源:《宁波大学学报》,作者:贾绪计; 金桃; 汪强; 林琳