网站首页 > 新闻中心 > 学习园地
联系方式
手机:18580429226
联系电话:023-63084468
联系人:杨晓飞
联系邮箱:syfmri@163.com
联系地址:重庆市渝中区青年路38号重庆国际贸易中心2004#
信息内容
基于脑影像的精神疾病预测
发布者:admin 发布时间:2020/6/23

近年来,基于神经成像的方法被广泛应用于精神疾病的研究,加深了我们对认知健康和大脑结构和功能紊乱的理解。机器学习技术的进步已在个性化预测和表征患者的精神障碍方面显示出很大的研究希望并取得了不少进展。

这些研究利用了各种神经成像模式的特征,包括结构、功能和扩散磁共振成像数据,以及多种模式的共同估计特征,来评估异质精神障碍患者,如精神分裂症和自闭症。在本文中,作者使用术语——predictome”(预测组)来描述从一个或多个神经成像模式中使用多变量大脑网络特征来预测精神疾病的研究模式。在预测组中,基于大脑网络的多个特征(来自相同的模式或多个模式)被纳入预测模型中,以联合估计某一疾病特有的特征并相应地预测被试的个体特征。到目前为止,已经有超过650篇关于精神疾病的经受同行评议的预测研究发表。本文调查了大约250项研究,包括精神分裂症、抑郁症、躁郁症、自闭症谱系障碍、注意力缺陷多动障碍、强迫症、社交焦虑障碍、创伤后应激障碍和物质依赖。在这篇文章中,作者全面回顾了最近基于神经影像学的预测方法、目前的趋势和常见的缺点,并分享了他们对未来的展望的方向。本文发表在Human Brain Mapping杂志上。

重点介绍:

虽然读者们可能已经读过一些机器学习和神经影像学研究的文章,但是这篇文章带来的系统性视角绝对是以往文章所无法带来的。在背景部分和第一个部分,和其他类似综述相似的是,作者介绍了当下机器学习方法和神经影响学研究的“火热”,为了把这篇文章打造成你了解和入门机器学习和影像组学方法的重要文献,我们为您在每一种方法后面都准备了该方法的网络资源去进一步了解该方法,有的比较难以理解的方法,我们附带的链接中有相应的代码实现过程,可以通过代码的一步步实现来进一步理解该方法。

接下来,作者介绍了不同疾病的预测研究概括,这里是你快速了解某个精神疾病领域研究进展的部分,你可以结合原文中的表格详细了解你感兴趣的部分。3部分作者从医生们最关注的的临床角度出发,提出了几个重要的科研成果向临床转化的条件,可以看做是此类研究希望提升商业产品能力的方向。第4部分从不同的研究路径入手,介绍了时下最时髦的预测和分类研究,包括多体素模式识别分析、多模态融合分析以及深度学习、复杂网络和FNCdFNC等方面的研究趋势。5部分则开始统一分析机器学习在脑影像数据分析中面临的通用困难和挑战,这些挑战是你在做研究时必须考虑的问题。第6部分,作者对未来该领域的研究方向给出了一些猜想,这其中包括你我都能想到的深度学习、动态模型以及大数据的构建,但是机器学习竞赛在脑成像领域的开展绝对算的上时下的一个新的特征和发展趋势。并且,作者对这些趋势性的内容给出了较为详尽的优劣预测,这是你在其他地方难以看到珍贵意见。

最后,我们对全文进行了总结,思影科技希望您能从这篇文章中学到更多东西。 

研究背景:

随着建立现代精神病学的不断发展,在尝试将不同的精神现象和疾病分类方面,研究者希望通过诊断工具对精神疾病进行客观评估的需求已经浮出水面。目前的严重精神障碍的临床诊断、疾病评估和治疗计划完全基于横断面自我报告的临床症状,并有纵向过程和结果的信息支持。研究人员一直在积极寻找客观的、基于生物学的疾病指标或生物标记,经过几十年的实验和尝试,根据预定义的症状类别对精神疾病进行分类,目前我们正处于一个转折点,在这个时期,出现了一种新的需要,即确立研究领域标准。这种方法的目的是结合临床和遗传神经科学的最新发现,以特定的神经病理生理学为基础的形成系统的且客观可重复的鉴别精神疾病的多维方法。通过利用先进的神经成像技术,现在有可能研究特定疾病的结构和功能脑损伤。神经成像模式,如磁共振成像(MRI)、脑磁图(MEG)和脑电图(EEG),为非侵入性地研究精神疾病的神经结构提供了重要工具,它们在各自的成像领域具有极高的准确性。利用这些强大的技术,研究人员已经开始了解可能导致特定疾病的复杂神经功能和结构。

近年来,在设计基于神经影像的预后/诊断工具方面出现了越来越多的趋势。因此,人们一直致力于使用神经成像工具来自动区分脑疾病患者与健康对照(HC)或其他患者。许多类似研究报告了有希望的预测性能,声称复杂的精神疾病可以用一种自动的方式来诊断,并且可靠、准确和迅速。然而,直到现在,这些工具还没有被整合到临床领域。作者认为一个关键的原因是,许多这类的研究,尽管在一个特定的研究数据集上出现了很有希望的结果,却没有被设计成推广到其他数据集,特别是临床数据集的标准化工具。

在本文中,作者回顾了基于机器学习的技术在精神病学诊断集中预测分析中的应用的现有文献,并讨论了当前的趋势和未来的方向。以往的相关综述总是集中在某一种具体的机器学习方法或者某种精神疾病上,而本文的目标是提供一个全面的、系统的概述。本文是迄今为止在主要精神疾病领域中最大的调查,审阅了来自各个不同精神疾病的约250篇论文。此外,近年来,预测分析研究呈指数增长,因此,一个更新的调查是很有必要的。在本文中,将对基于大脑的精神病学预测组的当前趋势及其转译观点进行一般性讨论,并强调一些常见的挑战和未来方向的指导方针。此外,本文还讨论了神经影像学的新趋势,如数据共享、多模态脑成像和鉴别诊断。本文的主要目的包括:

(a)系统地回顾和比较大量的最近的精神障碍诊断/预测研究在:MDD(抑郁症),双相情感障碍、自闭症,多动症,强迫症(OCD),社交焦虑障碍(SAD),创伤后应激障碍(PTSD)和药物依赖(SD)等疾病类型中的发展;

(b)讨论现有的机器学习技术的实际应用能力和缺陷。

(c)讨论当前该类研究存在一些问题,并从未来发展方向的角度出发来解决一些挑战。


1. 发展性精神疾病预测的研究流程

预测组研究使用神经影像学数据的目的是从一个或多个神经影像学模式中提取多变量脑网络特征,以预测结果的方法,如特定的精神疾病诊断或者病程分析。通常情况下,在特征提取和选择之后,研究人员会选择某种分类器以监督或半监督的方式使用预定义的标签集进行训练。进一步的模型验证可以通过使用独立的测试数据集或合并交叉验证(CV)方案来执行。图1展示了使用神经影像学数据进行精神疾病预测的基于大脑的预测组管道的最常见组件。虽然特定的分析流程在不同的预处理和后处理阶段可能会有所不同,但传统的预测组分析通常包括以下步骤:

(a)  特征提取和选择/缩减;

(b)  (b) 分类器训练;

(c)  (c) 分类和CV

(d)  (d) 模型性能评估。

IMG_256

1 一般的预测组分析的分析流程

注释:

(a)通常用于精神疾病预测的神经影像学方法。

(b)目前的特征选择方法。特征提取可以包括:(i)基于体素的(ii)基于网络的,(iii)基于数据的方法(例如,独立成分分析,ICA),或(iv)从多种模式(例如,fMRI和基因组学)联合估计特征。

(c)特征选择的类型可以包括自动选择或专家选择方法(即顶级智能人工选取,往往基于强先验假设)。

(d)分类器的选择可以包括支持向量机(SVM)、线性判别分析(LDA)、高斯过程分类器(GPC)、神经网络分类器(NNC)或逻辑回归分类器(LRC)

(e)可以使用测试验证设置或k-fold交叉验证方案进行模型验证。

(f)同质性疾病也可以进行数据驱动的亚型鉴定(如k-mean聚类等方法)。

(g)各种模型性能评估措施,如准确性、敏感性、特异性、预测精度和F1-scoreFN,假阴性;FP,假阳性;TN,真阴性;TP,真阳性;

 

1.1特征提取、选择/减少

预测组分析的第一步是将神经成像数据转换为特征(即,预测组的特征,决定使用什么作为特性并从数据中提取这些特性值)。神经影像学特征是指任何包含有价值信息的派生变量,这些信息可以从数据中提取出来。在本次调查中,回顾并强调了基于用于分类目的的特征类型的预测组研究,包括基于体素、基于区域和基于脑网络的特征选择方法。

例如,特征可以是特定脑网络内的一组脑体素,或者是感兴趣区域(ROI),或者多元数据驱动(例如,使用独立成分分析[ICA])提取的脑网络,或者是联合估计多模态特征,如图1b所示。基于体素的方法在脑体素水平上进行特征提取,而基于区域的方法则根据脑图谱(功能性或结构性)识别和提取预定义的兴趣区域(roi)。基于网络的特征提取方法,如ICA,旨在跨脑网络结合多个体素的功能连接特性。

除了特征提取外,在进行模型训练之前,从高维神经成像数据中减少特征的数量也很重要。在神经成像的背景下,特征选择可以帮助实现更高的准确率,并允许更具体地关注于解释组间差异的潜在大脑区域。事实上,神经成像数据中特征的数量是很大的,许多不相关的特征对模型的预测能力没有贡献,而且并不是所有的疾病都以同样的方式影响每个大脑网络。因此,一些基于大脑的特性可能不会有助于诊断标签,而一些特性可能会捕获其他特性已经发现的冗余信息。

计算时间和模型泛化也可以通过排除冗余和不相关的特征来得到提升。特征选择方法(如主成分分析[PCA])将高维神经影像数据投影到低维空间中,目的是保持模型的识别能力。虽然不是必不可少的步骤,但为了提高预测算法的强度,选择最优和有意义的特征是很重要的。在有监督学习方法中,大多数鉴别特征被选择用来放大信号和降低噪声。通常,先验信息用于处理神经成像数据的维度问题。根据特征的特点和学习问题的类型,采用一种特定的特征选择方法。

常见的特征选择方法包括:

(a)  专家特征选择(基于先验知识)

(b) 自动特征选择(基于特征选择算法)

这两种方法的组合也可以用于特性选择。例如,一个专家特征选择方法可以首先通过选择一个已知的特定于疾病的ROI来实现,然后一个自动的特征选择算法可以用来在预定义的ROI范围内选择有区别的特征。注意,为了避免模型性能偏差,特征选择和提取方法应该仅限于训练数据集。
1.2 分类训练器(即不同的分类算法)

分类器是一个将特征作为输入并生成类标签预测的函数。基于学习函数和基本假设,可以开发不同类型的分类器。神经影像学研究已经应用各种分类器来预测精神疾病。在应用这种分类算法时,需要考虑到特征数量相对较多、样本数量较少的维度问题。通常,分类器学习一个规则并优化地分离底层类。任何类型的分类或回归算法都可以用于训练目的,如线性和逻辑回归算法,多层神经网络和高斯方法。作者在这个部分对当前主流使用的各种分类算法进行了简要但明确的介绍。为了能够让读者在本文中获得更多的对分类算法的一般性认知,小编增加了一些内容,来帮助读者更好的了解这些方法。

最近邻方法(Nearest-neighbor

最简单的分类器称为最近邻,它不需要对分类函数进行任何显式学习。使用最近邻方法,识别训练样本和测试样本之间最相似的测度,例如最小的欧氏距离,然后分配训练样本的标签(即最近邻)到测试样本中。在最近邻算法中,使用最频繁的是k-近邻算法,该方法的实质是:给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例最邻近的K个实例,这K个实例的多数属于某个类,就把该输入实例分类到这个类中。更通俗说一遍算法的过程就是,来了一个新的输入实例,我们算出该实例与每一个训练点的距离(距离度量方法是需要根据数据特征确定的),然后找到前k个,这k个哪个类别数最多,我们就判断新的输入实例就是哪类。
判别模型和生成模型Discriminative andgenerative models

其他需要显式学习功能的分类器可以分为判别模型和生成模型。判别分类器使用基于预定义参数的学习函数直接学习对训练数据进行预测。相比之下,生成分类器学习一个统计模型,通过对基于示例类标签的特征值的分布建模来生成类标签。

更具体的说,判别方法是由数据直接学习决策函数 或者条件概率分布作为预测的模型,即判别模型。判别方法关心的是对给定输入,应该预测什么样的输出y。比如说要确定一只猫是加菲猫还是狸花猫,用判别模型的方法是先从历史数据中学习到模型,然后通过提取这只猫的相应特征来预测出这只猫是加菲猫的概率,还是狸花猫的概率。常见的判别模型有线性回归、对数回归、线性判别分析、支持向量机、 boosting、条件随机场、神经网络等。

IMG_257

常见的生产模型有隐马尔科夫模型、朴素贝叶斯模型、高斯混合模型、 LDA RestrictedBoltzmann Machine 等方法。

作者接下来简要的介绍了几种重要的判别模型和生成模型。 

支持向量机(Support vectormachine

在监督学习的训练阶段,数据标签被用来优化模型,通过找到一个超平面或决策边界,可以最大限度地区分群体。对于一个简单的学习函数,最常见的选择是基于可能影响结果的特征的线性组合来预测类标签。线性分类器可以被看作是学习一条线或一个边界(例如,将两个类中的点分隔开并区分它们的标签。线性支持向量机(SVM)就是这样一个学习决策边界的分类器。

由于支持向量机在神经影像预测中的广泛应用和前景看好,它是目前调查中最常见的分类器。支持向量机算法通常用于二分类,其目标是在高维空间中最大化不同类之间的边界。在数学上,SVM的判别函数由一个正交于决策边界的权重向量构成,由距离决策边界最近的数据点指定,称为支持向量。这个决策边界进一步定义了未出现的新情况的分类规则。

由于SVM方法已经是业界很成熟的机器学习方法,在各个不同平台上存在大量的学习资料,我们推荐以下链接作为入门了解的良好工具:      https://blog.csdn.net/v_JULY_v/article/details/7624837
  
线性判别分类器(Linear discriminant classifier

另一个强大的线性模型是线性判别分类器(LDC),它试图通过最大化类间与类内比值的方差来分离类别。概率判别模型的一个例子是逻辑回归分类器(LRC),它通过将log-odds ratio建模为预测变量的线性组合来学习最优决策规则。LDCLRC方法都可以产生概率预测,即新案例可以分配给特定的类和类标签。我们推荐以下链接作为入门了解的良好工具:   https://www.cnblogs.com/pinard/p/6244265.html
  
高斯过程分类器(
Gaussian processclassifier

此外,高斯过程分类器(GPC)是一种概率模型,是LRC的贝叶斯扩展。简单地说,GPC首先使用训练特征来确定区分casecontrol的最佳预测分布。与这个预测分布相关的参数是通过最大化训练特征的边际似然的对数来估计的。在训练阶段,GPC通过使用sigmoid函数提供测试数据的预测分布来预测病例组和控制组对象。进一步了解见:https://zhuanlan.zhihu.com/p/32152162
  
神经网络分类器(
Neural networkclassifier

此外,人工神经网络分类器(NNC)最近成为流行的网络建模方法。多层NNC是线性感知器分类器的扩展,可以产生复杂的非线性决策边界。通常,NNC的结构包括一个输入层、一个隐藏层和一个输出层。每一层的神经元都与下一层的神经元相连。隐藏后的神经元可以使用多种非线性传递函数(sigmoid函数)。简单地说,在训练阶段,使用反向传播技术调整一组人工连接神经元的权重,以达到学习目的,然后用于分类。

神经网络分类器的具体练习可以参考下文:

https://blog.csdn.net/HerosOfEarth/article/details/52165133
    
随机森林方法(Random forest

最近其他更强大的基于大脑的预测方法包括随机森林和深度学习分类器。随机森林分类器是一个决策树分类器的集合,它集成了多个层次的随机化。利用训练数据的随机子集,生成每个决策树,然后通过搜索训练特征的随机子集形成每个节点。对于每个特征,分类器估计一个分数来突出特征的区分能力(即,基尼系数(GI)得分)。随机森林方法提供了更好的泛化准确性,因为它随机化了训练对象,特别是在训练对象相对于训练特征的数量相对较小的情况下。此外,随机森林分类器提供了非线性决策边界,这有助于在训练过程中对特征的非线性模式进行建模。MATLAB随机森林实战看下面:https://blog.csdn.net/sgfmby1994/article/details/77863297 

深度学习方法分类

最近,深度学习分类器已成为精神疾病预测的一个有吸引力的选择。深度学习分类器可以使用层次方法直接从原始数据中学习具有最佳识别能力的特征。这与需要显式特征缩减步骤的传统分类器相比具有很大的优势。通过对原始数据进行非线性转换,深度学习分类器自动克服了特征选择的问题,这对于缺乏先验知识的高维特征或数据尤其有帮助。深度学习的方法目前是机器学习中大热的发展领域,有很多的新的方法出现,也有大量的网络资料供读者学习。深度学习对使用者的数学基础有一定的要求,因此,如果你只是单纯的使用者,学会如何利用现有的工具包就可以了。就目前为止,还没有出现相当有影响力的MRI图像或者EEG数据的深度学习分类工具,感兴趣的读者可以参考斯坦福大学深度学习小组利用CNN方法对MRI图像进行分类学习的项目:https://stanfordmlgroup.github.io/projects/mrnet/

 1.3分类和CV交叉验证

在训练阶段,分类器根据相关学习算法从训练特征中预测标签。例如,对于没有复杂的、迭代的特征选择的学习问题,训练好的分类器在之前未见过的测试数据上进行测试。为了获得更好的模型性能,分类器应该尽可能多地使用训练数据进行训练,这在基于神经成像的预测研究中通常是一个具有挑战性的问题。CV方法为我们提供了训练更多训练样本的分类器。一种常见的CV方法是使用多个训练集和测试集分区反复评估模型性能,这种验证方法称为k-fold CV。其他流行的CV方法包括:leave-one-out (LOOCV)hold-outLOOCV是一个迭代过程,通常用于较小的样本容量,其中k等于样本的数量,整个样本中的每个受试者都被遗漏一次,用于测试分类器。简单地说,LOOCV过程包括以下步骤:

(a)  去掉一个样本,对其余的样本进行训练,对这个样本进行预测

(b) 依次对每个样本进行重复,

(c) 计算对所有样本进行预测的准确性。

虽然这是一种流行的选择,但将每个样本排除在外可能会增加计算代价,因为它需要训练与样本数量一样多的分类器。此外,LOOCV也被证明可能会引入一些预测偏差,因为它可能会通过在训练状态中提供更多的数据而引入高方差,这也可能导致过拟合。

因此,首选的方法是k-fold,其中k <样本数。分区的常见选择是k = 10k = 5,这对应于在每个验证折叠期间忽略1020%的总样本。该方法的其他重要考虑包括

(a)   为了更好的预测准确性,在训练数据中包含所有类别的例子;

(b)   各类别的样本数量大致相同(即,平衡类)

(c)    将相关样本包含在同一折中。 

1.4模型性能评估

预测算法最常用的性能评估指标包括准确性、灵敏度、特异性和receiver operatingcharacteristic (ROC)曲线。这些措施提供了一个评估分类器如何准确的推广到新的测试样本中的能力。

在临床环境中,准确性表示模型如何准确地分类病例和控制,敏感性显示正确识别的真阳性的比例(即,和特异性表明正确识别的真阴性的比例(即真实阴性的比例)

模型的整体表现可以通过ROC曲线来评估,ROC曲线提供了曲线下面积(AUC)的总结。高敏感性表明只有少数参与者被误诊为HCs,而实际上是患者,高特异性表明少数参与者被误诊为患者,而实际上是HCs

准确率是指样本被正确分类的总比例。ROC曲线显示了在模型的一个决策阈值范围内真实阳性率(敏感性)和假阳性率(1-特异性)之间的平衡。为了避免由于组间潜在的不平衡而产生的偏差,一种常见的做法是报告平衡的准确性度量,方法是对每个诊断进行标签。总结分类性能的一个有用的方法是提供一个混淆矩阵,它在一边表示实际的标签,在另一边表示预测的标签。从混淆矩阵中还可以提取出其他有用的性能指标,包括正预测值(PPV)、负预测值(NPV)F1-score (precisionrecall的调和均值)G-mean (precisionrecall的几何均值)

正预测值和负预测值对于预测研究非常重要,因为它们直接量化了分类器在临床诊断中的潜在效用。正预测值定义为分类器正确预测参与者为患者的次数(即,阳性诊断)除以阳性预测的总数。负预测值定义为分类器正确预测一个负诊断的次数除以负预测值的总数。模型评估的不同指标相互之间其实连接紧密,对于解释模型性能具有重要意义,推荐:  https://chiang97912.github.io/2020/01/10/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E6%A8%A1%E5%9E%8B%E8%AF%84%E4%BC%B0%E6%96%B9%E6%B3%95%E5%8F%8A%E4%BB%A3%E7%A0%81%E5%AE%9E%E7%8E%B0/

作为大家实战各种不同模型评估指标的文章。

 

 

2. 利用神经影像学技术预测精神疾病

随着医学影像技术的进步,神经影像数据的收集比以往任何时候都要快,分辨率也更高。近年来,越来越多的人开始关注如何利用这些海量的大脑数据,通过分析、获取方法和实验设计来更深入地了解大脑的结构和功能。在本文中,作者使用“预测组”这个术语来描述从一个或多个神经影像学模式中使用多变量大脑网络特征来预测精神疾病。在预测组中,基于大脑网络的多个特征(来自相同的模式或多个模式)被纳入预测模型中,以联合估计某一疾病特有的特征并相应地预测被试。在这个部分,作者回顾了最近用于神经影像学分类和预测的预测方法,并提供了对精神疾病预测的研究概况。 

2.1对当前文献综述的调查程序的解释

目前的综述是基于对进行基于mri的精神疾病预测分析的研究文章的全面文献搜索。从1990年到2018年,系统的文献检索主要在PubMed进行,共发现550多篇文献。图2展示了本研究的系统文献搜索过程。作者搜索的精神疾病类型为8个,SZ(精分)、MDD(抑郁症)、ADHD (多动症), ASD (自闭症谱系障碍), PTSD(创伤后应激障碍)、 OCD(强迫性行为障碍)和SAD(焦虑症)以及SD(物质依赖症),以下步骤简单概括为:

(a)  不同的术语相关的分类/机器学习以及他们的缩写(例如,支持向量机,搜索术语SVM)

(b) 所有相关术语和缩略语的结构,功能和扩散磁共振成像(dMRI)结合生物标志物

(c) 术语和缩写上述八个精神疾病之一。

对所有疾病重复这些步骤,并进一步检查已确定的参考文献,以查找也包括在本综述中的遗漏出版物。另一项审查程序包括对目前审查的出版物的相关性进行审查。最后,在精神疾病诊断的病例对照设计中使用基于mri的数据预测分析方法,明确评估分类性能指标(例如,总体分类准确性)

此外,在谷歌Scholar中重复同样的搜索过程,以减少丢失相关兴趣文章的概率。本次调查最终选择了大约250篇论文,包括:101SZ, 61MDD/BP, 35ADHD, 38ASD, 1PTSD, 12OCD, 2SAD7SD。根据图1a- e中描述的为本文开发的方案对这些文章进行了分类,所有文章的摘要见表18(表格大大,无法全部贴出,见原文,可添加微信siyingyxf获取)。此外,作者将搜索范围限制在截至201812月的英文期刊文章。搜索条件还包括排除没有全文的文章,以及由相同作者发表的类似文章。对于每一项研究,定量研究成像方式、分类方法、样本量、类型特征等关键方面,如图2所示。

IMG_258

2 文献检索流程以及对应paper数量

作者在这个部分对每种疾病的相关预测研究进行了概括性的分析。所有疾病的研究基本概括如图三所示。

      2.2精分相关研究

SZ是一种慢性精神障碍,其典型特征为认知问题、对现实的感知解体、听觉和/或视觉幻觉,是一种具有持续性损伤的慢性过程。目前还没有针对SZ的标准临床诊断测试,并且已经相当多地关注于使用神经影像学特征识别生物学上的标记,这已经显示出一些希望。作者们调查了101篇同行评议的文章,如表1所示(同样见原文)。

首先来看使用结构MRI的研究: Davatzikos, Shen,et al.(2005)利用sMRI数据,使用基于体素的特征集,并应用高维非线性模式分类方法来计算SZHC (HC)的分离程度。使用leave-one out CV(looo -CV)作为cross validation,作者报告了81%的分类准确率(按性别分类,女性为82%,男性为85%)Yushkevich etal.(2005)的另一项研究使用SVM分类器和基于区域的特征集来区分SZ患者,准确率为72%。最近,Koutsouleris等人(2009)使用了sMRI和主成分特征选择方法,其中基于特征选择算法的整体预测性能,确定了最优的主成分数量来预测SZ。这项研究尤其重要,因为它报告可靠地预测了SZ的不同子类别,SZ的三类别分类显示出82%的最大准确性。另一项大规模研究的样本量为256例对照以及类似规模的复制队列,预测了基于sMRI特征驱动的SZ分类模型, CV和复制研究的准确性均为70%左右。

其次是fMRI数据的预测研究:最近,大量研究使用静息状态和任务功能磁共振成像(fMRI)的特征对SZ进行预测建模,并取得了有希望的结果。

(a) 基于任务态fMRI的研究:使用基于任务的fMRI范式的特征进行的研究包括语言流畅性、工作记忆和听觉判别实验。第一个相对大规模的研究(即使用三种不同的基于任务的fMRI数据对SZ进行分类),来自两个中心的155名参与者(Demirci, Clark, Magnotta, et al. 2008)。将projectionpursuit  algorithm应用于ICA分离的空间地图,实现了80% ~ 90%的分类精度,其中感觉运动任务的分类精度最高。

进一步,基于区域与大的同步估计从同步血流动力学建模的听觉响应图像,Calhoun 和他的同事获得了97%的预测准确率,后来在一个新的站点的数据中的模型预测准确率高达94%

许多精神障碍,如SZ、精神分裂情感性障碍和血压障碍,可能有大量重叠的症状、风险基因、脑功能障碍和治疗反应。因此,根据传统的诊断方法对这些患者进行临床鉴别变得非常具有挑战性。最近的一些研究探讨了SZ和分裂情感性障碍以及精神疾病的血压障碍的分类问题。Clementz和他的同事提出了一种基于生物类型的方法,他们确定了三种神经生物学上独特的生物学上定义的精神病类别,并表明生物类型并不遵循简单的疾病严重程度连续体,在不受影响的一级亲属中具有遗传特性。

b)静息态数据研究:

用于SZ预测的rsfMRI研究包括各种分类器,SVM、融合lassoGraphNetRFC-means聚类、正则化LDC等,如表1所示。总体而言,这些研究的样本量相对较大,分类准确率在62%100%之间,但100%准确率的研究样本量非常小(20名参与者),因此,结果可能无法在其他研究中推广。

接下来是使用dMRI数据的相关研究,本次综述中调查的dMRI研究报告的准确率在62%96%之间,使用支持向量机、LDAFishers等分类器LDC或多个分类器的组合,这些研究的特征包括来自roi的部分各向异性(FA)图和结构连接性。

最后,Zhu, Shen, Jiang, and Liu(2014)利用多模态dMRIsMRI数据的连通性测度对SZ患者进行预测,并取得了完美的准确性(,100%)。然而,由于样本容量小(即, HC = 10, SZ =10),以及该框架可能引入了分类偏差,缺乏对其他研究样本的泛化能力。

  总体,现有的SZ预测组研究多以功能和结构MRI数据为特征,以looc - cvcross validation方法选择,许多研究的样本量非常小。因此,未来有必要研究使用更好的CV方法和更小尺寸的预测模型。此外,虽然这些初步结果表明SZ可以被预测具有更高的准确性,但准确性范围在这些研究中存在很大差异,需要重复研究来确认普遍性 

2.3抑郁症(MDD)和双向情感障碍(BP)相关研究

虽然重叠的症状使得区分MDDBP以及与其他疾病(SZ和分裂情感障碍)具有挑战性,但最近的研究报道了对BPMDD的成功诊断预测。本文回顾了61项使用神经影像学自动诊断BPMDD的研究,见表2(同样见原文中的表格)。

在被调查的研究中,结构MRI主要用于预测BP患者,虽然只有少数研究包括BP样本。 

  因此,在推荐特定的分类器或机器学习框架作为BP预测的诊断工具之前,还需要进一步的研究。如表2所示,许多研究对MDD样本进行了分类。虽然使用rsfMRIsMRI和基于任务的fMRI作为特征和主要支持向量机分类器来预测MDD的研究有所增加,准确率在52% - 99%之间,但在大多数研究中样本量相对较小。虽然这些研究利用了多种基于MRI的特征,如sMRI、休息和基于任务的fMRI以及dMRI,它们为基于大脑的MDDBP的鉴别诊断提供了大量证据,但仍旧未出现泛化性能较好的分类模型。未来的研究应该采用大规模的样本量和更多的BP预测研究。 

 2.4 自闭症谱系障碍

ASD是一种神经发育障碍,其特征是社会交流受损、社会情感互惠的缺失、用于社会交往的非言语交际行为和刻板印象行为的缺失。自2010年以来,少数研究调查了男性和男性女性样本中ASD的自动诊断。本文调查了30篇使用基于MRI的特征进行ASD自动诊断的论文,其结果列于表3(见原文)中。

虽然这些研究利用了所有可用的MRI数据模式作为预测ASD的特征,但样本量以及基于每种模式的研究相对较少。此外,与自闭症谱系障碍相关的异质性,包括低功能和高功能患者的亚型,应该进一步使用预测模型进行研究。
  
2.5 多动症(ADHD

最常见的神经发育障碍之一是多动症。然而,由于缺乏基于生物学的诊断方法,目前ADHD的诊断仅基于行为症状。在这篇综述中,调查了35篇使用基于MRI的特征进行ADHD自动诊断的论文,如表4(见原文)所示。

总体而言,这些研究和以上对自闭症以及抑郁症等方面的研究相比,在准确率方面较低,同时也存在同样的样本量较小等问题。 

2.6强迫行为障碍(OCD

目前只有少数研究将分类算法应用于OCD。本文调查了12篇关于使用基于mri的特征进行OCD自动诊断的论文,如表5所示。这些研究包括了所有模态的数据,其中也有利用多模态数据进行预测的论文,但是总体而言,发展较慢,并且同样存在样本量及泛化能力的问题。 

2.7焦虑症(SAD

到目前为止,只发表了两篇关于SAD的研究,样本相对较小,准确率在80%以上(Frick et al.2014;Liu et al. 2015)。这些研究从不同的MRI模式中得出了多变量模式,这表明与SAD分类相关的特征可以跨模式提取和分析。这两项研究都报告说,有用的特征分布在广泛的大脑区域,而不是通常与焦虑相关的大脑局部区域。本文调查了两篇关于使用基于MRI的特征进行SAD自动诊断的论文,如表6所示。 

2.8创伤后应激障碍(PTSD

迄今为止,只有一项研究对创伤后应激障碍(PTSD)进行了鉴别分析,其中50名患有和未患有创伤后应激障碍的地震幸存者与使用结构成像的对照组进行了比较(Q Gong等,2014)。患者创伤后应激障碍的分类准确率达91%,最具鉴别性的特征出现在不同的大脑区域,尤其是左顶叶和右顶叶区域。表7给出了基于MRI特征的PTSD自动诊断的调查论文。

 2.9物质依赖(SD

到目前为止,只有少数预测研究SD(如酒精、尼古丁和可卡因成瘾)和预测治疗成功性,只有一项研究实现多通道成像方法来预测饮酒和大脑中的治疗效果,但是使用的是非人类数据(老鼠数据)。表8给出了7篇基于MRI特征的SD自动诊断的调查论文。总体而言,这些研究和以上对自闭症以及抑郁症等方面的研究相比,在准确率方面较低,同时也存在同样的样本量较小等问题。

 2.10对以上调查的系统分析

3展示了该调查的一些关键特性。图3a显示了每种疾病类型每年发表的研究数量,图3b显示了每种疾病类型每年发表的研究数量,图3c显示了每种疾病类型和每种疾病类型每年发表的研究数量。这些数据表明,自2007年以来,发表数量有了明显增长,自2010年以来,研究数量一直在快速增长。在2000年之前,只有一项ADHD预测研究,其样本量相对于最近的ADHD文章而言较低。

特别是,所有主要疾病的研究(即从2011年到2013年,美国各州(SZSZMDD/BPASDADHD)都呈现出峰值,这可能是由于最近的数据共享举措。从图3c可以看出,所有基于MRI的特征都被用来预测这些主要疾病,只有少量的多模态研究。此外,这表明结构核磁共振成像(sMRI)是最流行的模态选择,特别是在SZ研究中。对于MDD/BPASDADHD的研究,rsfMRI是最流行的模式。此外,与dMRI相比,多模态研究在这些主要疾病中更为常见。图3d显示了每种障碍分类器对常用分类器的总体预测精度,图3e显示了每种障碍分类器对每种障碍分类器的总体预测精度,图3f显示了每种障碍分类器对每种障碍分类器的总体样本量。支持向量机分类器是所有主要疾病中最常用的分类器,其次是LDA分类器。

IMG_259

3 本文搜集的所有文献根据MRI数据类型、疾病类型和分类模型的汇总概括

 

4a显示了整体精度、总样本大小以及每个障碍和对于每一个分类器使用的研究。图4 b显示了整体精度对每个通道的总样本量和对于每一个分类器中使用的研究,4 c显示整体精度的总样本量为每个障碍和每种模态的研究。有趣的是,即使样本量小于100,几乎所有的研究都报告了非常高的准确度,但几乎没有报告100%的分类准确度。在大多数主要疾病中,包括SZMDD/BP,报道的总体准确性随样本量的增加而下降,这令人担忧,因为这表明在这些小样本量研究中使用的分类框架可能无法在大规模研究中推广。此外,支持向量机分类方法,在大多数主要疾病中都能实现非常高的准确率。此外,rsfMRI和基于任务的SZMDD/BPADHDstudies均显示出较高的准确率。图4d为本次调查研究数量的样本量分布。虚线表示所有研究的平均样本量(红色)。图4e显示了针对每种障碍和研究中使用的每种分类器的每种模式的总体准确性。MDD/BPADHD研究报告的准确率最低。

IMG_260

可视化总结本次调查中各种精神疾病的预测研究

根据我们的调查研究(18)结构MRI的体积和皮质厚度,功能磁共振成像数据的ROIsICA组件和dMRI数据的FA之间的激活图和功能连接是最常用的分类特征。

此外,支持向量机是所有疾病研究中最常用的分类器,并观察了支持向量机方法的不同扩展,包括线性、非线性(不同的核函数)和递归特征消除支持向量机(SVM- rfe)。其他受调查的常用分类器包括LDA、高斯过程分类器(Gaussian process classifier, GPC)和随机森林(randomforest, RF)。图5和图6给出了主要疾病(排除了研究数量很少的疾病)的累积密度函数(CDF)。其中, (a)每种模式的出版年份,(b)每种模式的样本量,(c)每种模式的准确性,和(d)每种分类器的准确性。从这一总结中得出的一个有趣的观察结果是,针对许多主要精神障碍的多模态预测研究出现了增长。

IMG_261

5本次调查中精神疾病的预测研究的障碍特异性累积密度函数(CDF)的总结结果

注释:(a)精神分裂症(SZ) (b)抑郁症/双相情感障碍(MDD/BP) (c)自闭症谱系障碍(ASD)。对于每种疾病,给出了每种模式的出版年份、每种模式的样本量、每种模式的准确度和每种分类器的准确度

IMG_262

6 本次调查中精神疾病的预测研究的障碍特异性累积密度函数(CDF)的总结结果

注释:(a)注意缺陷/多动障碍(ADHD) (b)强迫症(OCD),和(c)物质依赖(SD)。创伤后应激障碍(PTSD)和社会焦虑障碍(SAD)被排除在外,因为发表数量很少。

 

3.   从临床应用的转化视角看基于脑的预测组研究 

3.1将预测结果转化为临床应用

通常,在以研究为基础的设置中,预测研究是使用两个或更多比例适当的精神疾病患者组和他们的健康对照组来实现的。在训练监督分类算法之前,对组标签进行仔细诊断,排除诊断不确定或共患病的受试者是一种常见做法。然而,在真实的临床人群中,疾病的诊断是一个更加复杂的过程。因此,预测建模领域需要有相当大的改进,才能将其应用于临床实践。在许多临床病例中,要解决的中心问题不像如何区分患者和对照组那么简单,而是在同一人群中不同疾病之间的具体区别(即子类型)。简单地说,在能够得到可用工具的准确临床实施之前,需要一个鉴别诊断过程。此外,目前预测建模方法的另一个限制是缺乏适当的(或任何)识别患者之间的共病的能力,这是跨多个诊断类别正确分配分类标签的关键。到目前为止,只有少数现有的研究,在目前的文献中,不同的疾病已证明多类分类(即。三种或三种以上疾病的亚型分类。然而,就本文发表截止,还没有这样的研究充分处理了共病的问题。

虽然在临床应用基于研究的诊断/预测工具之前应该解决现有的局限性,但即使是目前的方法也可以作为临床诊断的补充,虽然具有更高的决策不确定性,但可以为任何后续的医疗程序需求做出决策。除了传统的主观方法,结合精神疾病的定量预测方法可以帮助更准确的临床诊断。然而,在神经影像学预测模型的成功临床转化之前,有几个关键因素需要考虑,包括基于神经影像学的发现的可靠性和学科水平的临床过渡。此外,精神病学神经影像学研究中存在的一些空白需要解。更具体地说,预测建模的一些直接临床应用可能包括:

     1、除了临床访谈外,形成基于生物标志物的诊断:目前的临床诊断主要基于临床访谈。除了现有的行为测量,预测建模结果可以提供更准确的基于大脑的内表型或生物标志物,并结合这两个测量可以提供更深入的了解生物通路,机制和疾病的进展。例如,基于大脑的ASDADHD的生物标记可以更客观地帮助疾病诊断。 

     2、多类别分类:在临床实践中,诊断具有大量重叠症状的严重精神障碍,如SZ、分裂情感性精神障碍、单极型和双极型抑郁症以及心境障碍,是非常具有挑战性的。通过获得对多个疾病类别的预测置信度的估计,预测模型可用于识别患者群体中的共病。最近的多类方法可以为每个被试的所有感兴趣的类别指定一个预测值,并能够根据预测的置信度来指示多个疾病的受试者共病情况。其他识别共病的方法包括多标签分类和multi-task learning,其中为每个样本分配多个类标签。

      3、患者筛选:在进行临床操作或专家意见之前,基于神经影像学的预测结果可作为患者筛选阶段。预先使用预测模型对患者进行筛选可能会减少与临床访谈相关的时间和费用。

       4、治疗反应/结果预测:除了辅助临床诊断的决策程序外,预测技术还可以用于预测治疗反应和治疗结果的预测。通过监测治疗结果和使用预测模型寻求潜在的治疗手段,临床诊断和治疗可以变得更加高效。

       5、药物试验设计:基于预测模型的结果,对未来的药物反应也可以分类。通过选择最有可能对特定药物产生反应的个体的子集,可以设计更有效的药物试验。例如,对情绪稳定剂(双相)或抗抑郁药(抑郁)的反应的药物分类可以使用机器学习方法进行分类。 

3.2连续测量与分类诊断

在本文中调查的大多数精神疾病预测研究都是基于为测试样本分配离散或分类标签。然而,分类诊断方法在预测某一疾病类别时忽略了连续测量,这可能导致误导的结果,或遗漏了对预测风险有用的亚临床趋势。对于更可靠的结果,使用连续测量(如模式回归)进行预测,可以成为一个有价值的工具。

此外,对于使用基于大脑特征进行精神疾病预测,基于回归的建模可以用来估计疾病的进展和治疗结果,并可以估计连续的测量指标(例如,神经精神或认知测量)。为了从神经影像学数据中估计持续的临床措施,Wang及其同事最近的一项研究提出了一个使用关联向量机(RVM)构建回归的框架,与支持向量回归类似。另一项研究探索了区域间皮质厚度相关性,以识别和表征自闭症诊断观察表评分。这项研究的结果表明,多个大脑网络之间的结构协方差测量与自闭症症状有关。

此外,Tognin及其同事基于脑灰质体积和皮质厚度测量,使用相关向量回归预测精神病高危人群的正、负综合征量表得分。最近,研究开始预测健康和疾病的连续评估措施(例如,研究领域标准[RDoC];T. Insel etal. 2010)。这些研究表明,除了进行分类诊断外,还可以通过使用连续的疾病预测措施来取得有希望的结果。

除此以外,作者还分别讨论了疾病患病的风险预测和治疗结果的预测,但是相关研究目前还较为缺乏。虽然这类研究在临床转化上具有非常重要的意义和转化价值,但目前还没有出现类似的模型显示出较好的预测能力。 

4.     基于大脑的预测组的当前研究趋势  

 4.1单变量和多变量方法

近年来,各种多变量神经影像学分析方法的方法学发展受到越来越多的关注,因为它们能够检验除体素和单变量技术之外的其他特征。对于单变量功能性神经成像方法,通常在每个体素的时间过程中独立拟合预期反应变量的模型,然后使用实验条件下的估计反应水平进行进一步的测试。虽然方便,但这种方法引入了大量的统计测试,因为它只针对与特定刺激相关的特定大脑位置(即大脑活动区域),从而产生反应的统计差异图。也因此,它限制了对大脑区域间刺激无关关系(如功能连接)的研究。此外,单变量方法不允许在多个大脑位置估计刺激效果。多变量神经成像方法考虑了大脑活动在多个空间位置同时发生的整个空间模式,能够探测到单变量方法无法捕捉到的大脑活动的细微但局部的测量。与传统的单变量、基于模型的方法缺乏直接处理体素/区域间相互作用的能力相比,多体素模式方法估计了跨脑区域激活的相关性或协方差。多变量结果也可以更可靠地转换为底层大脑网络的特征。最近的多元神经影像学方法提供了分析刺激和同时测量的许多位置的反应之间的关系,如空间反应模式或多体素反应模式。与单变量技术相比,多变量方法可能提供更强大的统计能力和更好的重现性。

在基于神经影像的诊断中,多变量机器学习方法同时整合可用的特征来联合区分不同的组。通常,对于多变量机器学习方法,分类器在一个训练数据集上进行训练,以预测不同的类别(例如,患者组),然后应用于测试数据集。通过LOOCV以提高模型准确性。到目前为止,已有多种多变量机器学习方法在基于神经图像的预测中得到了应用,SVMk近邻(k-nearest neighbor, KNN)、高斯朴素贝叶斯(Gaussian Naive Bayes, GNB)LDA等。在这些分类器中,基于svm的分类器获得了更好的分类性能。

其他最近和更有效的分类器包括:随机森林(Breiman, 2001),深度学习(7给出了一个深度学习用来分类的例子)与人工神经网络分类器。多变量机器学习方法用于精神疾病诊断的例子包括使用结构MRI数据对SZ进行分类,分类精度从81%93%