雖然在當(dāng)前,人們對精神分裂癥的神經(jīng)機(jī)制有了一定的了解,但是對其神經(jīng)生物學(xué)的異質(zhì)性仍舊了解甚少,這嚴(yán)重影響了當(dāng)前對精神分類癥神經(jīng)生物學(xué)的不同表征的分析研究。
本文的研究者使用新穎的半監(jiān)督機(jī)器學(xué)習(xí)方法研究了多機(jī)構(gòu)多種族隊列中的神經(jīng)解剖亞型,旨在發(fā)現(xiàn)與疾病相關(guān)的不同模式。在已建立的精神分裂癥(n = 307)和健康對照(n = 364)數(shù)據(jù)中,對PHENOM(通過多維度神經(jīng)影像學(xué)評估精神病異質(zhì)性研究隊列)在三個不同站點(diǎn)的結(jié)構(gòu)MRI和臨床數(shù)據(jù)進(jìn)行了分析。
灰質(zhì)(GM)、白質(zhì)(WM)和腦脊液(CSF)的區(qū)域體積測量用于確定精神分裂癥的獨(dú)特且可重現(xiàn)的神經(jīng)解剖亞型。本研究發(fā)現(xiàn)了兩種不同的神經(jīng)解剖亞型。亞型1表現(xiàn)出較低的灰質(zhì)體積,在丘腦,伏隔核,顳內(nèi)側(cè),前額葉/額葉內(nèi)側(cè)和島狀皮層中最為突出;亞型2顯示基底神經(jīng)節(jié)和內(nèi)囊的體積增加以及正常的腦容量。灰質(zhì)體積與亞型1(r = –0.201,P = 0.016)的疾病持續(xù)時間呈負(fù)相關(guān),而與亞型2(r = –0.045,P = 0.652)無關(guān),可能表明這兩種亞型存在不同的潛在神經(jīng)病理學(xué)過程。這兩種亞型在年齡(t = –1.603,df = 305,P = 0.109),性別(卡方= 0.013,df = 1,P = 0.910),病程(t = –0.167,df = 277,P=0.868),抗精神病藥物劑量(t = –0.439,df = 210,P = 0.521),發(fā)病年齡(t = –1.355,df = 277,P = 0.177),陽性癥狀(t = 0.249,df = 289,P = 0.803),陰性癥狀(t = 0.151,df = 289,P = 0.879)或抗精神病藥類型(卡方= 6.670,df = 3,P = 0.083)等方面沒有顯著差異。
亞型1的教育程度低于亞型2(卡方= 6.389,d.f. = 2,P = 0.041)。總之,本文發(fā)現(xiàn)了兩種截然不同且具有高度可重復(fù)性的神經(jīng)解剖亞型。亞型1表現(xiàn)出與病程相關(guān)的廣泛的腦容量減少和較差的發(fā)病前功能。亞型2解剖結(jié)構(gòu)正常、穩(wěn)定,但基底節(jié)及內(nèi)囊較大,不能用抗精神病藥劑量來解釋。這些亞型挑戰(zhàn)了腦容量減少是精神分裂癥的一個普遍特征的觀點(diǎn),并提出了不同的病因解釋方案。
注釋:全文12100左右字?jǐn)?shù),推薦閱讀時間35分鐘,如僅對方法感興趣,可直接翻閱到“數(shù)據(jù)和方法”進(jìn)行閱讀
背景介紹
精神分裂癥在臨床表現(xiàn),病程,治療反應(yīng)和生物標(biāo)志等方面具有不同的表現(xiàn)現(xiàn)象。長期以來,人們已經(jīng)認(rèn)識到,這種異質(zhì)性影響了臨床治療診斷的準(zhǔn)確性,并掩蓋了研究結(jié)果。盡管如此,嘗試通過癥狀亞型來剖析這種異質(zhì)性的研究對研究和實踐影響不大。實際上,診斷系統(tǒng)已從分類方案(例如DSM-V)中刪除了大多數(shù)基于癥狀的精神分裂癥亞型。
先前的神經(jīng)影像學(xué)研究主要使用二元病例對照設(shè)計來研究精神分裂癥的神經(jīng)解剖異常。這些分析主要顯示出廣泛且細(xì)微的腦容量的降低。除分布缺陷外,據(jù)報道,包括在ENIGMA和COCORO以及作者團(tuán)隊自己的大樣本中發(fā)現(xiàn)基底節(jié)的體積也增加了。目前尚不清楚這兩種改變是否都存在于同一個體中,或者這些變化是否代表不同的潛在亞型。基于癥狀定義精神分裂癥亞型的研究表明,與其他亞型相比,具有更多負(fù)面癥狀的個體表現(xiàn)出更廣泛的皮層容量減少,但大腦信號相互重疊,無法弄清楚是否如同在大型數(shù)據(jù)集中發(fā)現(xiàn)的腦容量增加或減少。
基于神經(jīng)解剖學(xué)數(shù)據(jù)客觀地定義生物學(xué)亞型對于進(jìn)一步的研究很重要。先前的“生物型”研究已經(jīng)檢查了其他表型,包括結(jié)合基因,功能性MRI或電生理學(xué)和認(rèn)知學(xué)等數(shù)據(jù)的研究。 只有兩項先前的研究試圖直接解析精神分裂癥的神經(jīng)解剖學(xué)異質(zhì)性。但是,這些研究受到樣本多樣性不足和樣本量小的限制,這阻礙了亞型的嚴(yán)格可重復(fù)性分析,例如拆分后的樣本的可重復(fù)性,留一交叉驗證,與性別相關(guān)的評估以及保留45歲以內(nèi)的樣本以最小化衰老造成的影響。盡管其中一項研究受益于外部驗證集,但該研究中使用的方法并非專門設(shè)計用于根據(jù)患者亞型與健康對照的差異來識別患者亞型以更好地捕獲疾病效果。綜上所述,這些因素可能會導(dǎo)致所發(fā)現(xiàn)的亞型存在較低的可重復(fù)性以及亞型的重疊分布等問題,這些結(jié)果會影響對這些疾病亞型進(jìn)行合理解釋。
為了更好的描述精神分裂癥疾病亞型,需要更多的樣本數(shù)據(jù)以及更多樣化的數(shù)據(jù),并且還需要適用于不同數(shù)據(jù)中心和族群的高級的數(shù)據(jù)分析方法。為了應(yīng)對這一挑戰(zhàn),研究者們建立了一個橫跨三大洲的聯(lián)盟,稱為PHENOM(“通過多維度神經(jīng)成像評估精神疾病的異質(zhì)性”)。然后,他們應(yīng)用了最近開發(fā)的稱為HYDRA(通過判別分析進(jìn)行異質(zhì)性分離)的半監(jiān)督機(jī)器學(xué)習(xí)算法(注:半監(jiān)督學(xué)習(xí)是一種同時結(jié)合監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)的模型學(xué)習(xí)方法。半監(jiān)督學(xué)習(xí)同時使用大量無標(biāo)簽的數(shù)據(jù)和一部分有監(jiān)督的數(shù)據(jù)。在本文中,HYDRA算法通過對健康被試和患者被試做分類進(jìn)行監(jiān)督學(xué)習(xí),然后在患者被試中尋找疾病亞型進(jìn)行無監(jiān)督學(xué)習(xí)。)來識別神經(jīng)解剖亞型。
HYDRA與以前的聚類方法有根本上的不同,因為HYDRA專門通過建模與健康對照之間的差異來對疾病影響進(jìn)行聚類,而不是直接對患者聚類。通過約束年齡、性別、掃描儀、種族和其他可能會引起疾病異質(zhì)性的因素,此方法有助于識別真正的疾病亞型。之所以如此,是因為對照組中已經(jīng)存在所有這些混雜的變異,而僅歸因于病理過程的患者和對照之間的差異才得以聚集。他們假設(shè)這種方法將客觀地揭示以前在典型的病例對照設(shè)計中被掩蓋的獨(dú)特的神經(jīng)解剖亞型,并且不能用病程或抗精神病劑量來解釋。
數(shù)據(jù)和方法
研究樣本和圖像采集參數(shù)
這項研究收集了來自三個地點(diǎn)的PHENOM子樣本。研究人員有意從各種成像協(xié)議中選擇了樣本,包括來自德國的1.5 T數(shù)據(jù)。為確保疾病亞型不受位點(diǎn)/方案的偏倚,他們通過利用“留一(數(shù)據(jù)中心)交叉驗證”(這個方法是指每一次留出一個數(shù)據(jù)站點(diǎn)的所有數(shù)據(jù)用于測試,剩下的站點(diǎn)數(shù)據(jù)用于訓(xùn)練,重復(fù)多次,直到所有數(shù)據(jù)都參與了測試),進(jìn)一步驗證了亞型分類的可重復(fù)性。圖像由各自的研究人員共享,并在賓夕法尼亞大學(xué)的生物醫(yī)學(xué)圖像計算和分析中心進(jìn)行了分析。從941名精神分裂癥患者和對照組的國際隊列中選取被試,只分析45歲以下的被試,以減少衰老造成的影響。表1列出了最終選出來的樣本(307位精神分裂癥患者和364位健康對照者)的人口統(tǒng)計學(xué)數(shù)據(jù),反映了聯(lián)合隊列研究和MRI掃描協(xié)議的多樣性。來自三個站點(diǎn)的數(shù)據(jù)詳情如下:
站點(diǎn)1(美國):
這項研究得到了賓夕法尼亞大學(xué)機(jī)構(gòu)審查委員會的批準(zhǔn)。獲得了每個被試的書面知情同意。由訓(xùn)練有素的臨床研究人員進(jìn)行招募和評估。診斷評估采用了DSM-IV (Structured Clinical Interview for DSM-IV,SCID)的結(jié)構(gòu)化臨床訪談。如果被試在過去6個月內(nèi)有藥物濫用或依賴(尼古丁除外)史,或在研究當(dāng)天尿檢呈陽性,則不納入研究。如果健康對照被試符合任何DSM-IV精神障礙的標(biāo)準(zhǔn),則將其排除。采用陽性癥狀評定量表(Scale for the Assessment of Positive Symptoms,SAPS) (Andreasen, 1984)和陰性癥狀評定量表(Scale for the Assessment of Negative Symptoms,SANS) (Andreasen, 1983)對患者樣本進(jìn)行評估。
站點(diǎn)2(德國):
被試來自德國慕尼黑路德維希-馬克西米利安大學(xué)精神病學(xué)和心理治療系。該研究方案得到了路德維希-馬克西米利安大學(xué)倫理委員會的批準(zhǔn)。被試在MRI和臨床檢查前提供書面知情同意書。由訓(xùn)練有素的臨床研究人員對被試進(jìn)行招募和評估。如果被試有其他精神疾病和/或神經(jīng)系統(tǒng)疾病、過去或現(xiàn)在經(jīng)常酗酒、和/或服用非法藥物、過去頭部外傷失去意識或電休克治療、不懂德語、智商< 70、年齡< 18或> 65歲的情況,則被排除到數(shù)據(jù)隊列之外。通過使用正面和負(fù)面癥狀量表(Positive and Negative Syndrome Scale,PANSS)對患者進(jìn)行評估。
站點(diǎn)3(中國):
本研究經(jīng)天津醫(yī)科大學(xué)總醫(yī)院倫理委員會批準(zhǔn)。在研究登記之前,每個被試都要得到書面的知情同意。由兩位臨床精神病專家通過使用DSM-IV (SCID)來確定被試是否患有精神分裂癥。入選標(biāo)準(zhǔn)為年齡處于16-60歲之間且是右利手。受試者排除標(biāo)準(zhǔn)為:MRI禁閉癥、妊娠、全身疾病史、中樞神經(jīng)系統(tǒng)疾病和頭部外傷史、近3個月或終身藥物濫用或依賴史。對于健康對照,額外的排除標(biāo)準(zhǔn)是有一級親屬有過精神病史或有精神障礙。通過使用PANSS對精神分裂癥患者進(jìn)行評分。
圖像采集參數(shù)
站點(diǎn)1(美國)中,通過使用3T TIM TRIO掃描儀(德國西門子)采集T1加權(quán)的梯度回波序列獲取影像,TR=1810ms,TE=3.51ms,TI=1100ms,flip angle=9 degree, FOV=240mm x 180mm,matrix=256 x 192, slice=160,slice/skip thickness=1mm/0mm。
站點(diǎn)2(德國)中,通過1.5 T Magnetom Vision掃描儀采集T1加權(quán) MPRAGE像,TR=11.6ms,TE=4.9ms,FOV=230mm,matrix=512 x 512,126個連續(xù)的軸向切片,每個切片厚度為1.5mm,體素大小=0.45 x 0.45 x 1.5mm。
站點(diǎn)3(中國)中,通過3T MR系統(tǒng)(Discovery MR750, General
Electric, Milwaukee, WI, USA)采集圖像數(shù)據(jù)。TR=8.2ms,TE=3.2ms,TI=450ms,flip angle=12 degree,FOV=256mm x 256mm,Matrix=256 x 256,層間厚度為1mm,188個矢狀面切片。
表1 數(shù)據(jù)樣本的人口學(xué)數(shù)據(jù)
圖像預(yù)處理
采用了一套廣泛使用的質(zhì)量控制程序,其中包括人工驗證和自動標(biāo)記。首先人工檢查原始T1圖像是否存在運(yùn)動偽影、圖像偽影或者受限的FOV。矯正因受不均勻影響而發(fā)生扭曲的圖像,并采用multi-atlas、multi-warp分割方法(MUSE)將每個被試的圖像分割成感興趣的解剖區(qū)域(ROIs),其中包括灰質(zhì)(GM)、白質(zhì)(WM)和腦脊液(CSF)。通過使用非線性配準(zhǔn)的配準(zhǔn)方法將剝?nèi)ワB骨的t1圖像配準(zhǔn)到位于MNI標(biāo)準(zhǔn)空間的模板中,生成了基于GM、WM和CSF組織的體素水平區(qū)域腦圖譜(regional volumetric map)。同時研究人員還會人工評估經(jīng)過上述處理后的圖像,如果大腦組織提取的不好、腦組織分割的不太好或者存在配準(zhǔn)錯誤(在圖像預(yù)處理的過程中,經(jīng)常會發(fā)生配準(zhǔn)、分割錯誤。配準(zhǔn)錯誤可能是指某些關(guān)鍵腦區(qū)過度配準(zhǔn),發(fā)生較為嚴(yán)重的、不自然的扭曲。),就去除掉這些圖像。
站點(diǎn)間圖像歸一化和協(xié)變量校正
通過使用線性模型在健康被試的子樣本中估計ROI區(qū)域中特定于站點(diǎn)的站點(diǎn)效應(yīng),這些樣本中每個站點(diǎn)都具有相同的男女比[平均年齡(標(biāo)準(zhǔn)差):賓夕法尼亞大學(xué) 29.97(7.13),慕尼黑 29.39(6.17),天津 29.04(7.54),P>0.46],然后從所有數(shù)據(jù)(包括疾病數(shù)據(jù))中移除站點(diǎn)效應(yīng)。在對站點(diǎn)效應(yīng)進(jìn)行校準(zhǔn)之后,對ROI進(jìn)行年齡和性別的歸一化;因此,此處報告的所有聚類結(jié)果均與數(shù)據(jù)采集地點(diǎn),年齡以及性別無關(guān)。
使用HYDRA對精神分裂癥進(jìn)行亞型分類
研究者將HYDRA用于ROI上測量來識別亞型。HYDRA通過比較患者和對照組來確定患者的亞型。與完全監(jiān)督學(xué)習(xí)方法如支持向量機(jī)和隨機(jī)森林不能區(qū)分患者的亞型不同,HYDRA能夠同時進(jìn)行分類和聚類。HYDRA使用支持向量機(jī)對健康對照和患者進(jìn)行分類,分類器構(gòu)建的超平面兩側(cè)則分別是健康對照和患者。HYDRA通過聚類算法將由分類器構(gòu)建的多面體的不同平面(超平面)與患者聯(lián)系起來,并對患者進(jìn)行亞型分類。與無監(jiān)督聚類算法(如k-means)相比,HYDRA可以有效地根據(jù)患者與對照組的差異對患者進(jìn)行聚類;而k-means則根據(jù)患者間的相似性對患者進(jìn)行聚類,這種方法容易混淆個體間的差異(如年齡或性別)。HYDRA通過改變超平面的數(shù)目來評估更多的子類型,具有一定的靈活性。
在HYDRA算法中,通過線性邊界最大化分類器(其實就是SVM)構(gòu)建一個凸多邊形對健康對照以及患者進(jìn)行區(qū)分。亞型分類是通過將患者與稱為超平面的多面體的不同面聯(lián)系起來進(jìn)行聚類來實現(xiàn)的。HYDRA由以下幾個主要步驟組成:
多次初始化并迭代求解凸多邊形的解,最后求解多個聚類結(jié)果中的一致性解。具體來說,HYDRA通過對K個單位長度的超平面進(jìn)行采樣進(jìn)行初始化,以完成對患者的分組,這樣得到的超平面考慮了患者與健康對照之間所有成對差異的空間。采用確定點(diǎn)過程(determinantal point processes, DPP)的方法選擇K個唯一的超平面,DPP是一種采樣技術(shù),對疾病的不同方向進(jìn)行采樣。然后用采樣得到的超平面估計初始的聚類分配(S-)。然而由此估計的出來的結(jié)果可能會因初始化的不同而有所不同,因此DPP提出了一個多次初始化的策略。最終的聚類結(jié)果是基于多次聚類出來的結(jié)果的一致性解得到的。HYDRA算法具體如下:
輸入:X∈R^{n x d}, Y∈{-1,+1}^n, (有n個被試的訓(xùn)練數(shù)據(jù),每個被試的數(shù)據(jù)有d維圖像特征),K(亞型或者超平面的數(shù)量)
輸出:W∈R^{d x K}, b∈R^{1 x K} (W和b是分類器參數(shù));S-(聚類結(jié)果)
初始化:初始化S-
循環(huán):直到算法收斂或者到達(dá)一定的迭代次數(shù)(循環(huán)終止條件)
固定S- 的值,求解W和b
固定W和b的值,求解S-
HYDRA算法的基本思路假設(shè)圖中灰色方塊為健康對照,紅色菱形為患病被試。
圖(a)中,線性SVM將健康被試和患者在高維空間中使用一線性超平面(實線)分開,然而這個分類器的劃分邊界(點(diǎn)狀線)很窄。眾所周知,SVM分類器中會構(gòu)建兩條線穿過支持向量點(diǎn),而SVM的優(yōu)化目標(biāo)則是使這兩條線的距離最大。如果這兩條線之間的距離比較窄的話,那么分類器的泛化性能則會比較弱。當(dāng)然也可以使用核方法在高維空間中構(gòu)建非線性超平面劃分結(jié)果,但是這樣構(gòu)造的非線性函數(shù)可解釋性比較弱。更重要的一點(diǎn)是,僅僅使用由監(jiān)督學(xué)習(xí)構(gòu)建出來的超平面無法發(fā)現(xiàn)患者數(shù)據(jù)中所隱含的數(shù)據(jù)堆(比如圖a中,患者被試有兩個cluster,但是監(jiān)督學(xué)習(xí)方法無法發(fā)現(xiàn)這樣的數(shù)據(jù)堆);
為了解決上面的問題,圖(b)中,HYDRA使用多個線性分類器對數(shù)據(jù)進(jìn)行劃分,多個分類器構(gòu)建的多個超平面則能夠組成一個凸多邊形(綠色加粗線段)。凸多邊形的不同面捕獲了不同的亞型;
圖(c),使用3個分類器構(gòu)建的凸多邊形捕獲了3種亞型。(Varol E, Sotiras A, Davatzikos C. Alzheimer’s Disease Neuroimaging I. HYDRA: revealing heterogeneity of imaging and genetic patterns through a multiple max-margin discriminative analysis framework. NeuroImage 2017; 145: 346–64.)
HYDRA分析使用以下參數(shù):
循環(huán)迭代估計超平面參數(shù)和聚類結(jié)果50次,20次估計聚類結(jié)果的一致性解,正則化參數(shù)為0.25,10折交叉驗證。根據(jù)得到的解的穩(wěn)定性來評估HYDRA的聚類性能。使用adjusted Rand指數(shù)(ARI,Hubert and Arabie, 1985)評估在十折交叉驗證中,多次聚類結(jié)果的相似性。因此,ARI計算了被試被劃分在同一個聚類堆中的一致性,盡管在不同的交叉驗證中同一個被試可能會被劃分在不同的聚類堆中。ARI的計算修正了被試的隨機(jī)分組,對多個聚類結(jié)果的重合性估計提供了更加保守的估計。在這里,ARI等于1表示在多次交叉驗證中,被試一直被劃分在相同的聚類堆中。
精神分裂癥亞型的可重復(fù)性分析利
用(i)Permutation test(排列測試):對亞型的可重復(fù)性進(jìn)行了廣泛的分析,以檢驗統(tǒng)計學(xué)意義;(ii)Split-sample reproducibility: 多次拿出不同樣本,以評估每一半的子類型是否表現(xiàn)出相似的情況;(iii)“留一(數(shù)據(jù)采集站點(diǎn))交叉驗證(Leave-one-site-out validation)”,以檢查使用此方法發(fā)現(xiàn)的子類型是否與將所有站點(diǎn)放在一起得到的解決方案一致。
Permutation tests for the subtypes
為了驗證疾病亞型分布的穩(wěn)定性,在健康(HC)樣本中做了亞型分析,在這些樣本中,與疾病相關(guān)的變異并不存在。為此,將HC樣本(n = 364)隨機(jī)分為HC組(~20%)和偽患者組(~80%),并進(jìn)行HYDRA分析。這些樣本隨機(jī)重排了50次,并且每一次都運(yùn)行一次HYDRA算法。為了將這些結(jié)果與實際患者組的聚類結(jié)果進(jìn)行比較,研究人員使用了大小一樣的HC和患者組(分別為~20%和~80%,364個人)。這樣做是為了使零分布和實際實驗使用完全相同的樣本量。最后,將實際實驗中得到的ARI與隨機(jī)重排實驗中得到的ARI的零分布進(jìn)行比較,以確定其統(tǒng)計學(xué)意義。
Split-sample reproducibility
為了研究精神分裂癥亞型的可重復(fù)性,研究人員進(jìn)行了split-sample分析。數(shù)據(jù)樣本被分成兩半,然后分別在Split 1和Split 2中使用HYDRA算法。然后在兩個Split中進(jìn)一步比較體素水平的volumetric profiles(連接模式)。
Leave-one-site-out validation(LOSO)
通過使用LOSO進(jìn)一步交叉驗證得到的聚類結(jié)果。該方法首先在兩個站點(diǎn)的數(shù)據(jù)中對HYDRA模型進(jìn)行訓(xùn)練,然后使用訓(xùn)練后的模型在剩下的一個站點(diǎn)中的數(shù)據(jù)進(jìn)行測試,識別出亞型(subtype)標(biāo)簽(subtype 1或subtype 2)。
對所有三種可能的站點(diǎn)組合重復(fù)此過程,如圖1所示。由LOSO策略預(yù)測出來的兩個亞型與使用所有站點(diǎn)上的數(shù)據(jù)預(yù)測出來的亞型進(jìn)行了比較。
圖1 LOSO預(yù)測示意圖:每個站點(diǎn)的兩個亞型(SCZ1和SCZ2)是使用在其他兩個站點(diǎn)上訓(xùn)練的HYDRA模型確定的。同一亞型的患者重疊率為86.72% (站點(diǎn)1為83.33%,站點(diǎn)2為86.21%,站點(diǎn)3為90.63%),與使用所有站點(diǎn)的數(shù)據(jù)訓(xùn)練得到的結(jié)果相比較。
體素水平的分析
研究人員使用區(qū)域線性多元判別統(tǒng)計映射(regionally linear multivariate discriminative statistical mapping, MIDAS)進(jìn)行體素水平的分析,以研究不同亞型之間的神經(jīng)解剖學(xué)差異。MIDAS利用區(qū)域判別分析的能力,與其他信息映射方法(如Searchlight)相比,在檢測組間差異方面具有較高的敏感性和特異性。
MIDAS是最近發(fā)表并驗證的一種基于體素的組水平的比較方法。它克服了由于在應(yīng)用廣義線性模型之前通過任意和固定的高斯濾波器對圖像進(jìn)行臨時過濾而導(dǎo)致的基于體素的常規(guī)分析的局限性。MIDAS有效地確定了能夠最佳捕獲組差異的任何圖像數(shù)據(jù)的區(qū)域變化的、各向異性的濾波。使用MIDAS比較組間的regional volumetric map可以獲得更好的統(tǒng)計效力。
MIDAS使用一組足夠大的重疊鄰域(P)解析任意一組圖像map(本文中為volumetric map),并基于最小二乘支持向量機(jī)(LS-SVM)進(jìn)行區(qū)域判別分析。LS-SVM通過權(quán)重向量w將圖像特征X∈R^{n x v}(n個被試以及v維的圖像特征)與組變量Y∈R^n關(guān)聯(lián)起來。對組間進(jìn)行最優(yōu)判別的區(qū)域模式等價于對一個最優(yōu)核進(jìn)行局部濾波,該核的系數(shù)為判別器的權(quán)值。然后,通過調(diào)整每個體素對估計的局部激活模式(a)的總體貢獻(xiàn),并使用各自機(jī)器學(xué)習(xí)器的總體預(yù)測能力,計算特定體素的統(tǒng)計量:
其中,a正比于(X-X_mean)^T(X-X_mean)w/n,其中i表示voxel的編號。這種體素水平的統(tǒng)計量表明了該體素在包含該體素的所有部分重疊區(qū)域過濾器中的參與程度。最后,通過近似排列試驗(approximating permutation tests)得到體素統(tǒng)計量對應(yīng)的p值。
在MIDAS中,使用尺寸為182 x 218 x 182的GM、WM或CSF的體素區(qū)域容積圖(voxel-wise regional volumetric maps)來評估組間的體素神經(jīng)解剖學(xué)差異。MIDAS分析使用了以下參數(shù):體素的15個鄰域半徑、500個鄰域,正則化參數(shù)為0.1。
精神分裂癥亞型的臨床檢查
在每個亞型中,總的灰質(zhì)體積與疾病持續(xù)時間之間的關(guān)系通過使用Pearson相關(guān)分析進(jìn)行評估。使用雙樣本t檢驗來評估不同亞型之間的差異,包括年齡、患病時間、每日氯丙嗪當(dāng)量劑量(mg) (CPZ mg eq/day)、發(fā)病年齡、陽性癥狀和陰性癥狀(詳見補(bǔ)充資料)。性別、受教育程度(順序量表)和抗精神病藥物類型(第一代與第二代)用卡方檢驗進(jìn)行比較。
結(jié)果
HYDRA揭示了兩種高度可重復(fù)的疾病亞型
在標(biāo)準(zhǔn)病例對照比較中,患者人群大腦容量既呈現(xiàn)減少的趨勢又呈現(xiàn)增加的趨勢(圖2),但尚不清楚這些影響是由整個患病人群還是由部分患者亞群造成的。HYDRA有效地解決了這個問題,如下所述。研究人員將HYDRA應(yīng)用于感興趣區(qū)域的結(jié)構(gòu)像數(shù)據(jù)上(見補(bǔ)充材料表1),以識別亞型。他們使用adjusted Rand指數(shù)(ARI)來評估在不同數(shù)量的聚類堆(2到8個聚類堆)下聚類堆聚類的一致性(也就是聚類結(jié)果的穩(wěn)定性,如果多次運(yùn)行HYDRA算法得出的亞型聚類堆具有較高的相似性,則說明所發(fā)現(xiàn)的亞型具有高度的可重復(fù)性,反映了聚類出來的亞型的有效性),該指數(shù)對聚類堆的數(shù)量(K)相對不敏感。
當(dāng)聚類數(shù)量K=1的時候,ARI指標(biāo)并沒有意義,因為所有的患者被聚類到一個聚類堆中。然而,如果把樣本理解為呈現(xiàn)均勻分布的話(即最優(yōu)K=1),那么可以在別的K值中找到較低的ARI值。當(dāng)K=2時,可以找到最大的ARI數(shù)值指標(biāo),ARI=0.616(見圖3)。K位于2到8之間時,ARI指標(biāo)在0.4左右,低于K=2的時候。當(dāng)K值變化時,精神分裂癥患者在不同K值以及不同數(shù)據(jù)站點(diǎn)的分布情況如補(bǔ)充材料表2所示。在K = 2時,每個數(shù)據(jù)站點(diǎn)有更多的患者被分配到亞型1。為了確定疾病亞型聚類的統(tǒng)計顯著性,研究人員將每個聚類堆的ARI指標(biāo)與使用排列測試生成的零分布進(jìn)行了比較。K= 2時的ARI值高于零分布(P_fdr < 0.001)(圖4),但K=3時的ARI值不高于零分布。K=4 ~ 8時的ARIs也高于零分布;然而,當(dāng)聚類數(shù)量為3或者更大時,聚類出來的疾病亞型之間將呈現(xiàn)更多的性別、年齡或數(shù)據(jù)站點(diǎn)差異(見補(bǔ)充材料表2-9)。
在split-sample實驗中,K=2時依然具有最高的可重復(fù)性(圖5)。當(dāng)K=2時,在Split 1與Split 2中也存在具有可重復(fù)性的體素模式(voxel-wise volumetric patterns,本文中,這里指的是體素水平上的體積差異模式),但是當(dāng)K>2時則沒有(圖6和圖7)。
此外,還是用“留一(數(shù)據(jù)站點(diǎn))交叉驗證”方法對疾病亞型進(jìn)行可重復(fù)性的分析(圖1)。使用“留一(數(shù)據(jù)站點(diǎn))交叉驗證”方法從所有三個站點(diǎn)獲得的亞型1和亞型2與同時使用所有站點(diǎn)數(shù)據(jù)計算得到的兩個亞型進(jìn)行了比較(見補(bǔ)充材料表2: K=2)。在HYDRA的多次迭代聚類的過程中,被聚類到相同類別的患者比例為86.72%,站點(diǎn)1的患者中,這個比例為83.33%,站點(diǎn)2為86.21%,站點(diǎn)3為90.63%。這兩種亞型在不同站點(diǎn)的數(shù)據(jù)中具有較高的可重復(fù)性(圖8)。鑒于這結(jié)果,隨后的分析將集中在這兩個具有較高可重復(fù)性的疾病亞型。
圖2 健康對照組(HC) (n = 364)和精神分裂癥(SCZ) (n = 307)的關(guān)鍵區(qū)域的體積差異。注意,在這個標(biāo)準(zhǔn)病例對照比較中,區(qū)域體積既呈現(xiàn)減少的趨勢又呈現(xiàn)增加的趨勢。
圖3 精神分裂癥亞型的交叉驗證穩(wěn)定性:K=2時,具有最高的亞型聚類穩(wěn)定性。
圖4 通過與隨機(jī)排列得到的零分布比較,得到在不同數(shù)量亞型(K)下的ARI的統(tǒng)計顯著性。n.s代表沒有顯著性。
圖5 split-sample測試中的交叉驗證穩(wěn)定性:ARI指標(biāo)與聚類數(shù)量K的關(guān)系,當(dāng)K=2時,在Split 1和Split 2中均呈現(xiàn)最高的可重復(fù)性。
圖6 K = 2時,在兩個Split中,每個亞型(HC-SCZ1與HC-SCZ2)與HC之間的GM體積差異。GM的體積差異模式與使用所有數(shù)據(jù)得到的體積差異模式均相似,FDR-p<0.05。在MIDAS分析中,Effect Size圖是由一組區(qū)域所掩蓋的區(qū)域體積圖(regional volumetric maps)生成的,這些區(qū)域在統(tǒng)計上有顯著差異,之后的所有Effect Size圖都是這樣生成的。
圖7 K=3時,在兩個Split中,每個亞型與HC之間的GM體積差異模式。Split 1與Split 2中不存在具有可重復(fù)性的模式,FDR-p<0.05。
圖8 每個站點(diǎn)中,疾病亞型與健康對照(HC)之間的GM體積差異:與HC相比,SCZ1在丘腦、伏隔核、內(nèi)側(cè)顳葉、內(nèi)側(cè)前額葉/額葉和島葉皮質(zhì)中體積明顯增大,而SCZ2在基底神經(jīng)節(jié)中體積增大,FDR-p<0.05
不同亞型表現(xiàn)出不同的神經(jīng)解剖學(xué)缺陷
亞型之間在體素水平上存在顯著的神經(jīng)解剖學(xué)缺陷差異(圖9)。與健康對照組(圖9A)和亞型2(圖10)相比,亞型1表現(xiàn)出廣泛分布的灰質(zhì)缺陷。與健康對照組相比,亞型1在丘腦、伏隔核、內(nèi)側(cè)顳葉、內(nèi)側(cè)前額葉和島葉皮質(zhì)具有最為突出的異常。此外,亞型1表現(xiàn)出廣泛減少的白質(zhì)體積(圖9C)。相比之下,亞型2的腦解剖結(jié)構(gòu)正常,但基底神經(jīng)節(jié)(蒼白球、殼核和尾狀核部分)的灰質(zhì)體積較大(圖9B)。與健康對照組相比,亞型2的深部結(jié)構(gòu),特別是內(nèi)囊的白質(zhì)體積也相對較大(圖9D)。與健康對照組相比,這兩種亞型腦脊液體積均輕度升高,主要發(fā)生在第三腦室和額葉半球間裂中(圖11)。
圖9 灰質(zhì)和白質(zhì)的體積模式確定了這兩種亞型。相比于健康對照組(HC),
(A)精神分裂癥亞型1 (SCZ1)表現(xiàn)出較少的灰質(zhì)體積的普遍模式,特別是在丘腦、伏隔核、內(nèi)側(cè)顳葉、內(nèi)側(cè)前額葉/額葉和島葉皮質(zhì)
(B)精神分裂癥亞型2 (SCZ2)在基底神經(jīng)節(jié)(蒼白球、殼和尾狀部分)中表現(xiàn)出較大的灰質(zhì)體積
(C)精神分裂癥亞型1表現(xiàn)出較小的白質(zhì)體積
(D)精神分裂癥亞型2表現(xiàn)出較大的白質(zhì)體積。
圖10 兩個疾病亞型之間的GM體積模式比較,FDR-p<0.05。
圖11 每個亞型與健康對照之間的CSF體積差異模式比較,FDR-p<0.05
亞型模式在留一交叉驗證中表現(xiàn)出魯棒的可重復(fù)性
相比使用所有站點(diǎn)的數(shù)據(jù)(圖9)一起計算得到的結(jié)果,使用“留一(數(shù)據(jù)站點(diǎn))交叉驗證”的方法得到的亞型表現(xiàn)出最佳的可重復(fù)性(圖12)。與上述結(jié)果一致,亞型1存在廣泛分布的異常,最明顯的是在丘腦、伏隔核、內(nèi)側(cè)顳葉、內(nèi)側(cè)前額葉和島葉皮質(zhì)(圖12A)的灰質(zhì)減少,而亞型2在基底神經(jīng)節(jié)體積較大(圖12B)。與亞型2相比,亞型1也表現(xiàn)出灰質(zhì)缺陷的分布模式(圖13),這與上述結(jié)果(圖10)一致。
圖12 可重復(fù)性分析。使用“留一(數(shù)據(jù)站點(diǎn))交叉驗證”方法分析兩種亞型的灰質(zhì)體積模式:與健康對照(HC)相比,(A)精神分裂癥亞型1(SCZ1)在丘腦、伏隔核、顳內(nèi)側(cè)、額前/額內(nèi)側(cè)和島狀皮層表現(xiàn)出較小的體積(B)亞型2(SCZ2)在基底神經(jīng)節(jié)中顯示較大的體積。
圖13 使用“留一(數(shù)據(jù)站點(diǎn))交叉驗證”法估計的兩種亞型間的GM體積模式,FDR-p<0.05。這些結(jié)果與使用所有數(shù)據(jù)計算得到的結(jié)果是一致的(圖10)。
敏感性分析提供了模型可收斂的結(jié)果
接下來,研究人員進(jìn)行了敏感性分析,以確保上述結(jié)果不受樣本量、性別差異、藥物、疾病長期性或組織對比度的影響。首先,確保這些發(fā)現(xiàn)不受樣本數(shù)量大小差異的影響(亞型1:n = 192;亞型2:n = 115),他們在亞型1的一個子集(n = 115)中做了重復(fù)分析,發(fā)現(xiàn)了一致的模式(圖14);第二,亞型1具有廣泛分布的異常灰質(zhì)體積的減少,亞型2在男性和女性中都具有較大的基底神經(jīng)節(jié)(圖15);第三,評估藥物治療的潛在貢獻(xiàn),研究者調(diào)整了抗精神病藥劑量(氯丙嗪當(dāng)量,CPZ)。與圖9的結(jié)果一致,在控制了氯丙嗪(圖16和17)后,亞型仍然存在,盡管在這個有藥物信息的子樣本中樣本量和相應(yīng)的統(tǒng)計能力顯著降低。
第四,他們進(jìn)一步將分析限于病程小于2年的精神分裂癥樣本(占總精神分裂癥樣本的1/3,平均病程0.54年),以減輕疾病慢性病的影響(圖18-20)。雖然觀察到完整的精神分裂癥樣本(圖9)與病程小于2年的精神分裂癥樣本(圖18)有相似之處,但在腦灰質(zhì)缺損的空間分布上,如在島葉皮層上,存在一些明顯的差異。最后,研究人員檢驗了灰質(zhì)和白質(zhì)體積的總和(即大腦的總體積),以確保結(jié)果不受因為圖像對比度變化所導(dǎo)致的灰白質(zhì)分割效果(一般來說,現(xiàn)有的分割算法是基于腦脊液、灰白質(zhì)之間的對比度和解剖先驗進(jìn)行分割的,如果圖像的灰白質(zhì)對比度發(fā)生變化,圖像的灰白質(zhì)分割效果可能會受到對比度的影響)的影響。這個分析產(chǎn)生了與主分析一致的疾病亞型模式(圖21)。
圖14 分別將(A)使用所有數(shù)據(jù)樣本計算得到的亞型1和(B)使用與亞型2一樣數(shù)量的自樣本計算的到的亞型1與健康被試比較得到GM體積差異圖,FDR-p<0.05。本實驗表明,在SCZ1中觀察到的較小的GM體積的發(fā)現(xiàn)并不受SCZ1較大的樣本量影響。
圖15 男性(左欄)和女性(右欄)分別是各亞型相對于HC的GM體積模式,FDR-p < 0.05。這些模式與同時使用兩個性別的數(shù)據(jù)得到的模式是一致的,這表明,亞型的估計并不是由兩個亞型的性別差異驅(qū)動的。
圖16 當(dāng)cpz當(dāng)量劑量數(shù)據(jù)調(diào)整之后,與HC相比,K=2的亞型的GM體積模式發(fā)生了改變 [n = 125 SCZ1,n = 87 SCZ2]。這些模式與從整個樣本中得到的模式是一致的,盡管較弱,主要是由于樣本量較小,FDR-p < 0.05。
圖17 經(jīng)cpz當(dāng)量劑量調(diào)整后,兩種亞型間GM體積差異的比較(FDR-p < 0.05)。這些結(jié)果與未進(jìn)行CPZ調(diào)整的結(jié)果一致(圖10和圖13)。
圖18 在病程小于2年的患者中(平均病程為0.54年),由此計算得到的兩個亞型與健康被試之間的GM體積差異,FDR-p<0.05。這些模式與來自較大群體的研究結(jié)果一致,只是由于樣本量較小,結(jié)果略弱一些。
圖19 在病程小于2年的患者中,由此計算得到的兩個亞型與健康被試之間的CSF體積差異,FDR-p<0.05。
圖20 在病程小于2年的患者中,由此計算得到的兩個亞型之間的CSF體積模式,FDR-p<0.05。
圖21 每個疾病亞型與健康對照之間的腦組織(灰質(zhì)和白質(zhì))的體積差異模式圖。圖中結(jié)果分別與灰質(zhì)和白質(zhì)的結(jié)果一致。所以MRI圖像中灰質(zhì)與白質(zhì)之間的對比度并不會影響組織分割結(jié)果以及疾病亞型的聚類結(jié)果。
表2 精神分裂癥亞型1和亞型2患者的人口學(xué)和臨床指標(biāo)的比較 FGAs=第一代抗精神病藥;SCZ1 =精神分裂癥亞型1;精神分裂癥亞型2; SGAs=第二代抗精神病藥。
亞型1中患者的受教育程度較低
亞型1中患者的受教育程度較低(卡方= 6.389,d.f. = 2, P = 0.041),但在年齡、性別、患病時間、抗精神病藥物劑量、發(fā)病年齡、癥狀嚴(yán)重程度或抗精神病藥物類型等方面,兩個亞型無差異(表2)。 亞型1的灰質(zhì)體積與病程呈負(fù)相關(guān)亞型1患者灰質(zhì)體積與病程呈負(fù)相關(guān)(r = -0.201;P = 0.016),但亞型2并沒有這樣的現(xiàn)象 (r = -0.045;P = 0.652),如圖22。
圖22 兩種亞型的總灰質(zhì)體積與病程的關(guān)系。A)精神分裂癥亞型1患者灰質(zhì)體積與病程呈負(fù)相關(guān)(SCZ1;r = -0.201, PFDR = 0.016),但(B)精神分裂癥亞型2的灰質(zhì)體積與病程無顯著相關(guān)性(SCZ2;r = -0.045, P = 0.652)。
討論
研究人員確定了精神分裂癥的兩個明顯不同的神經(jīng)解剖亞型。相對于健康對照組,亞型1顯示出廣泛分布的灰質(zhì)減少的模式,而亞型2表現(xiàn)出正常的灰質(zhì)和白質(zhì)背景下,基底節(jié)和內(nèi)囊的體積增加。這項研究的總體結(jié)果總結(jié)在圖23中。這兩種亞型對排列試驗(permutation test)、分離樣本試驗(split sample test)、留一(數(shù)據(jù)站點(diǎn))交叉驗證試驗、性別分析、抗精神藥物劑量調(diào)整和對病程不超過2年的患者的限制具有魯棒性。關(guān)鍵的是,標(biāo)準(zhǔn)的病例對照比較掩蓋了這樣一個事實,即精神分裂癥的平均差異來自于不同的神經(jīng)解剖學(xué)亞型,灰質(zhì)的減少僅占患者總數(shù)的約三分之二,皮層下的增加僅占患者總數(shù)的約三分之一。最近使用normative models的研究也表明,精神分裂癥的這種平均群體差異掩蓋了生物異質(zhì)性,客觀地定義生物亞型是一個合乎邏輯的下一步。隨著對神經(jīng)影像學(xué)異質(zhì)性的不斷認(rèn)識,上述分析揭示了無法通過(相對粗糙的)臨床表型檢測到的亞型,但這些亞型可能具有尚未被發(fā)現(xiàn)的臨床意義。因此,文章中的發(fā)現(xiàn)挑戰(zhàn)了精神分裂癥患者腦容量普遍減少的主流觀點(diǎn),澄清了以前的病例對照研究結(jié)果,并首次提出精神分裂癥患者的亞型之間存在根本的腦差異,而這些亞型并沒有被慢性或標(biāo)準(zhǔn)的臨床措施明確界定。
神經(jīng)解剖學(xué)模式和潛在的機(jī)制
自從早期的大腦造影研究以來,已經(jīng)形成了一種共識,即被診斷為精神分裂癥的個體表現(xiàn)出灰質(zhì)減少和腦室增大,這已被最近的meta分析和mega分析所證實。亞型1中,所觀察到的灰質(zhì)減少與一項大型分析報告的結(jié)果一致,即腦島最大容量缺陷。一項多數(shù)據(jù)中心的研究發(fā)現(xiàn)內(nèi)側(cè)額葉、顳邊緣和大腦外側(cè)外側(cè)皮質(zhì)萎縮;ENIGMA和COCORO項目發(fā)現(xiàn)海馬體、丘腦和伏隔核的體積減少。
本文的研究發(fā)現(xiàn)了皮質(zhì)下灰質(zhì)的增加,并且揭示了一些腦結(jié)構(gòu)的個體差異。在這里,研究人員發(fā)現(xiàn)基底神經(jīng)節(jié)體積的增加僅發(fā)生在一部分皮質(zhì)灰質(zhì)沒有減少的個體中(所占比例約為37%)。這些結(jié)果挑戰(zhàn)了傳統(tǒng)觀念,即腦容量減少是精神分裂癥的普遍特征。精神分裂癥多基因風(fēng)險和單一風(fēng)險等位基因也與非臨床樣本中較大的殼核有關(guān)。此外,最近的一項研究發(fā)現(xiàn),經(jīng)初次診斷的未接受過藥物治療的樣本中的殼核蛋白量增加,而家庭成員未受影響。
綜上所述,本文的發(fā)現(xiàn)可能暗示先前未發(fā)現(xiàn)過的原發(fā)性多巴胺痛精神分裂癥亞型。與亞型2的體積增加受限相比,亞型1的廣泛分布的體積減小與早期神經(jīng)發(fā)育破壞,炎癥和皮質(zhì)功能障礙相關(guān)的機(jī)制更為一致,在這種機(jī)制中,補(bǔ)體-小膠質(zhì)細(xì)胞系統(tǒng)的過度活動可產(chǎn)生突觸過度修剪并損害中間神經(jīng)元遷移。中間神經(jīng)元功能障礙和更廣泛的皮質(zhì)異常發(fā)育,也與谷氨酸過高和皮質(zhì)中的興奮性/抑制性平衡失調(diào)有關(guān)。雖然這些機(jī)制可能導(dǎo)致繼發(fā)性多巴胺能破壞,但原發(fā)性非多巴胺能異常的存在可能使1型患者對目前的多巴胺阻斷性抗精神病藥反應(yīng)較弱。
圖23 精神分裂癥亞型1(SCZ1)與亞型2(SCZ2)的總結(jié)。
總結(jié)
總之,本文發(fā)現(xiàn)了精神分裂癥的兩個明顯不同的神經(jīng)解剖亞型,從而提示了這種疾病在神經(jīng)解剖學(xué)上的兩種疾病維度。相對于健康對照組,亞型1具有較小的灰質(zhì)體積的廣泛分布模式,而亞型2具有相對較大的基底神經(jīng)節(jié)和內(nèi)囊,但皮層解剖結(jié)構(gòu)正常。這兩種亞型在病例對照研究或臨床亞型研究中并未發(fā)現(xiàn),這些研究沒有直接說明潛在的神經(jīng)解剖學(xué)異質(zhì)性。未來的研究將結(jié)合腦結(jié)構(gòu)和功能的其他方面以及臨床特征(包括認(rèn)知表現(xiàn),急性治療反應(yīng),縱向進(jìn)展和病因)等信息進(jìn)行更加細(xì)致的研究。這些“亞型特征”將在高風(fēng)險,亞綜合征和流行病學(xué)樣本中追蹤。隨著進(jìn)一步的研究,這些亞型可能有助于利用廣泛使用的臨床腦成像方法在診斷、預(yù)后和治療方面的生物異質(zhì)性的細(xì)致的臨床護(hù)理。
本文給機(jī)器學(xué)習(xí)如何更進(jìn)一步的介入神經(jīng)影像學(xué)和臨床診斷之間的關(guān)系給出了一個很好的范例,在一些疾病的神經(jīng)基礎(chǔ)難以從理論上闡釋清楚時,僅僅依靠臨床癥狀及行為表現(xiàn)來進(jìn)行疾病亞型的診斷不僅容易出現(xiàn)分類不清的問題,而且對進(jìn)行診斷的醫(yī)生也提出了很高的要求,使用機(jī)器學(xué)習(xí)的方法,結(jié)合監(jiān)督和半監(jiān)督可以更好的對疾病潛在的亞型進(jìn)行探索和進(jìn)一步確認(rèn)。在當(dāng)前,不同疾病的腦影像數(shù)據(jù)的積累已經(jīng)向著多中心、大數(shù)據(jù)的方向不斷前進(jìn)了,這給機(jī)器學(xué)習(xí)甚至于深度學(xué)習(xí)的介入提供了良好的基礎(chǔ),在以后的相應(yīng)實踐中一定能夠大放異彩。計算機(jī)視覺領(lǐng)域的大跨步發(fā)展已經(jīng)給我們一個很好的啟示了,現(xiàn)在已經(jīng)是“取經(jīng)”的開端時間了,再猶豫就要錯過這個“風(fēng)起云涌,英雄輩出”的新機(jī)遇了,不要等待,這里的機(jī)器學(xué)習(xí)班等你來戰(zhàn)!
微信掃碼或者長按選擇識別關(guān)注思影
如對思影課程感興趣也可微信號siyingyxf或18983979082咨詢。覺得有幫助,給個轉(zhuǎn)發(fā),或許身邊的朋友正需要。請直接點(diǎn)擊下文文字即可瀏覽思影科技其他課程及數(shù)據(jù)處理服務(wù),歡迎報名與咨詢,目前全部課程均開放報名,報名后我們會第一時間聯(lián)系,并保留名額。
更新通知:第十屆腦影像機(jī)器學(xué)習(xí)班(已確定)
更新通知:第十二屆磁共振彌散張量成像數(shù)據(jù)處理班(已確定)
第六屆任務(wù)態(tài)fMRI專題班(預(yù)報名,南京)
更新通知:第二十八屆磁共振腦影像基礎(chǔ)班(重慶,已確定)