研究表明,功能連接可揭示生物標(biāo)志物的個(gè)體心理或臨床特征。然而在靜息態(tài)功能磁共振的典型分析中,不同研究者對(duì)其分析方法的選擇并不固定且存在很多差異。為此,對(duì)靜息態(tài)數(shù)據(jù)進(jìn)行一種特定類(lèi)型的研究將具有較強(qiáng)的現(xiàn)實(shí)意義,所以我們選擇了一種預(yù)測(cè)模型(針對(duì)功能連接),接下來(lái)本文將對(duì)此選擇做出合理的解釋。本文發(fā)表在Neuroimage雜志。
研究方法:
本文系統(tǒng)地研究了 6 個(gè)不同隊(duì)列的預(yù)測(cè)模型(被試2000人左右)。這些模型涉及的病癥及考慮的因素為:神經(jīng)退行性疾?。ò柎暮D习Y、創(chuàng)傷后應(yīng)激障礙)、精神障礙疾病(精神分裂癥、自閉癥)、藥物影響(大麻使用)、臨床環(huán)境和心理特征(流體智力)。人們對(duì)rest-fMRI 的預(yù)測(cè)過(guò)程主要包括三個(gè)步驟:定義腦區(qū)、確定交互作用以及監(jiān)督學(xué)習(xí)的最優(yōu)方案。本文對(duì)于任何一步都會(huì)進(jìn)行基準(zhǔn)測(cè)試: 在實(shí)驗(yàn)過(guò)程中,本文采用8種方法定義腦區(qū)(從REST-fMRI數(shù)據(jù)中預(yù)定義或直接生成),采取3種措施建立功能連接(從提取的時(shí)間序列中),構(gòu)建10個(gè)分類(lèi)模型(為比較受試者之間的交互作用)。盡管人口分布及地點(diǎn)存在差異性,但本文仍然對(duì)240多個(gè)不同的管道進(jìn)行了總結(jié),且對(duì)本文的模型進(jìn)行了概括。研究發(fā)現(xiàn),實(shí)驗(yàn)效果在根據(jù)功能數(shù)據(jù)所定義的區(qū)域上達(dá)到最好,且人們利用諸如線(xiàn)性回歸這種線(xiàn)性預(yù)測(cè)模型,其預(yù)測(cè)效果最佳。
研究背景:
靜息態(tài)功能磁共振成像(Rest-fMRI)是一種無(wú)特定任務(wù)的腦活動(dòng)的分析,目前,它已成為探測(cè)人腦功能(針對(duì)健康人群及疾病人群)的首選工具。同時(shí)由于REST-fmri數(shù)據(jù)容易獲得、前景廣闊的特點(diǎn),這就導(dǎo)致人們開(kāi)始大規(guī)模地收集REST-fMRI數(shù)據(jù)(如2013年,Van Essen等人的人類(lèi)連接組項(xiàng)目)。由于大樣本的數(shù)據(jù),其統(tǒng)計(jì)分析結(jié)果更準(zhǔn)確,更更具有說(shuō)服力,所以人們將較容易獲得的rest-fmri腦影像數(shù)據(jù)與人體神經(jīng)病理等臨床癥狀聯(lián)系起來(lái),他們利用REST-fMRI數(shù)據(jù),構(gòu)建預(yù)測(cè)模型、建立生物標(biāo)記物。
人們可以從REST-fMRI數(shù)據(jù)中提取出功能連接體(表征大腦的網(wǎng)絡(luò)結(jié)構(gòu)),而且人們可用大腦功能連接體的權(quán)重來(lái)表示個(gè)體的行為、認(rèn)知、年齡、心理健康程度及和腦部病理程度。
功能連接能否轉(zhuǎn)化為預(yù)測(cè)感興趣表型的生物標(biāo)記與機(jī)器學(xué)習(xí)管道(管道在本文中的意思是連續(xù)的數(shù)據(jù)處理形成的固定步驟)息息相關(guān),換句話(huà)說(shuō),機(jī)器學(xué)習(xí)管道對(duì)此過(guò)程有著關(guān)鍵作用。就REST-fMRI數(shù)據(jù)而言,將功能連接轉(zhuǎn)換為對(duì)分類(lèi)對(duì)象的表型的處理管道通常包括3個(gè),如圖1所示:
盡管該領(lǐng)域的許多綜述表明,人們可運(yùn)用大腦功能連接邊的權(quán)重對(duì)感興趣的客體進(jìn)行分類(lèi),但這個(gè)過(guò)程中能使用的管道種類(lèi)實(shí)在太多,且不同的管道選擇對(duì)研究的準(zhǔn)確性有相當(dāng)大的影響,此外,分析這種變化所耗費(fèi)的成本是一般研究的兩倍,所以很少有人討論此問(wèn)題。綜上,人們之所以不討論此問(wèn)題可簡(jiǎn)單概括如下:首先,這種研究方法對(duì)實(shí)踐者而言是一種負(fù)擔(dān),因?yàn)樗麄儧](méi)有系統(tǒng)的指導(dǎo),且他們需要在諸多選擇中去做出合理的選擇。其次,多變的方法會(huì)給研究人員帶來(lái)特別大的自由度,所以這可能對(duì)生物標(biāo)志物預(yù)測(cè)準(zhǔn)確性的測(cè)量造成影響。考慮到上述因素,我們應(yīng)該慎重地選擇建模方法和處理管道。
因此,本文基于功能連接組的分類(lèi)管道及分類(lèi)管道的不同步驟,進(jìn)行了系統(tǒng)的基準(zhǔn)測(cè)試(基準(zhǔn)測(cè)試是指通過(guò)設(shè)計(jì)科學(xué)的測(cè)試方法、測(cè)試工具和測(cè)試系統(tǒng),實(shí)現(xiàn)對(duì)一類(lèi)測(cè)試對(duì)象的某項(xiàng)性能指標(biāo)進(jìn)行定量的和可對(duì)比的測(cè)試)。除此之外,為制定出更好的策略,本文還分析了6個(gè)不同隊(duì)列的預(yù)測(cè)精度,這其中包括不同的臨床問(wèn)題、不同的樣本量、難度不一的預(yù)測(cè)問(wèn)題及一個(gè)心理特征。雖然最優(yōu)模型可能會(huì)因預(yù)測(cè)任務(wù)而產(chǎn)生差異,但本文所作的基準(zhǔn)測(cè)試仍可概括出一些基本趨勢(shì)。
具體來(lái)說(shuō),將從以下幾個(gè)方面來(lái)展開(kāi)研究:
1. 我們應(yīng)該如何選擇節(jié)點(diǎn):通過(guò)預(yù)定義的圖譜還是采用數(shù)據(jù)驅(qū)動(dòng)的方法?基于腦影像的診斷,我們需要多少節(jié)點(diǎn)?節(jié)點(diǎn)應(yīng)該選擇分布式大腦網(wǎng)絡(luò)還是感興趣區(qū)域(ROI)?
2.我們應(yīng)該如何表示大腦功能連接組的權(quán)重:是通過(guò)相關(guān)性、部分相關(guān)性還是采用更復(fù)雜的模型來(lái)測(cè)量協(xié)方差矩陣的幾何特征?
3.考慮到大腦功能連接組的權(quán)重,我們應(yīng)選擇哪些分類(lèi)器來(lái)用于機(jī)器學(xué)習(xí)?我們應(yīng)該首選線(xiàn)性模型還是非線(xiàn)性模型?應(yīng)該使用稀疏模型還是非稀疏模型?我們是否還應(yīng)該考慮特征選擇呢?
本文除了探索以上這些主要問(wèn)題,還對(duì)預(yù)處理策略和協(xié)變量控制進(jìn)行了額外的實(shí)驗(yàn)(研究帶通濾波和全腦均值回歸的效果)。
本文的全局概括:
本文結(jié)構(gòu)如下:
首先回顧了迄今為止被大量使用的具體方法。
接著,提出了基準(zhǔn)測(cè)試的不同選擇(針對(duì)分類(lèi)管道步驟),并對(duì)這些方法進(jìn)行了相應(yīng)的描述;
最后,根據(jù)本文的試驗(yàn)情況,對(duì)其實(shí)驗(yàn)結(jié)果進(jìn)行報(bào)告并揭示了它們的趨勢(shì)。
方法:功能連接組分類(lèi)管道
當(dāng)前實(shí)踐的簡(jiǎn)要回顧:基于功能連接組的預(yù)測(cè)方法
在研究過(guò)程中,本文首次使用三篇綜述里面有關(guān)預(yù)測(cè)研究的調(diào)查方法,這三篇綜述的作者分別為Wolfers , Arbabshirani 等人及Brown and Hamarneh 。從這些綜述中來(lái)看,這27項(xiàng)研究均運(yùn)用了REST-fMRI數(shù)據(jù),并獲得了良好的分類(lèi)分?jǐn)?shù)。下面將對(duì)不同管道步驟中的選擇進(jìn)行簡(jiǎn)要概括(詳情見(jiàn)表2)。 定義腦區(qū)ROI的不同方法:
參考文獻(xiàn)坐標(biāo),以其為中心,制作半徑為 5 毫米到 10 毫米的小球ROI;
參考一些腦圖譜如 AAL腦圖譜、基于皮層結(jié)構(gòu)的圖譜以及基于功能連接的分區(qū)圖譜;
基于k-均值、Ward聚類(lèi)方法、獨(dú)立成分分析方法(ICA)或字典學(xué)習(xí)的數(shù)據(jù)驅(qū)動(dòng)方法,以往研究中使用的分區(qū)的腦區(qū)數(shù)量可設(shè)置成幾十個(gè)到幾百個(gè),但人們通常將節(jié)點(diǎn)數(shù)(即腦區(qū)數(shù)量,為方便描述,后文統(tǒng)一為節(jié)點(diǎn))控制在100個(gè)左右。
接下來(lái)描述大腦功能連接組的表示情況:
實(shí)驗(yàn)研究從二階統(tǒng)計(jì)量的角度出發(fā),來(lái)定義功能交互作用(基于單一協(xié)變量)。研究使用 Pearson 相關(guān)或偏相關(guān)的數(shù)理統(tǒng)計(jì)方法,其研究過(guò)程主要涉及最大似然估計(jì)或 Ledoit-Wolf 收縮協(xié)方差估計(jì)。我們知道節(jié)點(diǎn)之間的部分相關(guān)性有助于規(guī)避相關(guān)結(jié)構(gòu)中的間接影響,但這一過(guò)程需要借助對(duì)協(xié)方差的收縮估計(jì)(收縮是一種正則化形式,用于在訓(xùn)練樣本數(shù)量比特征數(shù)量少的情況下改善協(xié)方差矩陣的估計(jì)),我們對(duì)其中最簡(jiǎn)單的一個(gè)實(shí)驗(yàn)進(jìn)行了基準(zhǔn)測(cè)試。
關(guān)于預(yù)測(cè)分類(lèi)器的描述
人們?cè)谥暗膶?shí)驗(yàn)中已經(jīng)使用過(guò)許多不同的分類(lèi)器(其中包括線(xiàn)性分類(lèi)器、非線(xiàn)性分類(lèi)器以及稀疏分類(lèi)器和非稀疏分類(lèi)器),本文從中挑選出一些模型,并對(duì)其進(jìn)行使用。詳情見(jiàn)表A2。除了表上面所展示的原型管道之外,還有一些研究使用了如網(wǎng)絡(luò)模塊化或中心性等圖論的網(wǎng)絡(luò)建模方法,但值得一提的是,人們很少把這些方法與監(jiān)督學(xué)習(xí)相結(jié)合使用。雖然圖論指標(biāo)可以很好地捕捉到大腦連通性全局方面的信息,但不能很好地捕獲特定子網(wǎng)絡(luò)中的連通性特征。所以本文只專(zhuān)注于機(jī)器學(xué)習(xí)方法(用于提取判別關(guān)系),不研究圖論方法。
因?yàn)楫?dāng)前的做法非常多樣且對(duì)建模方法沒(méi)有標(biāo)準(zhǔn)的定義及選擇。所以為了確保研究的準(zhǔn)確性及合理性,本文探索了經(jīng)典機(jī)器學(xué)習(xí)管道中比較流行的方法及其變體,以更好地滿(mǎn)足我們的實(shí)驗(yàn)?zāi)繕?biāo)(對(duì)功能連接進(jìn)行良好且有效的預(yù)測(cè))。
接下來(lái),將會(huì)對(duì)本文的研究進(jìn)行詳細(xì)的介紹。定義感興趣腦區(qū)(ROI)
實(shí)驗(yàn)假設(shè):在本文定義的ROI范圍內(nèi),能很好地捕捉到與功能連接相關(guān)的功能單元。雖然本文研究了解剖學(xué)上和功能上所定義的腦圖譜,也學(xué)習(xí)了定義ROI的相關(guān)數(shù)據(jù)驅(qū)動(dòng)方法,但因?yàn)槭褂脳l件以及不同病理的差異性,所以我們需要清楚:在實(shí)際的研究中,ROI的選擇是一個(gè)極其困難的過(guò)程。
預(yù)定義圖譜的選擇:
本文選擇了四個(gè)標(biāo)準(zhǔn)腦圖譜,其中兩個(gè)是結(jié)構(gòu)圖譜:
(1)AAL116腦圖譜
(2)Harvard Oxford圖譜,總共包含118個(gè)ROI
(3)Bootstrap Analysis of Stable Clusters (BASC)腦圖譜,選擇序號(hào)為36,64,122,197,325,444的感興趣區(qū)
(4)Power圖譜,制作半徑為5mm的小球ROI
對(duì)于所有的基準(zhǔn)測(cè)試,本文都只使用預(yù)先計(jì)算的區(qū)域。值得說(shuō)明的一點(diǎn)是,在對(duì)靜息態(tài)數(shù)據(jù)的研究過(guò)程中,如果有些功能圖譜可運(yùn)用字典學(xué)習(xí)的方法計(jì)算出,那么本文便參照Mensch等人計(jì)算的圖譜,對(duì)數(shù)據(jù)進(jìn)行合理的訓(xùn)練,以確保實(shí)驗(yàn)結(jié)果的準(zhǔn)確性。
數(shù)據(jù)驅(qū)動(dòng)方法的選擇:
本文選擇了四種當(dāng)下流行的數(shù)據(jù)驅(qū)動(dòng)方法(從fMRI數(shù)據(jù)中提取ROI,且用兩種聚類(lèi)方法來(lái)定義ROI:)(1)K均值聚類(lèi)(2)Wards聚類(lèi)算法(3)組ICA方法(4)字典學(xué)習(xí)方法
數(shù)據(jù)驅(qū)動(dòng)圖譜的維度選擇:
我們采取聚類(lèi)的方法,提取出不同編號(hào)的ROI,具體為:40,60,80,100,120,150,200,300。同理,我們借助CanICA 和 DictLearn線(xiàn)性分解方法,提取出以下成分:40,60,80,100,120。
為避免實(shí)驗(yàn)?zāi)P统霈F(xiàn)過(guò)擬合的情況,對(duì)每一種數(shù)據(jù)驅(qū)動(dòng)方法的分割都限制在訓(xùn)練集,并直接將分割結(jié)果應(yīng)用于測(cè)試集。與此同時(shí),在交叉驗(yàn)證循環(huán)的過(guò)程中,對(duì)于每個(gè)分割(定義大腦 ROI),也將其限制在訓(xùn)練集上。
為了實(shí)現(xiàn)預(yù)測(cè)目標(biāo),本文使用圖譜來(lái)學(xué)習(xí)連接模式。此外,為了讓所提取的ROI區(qū)域增強(qiáng),在提取大腦 ROI 之前,先對(duì) rest-fMRI 數(shù)據(jù)上做了高斯平滑核為6mm 的高斯平滑的操作。
本文還測(cè)試了節(jié)點(diǎn)是直接使用局部腦區(qū)還是分布式網(wǎng)絡(luò)。目前,功能連接組學(xué)將大腦的局部區(qū)域或?qū)鄠€(gè)區(qū)域的分布式網(wǎng)絡(luò)都稱(chēng)之為節(jié)點(diǎn)。為了確保實(shí)驗(yàn)的準(zhǔn)確性,本文在實(shí)驗(yàn)過(guò)程中,對(duì)這兩種方法都進(jìn)行了考慮。
在腦網(wǎng)絡(luò)(借助Canica和DictLearn獲得)中采用隨機(jī)游走算法提取節(jié)點(diǎn)。對(duì)于K-Means和BASC方法,只需在它們的連通分量中劃分集群即可,在此過(guò)程中,去除尺寸 < 1500立方毫米的假陽(yáng)性區(qū)域。圖2展示了利用各種數(shù)據(jù)驅(qū)動(dòng)方法從ADNI REST-fMRI數(shù)據(jù)中獲得的大腦區(qū)域,具體情況如圖所示:
圖2:使用ICA、DictLearn、KMeans和Ward方法提取的大腦區(qū)域。使用 ICA 和字典學(xué)習(xí)方法,得到的靜息態(tài)網(wǎng)絡(luò)的維度分別是80和60,隨之被分解為多個(gè)區(qū)域(150個(gè))。通過(guò)KMeans和Ward聚類(lèi)得到120個(gè)區(qū)域,其顏色隨機(jī)分配。
多連通圖的參數(shù)化
然后對(duì)每個(gè)節(jié)點(diǎn)都提取出其時(shí)間序列。在信號(hào)提取的過(guò)程中,本文探索了幾種降噪方法來(lái)規(guī)避非神經(jīng)偽影,降噪方法具體為:對(duì)數(shù)據(jù)做低通濾波的處理,對(duì)全腦均值均值進(jìn)行回歸。為了有效地估計(jì)功能連通性,使用了Ledoit-Wolf收縮估計(jì),并給出了收縮參數(shù)的形式表達(dá)式。雖然REST-fMRI數(shù)據(jù)集的時(shí)間序列長(zhǎng)度不同,但這種估計(jì)方法仍能產(chǎn)生良好效果,本研究還針對(duì)協(xié)方差,研究了它的的非正則化及稀疏估計(jì)方面的問(wèn)題(見(jiàn)附錄H.2)。本研究在這種協(xié)方差結(jié)構(gòu)的背景下,對(duì)三種不同的功能交互的參數(shù)化過(guò)程進(jìn)行了研究:全相關(guān)、偏相關(guān)及協(xié)方差矩陣。雖然協(xié)方差矩陣使用頻率較低,但它具備良好的數(shù)學(xué)基礎(chǔ),且許多研究都報(bào)告出該框架具有良好的解碼性能。本研究對(duì)兩個(gè)變量進(jìn)行了比較,使用歐幾里得平均值或幾何平均值作為參考點(diǎn)(在這兩種情況下都參考了Nilearn所提出的方法)。值得注意的是,偏相關(guān)和切線(xiàn)空間的計(jì)算都需要求協(xié)方差逆矩陣,因此這些矩陣必須可逆。所以,這些參數(shù)化法不適用于非正則化協(xié)方差估計(jì)。
為了后面統(tǒng)計(jì)分析過(guò)程的良好進(jìn)行,本研究對(duì)功能連接的每個(gè)參數(shù)都進(jìn)行了矢量化的操作處理(數(shù)據(jù)的標(biāo)準(zhǔn)化),使用連通矩陣的下三角部分進(jìn)行分類(lèi)。
監(jiān)督學(xué)習(xí):分類(lèi)器
最后,使用預(yù)測(cè)模型進(jìn)行分類(lèi)。在這個(gè)過(guò)程當(dāng)中,本研究運(yùn)用了幾種不同的方法(線(xiàn)性方法、非線(xiàn)性方法、稀疏方法和非稀疏方法)。對(duì)于非線(xiàn)性方法,用 K = 1 和歐幾里得距離的方法來(lái)度量最近鄰方法(K-NN)、高斯樸素貝葉斯 (GNB) 和隨機(jī)森林分類(lèi)器 (RF)。對(duì)于線(xiàn)性分類(lèi)器,本研究使用了支持向量分類(lèi) (SVC) 和 Logistic 回歸的方法,設(shè)定稀疏度值為?1,并對(duì)其做了正則化的處理。對(duì)于非稀疏線(xiàn)性分類(lèi)器,本研究使用了嶺分類(lèi)、SVC、Logistic回歸的數(shù)學(xué)方法。此外,對(duì)于 SVC,還使用了單因素方差分析方法對(duì)其進(jìn)行 10%閾值的特征篩選。對(duì)于正則化參數(shù)(例如 SVC 中的軟邊距參數(shù)),使用默認(rèn)的值C =1或α= 1,因?yàn)檠芯堪l(fā)現(xiàn)這兩個(gè)默認(rèn)值具有很好的代表性。
實(shí)驗(yàn)研究
為了對(duì)不同的預(yù)測(cè)模型進(jìn)行基準(zhǔn)測(cè)試,本實(shí)驗(yàn)所用的數(shù)據(jù)為五個(gè)公開(kāi)可用的REST-fMRI數(shù)據(jù)集,并在這些數(shù)據(jù)集上應(yīng)用了不同的功能連接組分類(lèi)管道。在實(shí)驗(yàn)過(guò)程中,對(duì)臨床上不同的的功能連接預(yù)測(cè)結(jié)果都進(jìn)行了研究,這其中包括:神經(jīng)退行性、神經(jīng)精神障礙、藥物濫用的影響及流動(dòng)智力。本文專(zhuān)注于二進(jìn)制的分類(lèi)問(wèn)題。具體情況如表1所示:
表1:數(shù)據(jù)集和預(yù)測(cè)任務(wù)。每組的被試數(shù)目:COBRE :142人ADNI :136 人ADNIDOD:167人ACPI :126 人ABIDE :866人HCP : 443人
IQ代表流動(dòng)智力(788 名受試者在 HCP900 版本中獲得 IQ 分?jǐn)?shù))表 A3總結(jié)了每個(gè)數(shù)據(jù)集的采集參數(shù)。
1. 參照ADNI的restfMRI 數(shù)據(jù),以對(duì)患有輕度認(rèn)知障礙 (MCI) 的被試與被患有阿爾茨海默病 (AD) 的被試進(jìn)行區(qū)分。
2. 參照ADNIDOD的restfMRI 數(shù)據(jù),將PTSD患者與健康對(duì)照組區(qū)分開(kāi)來(lái)。
3. 參照ACPI的restfMRI 數(shù)據(jù),判別被試是否有過(guò)吸食大麻史。
4. 參照ABIDE的restfMRI 數(shù)據(jù),以此區(qū)分出患有自閉癥障礙的患者實(shí)驗(yàn)組與健康對(duì)照組。
5. HCP 900人連接體項(xiàng)目包含健康受試者的成像和行為數(shù)據(jù)。使用來(lái)自HCP900釋放的預(yù)處理的rest-fMRI數(shù)據(jù)來(lái)區(qū)分高智商和低智商個(gè)體.
6. 參照COBRE(生物研究中心)的 restfMRI 數(shù)據(jù),來(lái)研究精神分裂癥和雙相情感障礙這兩種疾病。需要注意的是,本文主要利用精神分裂癥患者的數(shù)據(jù),將其與健康組進(jìn)行對(duì)照,以便達(dá)到預(yù)測(cè)目標(biāo)。
Rest-fMRI數(shù)據(jù)預(yù)處理:軟件及相關(guān)過(guò)程
用SPM12軟件對(duì) COBRE、ADNI 和 ADNIDOD數(shù)據(jù)進(jìn)行預(yù)處理。預(yù)處理包括:頭動(dòng)校正、一步配準(zhǔn),平滑(高斯平滑核為5mm)。除此之外,在數(shù)據(jù)處理的過(guò)程中,剔除了有嚴(yán)重偽影(多人肉眼觀察)或頭動(dòng)大于 2 毫米的被試。對(duì)于經(jīng)過(guò)預(yù)處理的 ABIDE數(shù)據(jù) 和 ACPI數(shù)據(jù),本研究選用 C-PAC pipeline 來(lái)處理圖像,但本研究在這個(gè)過(guò)程中,沒(méi)有回歸全腦均值。對(duì)于 ACPI數(shù)據(jù),本研究使用ANTS配準(zhǔn)的方法對(duì)圖像數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,但沒(méi)有刪除數(shù)據(jù),也沒(méi)有對(duì)數(shù)據(jù)做全腦均值的回歸處理。對(duì)經(jīng)過(guò)預(yù)處理可用的數(shù)據(jù)者,繼續(xù)進(jìn)行下面的操作,而且,本研究沒(méi)有對(duì)HCP 數(shù)據(jù)做任何額外的預(yù)處理操作。
刪除標(biāo)準(zhǔn):
本研究通過(guò)目視檢查(肉眼觀察)的步驟剔除了一些被試,也借助其他辦法排除了不符合要求的被試。例如,本研究從 COBRE 樣本中剔除了既患有雙相情感障礙疾病又患有分裂情感疾病的被試。對(duì)于HCP數(shù)據(jù),本研究為了更容易預(yù)測(cè)二元分類(lèi)設(shè)置,把低智商與高智商被試做了分組處理,根據(jù)分位數(shù) 0.333 (以下為低智商)和 0.666 (以上為高智商)來(lái)選擇(詳情見(jiàn)表1)。
交叉驗(yàn)證和誤差測(cè)量:
本研究在進(jìn)行交叉驗(yàn)證(CV)的過(guò)程中對(duì)所有被試進(jìn)行隨機(jī)處理,并對(duì)每個(gè)數(shù)據(jù)集做了超過(guò)100次的分割,最終將被試分成兩組:75%的被試運(yùn)用訓(xùn)練分類(lèi)器和數(shù)據(jù)驅(qū)動(dòng)模型的方法來(lái)分割腦區(qū),剩余25%的被試則在不可見(jiàn)數(shù)據(jù)上進(jìn)行測(cè)試。此外,本研究對(duì)數(shù)據(jù)進(jìn)行分層處理,以保持組之間的樣本比率。針對(duì)每次分割,本研究計(jì)算出曲線(xiàn)下面積(AUC),曲線(xiàn)下面積的值1代表完美預(yù)測(cè),0.5代表隨機(jī)水平概率。AUC的最終預(yù)測(cè)分?jǐn)?shù)可用來(lái)衡量不同選擇之下的預(yù)測(cè)管道結(jié)果情況。
計(jì)算和實(shí)施:
本研究的實(shí)驗(yàn)研究包含240多種類(lèi)型的管道(8個(gè)圖譜,3個(gè)連通性度量,10個(gè)分類(lèi)器,以及其他變量,如3個(gè)filter選項(xiàng)和3個(gè)協(xié)方差回歸選項(xiàng)),這些管道分別在5個(gè)數(shù)據(jù)集上運(yùn)行。其運(yùn)行結(jié)果是:在原始數(shù)據(jù)到模型計(jì)算期間的這個(gè)過(guò)程之中,本研究需要對(duì)50多萬(wàn)個(gè)管道進(jìn)行擬合,所以計(jì)算量相當(dāng)大。本研究使用Python2.7工具進(jìn)行數(shù)據(jù)處理。這其中包括:定義腦圖譜、提取具有代表性的時(shí)間序列以及構(gòu)建連通性度量。
結(jié)果:管道選擇的基準(zhǔn)
接下來(lái),本研究概述不同的模型選擇對(duì)預(yù)測(cè)結(jié)果所產(chǎn)生的影響。
本研究在表2中報(bào)告了所有REST-fMRI數(shù)據(jù)集所獲得的AUC分?jǐn)?shù),并且在表2中,本研究已將每步的最優(yōu)選擇進(jìn)行呈現(xiàn),以下本研究將對(duì)這些最優(yōu)選擇進(jìn)行詳細(xì)闡述。
不同的方法將產(chǎn)生不同的影響,為了更好衡量其影響,所以本研究對(duì)每個(gè)管道的預(yù)測(cè)分?jǐn)?shù)計(jì)算出平均值。這種相對(duì)測(cè)量方法避免了因折疊或數(shù)據(jù)集不同而導(dǎo)致的分?jǐn)?shù)差異的情況。本研究對(duì)這些相對(duì)預(yù)測(cè)分?jǐn)?shù)進(jìn)行了觀察,并研究了不同的步驟選擇(如分類(lèi)器的選擇、連接參數(shù)的選擇和大腦圖譜的選擇)對(duì)預(yù)測(cè)管道的影響。在實(shí)驗(yàn)過(guò)程中,涉及很多步驟的選擇,對(duì)于固定步驟而言,其影響有二:第一,當(dāng)某些實(shí)驗(yàn)步驟是最優(yōu)選擇或接近最優(yōu)選擇時(shí),本研究可以考慮其中一個(gè)步驟的影響;第二,對(duì)必選步驟來(lái)說(shuō),本研究可以考慮該步驟對(duì)其他步驟的影響。從經(jīng)驗(yàn)上看,這兩種情況得出了相似的結(jié)論,詳情見(jiàn)附錄 C。
分類(lèi)器的選擇
圖 3 總結(jié)了分類(lèi)器對(duì) rest-fMRI 數(shù)據(jù)集預(yù)測(cè)分?jǐn)?shù)的情況。結(jié)果顯示不同模型和數(shù)據(jù)集(即預(yù)測(cè)目標(biāo))之間存在一定的差異性,非稀疏(l2-regularized)線(xiàn)性分類(lèi)器的表現(xiàn)情況更好,略領(lǐng)先于logistic-l2。
圖3:分類(lèi)器的選擇對(duì)預(yù)測(cè)準(zhǔn)確性的影響。對(duì)于每個(gè)分類(lèi)器,當(dāng)改變其他步驟(正在進(jìn)行)的建模選擇時(shí)??傮w而言,L2正則化的線(xiàn)性分類(lèi)器的表現(xiàn)更好。
連接參數(shù)的選擇
圖4總結(jié)了REST-fMRI數(shù)據(jù)集的相對(duì)預(yù)測(cè)分?jǐn)?shù)受協(xié)方差矩陣的參數(shù)化情況的影響。通常來(lái)說(shuō),切空間參數(shù)化(正切空間投影法被應(yīng)用于功能連接的估計(jì),具體方法可以看這篇文章:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7086233/)的性能優(yōu)于完全相關(guān)或部分相關(guān)。
圖4:連接參數(shù)對(duì)預(yù)測(cè)精度的影響。實(shí)驗(yàn)過(guò)程中,本研究將完全相關(guān)性方法或部分相關(guān)性方法與基于切線(xiàn)空間的方法進(jìn)行對(duì)比,發(fā)現(xiàn)使用基于切線(xiàn)空間的方法,其在預(yù)測(cè)時(shí),其連通性參數(shù)顯示出更高的準(zhǔn)確度和相對(duì)較低的方差。圖4方框顯示中位數(shù)和四分位數(shù),及五分位數(shù)和95分位數(shù)。
區(qū)域定義方法的選擇:
為找到大腦區(qū)域定義的最佳方法,本研究在實(shí)驗(yàn)過(guò)程中,對(duì)實(shí)驗(yàn)方法做了兩步處理。首先,本研究對(duì)每種方法都找出了最佳預(yù)測(cè)的維度,但這只適用于具有各種維度的 BASC 圖譜及數(shù)據(jù)驅(qū)動(dòng)的區(qū)域定義方法(如ICA)。其次,本研究在最佳維度的這個(gè)背景之下,研究了每種方法的預(yù)測(cè)精度。
最好的辦法:
圖5總結(jié)了不同的區(qū)域定義方法的相對(duì)預(yù)測(cè)性能。盡管這些方法的系統(tǒng)性影響很?。ㄏ啾扔隈薨櫤蛿?shù)據(jù)集的方差),但就預(yù)測(cè)效果而言:參照功能數(shù)據(jù)定義方法所定義的區(qū)域要比參照解剖學(xué)定義方法的預(yù)測(cè)效果更好。其中,本研究使用?1字典學(xué)習(xí)方法定義區(qū)域(在REST-FMRI數(shù)據(jù)中),其實(shí)驗(yàn)效果似乎是最好的,其次是ICA方法(預(yù)測(cè)效果排名第二)。
圖5:不同的圖譜定義的方法對(duì)預(yù)測(cè)精度的影響。
最優(yōu)維度:
本研究對(duì)每種最佳維度方法的選擇進(jìn)行了圖示,如圖 6所示。在實(shí)驗(yàn)過(guò)程中,本研究發(fā)現(xiàn)了一個(gè)在不同情況下會(huì)出現(xiàn)變化的最優(yōu)值:這個(gè)值會(huì)隨著提取節(jié)點(diǎn)數(shù)量的增加,使預(yù)測(cè)精度升高,然而對(duì)于其他方法,在相同情況下,這個(gè)值的預(yù)測(cè)精確性又會(huì)緩慢下降。詳情見(jiàn)圖6。除此之外,典型的最優(yōu)區(qū)域數(shù)量約為 150(見(jiàn)附錄 E)。
圖6:腦區(qū)數(shù)量對(duì)預(yù)測(cè)準(zhǔn)確性的影響。該圖顯示了不同方法(對(duì)五個(gè) rest-fMRI 數(shù)據(jù)集采用的方法)的 AUC 分?jǐn)?shù)的分布情況。水平條(黑色)表示中位數(shù),紅色箭頭表示維度。
更大的數(shù)據(jù)集和預(yù)先計(jì)算的圖譜:
為了研究數(shù)據(jù)分析(限于更高質(zhì)量數(shù)據(jù)集)的一致性對(duì)結(jié)果的影響,本研究對(duì)包括 HCP 數(shù)據(jù)在內(nèi)的基準(zhǔn)測(cè)試進(jìn)行了相同的預(yù)處理。因這些數(shù)據(jù)時(shí)間序列更長(zhǎng)且計(jì)算成本高,故為了降低計(jì)算成本及確保結(jié)果的嚴(yán)謹(jǐn)性,所以本部分將分析限制在預(yù)先計(jì)算的圖譜上(對(duì)于字典學(xué)習(xí)和ICA方法下的腦區(qū)分割,是從對(duì)ADNI REST-fMRI數(shù)據(jù)的估計(jì)中來(lái)的)。
圖7總結(jié)了不同方法對(duì)六個(gè)群組預(yù)測(cè)精確性的影響。該實(shí)驗(yàn)得出了與其他實(shí)驗(yàn)類(lèi)似的結(jié)論:使用字典學(xué)習(xí)、切線(xiàn)空間參數(shù)化和 L2 正則化分類(lèi)器的方法來(lái)獲取功能圖譜作為特征,對(duì)分類(lèi)性能的提升更大。詳情見(jiàn)下圖7。
圖7:預(yù)計(jì)算區(qū)域(限于六個(gè)數(shù)據(jù)集)的流水線(xiàn)選擇
該圖展示了相對(duì)預(yù)測(cè)分?jǐn)?shù)的邊際分布情況,最佳選擇方法正向排序?yàn)椋?/span>基于字典學(xué)習(xí)的分區(qū)方法(MOD1)、聚類(lèi)法(BASC)、連通性的切數(shù)空間參數(shù)化方法以及L2正則化的邏輯回歸方法。
濾波、全腦平均信號(hào)的影響
是否濾波以及是否回歸全腦平均信號(hào)對(duì)結(jié)果影響不大。
總結(jié):
本研究為使用功能磁共振數(shù)據(jù)作為特征的分類(lèi)機(jī)器學(xué)習(xí)的實(shí)踐提供了一些參考方向,具體總結(jié)在表 3 中:本研究發(fā)現(xiàn)帶正則化參數(shù)的邏輯回歸方法是一個(gè)在許多情況下都可以被使用的基本模型,并且使用ICA或者字典學(xué)習(xí)方法對(duì)功能數(shù)據(jù)進(jìn)行軟分區(qū)可以進(jìn)一步提升模型的分類(lèi)性能,除此以外,本文發(fā)現(xiàn)預(yù)處理過(guò)程中的濾波和全腦均值回歸對(duì)分類(lèi)結(jié)果的表現(xiàn)沒(méi)有明顯影響。
本文研究還有一個(gè)意義在于,使用良好的默認(rèn)模型可以抑制分析管道的組合爆炸,從而降低研究的計(jì)算成本,以使其實(shí)驗(yàn)結(jié)論更穩(wěn)定、更具有說(shuō)服力、更具有統(tǒng)計(jì)意義。值得一提的是,就數(shù)據(jù)而言,其數(shù)據(jù)分析不可能有一個(gè)萬(wàn)能的解決方案,本文方法的最優(yōu)選擇以及本研究的研究雖然與前人研究的結(jié)果具有一致性,但不代表任何研究運(yùn)用此方法都能達(dá)到和本文一樣的效果,所以大家在實(shí)驗(yàn)過(guò)程中,可根據(jù)自己的數(shù)據(jù)以及實(shí)驗(yàn)?zāi)康?,合理選擇實(shí)驗(yàn)方法和模型來(lái)進(jìn)行研究。
如需原文及補(bǔ)充材料請(qǐng)?zhí)砑铀加翱萍嘉⑿牛?/span>siyingyxf或18983979082獲取,如對(duì)思影課程及服務(wù)感興趣也可加此微信號(hào)咨詢(xún)。另思影提供免費(fèi)文獻(xiàn)下載服務(wù),如需要也可添加此微信號(hào)入群,原文也會(huì)在群里發(fā)布,如果我們的解讀對(duì)您的研究有幫助,請(qǐng)給個(gè)轉(zhuǎn)發(fā)支持以及右下角點(diǎn)擊一下在看,是對(duì)思影科技的支持,感謝!
微信掃碼或者長(zhǎng)按選擇識(shí)別關(guān)注思影
非常感謝轉(zhuǎn)發(fā)支持與推薦
歡迎瀏覽思影的數(shù)據(jù)處理業(yè)務(wù)及課程介紹。(請(qǐng)直接點(diǎn)擊下文文字即可瀏覽思影科技所有的課程,歡迎添加微信號(hào)siyingyxf或18983979082進(jìn)行咨詢(xún),所有課程均開(kāi)放報(bào)名,報(bào)名后我們會(huì)第一時(shí)間聯(lián)系,并保留已報(bào)名學(xué)員名額):
核磁:
北京:
第五十九屆磁共振腦影像基礎(chǔ)班(北京,4.14-19)
第二十九屆磁共振腦網(wǎng)絡(luò)數(shù)據(jù)處理班(北京,4.22-27)
第十九屆磁共振腦影像結(jié)構(gòu)班(重慶,4.13-18)
第六十屆磁共振腦影像基礎(chǔ)班(重慶,4.21-26)
第十二屆任務(wù)態(tài)功能磁共振數(shù)據(jù)處理班(上海,4.21-25)
第六十一屆磁共振腦影像基礎(chǔ)班(上海,5.7-12)
更新:第二十八屆磁共振腦網(wǎng)絡(luò)數(shù)據(jù)處理班(上海,5.22-27)
腦電及紅外、眼動(dòng):
北京:
第三十三屆腦電數(shù)據(jù)處理中級(jí)班(北京,4.7-11)
第二十五屆腦電數(shù)據(jù)處理入門(mén)班(北京,5.16-20)
南京:
第二十三屆腦電數(shù)據(jù)處理入門(mén)班(南京,4.23-27)
上海:
第三屆腦電機(jī)器學(xué)習(xí)數(shù)據(jù)處理班(Matlab版,上海,5.15-20)
重慶:
第二十二屆近紅外腦功能數(shù)據(jù)處理班(重慶,5.24-29)
數(shù)據(jù)處理業(yè)務(wù)介紹:
思影科技功能磁共振(fMRI)數(shù)據(jù)處理業(yè)務(wù)
思影科技嚙齒類(lèi)動(dòng)物(大小鼠)神經(jīng)影像數(shù)據(jù)處理業(yè)務(wù)
思影科技EEG/ERP數(shù)據(jù)處理業(yè)務(wù)
思影科技眼動(dòng)數(shù)據(jù)處理服務(wù)
思影科技腦結(jié)構(gòu)磁共振成像數(shù)據(jù)處理業(yè)務(wù)(T1)
思影數(shù)據(jù)處理業(yè)務(wù)三:ASL數(shù)據(jù)處理
思影科技腦影像機(jī)器學(xué)習(xí)數(shù)據(jù)處理業(yè)務(wù)介紹
思影數(shù)據(jù)處理服務(wù)六:腦磁圖(MEG)數(shù)據(jù)處理
BIOSEMI腦電系統(tǒng)介紹
目鏡式功能磁共振刺激系統(tǒng)介紹