最近,來自波士頓榮軍醫(yī)療保健系統(tǒng)和哈佛醫(yī)學院等多個單位的研究人員,在Neuroimage雜志上發(fā)表了研究,對FreeSurfer計算海馬亞區(qū)的兩種方法(標準處理和縱向處理)跨站點重復測量的信度進行了評估,進一步驗證該方法具有較高的信度。
摘要:
人類海馬容易受到一系列退行性疾病的影響,因此,通過神經成像對海馬體和海馬亞結構進行準確的測量對于了解疾病的機制以及在新型療法的臨床試驗中用作生物標記物具有重大意義。盡管可以相對可靠地測量海馬總體積,但了解這一信度如何受到不同掃描儀采集的影響至關重要,因為在大規(guī)模臨床試驗中可能會使用多個掃描平臺。對于海馬亞區(qū)測量尤其如此,最近的研究諸如FreeSurfer之類的通用圖像處理平臺進行測量。由于這些亞區(qū)的尺寸小,大腦內側顳葉區(qū)域的磁共振成像(MRI)信號丟失以及缺乏與標準神經成像程序相對照的對比度,因此,這些區(qū)域的準確分割具有挑戰(zhàn)性。
在這里,作者使用兩臺西門子掃描儀(Trio和Prismafit Trio升級版)評估FreeSurfer自動分割海馬亞區(qū)的重復測量的信度。研究者對11名健康的年輕參與者進行了T1加權圖像的采集(在Trio進行了兩次掃描,在Prismafit進行了一次掃描)。每次圖像都是通過標準的處理流程和FreeSurfer v6.0中最近發(fā)布的縱向處理的流程進行進行海馬區(qū)分割。對每個個體體積測量的重復信度進行了檢測,評估參數包括體積差百分比,Dice重疊系數和組內相關系數值(ICC)。分子層(molecular layer)、齒狀回和全海馬體積的信度較高,在三個時間點掃描中,掃描之間的平均體積差異小于3%,重疊大于80%,ICC>0.95。海馬旁下托和海馬溝信度最低,平均體積差大于5%,重疊小于70%,ICC評分在0.78-0.89之間。其他的亞區(qū),包括CA區(qū)域,平均體積差和重疊(分別<5%和>75%)是穩(wěn)定的,并且在三次掃描后的信度有所提高(ICC>0.9)。在同一掃描儀內的信度一般較高(Trio-Trio),且在不同的掃描之間(Trio- Prismafit)的信度也較高,不存在明顯的偏倚。這些結果表明,FreeSurfer自動分割算法是測量海馬亞區(qū)體積和總體積的可靠方法,可能在未來的臨床應用中是有所幫助的。
介紹:
海馬這一結構涉及到多種認知功能,包括記憶、獎賞處理和執(zhí)行過程。在組織學水平上,這一邊緣區(qū)域是極其復雜的,但主要的亞區(qū)有其明顯的功能特性,且可以通過腦影像處理方法識別出在病理上易受損的區(qū)域。這些亞區(qū)有不同的定義,但通常包括:齒狀回、下托、旁下托、內嗅皮層和四個角區(qū)(CA)。既往的研究已經證明了海馬及其亞區(qū)在整個生命周期內具有較高的可塑性,比如在關于情景記憶中,該區(qū)域將經歷一個不斷加強、弱化和改變的過程。該區(qū)域對一系列對神經元有負面影響的情況也很敏感,包括缺氧、應激激素和阿爾茨海默病(AD)。因此,海馬體及亞區(qū)的改變已在多種神經精神疾病和退化性疾病中被報道,包括精神分裂癥(SZD)、創(chuàng)傷后應激障礙(PTSD)和阿爾茨海默病。鑒于海馬在認知和疾病方面都有重要的地位,評估這些亞區(qū)測量的信度是神經影像學的主要目標,其臨床應用包括隨訪神經退行性疾病的進展過程,以及在大型多中心臨床試驗中作為監(jiān)測治療反應的生物標志物。
海馬的測量在既往的工作中已經被證明是可靠的,然而,亞區(qū)結構由于體積小,在典型的結構磁共振成像(MRI)相中缺乏適當的信號比,因此在精確分割和測量方面存在不足。最近在獲取硬件和序列技術的各個方面的發(fā)展提高了掃描質量,與從前相比,包括分辨率和信噪比(SNR)都克服了之前的一些限制。此外,最近新的技術也被開發(fā)來分割MRI圖像中的海馬亞區(qū)。作者在這里研究了FreeSurfer處理流程(6.0版;http://surfer。nmr.mgh.harvard.edu)。該方法最近被證明能夠在AD患者和認知健康對照者之間提供穩(wěn)定的鑒別(88%的準確率)。這些結果突出了此類處理方法的敏感性和臨床實用性,但沒有提供關于重復測量的信度,以及縱向測量必要參數和臨床試驗中治療效果的潛在評估。
在這里,作者獲得了在西門子Trio掃描儀的兩個時間點和西門子Prismafit (Trio升級)一個額外時間點的掃描,檢查了重復測試的信度,進而確定在縱向研究中海馬亞區(qū)測量的實用性。這項工作遵循之前的研究,對FreeSurfer的自動海馬分割算法的信度進行了檢驗,并評估了以前沒有研究過的跨掃描儀的測量結果。該研究的工作采用FreeSurfer 6.0中的標準處理流程,此外,還使用了FreeSurfer 6.0中最近發(fā)布的縱向分析工具。結果表明與標準處理流程相比,縱向處理流程提供了一個更可靠的測量結果,并支持其作為潛在的神經影像生物標志物的使用,進而跟蹤疾病的進展和在臨床試驗中測試治療反應的預后測量,比如在與海馬有關的神經退化疾病中。
方法:
2.1 被試
11名健康的年輕人和中年人參與了這項研究(年齡在22歲到55歲之間;平均值:30.2年;SD: 9.43年。男性6人,女性5人)。所有參與者在2個月內接受了基線掃描和后續(xù)掃描,掃描范圍為7-50天,使用西門子Trio掃描儀。然后,在第二次Trio掃描后,在升級的西門子Prismafit掃描儀上進行第三次掃描,對參與者進行大約2個月的掃描(范圍為50-70天)。
2.2 圖像采集
每個受試者進行了3次掃描。西門子Trio和Prismafit是兩種廣泛應用于神經影像學研究的掃描儀。兩者之間的過渡是一個主要的硬件和軟件升級,本質上,唯一不變的是主靜態(tài)磁場。此外,序列不完全相同,這就增加了影響圖像采集的變量。在每次掃描過程中,獲取的圖像包括2張高分辨率T1加權圖像,這些圖像使用磁化制備的快速梯度回波(MPRAGE),20通道的相控陣頭線圈,參數為200Hz/像素帶寬,翻轉角=7°,Trio: TR/TE/TI=2.53 s/3.32 ms/1.1s, Prismafit:TR/TE/TI=2.53s/3.35ms/1.1 s). 所有的掃描3D矢狀位掃描包含176 層(矩陣=256×176,分辨率=1mm,層厚=1mm).兩個序列的采集時間均為6:02分鐘。
2.3 圖像分析
2.3.1 標準FreeSurfer處理流程
所有T1加權圖像均進行運動偽影和灰白色對比度檢查。在每次掃描過程中使用較少運動偽影的單次采集圖像,避免引入噪聲信號。大腦皮層重建和體積分割是在FreeSurfer圖像分析軟件6.0版中完成。這個處理流程還包括:運動校正和對多個體積T1加權圖像進行平均, 剝除非腦組織,通過使用混合分水嶺/皮層表面變形的過程, 自動化Talairach變形, 分割皮層下白質和深部灰質結構(包括海馬、杏仁核、扣帶回、殼核和腦室),強度歸一化,灰質白質邊界的網格化,自動拓撲校正,表面變形,強度梯度最優(yōu)位置灰/白質邊界和灰質/腦脊液流體邊界的位置轉變最大的強度定義轉換到其他組織類。FreeSurfer形態(tài)測量已被證明在不同掃描儀之間和不同場強之間具有良好的重復測量的信度。在所有受試者通過標準處理流程后,為了保證灰質/白質和灰質/軟腦膜表面分界的準確性,對數據進行人工檢查和編輯。
2.3.2 縱向處理
縱向研究面臨的一個重大挑戰(zhàn)是,由于受試者或儀器相關因素,重復MRI掃描的受試者數據具有可變性和較低的再現性。然而,通過使用縱向處理方法的特異性可限制該可變性,并且避免了與常見方法相關的混雜效應。為了提取可靠的體積和厚度值,在FreeSurfer v6.0中使用縱向自動處理圖像流程。具體來說,先創(chuàng)建一個無偏差的被試模板空間和圖像,并進行反向配準。若干處理步驟包括:顱骨剝離、Talairach變換、atlas及球面圖配準和分割,然后用基于被試者內部的模板進行初始化,顯著提高信度和統(tǒng)計能力。使用這種方法,一個被試內的模板被引用來實施不同時間點的一致性分割,從而減少與縱向分析相關的混雜效應,進而提高整體分析的魯棒性和敏感性。作者的縱向處理包括三個時間點的掃描,包括同一掃描儀內重復的兩個時間點(Trio-A和Trio-B)和跨掃描儀(Trio-B和Prismafit)第三個時間點。
2.3.3 海馬亞區(qū)
FreeSurfer v6.0一部分發(fā)布的標準處理流程的內容用于海馬亞區(qū)自動分割并重建的處理流程,從而產生了每個亞區(qū)的體積估計值。FreeSurfer v6.0還發(fā)布了一種用于縱向處理的海馬亞區(qū)分割的算法。該算法對每個被試生成被試內模板,其中處理步驟是使用被試內模板中的共同信息對每個時間點圖像進行初始化處理。簡單地說,單個亞區(qū)的分割算法是基于圖像強度的貝葉斯推理,以及人工分割和超高分辨率(~0.1 mm各向同性)標記MRI數據庫建立的概率圖譜。縱向處理流程使用海馬的二值模板,該模板是使用從每個受試者的基礎模板分割中提取出來的。
海馬亞區(qū)分割可視化見圖1,三維渲染圖見圖2。
圖1 單個被試的海馬亞區(qū)分割和彩色示意圖
圖2 單個被試的海馬亞區(qū)3D渲染圖
2.4 統(tǒng)計方法
2.4.1 體積差百分比和Dice重疊系數
通過計算平均體積差百分比和Dice重疊系數來確定由公式(1)和公式(2)給出的每個子區(qū)域的體積對應關系。
注:三次掃描分別表示為A-B;B-C;A-C。
在公式中,A表示Trio掃描儀第一次掃描時的給定亞區(qū)的測量值,B表示Trio掃描儀第二次掃描時的相同亞區(qū)的測量值,C表示Prismafit掃描儀提供的亞區(qū)測量值。
公式(1)用于估計兩臺掃描儀(Trio-A和Trio-B;Trio-B至Prismafit-C;Trio-A到Prismafit-C),其中最優(yōu)值為0表示體積沒有差異,增大的值表示體積差異更大。
公式(2)用于估計兩次掃描之間的Dice重疊系數,在相同體積下得到100的最優(yōu)值,值的減少表示重疊減少。Dice重疊系數是一種常用的度量方法,用于驗證真實值和估計值之間的對應關系。
所有的亞區(qū)體積都在某種程度上與海馬總體積相關,作者通過皮爾遜相關和p值來檢驗左、右海馬亞區(qū)體積與同側海馬體積的相關性。
2.4.2 組內相關系數(ICC)
使用體積差百分比和Dice重疊系數來進行單獨檢查其信度是不夠的,因為體積差異并不能一起評估被試內和被試間的變異性,Dice重疊系數也不能說明真實標簽的變異性,而真實標簽對于確定一個方法是否可以被認為“足夠好”至關重要。在重復測量數據中,組內系數(ICC)可用于測量受試者內相對于受試者間的易變性。第三種形式的ICC (ICC3,1),在以前的文獻中定義為,應用于每個亞區(qū),用以估計在兩臺掃描儀上的三次掃描之間的測量一致性。重復此計算以估計同一掃描儀提供的兩次掃描的一致性。為了評估海馬亞區(qū)橫向分析和縱向分析的信度,作者分別報告了兩種處理方法的結果。
3.結果:
3.1 體積對應的結果
圖3為標準FreeSurfer處理流程和縱向處理后的容積差百分比。值表示每次比較的結果(Trio-A和Trio-B;Trio-B和Prismafit-C;Trio-A 和Prismafit-C)。海馬總體積、分子層、齒狀回、CA1在所有時間點上的一致性最高??v向處理的結果表示,各時間點間的平均體積差小于3%。而海馬裂、旁下托和海馬傘的一致性最低,各時間點間的平均體積差異大于5%。從Trio-A到Trio- B的體積差始終低于跨掃描儀的體積差值,這表明同一掃描儀內的結果總體上表現更好。
圖3 縱向處理的結果提高了所有區(qū)域重復測量的信度。
圖4顯示了FreeSurfer的標準和縱向處理流程在同一掃描儀內和跨掃描儀兩個時間點的平均體積差百分比。海馬總體積、分子層和齒狀回穩(wěn)定性最好。然而,掃描儀內部的體積差異始終低于跨掃描儀之間的差異,這表明在同一掃描儀測量中的結果表現得更好。左右海馬亞區(qū)在時間點和處理上的體積百分比差異無統(tǒng)計學意義(p>0.05)。這表明額外機器的掃描可能會增加噪音信號,因此縱向估計的結果可能受到影響。
圖4 縱向處理的結果提高了所有區(qū)域重復測量的信度。
圖5顯示了經過標準和縱向處理的Dice重疊系數系數。值表示每次比較之間的Dice重疊系數值。海馬總體積、下托、旁下托和海馬尾的跨時間點的一致性最強,各個時間點的重疊系數值超過75%。只有海馬裂是最不一致的,在不同時間點之間的平均體積重疊小于70%。在縱向處理結果中,Dice重疊系數系數是升高的,多數亞區(qū)的得分大于80%。
圖5 縱向處理的結果提高了所有區(qū)域重復測量的信度。
圖6顯示了經過FreeSurfer標準和縱向處理的兩個時間點(包括同一掃描儀內和跨掃描儀)的Dice重疊系數系數。海馬總體積、CA4和海馬尾在兩個時間內是保持穩(wěn)定的。在縱向處理的結果中,各個亞區(qū)的重疊系數值不斷增加,大多數的亞區(qū)得分達到75%或更高。不同時間點和左右海馬亞區(qū)的Dice重疊系數系數值無統(tǒng)計學意義(p>0.05)。然而,在同一掃描器內的Dice重疊系數系數值始終高于跨掃描器之間的值。這進一步表明,用額外的機器掃描可能會增加噪聲信號并影響縱向處理流程的結果。
SHAPE \* MERGEFORMAT
圖7顯示了使用兩種處理方法中在掃描儀內和跨掃描儀兩個時間點的海馬總體積圖。海馬總體積通過半球配對來觀察原始值的信度。在縱坐標處理圖中,相關系數越高,表明該處理方法的穩(wěn)定性越好。
圖7 縱向處理的結果大大降低不同掃描儀間海馬總體積的噪聲。
從Siemens的Trio掃描儀與Siemens的Prismafit掃描儀在標準橫向處理和縱向處理后,每個被試配對的不同半球海馬總體積之間的相關圖。左半球為紅色,右半球為綠色。
表1報告了各個時間點上,各亞區(qū)體積與同側海馬總體積的相關系數。左、右亞區(qū)體積與海馬總體積呈正相關。雙側海馬下托、CA1和分子層與各自半球的海馬總體積的相關性最強(r > 0.90, p < 0.001),而相關系數最低的是左、右海馬裂和右旁下托(r < 0.50, p < 0.001)。
表1 標準處理和縱向處理的不同掃描儀間三個時間點(從Trio-A到Trio-B到Prismafit)的海馬亞區(qū)體積與海馬總體積的相關系數。所有亞區(qū)體積均顯示與同側海馬體積之間存在顯著相關性(p <0.001)。
3.2 重復測量的信度
不同亞區(qū)的結果均表現出較高的信度,標準處理流程顯示其信度為0.74-0.98,縱向處理流程為0.92-0.99(所有三個時間點,表2)。體積百分比的結果顯示不同亞區(qū)同時保持高信度的能力,包括分子層,齒狀回、海馬總體積(> 0.98),以及中等穩(wěn)定性的亞區(qū),包括海馬裂,海馬旁下托,海馬傘和CA3(>
0.92)。三個時間點均納入后,縱向處理所得的各區(qū)域ICC值均大于0.90。縱向處理的ICC值明顯高于與標準處理的值,包括右側CA1、海馬裂、右側齒狀回、右側CA3、右側CA4、海馬傘、右側HATA和海馬總體積。作者觀察到在標準處理中左海馬亞區(qū)區(qū)域的信度高于右海馬亞區(qū),其差異有統(tǒng)計學意義(p < 0.05)。然而,在縱向處理過程中,不同半球之間的信度沒有顯著差異(p
> 0.05)。
表2在不同掃描儀之間(Trio-A,
Trio-B至Prismafit)及不同的處理流程,各個亞區(qū)的組內相關系數值
掃描時僅包含兩個時間點(表3),亞區(qū)體積呈現出相對穩(wěn)定,ICC得分大多在0.90以上,右側海馬裂和右側CA3得分在0.80以下。雖然這些區(qū)域的結果都不太一致,但在縱向處理中其穩(wěn)定性顯著增加。在兩個時間點通過標準處理或縱向處理的結果顯示,半球的信度系數無統(tǒng)計學差異(p > 0.05)。
表3 在2個時間點內(Trio-B至Prismafit)及不同的處理流程,各個亞區(qū)的組內相關系數值
結論:
本研究介紹的結果反映了根據T1加權掃描估計的自動海馬領域測量值的重測可靠性。使用類內相關系數(ICC),體積差異百分比和Dice重疊系數,研究者能夠量化freesurfer分割的可靠性。并且研究結果表明,大多數區(qū)域是高度穩(wěn)定的,被試和試次間的差異很小。但是,研究者發(fā)現包含額外的掃描儀會影響可靠性。在縱向處理中,跨站點(Trio與Prismafit)掃描相比的同站點多次(Trio-A與Trio-B)掃描的可靠性較差。這些結果可能表明需要對縱向研究中的各個受試者的縱向點進行匹配。
該研究從技術層面分析了同一掃描儀及不同掃描儀的3個時間點3D-T1掃描,且用FreeSurfer發(fā)布的標準處理流程和縱向處理流程的結果進行差異信度的分析,其結果表示,如果有多個時間點的結構像,用縱向處理流程的方法得到的穩(wěn)定性較高,也就意味這樣的處理方法是比較可靠的。
原文:Test-retest reliability of FreeSurfer automated hippocampal subfield
segmentation within and across scanners
微信掃碼或者長按選擇識別關注思影
如對思影課程感興趣也可微信號siyingyxf或18983979082咨詢。覺得有幫助,給個轉發(fā),或許身邊的朋友正需要。請直接點擊下文文字即可瀏覽思影科技其他課程及數據處理服務,歡迎報名與咨詢,目前全部課程均開放報名,報名后我們會第一時間聯系,并保留名額。
更新通知:第十屆腦影像機器學習班(已確定)