午夜亚洲www湿好大,日韩一级精品,亚州无码视频久久久久,中文字幕国语对白在线观看-在线观看A级片_亚洲中文字幕人成乱码_亚洲精品国产精品乱码不99_美女视频黄频大全视频免费

Nature子刊:靈活的語(yǔ)音皮質(zhì)編碼可增強(qiáng)與任務(wù)相關(guān)的聲學(xué)信息的神經(jīng)處理

語(yǔ)音是我們?nèi)粘I钪凶钪匾穆曇粜盘?hào)。它所傳遞的信息不僅可以用于人際交往,還可以用于識(shí)別個(gè)人的身份和情緒狀態(tài)。最相關(guān)的信息類型取決于特定的環(huán)境和暫時(shí)的行為目標(biāo)。因此,語(yǔ)音處理需要具有很強(qiáng)的自適應(yīng)能力和效率。這種效率和適應(yīng)性是通過(guò)早期聽(tīng)覺(jué)感覺(jué)區(qū)域的自下而上的物理輸入處理和自上而下的聽(tīng)覺(jué)和非聽(tīng)覺(jué)(如額葉)區(qū)域驅(qū)動(dòng)的自上而下的調(diào)節(jié)機(jī)制之間的積極相互作用實(shí)現(xiàn)的。因此,交互語(yǔ)音模型提出對(duì)輸入進(jìn)行初始自下向上的處理,激活聲音的多種可能的語(yǔ)言表示。同時(shí),高水平的語(yǔ)音識(shí)別機(jī)制會(huì)對(duì)這些相互競(jìng)爭(zhēng)的解釋產(chǎn)生抑制作用,最終導(dǎo)致正確解釋的激活。因此,自上而下的調(diào)節(jié)被認(rèn)為改變了自下而上的語(yǔ)音處理。然而我們尚不清楚這些自頂向下的調(diào)制是否以及以何種方式改變了聲音內(nèi)容的神經(jīng)表征(以下簡(jiǎn)稱語(yǔ)音編碼)。這些變化發(fā)生在皮層處理通路的什么部位也不清楚。

因此,來(lái)自日內(nèi)瓦大學(xué)的研究在Nature Human Behaviour上發(fā)文討論了這一問(wèn)題。在該研究中,作者使用基于模型的功能磁共振成像,在基本聲學(xué)特征(頻譜時(shí)變)的表示水平上,檢查聽(tīng)覺(jué)皮層機(jī)制對(duì)語(yǔ)音編碼的情境依賴性。作者發(fā)現(xiàn)使用相同的語(yǔ)音執(zhí)行不同的任務(wù)會(huì)導(dǎo)致刺激中的大腦對(duì)任務(wù)績(jī)效相關(guān)的聲學(xué)特征的神經(jīng)處理的增強(qiáng),這種自上而下的增強(qiáng)機(jī)制在聽(tīng)覺(jué)感知的早期階段就已能觀察到。

 

前言:

根據(jù)先前在動(dòng)物和人類中的研究,學(xué)者們已經(jīng)提出皮質(zhì)的聲音編碼可以通過(guò)一組調(diào)制濾波器來(lái)表征。在耳蝸中的初始頻率分解之后,聲音在皮層下(丘腦)和皮層處理過(guò)程中就其聯(lián)合頻譜和時(shí)間調(diào)制內(nèi)容進(jìn)行分解。這種分解提供了聲音的多分辨率表示。有證據(jù)表明,語(yǔ)音信息是在人類顳上回(STG)的多維空間中編碼的。對(duì)動(dòng)物的多項(xiàng)研究表明,主要聽(tīng)覺(jué)區(qū)域的神經(jīng)處理的時(shí)間敏感性很靈活,可以動(dòng)態(tài)適應(yīng)任務(wù)需求,任務(wù)難度或聯(lián)想學(xué)習(xí)。這些自上而下對(duì)早期聽(tīng)覺(jué)處理的影響在人腦中發(fā)生的程度仍有待探索。在人類中,已經(jīng)發(fā)現(xiàn)了對(duì)語(yǔ)音神經(jīng)處理的自上而下的影響,但基本是在較高處理級(jí)別的區(qū)域中發(fā)現(xiàn)的,例如下頂葉或額葉皮層或位于后顳上回(postSTG)和顳上溝的(聽(tīng)覺(jué))關(guān)聯(lián)區(qū)域中。這些針對(duì)人類的研究表明,語(yǔ)音處理的神經(jīng)機(jī)制積極地適應(yīng)任務(wù)需求、注意力和先前的語(yǔ)義知識(shí)。

在先前的兩項(xiàng)研究中,研究者們發(fā)現(xiàn)自上而下的調(diào)制作用會(huì)依據(jù)被試在先前任務(wù)中的信息去調(diào)節(jié)聲音信息在顳葉內(nèi)編碼的特定方面。這些聲音編碼的動(dòng)態(tài)變化主要發(fā)生在初級(jí)聽(tīng)覺(jué)皮層的后顳上回、顳上溝區(qū)域或者初級(jí)聽(tīng)覺(jué)皮層上方的額下回區(qū)域。

然而,語(yǔ)音處理的交互模型預(yù)測(cè),自上而下的機(jī)制甚至影響早期聽(tīng)覺(jué)詞匯前的處理水平,使早期處理能夠調(diào)整或放大與語(yǔ)音處理至關(guān)重要的聲學(xué)特征。根據(jù)此類模型,可以預(yù)期,任務(wù)需求調(diào)節(jié)已經(jīng)存在于早期聽(tīng)覺(jué)皮層區(qū)域(即顳橫回(HG)和顳橫溝(HS))的語(yǔ)音編碼。然而,目前仍舊沒(méi)有一致的證據(jù)表明,在主要聽(tīng)覺(jué)區(qū)域發(fā)現(xiàn)任務(wù)依賴導(dǎo)致的自上而下的調(diào)節(jié)所引起的激活。例如,對(duì)語(yǔ)音刺激執(zhí)行語(yǔ)義分類任務(wù)對(duì)HG的活動(dòng)影響最小。相比之下,其他使用模式分類技術(shù)的研究表明,在早期聽(tīng)覺(jué)區(qū)域中,語(yǔ)音喚起的反應(yīng)模式受任務(wù)需求、感知和學(xué)習(xí)的調(diào)節(jié)。然而,這些后續(xù)的研究都沒(méi)有將這些觀察結(jié)果與語(yǔ)音輸入的特定特征處理聯(lián)系起來(lái)。

基于模型的功能性磁共振成像(fMRI)分析的最新發(fā)展可以使我們現(xiàn)在能夠?qū)⒖臻g分布的神經(jīng)聲音表征與任務(wù)要求下的特定聲學(xué)特征聯(lián)系起來(lái)。

因此,在本研究中,作者使用基于模型的功能磁共振成像來(lái)探究語(yǔ)境是如何通過(guò)人類聽(tīng)覺(jué)皮層調(diào)節(jié)語(yǔ)言編碼的。具體來(lái)說(shuō),作者研究了相同語(yǔ)音的神經(jīng)編碼是如何隨著語(yǔ)音中不同聲學(xué)特征的優(yōu)先處理而變化的。在高分辨率fMRI測(cè)量中,被試在相同的語(yǔ)音刺激(與法語(yǔ)音韻學(xué)相似但沒(méi)有意義的假話)背景下執(zhí)行語(yǔ)音識(shí)別(識(shí)別用于停止的輔音)或副語(yǔ)言信息識(shí)別(識(shí)別說(shuō)話人)任務(wù)。然后,作者使用基于模型的解碼方法來(lái)檢測(cè)大腦在三個(gè)聲學(xué)維度上編碼的聲學(xué)能力頻率、頻譜調(diào)制和時(shí)間調(diào)制。這些聲學(xué)維度對(duì)于描述語(yǔ)音信號(hào)中語(yǔ)言和副語(yǔ)言信息的特定方面具有不同的重要性。例如,對(duì)爆破輔音(/p/、/t//k/)具有突然的頻譜寬度爆發(fā),而語(yǔ)音處理或說(shuō)話人識(shí)別則更依賴于精細(xì)的頻譜細(xì)節(jié)和音高處理。

因此,為準(zhǔn)確執(zhí)行這些任務(wù),被試需要專注于在聲音中的不同類型的聲學(xué)信息。因此,作者希望通過(guò)這種方法將得到反映聽(tīng)覺(jué)輸入動(dòng)態(tài)編碼的具體過(guò)程。具體而言,基于先前對(duì)語(yǔ)音不同方面的神經(jīng)處理的發(fā)現(xiàn),作者假設(shè)辨別說(shuō)話者的任務(wù)將導(dǎo)致較高頻譜調(diào)制的優(yōu)先編碼,而音素任務(wù)將導(dǎo)致較低頻譜調(diào)制和更快的時(shí)間調(diào)制的優(yōu)先編碼。此外,作者使用基于ROI的分析,研究了跨聽(tīng)覺(jué)不同區(qū)域的神經(jīng)編碼的任務(wù)驅(qū)動(dòng)調(diào)制,并評(píng)估了在早期聽(tīng)覺(jué)區(qū)域是否會(huì)發(fā)生這種調(diào)制。              

 

研究方法

被試:

十三名右利手、母語(yǔ)為法語(yǔ)的成年人(6名婦女;平均年齡(s.d.= 23歲(4歲))參加了這項(xiàng)研究。自我報(bào)告聽(tīng)覺(jué)正常和閱讀能力正常,沒(méi)有從事音樂(lè)家或與音樂(lè)相關(guān)的研究。研究的批準(zhǔn)是由瑞士沃州的州倫理委員會(huì)批準(zhǔn)的。所有被試在研究前均已簽署知情同意書,并為其參與獲得金錢補(bǔ)償。沒(méi)有使用統(tǒng)計(jì)方法來(lái)確定樣本量,但是我們的樣本量大于先前研究的報(bào)道。其他四名被試最初被包括在這項(xiàng)研究中,但后來(lái)被排除在外,因?yàn)閮蓚€(gè)沒(méi)有完成完整的實(shí)驗(yàn),另外兩個(gè)在fMRI采集過(guò)程中表現(xiàn)出過(guò)度的頭部運(yùn)動(dòng)(也就是說(shuō)本來(lái)參加實(shí)驗(yàn)的人是17個(gè))。

任務(wù)和刺激:

語(yǔ)音刺激包括120個(gè)假詞,這些假詞符合法語(yǔ)的語(yǔ)音標(biāo)準(zhǔn),但沒(méi)有意義。假詞是從預(yù)選的法語(yǔ)單詞列表中創(chuàng)建的,該單詞列表是使用Lexique心理語(yǔ)言工具箱從Lexique單詞數(shù)據(jù)庫(kù)(http://www.lexique.org)中檢索的,該工具包在遵循法語(yǔ)注音規(guī)則的情況下有選擇地對(duì)單詞中的字母進(jìn)行打亂。刺激的持續(xù)時(shí)間為1,000毫秒至1,200毫秒,采樣頻率為16 kHz。刺激的長(zhǎng)度范圍為35個(gè)音節(jié),平均為4個(gè)音節(jié)。

被試執(zhí)行了一個(gè)說(shuō)話人識(shí)別任務(wù)(三個(gè)目標(biāo)說(shuō)話者)和一個(gè)音素識(shí)別(三個(gè)目標(biāo)停止輔音; / p /,/ t // k /)任務(wù),例如,向被試展示了/gab?atad?/這個(gè)音節(jié),在說(shuō)話人識(shí)別任務(wù)中,他們需要確定相應(yīng)的說(shuō)話人(在此示例中為說(shuō)話人2),而在音素識(shí)別任務(wù)中,他們指出了刺激中的目標(biāo)音位(在本示例中為/ t /)。所有目標(biāo)(特定說(shuō)話者或特定音素)均等地分布在整個(gè)刺激中( n =每個(gè)目標(biāo)40),并且與任務(wù)無(wú)關(guān)的目標(biāo)在與任務(wù)相關(guān)的目標(biāo)之間保持平衡。

例如,說(shuō)話者1說(shuō)出了包含/ t / target的所有假詞中的13個(gè),說(shuō)話者2說(shuō)出了14個(gè)假詞,說(shuō)話者3說(shuō)了13個(gè)(同理類推,作者一共有三個(gè)音素,三個(gè)說(shuō)話人,這樣會(huì)形成每個(gè)人說(shuō)包含這三個(gè)目標(biāo)音素的最終組合都是141313)。

所有三個(gè)假詞只包含了三個(gè)目標(biāo)中的一個(gè)音素,并且這些目標(biāo)在每次刺激中發(fā)生一次或兩次(發(fā)生的可能性相等)。此外,有25%的單詞以目標(biāo)音素開頭。刺激由一位女性專業(yè)語(yǔ)音講師講出,并且為了創(chuàng)造出不同說(shuō)話者的感覺(jué),使用基于Audacity中實(shí)現(xiàn)的基于波形相似度(WSOLA)的重疊疊加技術(shù)來(lái)控制所記錄假詞的基本頻率(www.audacityteam.org)。由于時(shí)間延長(zhǎng)和重采樣的結(jié)合,作者使用的音高移位算法最小地改變了信號(hào)的速度。

為了創(chuàng)建與說(shuō)話者1相對(duì)應(yīng)的刺激,刺激的隨機(jī)子集(三分之一)的基本頻率相對(duì)于原始值下移了7.5%。為了產(chǎn)生對(duì)應(yīng)于說(shuō)話者2的刺激,將另外三分之一的項(xiàng)目的基頻下移0.01%,并且為了產(chǎn)生對(duì)應(yīng)于說(shuō)話者3的刺激,將其余項(xiàng)目的基頻上移至下一級(jí)。與原始刺激相比,說(shuō)話者2的基本頻率變化聽(tīng)不到。這些音調(diào)變化的刺激的自然性在先前的實(shí)驗(yàn)中進(jìn)行了研究,通過(guò)使用不同的被試驗(yàn)證了創(chuàng)建不同說(shuō)話者的感知的成功程度。

功能磁共振成像測(cè)量

功能磁共振成像實(shí)驗(yàn)包括兩個(gè)session,每個(gè)session間隔長(zhǎng)達(dá)一周。在第一次實(shí)驗(yàn)之前,被試熟悉了兩個(gè)識(shí)別任務(wù),以確保他們正確理解和執(zhí)行了任務(wù)。在這兩個(gè)fMRI實(shí)驗(yàn)中,被試執(zhí)行了兩個(gè)識(shí)別任務(wù)。

被試通過(guò)雙手按下按鈕來(lái)報(bào)告他們的反應(yīng)。他們只需要對(duì)暗示試驗(yàn)(試驗(yàn)的13%)做出反應(yīng),這些刺激信號(hào)是通過(guò)刺激后呈現(xiàn)的視覺(jué)提示來(lái)表示的(暗示試驗(yàn)不包括在腦成像數(shù)據(jù)分析中)。為了激發(fā)任務(wù)投入,如果被試在掃描過(guò)程中的任務(wù)績(jī)效達(dá)到或高于期望的績(jī)效水平(正確率為75%),則可以在兩次實(shí)驗(yàn)結(jié)束時(shí)獲得額外的獎(jiǎng)金。所有被試都實(shí)現(xiàn)了這一目標(biāo)。使用Sensimetricswww.sens.com)的S14fMRI兼容耳機(jī)以舒適的聆聽(tīng)水平雙聲道呈現(xiàn)聲音,并調(diào)節(jié)聲音強(qiáng)度以使其與被試感知的響度相等。

刺激分為四個(gè)不重疊的組(每組n = 30),每個(gè)組包含不同目標(biāo)的平衡子集。 四組中的每組均在一個(gè)fMRI掃描中顯示,并在下一個(gè)掃描中重復(fù)。在一個(gè)環(huán)節(jié)中,被試根據(jù)特定刺激執(zhí)行說(shuō)話者辨別任務(wù),然后在另一個(gè)掃描中執(zhí)行音素辨別任務(wù)。

每個(gè)刺激都出現(xiàn)了3次,并且刺激的順序是偽隨機(jī)的,因此在連續(xù)的試驗(yàn)中沒(méi)有與任務(wù)相關(guān)的目標(biāo)被重復(fù),并且無(wú)關(guān)的目標(biāo)也沒(méi)有連續(xù)重復(fù)兩次。一次實(shí)驗(yàn)總共包含八個(gè)run。每個(gè)run持續(xù)了大約8分鐘,包括60次試驗(yàn)。被試要求被試在13%的試驗(yàn)中做出回應(yīng),而在12%的試驗(yàn)中,沒(méi)有聲音出現(xiàn)(無(wú)效試驗(yàn))以增加刺激間隔。

MRI參數(shù)

使用7T西門子設(shè)備、32通道RF頭陣列線圈進(jìn)行腦成像??焖偈录嚓P(guān)設(shè)計(jì),35層重復(fù)時(shí)間(TR= 2,600 ms;采集時(shí)間(TA= 1,250 ms,回波時(shí)間(TE= 20 ms,體素大小= 1.5×1.5×1.5 mm 3。作者采用了聽(tīng)覺(jué)實(shí)驗(yàn)中較為常見(jiàn)的長(zhǎng)TR設(shè)計(jì),在每個(gè)全腦掃描之間有1500的間隔,這個(gè)期間聽(tīng)覺(jué)刺激出現(xiàn),這樣可以盡可能的避免核磁掃描帶來(lái)的噪聲影響。掃描過(guò)程中采取了jitter的方法來(lái)隨機(jī)間隔刺激,分別有兩個(gè),三個(gè)或四個(gè)TR的隨機(jī)刺激間隔。最小的刺激間隔為5,100毫秒。

采集了T1結(jié)構(gòu)像用于配準(zhǔn),采集了feildmap圖用于場(chǎng)強(qiáng)校正。數(shù)據(jù)預(yù)處理使用BrainVoyagerBrainVoyager QXBrain Innovation)分析功能和解剖像(T1)。Brain Voyager是一款商業(yè)的且成熟的核磁數(shù)據(jù)處理軟件,每個(gè)模態(tài)的都有,并且基于windows的界面化處理。

單變量組對(duì)比的fMRI分析

單變量分析基于在被試的皮質(zhì)表面(與基于voxel的分析不同,現(xiàn)在基于皮質(zhì)映射的方法可以將時(shí)間序列信息映射在對(duì)應(yīng)皮層的皮質(zhì)表面,進(jìn)行基于surface的分析,但是單變量分析的對(duì)象仍舊是時(shí)間序列)重建中重新采樣的功能時(shí)間序列。作者建立的GLM模型中確定了兩個(gè)contrast,分別是音素識(shí)別的條件和說(shuō)話人識(shí)別的條件。

 

ROI的選取

作者手動(dòng)標(biāo)記了以下六個(gè)聽(tīng)覺(jué)ROIHG(赫氏回),PT(顳平面),PP(顳極),antSTG(顳上回前部),midSTG(顳上回中部)和postSTG(顳上回后部),具體ROI的皮質(zhì)概率圖見(jiàn)圖3。作者在文中很具體的描述了不同ROI的解剖位置和選擇方法,感興趣的朋友可閱讀原文method部分。

文中的數(shù)據(jù)分析與結(jié)果部分基本重合,因此集中在結(jié)果部分一起解釋。



結(jié)果

識(shí)別任務(wù)和行為表現(xiàn)

fMRI掃描儀(7T)中,被試對(duì)相同的假詞執(zhí)行了音素和說(shuō)話者識(shí)別任務(wù)(請(qǐng)參見(jiàn)方法中的任務(wù)和刺激部分)。在說(shuō)話者識(shí)別任務(wù)中,要求被試辨別聽(tīng)到的假詞是三個(gè)說(shuō)話者中的哪一個(gè)說(shuō)的,而在音素識(shí)別任務(wù)中,被試聽(tīng)到了相同的假詞,但被要求指出他們是否包含/ p /,/ t // k /聲音。

假詞用于減少詞匯信息用于預(yù)測(cè)目標(biāo)聲音的存在并促進(jìn)音素任務(wù)期間對(duì)聽(tīng)覺(jué)輸入的依賴。為了在被試執(zhí)行任務(wù)期間將聲學(xué)焦點(diǎn)特別導(dǎo)向頻譜信息,作者在本研究中未使用實(shí)際的人來(lái)說(shuō)話。而是通過(guò)操縱一位女性說(shuō)話者記錄的假詞的基本頻率來(lái)創(chuàng)建三種不同說(shuō)話者,從而能夠以特定的頻譜信息來(lái)衡量聲學(xué)特征。

被試對(duì)兩項(xiàng)任務(wù)的識(shí)別成功率均高于閾值(75%),說(shuō)話人辨別任務(wù):平均值±標(biāo)準(zhǔn)誤差 = 88.8±2%,音素任務(wù)的平均±均值標(biāo)準(zhǔn)誤差 = 96.5±0.9%);然而,與不同的音素相比,被試在識(shí)別不同的說(shuō)話人時(shí)更加困難(t 12 = ?4.193,P = 0.001(雙尾),差異(平均值±均值標(biāo)準(zhǔn)誤差)?7.7±1.8%,95%置信區(qū)間(CI= -11.7%至-3.71%)。在每個(gè)任務(wù)中,對(duì)不同的刺激對(duì)象的反應(yīng)沒(méi)有顯著差異(對(duì)不同音素或者不同說(shuō)話人)。 

基于刺激構(gòu)建的音素和說(shuō)話人的調(diào)制模型

這項(xiàng)研究的目的是檢驗(yàn)當(dāng)不同的任務(wù)在相同的語(yǔ)音播放中執(zhí)行時(shí),相同的語(yǔ)音是否在聽(tīng)覺(jué)皮層中以不同的方式編碼。因此,作者需要確定材料中的聲音其本身的哪些聲學(xué)方面對(duì)執(zhí)行各自的任務(wù)最有幫助。為了做到這一點(diǎn),作者使用了一個(gè)模擬皮層聲音表征的模型來(lái)模擬作者設(shè)計(jì)的聲音刺激。這個(gè)模型由三個(gè)維度組成,包括聲音特征的頻率(圖1中的單位f,)、頻譜調(diào)制(spectral modulation1中的單位Ω)以及時(shí)間調(diào)制(temporal modulation,圖1中的單位ω)。通過(guò)這個(gè)三個(gè)維度,可以唯一的表示每個(gè)說(shuō)話人或者每個(gè)具體音素,如圖1中的圖所示,其中a里面上面標(biāo)著speaker的是三個(gè)模擬的說(shuō)話人的模型表征,其中前三個(gè)圖是在通過(guò)信號(hào)變換后,在頻閾上的波譜特征的變化,后三個(gè)是在通過(guò)短時(shí)傅里葉變換后的在頻域上的時(shí)間信息的變化。在下面的6張圖中表示了三個(gè)音素的對(duì)應(yīng)的頻域上的波譜特征的變化和時(shí)間信息的變化。

b圖中展示了標(biāo)準(zhǔn)化后的聲學(xué)特征在頻譜調(diào)制和時(shí)間調(diào)制上所展現(xiàn)出來(lái)的不同的分辨能力。從b圖的第一張圖中可以看出,在中心頻率為0.8 kHz2.9 kHz以上的高頻譜調(diào)制)下,不同說(shuō)話者的調(diào)制曲線的聲學(xué)變化最為顯著。從b圖的第二張圖可以看出:不同音素的聲學(xué)特征主要表現(xiàn)在以快速的時(shí)間調(diào)制速率(>7.8Hz上下)和較寬的頻譜調(diào)制頻率(中心頻率范圍較寬)下的聲學(xué)變化,主要表現(xiàn)在0.6 kHz以上的頻率上。

從以上的分析可以看出,說(shuō)話人的聲學(xué)特征變化集中在頻譜調(diào)制維度,而音素的聲學(xué)特征變化集中在較廣頻率范圍的時(shí)間調(diào)制維度上。因此,作者預(yù)期在具體的任務(wù)中對(duì)神經(jīng)解碼的分析應(yīng)該與其聲學(xué)特征的表征是一致的。

1  三個(gè)說(shuō)話人和三個(gè)音素在三個(gè)不同維度上的組合表征,a為未標(biāo)準(zhǔn)化的數(shù)據(jù),b為標(biāo)準(zhǔn)化后的數(shù)據(jù)

 

聽(tīng)覺(jué)皮層對(duì)說(shuō)話者任務(wù)和音素辨別任務(wù)的激活響應(yīng)

聽(tīng)覺(jué)語(yǔ)音在雙側(cè)顳上皮層廣泛區(qū)域引起顯著的BOLD反應(yīng),包括HG、HS、顳平面(PT)、顳極(PP)STG和顳上溝(STS);2)。雖然作者的本次研究并不關(guān)注單變量分析中兩種任務(wù)的激活差異,但是全腦單變量分析的結(jié)果仍舊發(fā)現(xiàn),說(shuō)話者辨別任務(wù)相比于音素辨別任務(wù)在右側(cè)顳極出現(xiàn)了更強(qiáng)的激活。但是音素辨別任務(wù)并未在任何一個(gè)腦區(qū)表現(xiàn)出比說(shuō)話者辨別任務(wù)更強(qiáng)的激活。這說(shuō)明,只用簡(jiǎn)單的單變量分析雖然也能看到一點(diǎn)兒由于任務(wù)不同所帶來(lái)的對(duì)相同聲音刺激表現(xiàn)出的腦區(qū)激活的不同,但是這種對(duì)比顯然不能提供更多的信息。

語(yǔ)音任務(wù)引起的激活(這里并未對(duì)比兩項(xiàng)任務(wù)的激活差異)

 

感興趣聽(tīng)覺(jué)區(qū)域中語(yǔ)音的神經(jīng)編碼

通過(guò)對(duì)以往研究的分析和作者的語(yǔ)音激活的結(jié)果,作者確定了6個(gè)ROI,并且映射于每個(gè)被試的皮質(zhì)表面重建中,分別是:HGPT,PP,前顳上回(antSTG),中顳上回(midSTG)和后顳上回(圖3;請(qǐng)參閱方法部分中的解剖ROI的描述部分劃定標(biāo)準(zhǔn))。

在這里,作者使用每個(gè)ROI和每個(gè)半球,分別訓(xùn)練一個(gè)線性解碼器,根據(jù)聲音表示模型的定義,重構(gòu)每個(gè)聲音的聲學(xué)特征。對(duì)聲音表征模型的所有特征的組重建精度是通過(guò)一個(gè)特定于任務(wù)的調(diào)制傳遞函數(shù)(MTF)來(lái)完成的。在這里,我們來(lái)了解下什么是MTF,MTF全稱為modulation transfer function,翻譯為調(diào)制傳遞函數(shù)。

該函數(shù)是描繪不同空間頻率下成像系統(tǒng)細(xì)節(jié)分辨力的函數(shù),其主要考查影像中信號(hào)的調(diào)制度相比于物體(對(duì)應(yīng)于理想成像系統(tǒng))中信號(hào)的調(diào)制度的降低程度。1962年國(guó)際放射界“模仿”了通訊工程學(xué)信息論的“頻率調(diào)制”概念,將其以時(shí)間頻率為自變量的頻率響應(yīng)函數(shù),換成以空間頻率(lp/mm)為變量的調(diào)制傳遞函數(shù)。所謂調(diào)制傳遞函數(shù)(MTF)即“響應(yīng)函數(shù)”,可以簡(jiǎn)單理解為記錄(輸出)信息量與有效(輸入)信息量之比。在這里,通過(guò)對(duì)fMRI12個(gè)ROI的時(shí)間序列的信息來(lái)衡量如何表征作者在上一步分析中通過(guò)頻率、頻譜調(diào)制和時(shí)間調(diào)制表征的不同的聲學(xué)特征。作者這里利用的線性解碼器其實(shí)是使用機(jī)器學(xué)習(xí)的方法來(lái)重建一個(gè)MTF函數(shù),用這個(gè)函數(shù)來(lái)表征這些ROI是如何特定的表征一個(gè)作者之前所建立的由三個(gè)特征所表征的不同的聲音的(三個(gè)不同說(shuō)話人和三個(gè)不同音素)。

作者對(duì)表示每個(gè)不同聲學(xué)特征的ROIMTF進(jìn)行了統(tǒng)計(jì)校正,然后獲得每個(gè)MTF的重建精度的平均值作為后續(xù)統(tǒng)計(jì)檢驗(yàn)的指標(biāo)。在這兩項(xiàng)任務(wù)中,作者指出所有刺激的聲音特征可以被準(zhǔn)確地重建為由兩個(gè)維度所表征的數(shù)據(jù)——頻譜調(diào)制和時(shí)間調(diào)制維度(圖4)。然而,在速度更快的時(shí)間調(diào)制(>10Hz上下)和中心頻率在0.5 kHz1.7kHz之間的重構(gòu)通常精度更高。

結(jié)果表明,六個(gè)ROI中有五個(gè)ROIMTF中的任務(wù)有所不同。在說(shuō)話者辨別任務(wù)期間,在以下ROIMTF中,特定說(shuō)話人聲音特征的重建精度更高:雙側(cè)HG,PPpostSTG,右PT和左中顳上回。在音素任務(wù)中,發(fā)現(xiàn)雙側(cè)后STG和右中STGMTF內(nèi)的重建精度更高。

3  ROIs概率圖

注釋:ROI概率圖,每個(gè)ROI用顏色編碼,顯示了覆蓋在LHRH膨脹的曲面重建上的被試之間手動(dòng)標(biāo)記的ROI。特定于ROI的色標(biāo)指示所有被試中各個(gè)ROI的重疊百分比(n = 13)。


4  說(shuō)話人和音素任務(wù)期間MTF函數(shù)重建的聲音表征

注釋: a,b,顯示了針對(duì)每個(gè)ROI在說(shuō)話者(a)和音素任務(wù)(b)期間聲音特征的重建精度的二維調(diào)制曲線。顏色代碼表示預(yù)測(cè)的聲能與聲音特征的實(shí)際能之間的組平均值r。

a,在說(shuō)話者辨別任務(wù)期間,發(fā)現(xiàn)峰值重構(gòu)精度在0.5 kHz1.7 kHz之間實(shí)現(xiàn)更快的時(shí)間調(diào)制(上下> 10> Hz)和更高的頻譜調(diào)制(每倍頻程4個(gè)周期)。 

b,在音素任務(wù)期間,發(fā)現(xiàn)中心頻率在0.4 kHz1.0 kHz之間的快速時(shí)間調(diào)制(上下> 10> Hz)具有峰值重建精度。所有相關(guān)性均經(jīng)過(guò)統(tǒng)計(jì)學(xué)驗(yàn)證。

進(jìn)一步的分析結(jié)果表明,對(duì)于每倍頻程1.1個(gè)周期以上的頻譜調(diào)制,說(shuō)話者任務(wù)期間的重建精度明顯高于音素任務(wù)(Ω= 1.7t 12 = 3.548P = 0.004;Ω= 2.6t 12 = 4.225,P = 0.001;Ω= 4.0t 12 = 5.092P <0.001;所有測(cè)試均經(jīng)過(guò)Bonferroni校正后的測(cè)試數(shù)量;6)。

相比之下,在最低音譜范圍內(nèi),音素任務(wù)期間的重建精度顯著高于說(shuō)話者任務(wù)期間的重建精度Ω= 0.5t 12 = -6.387,P <0.001;圖6)。時(shí)間調(diào)制的結(jié)果表明,兩個(gè)任務(wù)之間的精度在時(shí)間調(diào)制重建速率較高的情況下重疊,而在時(shí)間調(diào)制重建速率較慢的情況下,說(shuō)話人任務(wù)的準(zhǔn)確度明顯高于音素任務(wù)(ω= 1.0t 12 = 4.932 0.001;ω 1.2t 12  4.960,0.001;ω 2.8t 12  5.361,0.001。ω= 3.4t 12 = 4.725P <0.001;圖6)。這些差異表明,與更廣泛的語(yǔ)音編碼相比,快速時(shí)間調(diào)制的編碼更特定于音素任務(wù)。

最后,作者檢查了在任務(wù)中觀察到的聲音的神經(jīng)編碼中的差異是否顯示出與任務(wù)性能相關(guān)的聲音特征的放大。使用多種聲音功能分析目標(biāo)可分離性。對(duì)于每個(gè)任務(wù),對(duì)所有正重構(gòu)的聲音特征進(jìn)行分類,并分別對(duì)兩個(gè)半球進(jìn)行分類。

結(jié)果發(fā)現(xiàn)了目標(biāo)類別和任務(wù)之間的交互效應(yīng)(F 1,12 = 17.714; P = 0.001),以及目標(biāo)類別,任務(wù)和ROI之間的三交互效應(yīng)(F 5,8 = 6.516; P = 0.011)。當(dāng)分別測(cè)試每個(gè)ROI時(shí),僅在前顳上回中發(fā)現(xiàn)了該任務(wù)的主效應(yīng),并且相比音素任務(wù),對(duì)說(shuō)話人判別任務(wù)具有更高的分類準(zhǔn)確性F 1,12 = 5.869,P = 0.032;圖7b)。

沒(méi)有在其他任何ROI中發(fā)現(xiàn)任務(wù)的這種影響(HGF 1,12 = 0.690,P = 0.422; PTF 1,12 = 0.915,P = 0.358; PPF 1,12 = 0.015P = 0.904; 中顳上回:F 1,12 = 0.116,P = 0.739;后顳上回:F 1,12 = 2.162P = 0.167;7b.

此外,作者還發(fā)現(xiàn)目標(biāo)類別與以下ROIMTF的識(shí)別精度相關(guān):HG,PT,中顳上回和后顳上回(HGF 1,12 = 26.078,P <0.001; PTF 1,12 = 7.638,P = 0.017; 中顳上回:F 1,12 = 5.077,P = 0.044;后顳上回:F 1,12 = 15.161,P = 0.002)。在以上這些ROI中,從fMRI信號(hào)中重建的聲音特征對(duì)說(shuō)話人任務(wù)分類的準(zhǔn)確度高于音素任務(wù)。在音素分類中發(fā)現(xiàn)了相反的情況(圖6c)。這些結(jié)果表明,聲音的聲學(xué)表示隨任務(wù)要求而變化。

通過(guò)MTF重建的不同ROI的聲學(xué)特征的表征模型的統(tǒng)計(jì)結(jié)果

注釋:a,顯示出任務(wù)調(diào)節(jié)效果的ROIs被疊加在LHRH膨脹的組表面重建上。

通過(guò)MTF重建的聲學(xué)特征模型在頻譜調(diào)制和時(shí)間調(diào)制上表現(xiàn)出的任務(wù)分離能力

注釋:a,b,說(shuō)話人辨別任務(wù)(藍(lán)色)和音素辨別任務(wù)(紅色)在頻譜調(diào)制(a)和時(shí)間調(diào)制上的變化。陰影區(qū)域代表SE。從圖中可以,說(shuō)話者任務(wù)期間,每倍頻程1.7、2.64個(gè)周期的頻譜調(diào)制的重構(gòu)精度顯著高于音素任務(wù),而在音位辨別任務(wù)中,每倍頻程0.5個(gè)周期的頻譜調(diào)制的重構(gòu)精度較高。b的時(shí)間調(diào)制模型表明,在音素辨別任務(wù)中,重建精度在較高的時(shí)間調(diào)制速率下(非顯著)最高,而在說(shuō)話者任務(wù)期間的重建精度在1.0 Hz,1.2 Hz的較慢和中等調(diào)制速率下較高,2.8 Hz3.4 Hz。

通過(guò)MTF函數(shù)得到的重建精度在不同ROI對(duì)不同任務(wù)的預(yù)測(cè)能力

      

總結(jié):

總之作者的數(shù)據(jù)闡明了聽(tīng)覺(jué)處理過(guò)程中自上而下的預(yù)測(cè)能力對(duì)聽(tīng)覺(jué)皮質(zhì)語(yǔ)音感知調(diào)節(jié)的神經(jīng)計(jì)算機(jī)制,提供了人腦如何在聽(tīng)覺(jué)環(huán)境中動(dòng)態(tài)的處理語(yǔ)音信息的新的見(jiàn)解。作者發(fā)現(xiàn),在相同的語(yǔ)音環(huán)境中,不同任務(wù)的表現(xiàn)會(huì)導(dǎo)致與任務(wù)表現(xiàn)密切相關(guān)的聽(tīng)覺(jué)特征的神經(jīng)增強(qiáng)。這些任務(wù)效應(yīng)在聽(tīng)覺(jué)皮層處理的早期階段就已經(jīng)出現(xiàn),這說(shuō)明自上而下的控制機(jī)制對(duì)聽(tīng)覺(jué)感官靈活地處理語(yǔ)音信息是至關(guān)重要的。該研究結(jié)果為人類大腦中聽(tīng)覺(jué)編碼的靈活性提供了有意義的見(jiàn)解。


原文:Cortical encoding of speech enhances task-relevant acoustic information


微信掃碼或者長(zhǎng)按選擇識(shí)別關(guān)注思影

    

如對(duì)思影課程感興趣也可微信號(hào)siyingyxf或18983979082咨詢。覺(jué)得有幫助,給個(gè)轉(zhuǎn)發(fā),或許身邊的朋友正需要。請(qǐng)直接點(diǎn)擊下文文字即可瀏覽思影科技其他課程及數(shù)據(jù)處理服務(wù),歡迎報(bào)名與咨詢,目前全部課程均開放報(bào)名,報(bào)名后我們會(huì)第一時(shí)間聯(lián)系,并保留名額。


更新通知:第二十八屆磁共振腦影像基礎(chǔ)班(重慶,已確定)



更新通知:第十屆腦影像機(jī)器學(xué)習(xí)班(已確定)


更新通知:第十二屆磁共振彌散張量成像數(shù)據(jù)處理班(已確定)



第六屆任務(wù)態(tài)fMRI專題班(預(yù)報(bào)名,南京)






眼動(dòng)數(shù)據(jù)處理班(預(yù)報(bào)名)

數(shù)據(jù)處理業(yè)務(wù)介紹:



招聘及產(chǎn)品: