數(shù)據(jù)非依賴性采集(DIA)是近幾年來(lái)興起的一種新的質(zhì)譜數(shù)據(jù)采集方式。不同于傳統(tǒng)的數(shù)據(jù)依賴性采集(DDA)策略,DIA將整個(gè)掃描范圍劃分為若干個(gè)可變窗口,將每個(gè)窗口內(nèi)的所有母離子進(jìn)行碎裂,采集所有母離子的碎片離子,從而完整地獲得樣本中所有母離子的全部碎片信息?;贒IA的定量蛋白質(zhì)組具有通量高、穩(wěn)定、準(zhǔn)確性好等優(yōu)點(diǎn),對(duì)于大規(guī)模蛋白質(zhì)組的定量分析具有顯著優(yōu)勢(shì)。然而,DIA數(shù)據(jù)異常復(fù)雜,通常需要對(duì)同一樣本預(yù)先利用DDA實(shí)驗(yàn)構(gòu)建數(shù)字譜圖庫(kù),使得DIA的數(shù)據(jù)挖掘受限于DDA實(shí)驗(yàn)。
近日,我系喬亮研究員團(tuán)隊(duì)與合作者利用深度學(xué)習(xí)技術(shù)從肽段或蛋白質(zhì)序列構(gòu)建預(yù)測(cè)譜圖庫(kù),實(shí)現(xiàn)了DIA蛋白質(zhì)組數(shù)據(jù)的直接分析。論文“In silico spectral libraries by deep learning facilitate data-independent acquisition proteomics”在線發(fā)表于《Nature Communications》2020, 11, 146。論文的共同第一作者是復(fù)旦大學(xué)化學(xué)系17級(jí)直博生楊奕和復(fù)旦大學(xué)生物醫(yī)學(xué)研究院劉曉慧老師,通訊作者是復(fù)旦大學(xué)化學(xué)系喬亮研究員。
研究人員設(shè)計(jì)了基于卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)的深度神經(jīng)網(wǎng)絡(luò)模型來(lái)預(yù)測(cè)肽段的二級(jí)質(zhì)譜圖(MS/MS)和歸一化保留時(shí)間(iRT),由DDA鑒定得到的肽段列表生成DIA分析所需的譜圖庫(kù),并在HeLa細(xì)胞數(shù)據(jù)集上將DeepDIA與另外一種現(xiàn)有的基于深度學(xué)習(xí)的譜圖預(yù)測(cè)工具Prosit(Nature Methods 2019, 16, 509–518)進(jìn)行了比較測(cè)試。結(jié)果表明,與使用通用模型來(lái)生成譜圖庫(kù)相比,使用DeepDIA構(gòu)建專用于特定儀器的模型預(yù)測(cè)生成的譜圖庫(kù)質(zhì)量更好,DIA數(shù)據(jù)分析檢測(cè)到的肽段和蛋白數(shù)量更多,重復(fù)性更好,效果接近DDA構(gòu)建的譜圖庫(kù):
研究人員還設(shè)計(jì)了預(yù)測(cè)肽段在質(zhì)譜中的可檢測(cè)性的模型,實(shí)現(xiàn)了由蛋白序列構(gòu)建預(yù)測(cè)譜圖庫(kù)。從SwissProt物種數(shù)據(jù)出發(fā),預(yù)測(cè)蛋白的理論酶切肽段的可檢測(cè)性,篩選可檢測(cè)性分?jǐn)?shù)達(dá)到一定閾值的肽段來(lái)構(gòu)建譜圖庫(kù)。在HeLa細(xì)胞和小鼠組織樣品數(shù)據(jù)集上的測(cè)試結(jié)果表明,與考慮全部理論肽段相比,可檢測(cè)性篩選能降低DIA分析的假陽(yáng)性率并提高蛋白鑒定量。最終實(shí)現(xiàn)了完全不需要DDA實(shí)驗(yàn),從SwissProt蛋白序列數(shù)據(jù)庫(kù)出發(fā)的DIA數(shù)據(jù)直接解析。研究人員還將DeepDIA用于未去高峰度蛋白的血清樣品的DIA數(shù)據(jù)直接分析。與傳統(tǒng)方法相比,DeepDIA檢測(cè)到蛋白的數(shù)量為DDA建庫(kù)的兩倍以上。
本研究中訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)模型所需數(shù)據(jù)量?jī)H為HeLa細(xì)胞樣品分餾DDA的鑒定結(jié)果,通??梢栽谝惶斓臅r(shí)間內(nèi)完成訓(xùn)練數(shù)據(jù)的采集。模型訓(xùn)練只需要普通的臺(tái)式工作站,可以在數(shù)小時(shí)內(nèi)完成。研究人員期望,未來(lái)蛋白質(zhì)組學(xué)實(shí)驗(yàn)室可以利用深度學(xué)習(xí)技術(shù)構(gòu)建專用于每一臺(tái)儀器的模型,將其用于該儀器DIA數(shù)據(jù)的分析,而無(wú)需另外進(jìn)行DDA實(shí)驗(yàn)。同時(shí),深度學(xué)習(xí)也可以在質(zhì)譜組學(xué)大數(shù)據(jù)分析的其他方面發(fā)揮作用。
DeepDIA開(kāi)源代碼:https://github.com/lmsac/DeepDIA
全文鏈接:https://www.nature.com/articles/s41467-019-13866-z
版權(quán)與免責(zé)聲明:本網(wǎng)頁(yè)的內(nèi)容由收集互聯(lián)網(wǎng)上公開(kāi)發(fā)布的信息整理獲得。目的在于傳遞信息及分享,并不意味著贊同其觀點(diǎn)或證實(shí)其真實(shí)性,也不構(gòu)成其他建議。僅提供交流平臺(tái),不為其版權(quán)負(fù)責(zé)。如涉及侵權(quán),請(qǐng)聯(lián)系我們及時(shí)修改或刪除。郵箱:sales@allpeptide.com