近日,國際生物信息學(xué)重要期刊《Briefings in Bioinformatics》在線發(fā)表了上海交通大學(xué)生命科學(xué)技術(shù)學(xué)院魏冬青課題組的研究成果“DTI-MLCD: predicting drug-target interactions using multi-label learning with community detection method”。該論文提出的基于網(wǎng)絡(luò)的標(biāo)簽空間劃分的多標(biāo)簽多分類學(xué)習(xí)方法為藥物-靶標(biāo)相互作用(drug-target interaction , DTI)預(yù)測(cè)問題提供了一種新的思路。該方法為下游新藥設(shè)計(jì)、老藥新用提供了理論和實(shí)踐依據(jù),具有一定的理論意義和重要應(yīng)用價(jià)值。上海交通大學(xué)生命科學(xué)技術(shù)學(xué)院“致遠(yuǎn)榮譽(yù)計(jì)劃”博士生褚晏伊為第一作者,生命科學(xué)技術(shù)學(xué)院長聘教授魏冬青、副研究員熊毅為共同通訊作者,加拿大皇家學(xué)會(huì)院士、美國AAAS院士、加拿大卡爾加里大學(xué)教授Dennis Russell Salahub為論文合作者。
藥物發(fā)現(xiàn)是識(shí)別具有潛在治療作用的新候選化合物的過程,在此過程中,預(yù)測(cè)藥物-靶標(biāo)相互作用研究是一個(gè)必不可少的步驟。蛋白質(zhì)是重要的藥物靶標(biāo),藥物通過與各種靶標(biāo)相互作用在人體中發(fā)揮重要作用,可以增強(qiáng)或抑制其功能,發(fā)揮調(diào)控作用以達(dá)到治療某一種疾病目的。因此,識(shí)別DTIs可以幫助理解藥物的作用機(jī)制,對(duì)新靶點(diǎn)的發(fā)現(xiàn)、藥物的重定位等有著至關(guān)重要的作用。此外,由于DTI的實(shí)驗(yàn)確定既耗時(shí)又耗費(fèi)資源,現(xiàn)有的方法和工具還有諸多缺陷和不足,因此非常需要開發(fā)高效的計(jì)算方法,以充分利用已知DTI的異質(zhì)生物學(xué)數(shù)據(jù)來厘清藥物在人體中的作用機(jī)理。在過去的幾十年中,已經(jīng)開發(fā)出許多用于預(yù)測(cè)DTI的計(jì)算方法,但是尚存在精度低、假陽性高等問題。
圖1. DTI預(yù)測(cè)方法簡(jiǎn)要分類
在DTI預(yù)測(cè)問題上,魏冬青課題組于2019年12月曾在《Briefings in Bioinformatics》在線發(fā)表了“DTI-CDF: a cascade deep forest model towards the prediction of drug-target interactions based on hybrid features”(?https://doi.org/10.1093/bib/bbz152),發(fā)展了深度級(jí)聯(lián)森林的人工智能方法DTI-CDF(圖2),在小樣本量數(shù)據(jù)的情況下可獲得性能媲美或優(yōu)于深度學(xué)習(xí)的結(jié)果。隨后,進(jìn)一步提出了多標(biāo)簽分類框架DTI-MLCD(圖3),避免了冗余特征空間和高特征維度導(dǎo)致的過擬合等問題,并且可以一次預(yù)測(cè)藥物或靶標(biāo)的一系列相互作用。此外,魏冬青課題組更新了2008年建立的金標(biāo)準(zhǔn)數(shù)據(jù)集,將數(shù)據(jù)量增加了3倍,并公開了數(shù)據(jù)集更新的代碼,以便于其他科研人員隨時(shí)更新,并使用最新代碼進(jìn)行科學(xué)研究。最重要的是,根據(jù)該課題組研究建立的AI藥物篩選平臺(tái),篩選出了新冠病毒的有效的中藥有效成分抑制劑和多肽——人腸防御素5 (HD5),獲得鐘南山院士團(tuán)隊(duì)和合作單位陸軍軍醫(yī)大學(xué)王軍平團(tuán)隊(duì)的實(shí)驗(yàn)驗(yàn)證(魏冬青為共同通訊作者的論文成果發(fā)表在消化病學(xué)頂級(jí)期刊《Gastroenterology》,https://doi.org/10.1053/j.gastro.2020.05.015)。
圖2.?DTI-CDF框架
圖3. DTI-MLCD框架
另外,在非編碼與疾病的相關(guān)性預(yù)測(cè)上,基于深度隨機(jī)森林算法和序貫學(xué)習(xí)的過程,在學(xué)習(xí)和過程中考慮標(biāo)簽之間的相關(guān)性,魏冬青課題組也發(fā)展并構(gòu)建了深度隨機(jī)森林在多標(biāo)簽預(yù)測(cè)中的應(yīng)用。在小樣本數(shù)據(jù)的情況下,獲得了與深度學(xué)習(xí)相媲美的結(jié)果。2020年6月,該成果在《Briefings in Bioinformatics》發(fā)表?“MLCDForest: multi-label classification with deep forest in disease prediction for long non-coding RNAs”( https://doi.org/10.1093/bib/bbaa104)。
此外,預(yù)測(cè)CYP450酶-底物選擇性(即一個(gè)候選藥物分子會(huì)被哪一種或哪幾種CYP450酶識(shí)別和結(jié)合)將能促進(jìn)對(duì)藥物分子的藥代動(dòng)力學(xué)毒理學(xué)性質(zhì)、藥物相互作用等方面的理解,最終也將促進(jìn)藥物發(fā)現(xiàn)和開發(fā),具有重要的臨床意義。2019年11月,美國化學(xué)學(xué)會(huì)出版的《Journal of Chemical Information and Modeling》期刊上還出版了魏冬青課題組題為“Prediction of CYP450 Enzyme-Substrate Selectivity Based on the Network-Based Label Space Division Method”(https://doi.org/10.1021/acs.jcim.9b00749)的論文,為CYP450酶-底物選擇性預(yù)測(cè)問題提供了一種新的解決思路。
該系列研究獲得了國家重點(diǎn)研發(fā)計(jì)劃(2016YFA0501703)、國家自然科學(xué)基金重點(diǎn)項(xiàng)目(61832019)、面上項(xiàng)目(61872094)、青年項(xiàng)目(31601074)等項(xiàng)目資助。
論文鏈接:https://doi.org/10.1093/bib/bbaa205
版權(quán)與免責(zé)聲明:本網(wǎng)頁的內(nèi)容由收集互聯(lián)網(wǎng)上公開發(fā)布的信息整理獲得。目的在于傳遞信息及分享,并不意味著贊同其觀點(diǎn)或證實(shí)其真實(shí)性,也不構(gòu)成其他建議。僅提供交流平臺(tái),不為其版權(quán)負(fù)責(zé)。如涉及侵權(quán),請(qǐng)聯(lián)系我們及時(shí)修改或刪除。郵箱:sales@allpeptide.com