2017年06月28日 瀏覽次數(shù): 0
?
RNA結(jié)合蛋白(RBP)是一大類在RNA后轉(zhuǎn)錄加工和調(diào)控中發(fā)揮重要作用的蛋白質(zhì),使用計(jì)算方法準(zhǔn)確學(xué)習(xí)和預(yù)測它們在轉(zhuǎn)錄組上的結(jié)合位點(diǎn)對研究它們的調(diào)控功能來說很有幫助。在計(jì)算生物學(xué)領(lǐng)域中,人們從未停下探索這一問題的腳步。最近,來自交叉信息研究院機(jī)器學(xué)習(xí)與計(jì)算生物學(xué)課題組的本科生李舒雅、董方宏、吳月昕等在導(dǎo)師曾堅(jiān)陽助理教授的指導(dǎo)下,提出了一個基于深度學(xué)習(xí)模型deep boosting的RBP結(jié)合位點(diǎn)預(yù)測的新方法(DeBooster)。這一工作相關(guān)論文A deep boosting based approach for capturing the sequence binding preferences of RNA-binding proteins from high-throughput CLIP-seq data近日發(fā)表于英國著名期刊Nucleic Acids Research(《核酸研究》)。
該研究工作通過學(xué)習(xí)高通量的CLIP-seq實(shí)驗(yàn)數(shù)據(jù)來預(yù)測新的RBP結(jié)合位點(diǎn),不僅可以得到比已有方法更好的預(yù)測效果,還降低了模型的復(fù)雜度,做到了更加高效便捷。前人的預(yù)測方法多依賴RNA二級結(jié)構(gòu)或三級結(jié)構(gòu)的預(yù)測作為特征輸入,因此需要占用很多的時間和計(jì)算資源。而DeBooster僅依賴序列信息就可以更好的預(yù)測效果,在實(shí)際應(yīng)用中有著更多優(yōu)勢,尤其適合被用來處理高通量基因組數(shù)據(jù)。
研究提出的新方法可以被廣泛應(yīng)用在各種RBP調(diào)控相關(guān)的分析中。它的預(yù)測結(jié)果一方面可以被已有文獻(xiàn)驗(yàn)證,另一方面也可以提供一些新的假設(shè)。比如說,DeBooster的預(yù)測結(jié)果可以解釋RNA解螺旋酶MOV10對mRNA穩(wěn)定性的調(diào)控,還可以很好地模擬原癌基因ERBB2上的突變對ELAVL1蛋白結(jié)合的強(qiáng)度和位置的影響。DeBooster能夠區(qū)分RNA編輯酶ADAR1的兩種潛在的不同種類的結(jié)合位點(diǎn),并且暗示了這兩種不同的結(jié)合位點(diǎn)可能受到不同程度的RNA編輯。另外,DeBooster的預(yù)測分?jǐn)?shù)可以成為研究突變效應(yīng)(尤其是RBP作用密集的RNA剪切位點(diǎn)附近的突變效應(yīng))的一個參考指標(biāo)。
《核酸研究》是國際核酸研究領(lǐng)域的權(quán)威專業(yè)期刊,2016年度影響因子為10.162。此項(xiàng)工作同清華大學(xué)生命科學(xué)學(xué)院的劉曉老師和美國加州大學(xué)河濱分校的姜濤教授合作完成。論文的共同第一作者李舒雅、董方宏、吳月昕均為清華大學(xué)本科生,論文通訊作者為交叉信息院曾堅(jiān)陽助理教授。研究工作得到國家自然科學(xué)基金和清華大學(xué)結(jié)構(gòu)生物學(xué)高精尖創(chuàng)新中心的經(jīng)費(fèi)支持。
論文鏈接:https://academic.oup.com/nar/article-lookup/doi/10.1093/nar/gkx492
?
?
版權(quán)與免責(zé)聲明:本網(wǎng)頁的內(nèi)容由收集互聯(lián)網(wǎng)上公開發(fā)布的信息整理獲得。目的在于傳遞信息及分享,并不意味著贊同其觀點(diǎn)或證實(shí)其真實(shí)性,也不構(gòu)成其他建議。僅提供交流平臺,不為其版權(quán)負(fù)責(zé)。如涉及侵權(quán),請聯(lián)系我們及時修改或刪除。郵箱:sales@allpeptide.com