近日,上海交通大學生命科學技術學院韋朝春團隊和中國農(nóng)業(yè)科學院作物科學研究所合作完成基于三代測序數(shù)據(jù)的水稻泛基因組構建及分析,相關成果論文 “Long-read sequencing of 111 rice genomes reveals significantly larger pan-genomes”在基因組學頂級期刊《Genome Research》在線發(fā)表。
該研究通過引入一系列新方法處理長讀長測序,構建了針對三代測序(TGS)數(shù)據(jù)的水稻泛基因組構建方法。與水稻參考基因組日本晴相比,新方法從105 個栽培稻(OS)構建的泛基因組包含 604 Mb 的新序列,比此前由~3000 個栽培稻品種二代測序數(shù)據(jù)(SGS)構建的泛基因組(~270Mb新序列)更全面。其中,重復序列是新序列的主要組成部分。加上6個野生稻(OR)品種,水稻泛基因組比現(xiàn)有參考基因組多879 Mb新序列和19,000個新基因。此外,該研究還為所有代表性水稻群體創(chuàng)建了9個高質(zhì)量的參考基因組,包括 5 個無間隙參考基因組。
該研究工作是由上海交通大學韋朝春教授課題組和中國農(nóng)業(yè)科學院作物科學研究所徐建龍研究員課題組合作完成。中國農(nóng)業(yè)科學院作物科學研究所張帆副研究員和上海交通大學生命科學技術學院博士生薛泓嶂為共同第一作者,中國農(nóng)業(yè)科學院作物科學研究所王文生研究員、徐建龍研究員和上海交通大學韋朝春教授為共同通訊作者。中國農(nóng)業(yè)科學院作物科學研究所黎志康研究員設計并參與了該項研究。
泛基因組(Pan-genome)是指某個群體中所有個體基因組的總和,泛基因組的構建和基因存在-缺失變異(PAVs)分析是基因組研究的新熱點。基于二代測序技術,人們初步構建了主要作物(如水稻、玉米、大豆)的泛基因組。然而,使用二代測序數(shù)據(jù)構建的泛基因組仍存在基因組不完整和基因注釋不準確的缺點。這些問題在很大程度上可以通過長讀長測序(也稱為三代測序)技術解決。
該研究挑選了100多個代表性水稻品種,結(jié)合二代和三代測序技術進行全基因組測序,獲得了連續(xù)性和完整性很高的個體基因組;在此基礎上,構建了高質(zhì)量水稻泛基因組,并填補了9個代表性水稻群體的高質(zhì)量參考基因組, 其中包括 5 個無間隙基因組。
在111 個水稻構建的高質(zhì)量泛基因組中包含879 Mb 的非冗余新序列(序列相似度<90% ,長度> 500bp)。新序列中近一半為長末端重復(LTRs)逆轉(zhuǎn)錄元件Gypsy。新序列分布在每條染色體上,Chr1 包含最多數(shù)量的新序列,而 Chr11 具有最長長度的新序列。除了 Chr4 和 Chr11 的端粒附近的兩個峰以外,含有高密度新序列的基因組區(qū)域傾向于位于著絲粒附近。在所有水稻基因組中,野生稻包含的重復序列 LTRs 明顯多于栽培稻。在水稻泛基因組新序列中共發(fā)現(xiàn)19,319 個新的蛋白質(zhì)編碼基因(2,132 個新基因家族)。在所有基因家族中,約80%是核心或軟核心(存在于所有樣本中或者存在于超過 90% 的樣本中),約20%是非必需的。
為了探究測序技術對泛基因組構建及分析的影響,該研究分別比較了75個水稻品種的二代和三代測序數(shù)據(jù)構建的泛基因組及其基因的存在和缺失結(jié)果(基因PAV)。將基因分為三組(TGS偏好的、SGS偏好的和無偏好的)后,與SGS偏好的基因相比,TGS偏好的基因具有更高的GC含量和更短的CDS長度。大多數(shù) SGS 偏好的基因的所有 CDS 區(qū)域都與重復元件重疊,這與 DNA 轉(zhuǎn)座子和 LTR 相關。然而,具有較高LINEs和 RC/Helitron比例的基因在 TGS 中比在 SGS 中更頻繁地被檢測到。這些結(jié)果表明,SGS數(shù)據(jù)在檢測基因PAVs時往往會得到更高的假陽性率,尤其是對于包含重復序列的基因。
該研究進一步對栽培稻的基因PAV與表型進行了關聯(lián)分析,檢測到14,471個顯著的基因PAV和表型的關聯(lián)。例如LOC_Os01g27930(一種反轉(zhuǎn)錄轉(zhuǎn)座子蛋白)的缺失與籽粒長寬比增加相關,而它的存在也與籽粒寬度增加相關。這些結(jié)果表明,基因PAVs對水稻表型變異可能有重要貢獻。
該項研究得到上海市自然科學基金、國家自然科學基金、三亞崖州灣科技城海南省聯(lián)合項目、海南崖州灣種子實驗室項目、農(nóng)業(yè)科技創(chuàng)新計劃與合作創(chuàng)新任務、上海交通大學代謝與發(fā)育國際聯(lián)合實驗室(JiRLMDS)聯(lián)合研究基金以及CAAS創(chuàng)新團隊和國家高層次人才特殊支持計劃支持。項目實施過程中還得到上海交通大學高性能計算中心的大力支持。
?
論文鏈接:
版權與免責聲明:本網(wǎng)頁的內(nèi)容由收集互聯(lián)網(wǎng)上公開發(fā)布的信息整理獲得。目的在于傳遞信息及分享,并不意味著贊同其觀點或證實其真實性,也不構成其他建議。僅提供交流平臺,不為其版權負責。如涉及侵權,請聯(lián)系我們及時修改或刪除。郵箱:sales@allpeptide.com