2018年3月10日,清華大學生命學院楊雪瑞課題組在Nucleic Acids Research雜志在線發表方法學論文“De novo annotation and characterization of the translatome with ribosome profiling data”(文章鏈接),詳細介紹了一種使用核糖體分析(ribosome profiling)數據鑒定RNA的翻譯并重構翻譯組的新方法,RiboCode。這是楊雪瑞課題組在翻譯組學研究領域的第二套信息挖掘方法。Ribosome profiling技術有兩個不同的應用方向:翻譯速率的定量比較與翻譯事件的系統鑒定。此前,楊雪瑞課題組開發了ribosome profiling數據分析工具Xtail,用于基因翻譯速率的定量比較,文章發表于Nature Communications(文章鏈接)。此次發表的RiboCode工具則針對第二個應用方向:鑒定RNA翻譯活性并構建翻譯組。
RiboCode方法流程
近年來,越來越多的證據表明經典的“編碼/非編碼基因”簡單二分法并不準確?;蜣D錄產物RNA的許多“非編碼”序列,如5’UTR(5’ untranslated region)、非編碼RNA(non-coding RNA)等,都存在開放讀碼框(open reading frame,ORF),其中一些ORF可能在特定條件下翻譯形成小肽或蛋白質,并具有多種生物學功能。對于這些RNA來說,其翻譯與否和細胞狀態及環境相關,不能簡單歸類為編碼或非編碼RNA。因此,對轉錄組RNA中所有可能的ORF進行翻譯活性的鑒定,構建特定生理條件下細胞的翻譯組(translatome)成為RNA及蛋白質相關研究領域的迫切需求。
使用RiboCode構建酵母細胞翻譯組
楊雪瑞課題組的一個重要研究方向為使用ribosome profiling技術系統分析腫瘤、發育等復雜生物學過程中的翻譯調控機制,并同時進行相關實驗技術及數據分析方法的開發。Ribosome profiling通過對核糖體保護的RNA片段(ribosome protected fragment,RPF)的深度測序分析,提出基因組范圍的翻譯狀態圖譜。翻譯過程中,核糖體相對于RNA以密碼子長度(3 nt)為單位移動。因此,以P-位點為基準,來源于正常翻譯過程的RPF片段應該在RNA上呈現3堿基的周期性分布。這是判斷一個RNA是否被翻譯的直接證據。但是,ribosome profiling數據遠非如此理想,多種因素都可能干擾對翻譯的判斷,例如RPF總體分布不均勻、覆蓋率低、ORF長度差異大、P-位點判斷誤差、測序誤差、RNA片段污染等等。因此,從核糖體分析數據中準確鑒定具有翻譯活性的ORF需要高敏感、高準確度的方法流程。
楊雪瑞課題組針對此需求,設計了RiboCode方法,用于從核糖體分析數據中鑒定有翻譯活性的RNA,最終構建全面的翻譯組。在一系列測試中,RiboCode表現出優異的準確性、敏感性和分析效率,顯著超越了現有的其它方法。文章中使用RiboCode方法分析了多套人類細胞、小鼠細胞、斑馬魚及酵母的ribosome profiling數據,鑒定了各種類型的非編碼RNA或非編碼片段的翻譯,其中絕大多數是此前從未被注釋過的。例如在酵母細胞中,RiboCode重構了正常生理條件、氧化應激、熱激三種狀態下的翻譯組,其中UTR區的翻譯,包括5’UTR的uORF及3’UTR的dORF,在應激條件下明顯更加活躍,而且部分UTR的翻譯水平與mRNA上相應的已知蛋白編碼區翻譯高度正相關或負相關。
總之,RiboCode方法幫助研究人員充分利用ribosome profiling這一技術挖掘細胞中的翻譯信號,并全面重構特定生理狀態下的翻譯組,滿足了翻譯組學及RNA研究等領域的重大需求。該工具此前已向領域內同行公開,在文章發表前已有近600次下載。RiboCode與此前發表的Xtail方法覆蓋了ribosome profiling數據的兩大主要分析方向:翻譯效率的定量比較與翻譯活性的系統鑒定。目前實驗室正致力于使用這些工具協助針對腫瘤、發育等重要生物學過程的翻譯組學與翻譯調控機制研究。
清華大學生命學院2013級博士生肖正濤為本文的第一作者,楊雪瑞研究員為本文的通訊作者。研究工作得到了生命學院鄧海騰課題組在質譜數據分析方面的幫助。本研究由國家重點研發計劃“精準醫學研究”重點專項、國家自然科學基金委、青年千人計劃、清華-北大生命科學聯合中心、清華大學自主科研項目提供經費支持。清華大學蛋白質研究技術中心生物計算平臺提供了計算資源的支持。
RiboCode文章鏈接:https://academic.oup.com/nar/advancearticle/doi/10.1093/nar/gky179/4925760