參考文章:開掛了!四海八荒都在找尋的RNA-Seq高階分析 作者:美吉生物

自古套路得人心啊,做生信資料分析總不能所有的分析思維都要靠自己來總結吧,而分析的思路又恰恰是最重要的。看到這篇文章總結的很全面,適合精讀!特快馬加鞭來相送~

1. 基因共表達網路分析(Weighted Gene Co-Expression Network Analysis, WGCNA)

基因共表達網路是基於基因間表達資料的相似性而構建的網路圖,圖中的節點代表基因,具有相似表達譜的基因被連線起來形成網路。透過構建基因共表達網路,可以深入探討基因間的相互作用關係並挖掘核心基因(hub gene)。

農學:

獲得跟其生產發育、產量品質和抗逆機制等表型性狀密切相關的潛在核心基因;

醫學:

鎖定與疾病發生相關的中心基因,從而有助於迅速篩選與此病症相關的生物標記和潛在藥物靶點。

案例

神經幹細胞具有自我更新能力,能夠分化產生神經組織中不同細胞型別的細胞。但成體神經幹細胞數量稀少,所處環境複雜,使得在體識別、解析成體神經幹細胞的分子特徵及示蹤成體幹細胞的分化譜系面臨巨大的挑戰。Luo et al (2015)透過對小鼠CD133+ /CD133- 室管膜神經幹細胞進行單細胞轉錄組測序,然後透過構建基因共表達網路(WGCNA)(圖1),發現了啟用神經幹細胞的訊號通路,並運用相關實驗手段驗證了這些訊號通路的存在。

RNA-seq分析套路大全:你想知道的都在這裡!抓緊收藏,你還在等什麼!

圖1 透過WGCNA構建的基因共表達網路

2.基因集富集分析(Gene Set Enrichment Analysis, GSEA)

根據基因功能註釋或預實驗結果構建目標基因集,將其按照在兩類樣本中的差異表達程度進行排序,然後檢驗該基因集是否在排序表的頂端或者底端富集。

該項分析透過檢測整個基因集的表達變化,可以在整體水平上全面檢測到表達差異不顯著但卻有重要生物學意義的基因,而無需指定一個差異程度的閾值。

案例

當前對非小細胞肺癌(NSCLC)的預測標記很不理想,迫切需要找到新的診斷和預測標記。Zhao et al。 (2016)基於RNA-Seq的GSEA分析揭示了STK39基因的表達與非小細胞肺癌相關的過程和通路顯著相關,表明STK39基因參與了非小細胞肺癌的發生和發展,其可作為潛在的生物標記(圖2)。

RNA-seq分析套路大全:你想知道的都在這裡!抓緊收藏,你還在等什麼!

圖2 基於RNA-Seq資料所做的基因集富集分析

3. 時序分析

是指對相同樣本在一個時間段的不同時間點的基因表達水平進行測量,以觀測該樣本在各個時間點的基因表達變化情況,並藉此開展相關分析。

透過時序分析,可以探討該樣品在這個時間段內的多個時間點的基因表達模式,繼而對某個表達模式的基因進行GO和KEGG的功能類富集,從而挖掘其生物學功能;同時可以預測基因間調控網路在時序上的變化趨勢,挖掘不同時間基因調控網路中與時間或其他特定因素相關的模組。

案例

David et al。 (2013) 透過對水稻根和芽在磷元素缺乏早期和晚期以及磷含量恢復後的時空轉錄組進行綜合研究,揭示了為維持植物磷元素的體內平衡所需的大量潛在重要調控因子(圖3)。

RNA-seq分析套路大全:你想知道的都在這裡!抓緊收藏,你還在等什麼!

圖3 時序分析案例圖示

4. 基因融合分析

基因融合(Gene fusion)是指將兩個或多個基因的編碼區首尾相連,置於同一套調控序列(包括啟動子、增強子和終止子等)的控制之下,構成嵌合基因。基因融合通常是由於染色體重排所造成的。

因為異常基因融合事件可以引起惡性血液疾病以及腫瘤的發生,所以透過分析基因融合現象將有助於探討發病機制、biomaker的篩選等,臨床意義重大。

案例

基因重排及其所導致的致癌融合蛋白的研究成為了相關靶標癌症治療的基礎。Bao et al。(2014)基於272例神經膠質瘤患者的RNA-Seq資料,分析了其中發生融合的轉錄本,並鑑定一個與惡性膠質瘤相關的新融合轉錄本(PTPRZ1-MET, ZM)(圖4)。

RNA-seq分析套路大全:你想知道的都在這裡!抓緊收藏,你還在等什麼!

圖4 融合基因分佈圖

5. RNA編輯分析

RNA編輯(RNA editing)是指由於編碼區RNA 發生核苷酸改變(包括缺失、插入和置換)而引起密碼子發生變化的現象,此時mRNA序列不與模板 DNA 忠實互補。

透過分析RNA編輯現象將有助於探討其在臨床上的應用以及一些癌症的發病機制。

案例

由A鹼基替換為I鹼基的RNA編輯事件常發現於一些癌症中,但在人類結腸癌中很少有過研究報道。Lee et al。 (2017)基於轉錄組資料在人類結腸癌中檢測到多種RNA編輯事件,結果表明非同義RNA編輯模式可以做為結腸癌的新的生物標記來使用,用來鑑別結腸癌病人(圖5)。

RNA-seq分析套路大全:你想知道的都在這裡!抓緊收藏,你還在等什麼!

圖5 RNA編輯模式及其位點&;amp;amp;lt;br&;amp;amp;gt;

6. 蛋白互作網路分析(Protein interaction network analysis, PINA)

蛋白質互作分析是理解細胞組織和分子功能的基礎。為了更好理解蛋白質的功能及其對基因的調控作用,有必要開展蛋白質相互作用(Protein-protein interaction , PPI)的研究。比如在醫學上,這將有助於深入探討人類疾病的致病機理和尋找基因治療的藥物靶點。

案例

白血病是發展中國家癌症死亡的主要原因,很多研究都致力於尋找它的臨床診斷標記。但因為它的病因高度複雜和異質性,涉及到許多分子組分間的相互作用 ,Yuan et al。(2017)基於蛋白質互作資料和白血病相關基因的晶片表達譜資料來構建蛋白質互作網路,從網路角度出發來尋找它的臨床診斷標記,結果鑑定得到一個可用於白血病臨床精準診斷的蛋白質互作網路,該網路包括97個基因和400個相互作用關係(圖6)。

RNA-seq分析套路大全:你想知道的都在這裡!抓緊收藏,你還在等什麼!

7.代謝途徑視覺化分析

iPath分析是利用基因組資訊來對壓力狀態下的新陳代謝通路進行視覺化分析的有效方法。進行對代謝途徑進行視覺化分析,可以檢視整個生物系統的代謝通路資訊,從而可以探討目標基因參與的生物代謝途徑並開展相關後續分析。

案例

牡蠣具有調整自身滲透平衡的特殊機制來適應海岸帶的鹽分波動。Meng et al。 (2013)採用代謝途徑視覺化的分析方法基於轉錄組資料對其在不同鹽壓力下的新陳代謝通路進行研究,結果揭示了“Intracellular free amino acids (FAAs)”這個氨基酸在牡蠣對廣鹽性環境的適應中起到重要作用,而FAAs代謝通路是最重要的鹽壓力效應器(圖7)。

RNA-seq分析套路大全:你想知道的都在這裡!抓緊收藏,你還在等什麼!

圖7 代謝途徑視覺化分析結果網路圖

參考文獻:

【1】Bao Z, Chen H, Yang M et al。 RNA-seq of 272 gliomas revealed a novel, recurrent PTPRZ1-MET fusion transcript in secondary glioblastomas。 Genome Research, 2014, 24: 1765-1773

【2】David Secco, Jabnoune M, Walker H et al。 Spatio-temporal transcript profiling of rice roots and shoots in response to phosphate starvation and recovery。 The Plant Cell, 2013, 25: 4285-4304。

【3】Lee S, Kim H, Kang J et al。 Identification of diverse adenosine-to-inosine RNA editing subtypes in colorectal cancer。 Cancer Research and Treatment, 2017。

【4】Luo Y, Coskun V, Liang A et al。 Single-cell transcriptome analyses reveal signals to activate dormant neural stem cells。 Cell, 2015, 161: 1175–1186。

【5】Meng J, Zhu Q, Zhang L et al。 Genome and transcriptome analyses provide insight into the euryhaline adaptation mechanism of Crassostrea gigas。 PLoS One, 2013, 8:e58563。

【6】Yuan X, Chen J, Lin Y et al。 Network biomarkers constructed from gene expression and protein-protein interaction data for accurate prediction of leukemia。 Journal of Cancer, 2017,8: 278-286。

【7】Zhao L, Zhu W, Xiong L et al。 Role of high expression levels of STK39 in the growth, migration and invasion of non-small cell type lung cancer cells。 Oncotarget, 2016,7: 61366-61377。