(*AIPuFu-免費大型綜合生物資訊學資源和工具平臺:http://www.aipufu.com*)

無論是傳統的多細胞轉錄組測序(bulk RNA-seq)還是單細胞轉錄組測序(scRNA-seq),

差異表達分析

(differential expression analysis)是比較兩組不同樣本基因表達異同的基本方法,可獲得一組樣本相對於另一組樣本表達顯著上調(up-regulated)和下調的基因(down-regulated),從而可進一步研究這些差異表達基因的功能,包括富集的通路(pathway)或生物學過程(biological process)。由於單細胞測序技術的侷限性,單細胞測序資料通常具有高噪音,有較高的dropout問題,即很多低表達或中度表達的基因無法有效檢測到。所以,以前針對傳統多細胞轉錄組測序資料開發的差異表達檢測方法或軟體不一定完全適用於單細胞測序資料。若想比較不同細胞亞型或不同條件下的細胞表達差異時,為了能得到可靠的結果,需要選定一個好的差異表達分析方法(微信公眾號:AIPuFuBio)。

近年來,有不少專門針對單細胞轉錄組測序資料的差異表達分析方法相繼被開發出來,如MAST (Finak et al。, 2015)、SCDE (Kharchenko et al。, 2014)、 DEsingle (Miao et al。, 2018)、 Census (Qiu et al。, 2017)、 BCseq (Chen and Zheng, 2018)等。具體可以見下表所示:

紅線上方是專門針對單細胞測序資料開發的差異表達分析軟體或R包,紅色下方是針對bulk轉錄組資料開發的軟體或R包

單細胞測序資料的差異表達分析方法總結-differential expression

圖1、一些比較流行的差異表達分析軟體

(Chen et al。 Frontiers in Genetics, 2019) 。

這裡要值得提一下

SCDE

(全名:Single Cell Differential Expression)軟體,其屬於最早一批專門針對單細胞測序資料開發的差異表達分析軟體,地址為:

https://

hms-dbmi。github。io/scde

/

。下圖是原文章中SCDE與其他傳統差異表達分析軟體的效能比較,顯示SCDE具有不錯的效能。

單細胞測序資料的差異表達分析方法總結-differential expression

圖2、SCDE與其他軟體在單細胞測序資料集上鑑定差異表達基因的效能比較

(Kharchenko et al。 Nature Methods, 2014)

最近,Wang et al。等人比較了11款經典的軟體在單細胞測序測序資料集上的差異表達分析效能,這些軟體具體如下表所示:

單細胞測序資料的差異表達分析方法總結-differential expression

圖3、不同差異表達軟體的相關資訊

(Wang et al。 BMC Bioinformatics, 2019)

單細胞測序資料的差異表達分析方法總結-differential expression

圖4、不同差異表達軟體ROC曲線比較

( Wang et al。 BMC Bioinformatics, 2019)

單細胞測序資料的差異表達分析方法總結-differential expression

圖5、不同差異表達軟體各主要指標的比較

( Wang et al。 BMC Bioinformatics, 2019)

單細胞測序資料的差異表達分析方法總結-differential expression

圖6、不同差異表達軟體之間在真實資料集上檢測到的差異表達基因比較

( Wang et al。 BMC Bioinformatics, 2019)。差異表達基因的定義為:adjusted p-value< 0。05

單細胞測序資料的差異表達分析方法總結-differential expression

圖7、樣本數量對不同差異表達軟體各方面效能的影響比較

( Wang et al。 BMC Bioinformatics, 2019)

單細胞測序資料的差異表達分析方法總結-differential expression

圖8、不同差異表達軟體鑑定到的top 300個差異表達基因富集的顯著KEGG通路數和GO條目數比較

( Wang et al。 BMC Bioinformatics, 2019) 。(條件:FDR<0。05)

總的來說,不同的差異表達軟體有不同的優缺點。有些軟體具有高靈敏性,但檢測精度卻比較低,有些則剛好相反。這11款軟體中,DEsingle 和SigEMD這兩個方法較好的平衡了差異表達基因檢測靈敏性和準確性。值得注意的是,Wang et al。 的比較發現,現在這些專門針對單細胞測序資料開發的差異表達分析軟體和傳統的方法相比,並沒有顯示出太多的優勢( Wang et al。 BMC Bioinformatics, 2019)。這也進一步說明,還需不斷開發新的單細胞測序差異表達分析方法,以更好的檢測單細胞測序資料的差異表達基因。

(更多經典,可見大型免費綜合生物資訊學資源和工具平臺AIPuFu:http://www.aipufu.com)

。筆者建議,做單細胞測序資料的差異表達分析,最好還是選擇專門針對單細胞測序資料開發的軟體,如SCDE、DEsingle 和SigEMD等。

希望今天的內容對大家有用哦,會持續更新的,歡迎留言~~

參考文獻

Chen et al。 Single-Cell RNA-Seq Technologies and Related Computational Data Analysis,Frontiers in Genetics, 2019

Wang et al。 Comparative analysis of differential gene expression analysis tools for single-cell RNA sequencing data, BMC Bioinformatics, 2019

Kharchenko et al。 Bayesian approach to single-cell differential expression analysis, Nature Methods, 2014