电竞比分网-中国电竞赛事及体育赛事平台

分享

如何尋找腫瘤驅(qū)動(dòng)基因

 生物_醫(yī)藥_科研 2019-05-24

更多腫瘤“干貨”,喂飽你!

背景介紹

腫瘤基因組學(xué)目前面臨的挑戰(zhàn)之一是將腫瘤形成過程中所涉及的基因組變化(即驅(qū)動(dòng)因素)與對(duì)癌細(xì)胞沒有任何益處的基因組區(qū)分開來。癌癥形成的過程中驅(qū)動(dòng)基因(即那些帶有驅(qū)動(dòng)因子變化的基因)給予腫瘤形成過程自然選擇的優(yōu)勢(shì),因此可以通過檢測(cè)腫瘤中的陽(yáng)性信號(hào)來鑒定驅(qū)動(dòng)基因。

為了找到驅(qū)動(dòng)基因,研究者們開發(fā)出一系列的腫瘤驅(qū)動(dòng)基因軟件和整理了很多數(shù)據(jù)庫(kù)。現(xiàn)在簡(jiǎn)單地介紹下這幾個(gè)軟件。

驅(qū)動(dòng)預(yù)測(cè)軟件

目前這些預(yù)測(cè)軟件使用的方法可以分為三大類:基于基因功能算法、基于突變聚類方法、基于頻率的算法。

1.基于頻率的算法:

基于癌癥驅(qū)動(dòng)基因比其他基因的突變頻率較高這一原理,使用統(tǒng)計(jì)算法計(jì)算出高頻突變頻率高于背景突變頻率的基因?yàn)榘┌Y驅(qū)動(dòng)基因,這類方法在現(xiàn)有報(bào)道中較為常用。

2.基于突變聚類的方法:

通過檢測(cè)基因間顯著聚集在氨基酸序列特定區(qū)域的突變的基因,發(fā)現(xiàn)可能的驅(qū)動(dòng)基因。

3.基于基因功能的算法:

根據(jù)突變基因?qū)?yīng)的蛋白信息構(gòu)建基因突變有害性的評(píng)價(jià)模型,最終將有害性較高的基因認(rèn)定為驅(qū)動(dòng)基因。

主要原理介紹

其中MutSigCV考慮了腫瘤異質(zhì)性,尋找相對(duì)于背景突變的高頻突變。MutSigCV根據(jù)突變信息建立一個(gè)突變背景模型,根據(jù)模型判斷每個(gè)基因的突變是否比偶然突變更顯著。

下圖左側(cè)顯示了一組染色體,每個(gè)染色體來自不同癌癥患者的腫瘤?;蚍謩e為彩色條帶,并且體細(xì)胞突變由紅色三角形表示。如圖所示,所有腫瘤的突變可以通過折疊聚集在一起,并且可以計(jì)算每個(gè)基因的突變總數(shù)。然后將此計(jì)數(shù)轉(zhuǎn)換為分?jǐn)?shù),最后根據(jù)前期構(gòu)建的突變背景模型計(jì)算其顯著性。之后通過閾值來控制假陽(yáng)性率(FDR),并且超過該閾值的基因?yàn)殛?yáng)性突變。

驅(qū)動(dòng)基因預(yù)測(cè)的主流方式是尋找高頻突變基因(SMG),但是也有局限性,OncodriveCLUST是基于蛋白編碼破壞程度的預(yù)測(cè)方式,是驅(qū)動(dòng)基因檢測(cè)的補(bǔ)充。OncodriveCLUST分析軟件利用驅(qū)動(dòng)突變?cè)谖稽c(diǎn)分布上具有形成突變簇的偏好性以及利用同義突變無(wú)偏分布的特點(diǎn)構(gòu)建背景突變模型,尋找可能的驅(qū)動(dòng)突變。具體算法如下:

i表示簇內(nèi)的蛋白質(zhì)位置,fractionMutations是落在該位置的突變的百分比,dist是跨越i的氨基酸的數(shù)量。以及具有最大突變數(shù)的簇的位置,通過對(duì)所有簇的得分求和來獲得基因聚類得分。最后,通過將其與計(jì)算編碼 - 沉默突變的所有基因聚類得分獲得的背景模型分布進(jìn)行比較,來估計(jì)觀察到的基因聚類得分的顯著性。

OncodriveFM(functional mutation)是根據(jù)功能突變有害性進(jìn)行預(yù)測(cè),即如果基因發(fā)生了影響功能域的突變,則該基因可以作為候選的驅(qū)動(dòng)基因,并且有研究結(jié)果也表明高頻突變和已知的驅(qū)動(dòng)基因具有較為明確的FM (功能突變)偏好性。具體方法為:

如上圖所示:第一步包括計(jì)算一組患者中鑒定的突變的FI評(píng)分,接下來,Oncodrive-fm評(píng)估每個(gè)基因是否存在對(duì)具有高FI(FM偏差)的突變,結(jié)果得到P - 每個(gè)基因的值。同時(shí)Oncodrive-fm也可用于評(píng)估基因model的FM偏差。

基于TCGA數(shù)據(jù)使用三種方法的對(duì)比

分別使用OncodriveFM(功能影響標(biāo)準(zhǔn)),OncodriveCLUST(突變聚類標(biāo)準(zhǔn))和MutSig(突變頻率標(biāo)準(zhǔn))描繪在CGC數(shù)據(jù)庫(kù)中注釋的基因,白色Not assessable表示無(wú)法計(jì)算功能影響的基因(OncodriveFM)或無(wú)突變簇的基因(OncodriveCLUST)。

從比較的結(jié)果看出,OncodriveCLUST、MutSig、OncodriveFM可以互相發(fā)現(xiàn)一些其他檢測(cè)方法忽略的基因,因此在檢測(cè)腫瘤的驅(qū)動(dòng)基因時(shí)建議使用基于不同原理的軟件綜合檢測(cè)。

參考文獻(xiàn)

[1] Dees N D, Zhang Q, Kandoth C, et al. MuSiC: identifying mutational significance in cancer genomes[J]. Genome research, 2012, 22(8): 1589-1598.

[2] Tamborero D, Gonzalez-Perez A, Lopez-Bigas N. OncodriveCLUST: exploiting the positional clustering of somatic mutations to identify cancer genes[J]. Bioinformatics, 2013, 29(18): 2238-2244.

[3] Mularoni, Loris, et al. 'OncodriveFML: a general framework to identify coding and non-coding regions with cancer driver mutations.' Genome biology 17.1 (2016): 128.

文   案:趙宏強(qiáng)

審   核:張?jiān)娪?/p>

編   輯:邵利達(dá)

 精準(zhǔn)檢測(cè) | 科學(xué)解讀 | 合理引導(dǎo)

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多