Integrative analysis of genomic and epigenomic regulation of the transcriptome in liver cancer文章關(guān)鍵詞:肝癌,DNA甲基化,組蛋白修飾,轉(zhuǎn)錄組近年來聯(lián)合多組學(xué)分析已經(jīng)成為表觀領(lǐng)域的研究熱點(diǎn),利用單一組學(xué)數(shù)據(jù)分析致病因子的局限性愈發(fā)顯著。通過對(duì)多種層次和來源的高通量組學(xué)數(shù)據(jù)的整合分析,系統(tǒng)地研究臨床發(fā)病機(jī)理、確定最佳疾病靶點(diǎn)已經(jīng)成為精準(zhǔn)醫(yī)學(xué)研究的重要發(fā)展方向。 多組學(xué)聯(lián)合分析將有助于人們更加系統(tǒng)全面的認(rèn)識(shí)腫瘤的生物學(xué)行為,進(jìn)一步為尋找有價(jià)值的腫瘤標(biāo)志物和探討腫瘤相關(guān)機(jī)制提供新的線索。今年來多組學(xué)在肺癌,胃癌等癌癥的研究當(dāng)中取得了不錯(cuò)的研究進(jìn)展隨著組學(xué)分析技術(shù)的不斷發(fā)展,整合基因組,表觀組,轉(zhuǎn)錄組等組學(xué)分析,可以多層級(jí)全面的了解腫瘤的發(fā)生發(fā)展機(jī)制。。這篇NC文章聚焦在了肝癌這個(gè)腫瘤上面,看看組學(xué)分析能夠得到什么有意思的發(fā)現(xiàn)呢? 簡(jiǎn)單介紹一下今天的主角:HCC,肝細(xì)胞癌(Hepatocellular carcinoma HCC)是常見的惡性腫瘤類型之一,在全球癌癥死亡原因中排名第二,大約90%的原發(fā)肝癌都屬于肝細(xì)胞癌。中國是HCC患病率最高的地區(qū),每年約50%以上的新診斷和死亡的病例都發(fā)生在中國,并且我國被診斷為肝癌的患者平均年齡為55-59歲,比國外肝癌低發(fā)率國家要早近20年[1,2,3]。肝細(xì)胞癌(Hepatocellular carcinoma,HCC),全球惡性癌癥死因“惡名榜”第二。中國是HCC的重災(zāi)區(qū),不僅“貢獻(xiàn)”50%的全球HCC新發(fā)和死亡病例,且平均年齡55-59歲比國外HCC低發(fā)國家早近20年。 一:Summary? 作者從以轉(zhuǎn)錄組的數(shù)據(jù)入手,結(jié)合基因組數(shù)據(jù)和表觀數(shù)據(jù)進(jìn)行差異分析。看能不能找到與肝癌的發(fā)生發(fā)展密切相關(guān)的異?;蚧蛘呤峭贰?/ins> ?這篇文章主要關(guān)注)肝癌轉(zhuǎn)錄組學(xué)基因和表觀遺傳的差異[1] [2] 主要研究思路是:1.分析64個(gè)肝癌病人樣本中,DNA甲基化(METcor)和DNA拷貝數(shù)變異(CNVcor),探究?jī)烧?/ins>是否在肝癌發(fā)病上存在“共調(diào)控”作用(這里增加用到的技術(shù)手段,如富集分析、熱圖分析,下面亦然,讀者一開始看到這里會(huì)介紹不同工具的實(shí)際應(yīng)用才有繼續(xù)讀下去的欲望,反正我是這個(gè)樣子的) 2.進(jìn)一步研究,能否根據(jù) MET cor和CNV cor進(jìn)行肝癌分型,在TCGA數(shù)據(jù)庫中進(jìn)行驗(yàn)證(NMF算法) 3.篩選對(duì)HCC侵襲性影響最大的基因變異BAP1,用Huh7細(xì)胞轉(zhuǎn)染實(shí)驗(yàn)進(jìn)行驗(yàn)證. ??2:Multi-omics integration of the CNVcor and METcor genes
reveal three prognostic subtypes of hepatocellular cacinoma. which can be
validated by an independent data. ??3:The most aggressive subtype expression stemness genes has frequent BAP1
mutations, implying its pivotal role in the aggressive tumorprogression. 帶著問題去思考: 二:Introduction1:DNA methylation and CNV aberrationor
mutation occur in cancer progression. 2:As HCC, genomic profiling studies demonstrated
the enormous heterogeneity of genomic and epigenomicderegulation. 3:In previous study, several key cancer-related
gene such as IGF2 UHRF1 regulation function by DNA
methylation 4:The transcription has influenced by the CNV
and DNA methylation , whether it has co-correlation is unclear . 5:Genomic and epigenomic profiles of DNA
copy-number variation (CNV), DNA methylation (MET), and gene expression (EXP)
were obtained from 64 HCC patients 三:Result3.1 Transcriptome deregulation by DNA copy number or methylation(DNA甲基化和拷貝數(shù)變異會(huì)導(dǎo)致轉(zhuǎn)錄失調(diào))
Transcriptome deregulation by DNA copy number or methylation.png a. 分別計(jì)算DNA甲基化MET[5] 和mRNA表達(dá)的相關(guān)性(藍(lán)色的),CNV和mRNA表達(dá)的相關(guān)系(紅色的),然后發(fā)現(xiàn)DNA甲基化(MET)是和表達(dá)呈負(fù)相關(guān)的,而CNV和表達(dá)呈正相關(guān)(因?yàn)?span style="text-decoration:line-through;">DNA甲基化MET相關(guān)性系數(shù)分布偏左邊為-0.153,反之~)
a圖關(guān)注的點(diǎn) b.在a圖的基礎(chǔ)上,需要找到差異顯著的那些基因,然后|r|>0.5,也就是紅圈圈的位置,然后發(fā)現(xiàn)了CNVcor有813個(gè),METcor有321個(gè)。把這幾個(gè)基因集進(jìn)行求交集發(fā)現(xiàn)了只有24個(gè)overlap基因. ps:拿到這些基因做了一個(gè)富集分析,發(fā)現(xiàn)CNV差異基因富集在蛋白相關(guān)的信號(hào)通路上,MET的差異主要富集在炎癥反應(yīng)等上面(感覺富集到的結(jié)果可能做不出什么文章。然后繼續(xù)往下看)
富集分析結(jié)果 c. CNV基因顯示出了它的一個(gè)基因組偏好性,比較集中在8號(hào)染色體上。DNA甲基化的基因在全基因組上分布沒有偏好性。 d.(左圖) 發(fā)現(xiàn)DNA甲基化的基因一般都分布在inter-genic(基因間區(qū))而不是CpG島。(右圖)發(fā)現(xiàn)DNA甲基化更偏向于發(fā)生在基因body區(qū)域,推測(cè)開放區(qū)域的甲基化可能會(huì)導(dǎo)致轉(zhuǎn)錄異常,芯片中CpG島的表達(dá)方式N_shore,N_shelf等。[6] [7] e:因?yàn)橐呀?jīng)拿到了60多個(gè)病人樣本,計(jì)算每個(gè)病人樣本的CNVcor上調(diào)和下調(diào)的基因個(gè)數(shù),METcor上調(diào)和下調(diào)的個(gè)數(shù)。然后畫出e的柱狀圖。(不同顏色代表上下調(diào)的基因)下面那個(gè)熱圖的意思就是說紅色的上調(diào)的,藍(lán)色的是下調(diào)的基因位點(diǎn)。 f:去尋找CNVcor上調(diào)和下調(diào)基因和METcor上調(diào)和下調(diào)的相關(guān)性。每個(gè)點(diǎn)代表著一個(gè)病人樣本。橫縱坐標(biāo)代表這個(gè)病人的差異基因的個(gè)數(shù),然后做了一個(gè)相關(guān)性分析。(但是這個(gè)相關(guān)性系數(shù)值不大,最大的0.86,CNV_DOWN和MET_DOWN有正相關(guān),其他的都是弱相關(guān)了) Q:這整個(gè)一個(gè)大Figure說明了什么? A:個(gè)人認(rèn)為是確定DNA甲基化和拷貝數(shù)變異適合轉(zhuǎn)錄組異常相關(guān)的,至于有多么相關(guān),數(shù)據(jù)給出信息。 3.2 Molecular subtype based on CNVcor and METcor genes對(duì)于CNV和MET差異表達(dá)基因可以用于肝癌的分子分型
Identification of molecular subtypes of HCC using CNVcor and METcor genes.
[iCluster,:一種可以利用R包進(jìn)行分類的分類方法,詳情可以見:http://www./packages/devel/bioc/html/iClusterPlus.html] d:用K-Mean的方法畫出利用icluster方法分類的這種類型的OS,TTR曲線,看看分類效果。 【我們還比較了iCl1,iCl2和iCl3亞組的臨床病理特征,發(fā)現(xiàn)iCl1腫瘤比iCl2或iCl3的侵襲性更強(qiáng)(P = 0.002,表1)。 其他臨床特征在亞組之間沒有差異。 這些結(jié)果與分子亞型的獨(dú)特侵襲性特征一致。 基于這些發(fā)現(xiàn),我們建議CNVcor和METcor基因的綜合分析可以識(shí)別分子亞型,每個(gè)分子亞型具有與轉(zhuǎn)錄失調(diào)相關(guān)的基因組和表觀基因組特征的不同組合,與不同的預(yù)后結(jié)果相關(guān)。】 Q:得到了這個(gè)分類結(jié)果,相當(dāng)于一個(gè)訓(xùn)練集,那么如何驗(yàn)證這個(gè)訓(xùn)練集的分類效果呢? 3.3 Validation of the molecular subtypes in an TCGA data set
Validation of the molecular subtypes in an TCGA data set.png 這個(gè)目的就是為了在大樣本庫中重復(fù)他們之前結(jié)果,用的數(shù)據(jù)是TCGA的數(shù)據(jù) b,c:尋找差異的基因,求交集,發(fā)現(xiàn)CNVcor基因在8號(hào)染色體進(jìn)行富集和之前一致 d.e: METcor基因在open sea區(qū)域和gene body域比在CpG島和TSS區(qū)域富集更頻繁 此外,異常CNVcor和METcor基因的頻率之間的相關(guān)性也得到驗(yàn)證,相關(guān)性0.82. f,g :分類效果,C1組DNA拷貝數(shù)和DNA甲基化畸變率最高,C3組最低 h:OS,RFS分析圖 Q:發(fā)現(xiàn)利用CNV和DNA甲基化是可以用作分子分型的,大樣本也重復(fù)出來了結(jié)果,接下來如何分析呢?如何去找DNA甲基化和拷貝數(shù)變異的關(guān)系呢? 我們接下來看看作者如何借助統(tǒng)計(jì)學(xué)去試圖尋找答案 3.4 Coordinated aberrations of DNA copy numbers and methylation整合DNA甲基化數(shù)據(jù)和拷貝數(shù)變異數(shù)據(jù)
Coordinated aberrations of DNA copy numbers and methylation 圖a,b整合了TCGA的數(shù)據(jù)和他們自己已有的數(shù)據(jù)進(jìn)行分析。 在C圖中,我們可以看到橫坐標(biāo)是CNV頻率,縱坐標(biāo)是MET頻率,可以看出他們有顯著的相關(guān)性 在圖d,e,f,g中,分別以CNV gain ,CNV lose,MET gain ,MET loss進(jìn)行坐標(biāo)變換。然后都發(fā)現(xiàn)他們的之間的相關(guān)性與橫縱坐標(biāo)軸的變量變化無關(guān)。 (雖然不太明白它這么比的目的是啥) 3.5 Identification of genomic key features in the HCC subtypes
Identification of genomic key features in the HCC subtypes a:TCGA中肝癌的數(shù)據(jù)樣本分析,剔除了同義突變后,篩選出在189個(gè)發(fā)生10次以上突變的重復(fù)突變基因,我們鑒定出37個(gè)差異突變基因,其中>5 %的突變頻率在C1、C2、C3亞型之間存在差異(其中有2個(gè)肝癌樣本沒有基因組突變數(shù)據(jù)),發(fā)現(xiàn)了BAP1是C1突變的最頻繁的基因。CTNB1是C2,C3當(dāng)中突變最頻繁的基因,而且和腫瘤的發(fā)展高度相關(guān)。 b:GeneMania軟件做的圖(基因間相互作用的,可以在cytocsape里面裝這個(gè)插件,也可以去分析網(wǎng)站GeneMANIA,網(wǎng)址: http://),為了找到亞型的功能決定區(qū)域,利用SNU和TCGA數(shù)據(jù)交集CNVcor genes (n?=?95) and METcor genes (n?=?179)進(jìn)行分析,發(fā)現(xiàn)了UBC 這個(gè)基因在CNV基因集中相關(guān)系數(shù)很高。(越靠中心說明了越重要。) c:先對(duì)這兩個(gè)基因集求一下交集,找到相同的差異的上調(diào)或者下調(diào)的基因。舉個(gè)例子來說:CA9是iCl1/C1腫瘤中上調(diào)表達(dá)差異最大的基因。(在文獻(xiàn)中,CA9是缺氧的一個(gè)標(biāo)志物,其過表達(dá)在HCC19中是一個(gè)不好的預(yù)后標(biāo)志物。此外,與其他亞型相比,侵襲性iCl1和C1腫瘤表達(dá)了高水平的干細(xì)胞相關(guān)基因,如KRT19、EPCAM和PROM1。與Rhee, H等人.報(bào)道的CA9的表達(dá)與HCC中干細(xì)胞相關(guān)表型相關(guān)[11] [12] 的結(jié)果符合[4]。) ??基于這個(gè)可能和干性[13] 有關(guān)的特性,進(jìn)一步評(píng)估已知的和干性相關(guān)的基因集(即, ESC、Nanog、Oct4、Sox2、Myc1、Myc2等已知的和細(xì)胞干性相關(guān)的基因集)。在熱圖中,黃色代表高表達(dá),藍(lán)色代表低表達(dá),發(fā)現(xiàn)在IC1,C1中這些干性的基因集高表達(dá)了。說明和這些差異表達(dá)的基因和腫瘤干性有關(guān)系。 (PS:腫瘤干細(xì)胞(CsC)理論認(rèn)為腫瘤的發(fā)生、發(fā)展、轉(zhuǎn)移和復(fù)發(fā)與CsC密切相關(guān),對(duì)CSC的研究已成為腫瘤研究的熱點(diǎn)。自我不斷的更新復(fù)制以及保持分化的潛能是干細(xì)胞的特性。Sox2、Nanog等轉(zhuǎn)錄因子是維持干細(xì)胞干性的核心轉(zhuǎn)錄因子,那么有關(guān)于這些轉(zhuǎn)錄因子的表達(dá)情況是作者探究肝癌細(xì)胞是否具有干性的核心關(guān)注點(diǎn)。) ??綜上所述,這些發(fā)現(xiàn)提示,與DNA拷貝數(shù)和DNA甲基化相關(guān)的HCC分子亞型也與BAP1和CTNNB1突變有關(guān),這可能在HCC亞型進(jìn)展中發(fā)揮調(diào)控作用。對(duì)于分類結(jié)果來說,我們認(rèn)為C1和iCl1腫瘤可能具有這些亞型的共同功能特征,如侵襲性或干性。我想知道為什么這里分析出兩個(gè)突變,后面只驗(yàn)證了一個(gè):因?yàn)镃1是惡性程度最高的HCC,所以更關(guān)注BAP1,另外一個(gè)就不詳細(xì)研究 d:展示了BAP1抑制對(duì)肝癌細(xì)胞干細(xì)胞基因表達(dá)的影響。Huh7細(xì)胞通過轉(zhuǎn)染以BAP1 shrna,下調(diào)BAP1的表達(dá),發(fā)現(xiàn)了包括CA9、KRT19、EPCAM、PROM1在內(nèi)的stemness基因的顯著上調(diào)表達(dá)。這些結(jié)果有力地支持了我們的發(fā)現(xiàn),即BAP1突變可能至少在一定程度上促進(jìn)了一種侵襲性HCC亞型表達(dá)。 這篇文獻(xiàn)的主圖基本上就講到這里了。看完之后思考之前的問題: 回到之前的問題: 文獻(xiàn)thinking: 本文首發(fā)于 ”百味科研芝士“ 微信公眾號(hào) |
|
|