电竞比分网-中国电竞赛事及体育赛事平台

分享

可能是最好用的TCGA數(shù)據(jù)庫GEPIA,兼談如何在沒有課題的情況下迅速畢業(yè)

 田明17grajsnth 2017-09-15


聽生信群里大神閑聊,說他自己的師弟做了個TCGA可視化工具,我就點開鏈接看了一下,不點開就算了,一點開不得了,
就像我手上的錘子手機(jī),千萬別用,用了就無法回頭。
TCGA相關(guān)的數(shù)據(jù)庫有很多,
但我最關(guān)心的功能只有三個,差異表達(dá),生存分析,相關(guān)性分析,這也是我篩選課題的一個方向

  • 能夠差異表達(dá)是前提
  • 如果這時候還跟生存相關(guān),那就錦上添花了,
  • 通過相關(guān)性分析找出他的朋友們,所謂物以類聚,看看這個人的朋友基本上就知道他是什么樣子的人

有一個恐怖的傳說一直讓我后背冒汗心里起火:你的工資是跟你密切交往的6個朋友的平均值,朋友居然重要到這個層面。

好了,不鬼扯,我們簡單介紹一下這個數(shù)據(jù)庫GEPIA(Gene Expression Profilling Interactive Analysis),翻譯一下應(yīng)該是
基因表達(dá)譜數(shù)據(jù)動態(tài)分析。
http://gepia./index.html

這個數(shù)據(jù)庫是北京大學(xué)開發(fā)的,沒有發(fā)文章,沒有發(fā)文章。

This tool is developed by Zefang Tang, Chenwei Li and Boxi Kang of Zhang Lab, Peking University.

我要學(xué)學(xué)寶劍叔叔右哉,先擬定一個讓你痛心的場景,藍(lán)后一步一步幫你解決, 這可能有助于我們直接解決問題。
假設(shè),

你現(xiàn)在已經(jīng)研二了,之前放浪形骸,行散神也散,現(xiàn)在木有課題,木有魚丸,明年要畢業(yè)了,藍(lán)后沒有管你

也沒有男女朋友,沒有大師兄,沒有沙師弟,你該怎么辦呢?
我們可以這樣,先找出某個特定癌癥中跟生存最相關(guān)的一串基因,再來慢慢篩選,正好GEPIA有這個功能。
先點擊一下Survival Analysis,依次點擊


點擊list會出現(xiàn)下面的結(jié)果,可以查詢,可以翻頁,可以一個個復(fù)制粘貼用以前講的方法做GO分析,KEGG分析,互作分析。可以看看這個
無代碼芯片分析圖文教程:每個人都可以做一做的生信第1題


這里我們直接選擇VADC1來看看,首先我們檢查一下這個基因分生存分析圖究竟是什么樣子,點擊它

這時候相當(dāng)于進(jìn)入了單基因入口,這里面給出了這個基因概括,說是線粒體膜的主要組成成分,也跟鐵的轉(zhuǎn)運(yùn)相關(guān),我覺得都是熱門方向
如果這個領(lǐng)域你hold不住,就返回去再換一個基因點進(jìn)來,最右邊圖我覺得很直觀,綠色代表VDAC1在正常組織的表達(dá),紅色代表在腫瘤組織中的表達(dá)
可能這張圖看不出啥特殊,我舉個例子,
 

A基因幾乎只在乳腺表達(dá),而且在乳腺癌中明顯高表達(dá)
B基因在全身廣泛表達(dá),但是表達(dá)風(fēng)度不高,而在乳腺癌中表達(dá)顯著提高
好了頁面往下拉就可以看到這個基因在多個癌癥癌和癌旁的表達(dá)情況,我們可以看出他在乳腺癌中是高表達(dá)的
但是在其他許多癌癥中也明顯差異表達(dá),這張表不會讓你漏掉其他癌癥,如果恰巧實驗室有人在做那個癌癥,你就可以跟他合伙搞一搞嘛。
因為你沒有人管,沒有大師兄,沒有沙師弟,你還有什么選擇?


此外,你是可以選擇呈現(xiàn)方式的,按照如下步驟操作可以得到漂亮的癌和癌旁的表達(dá)圖


點擊plot之后是這個樣子的,可以下載,可以直接放在文章里面

返回一開始的界面,往下面翻一翻就會看到和這個基因表達(dá)類似的基因


哎呦歪,里面HNRNPAB就是核內(nèi)不均一核糖核蛋白家族成員,他可是要調(diào)控RNA的可變剪切的,許多LNCRNA作pulldown后就會拉下這個家族的成員
相關(guān)的文章從SCIENCE,CELL到ONCOTARGETS都有。
但是我們差點忘了進(jìn)來是干什么的,我們是來看生存分析的。依次操作。


點擊plot就會得到下面的圖


這個圖真的是漂亮,一點都不含糊,好了這時候課題基本上就有苗頭了

VDAC1以暫時不知道的原因升高導(dǎo)致乳腺癌的發(fā)生,而乳腺癌患者高表達(dá)VADAC1的患者低生存

知道這些信息如何設(shè)計課題呢?可以看看這個
課題設(shè)計:收不完的病人查不完的房,臨床醫(yī)生如何快速地設(shè)計一個靠譜的課題?

臨床醫(yī)生做科研不外乎診和療

  • 從診治的角度來說,這個基因表達(dá)水平對診斷乳腺癌有沒有幫助?
  • 從治療的角度來說,既然高表達(dá)低生存,那么有沒有可能設(shè)計抗體來治療乳腺癌呢?

當(dāng)然那個是轉(zhuǎn)化醫(yī)學(xué),在這之前就是基礎(chǔ)醫(yī)學(xué)
從研究的角度來看:

  • 這個基因高表達(dá)的原因是什么?表觀遺傳相關(guān)么,突變么,轉(zhuǎn)錄激活么,翻譯修飾么,搞清楚就已經(jīng)不容易了。

我們試一試表觀遺傳有沒有影響,在UCSC數(shù)據(jù)庫中打開VDAC1,我的媽呀,他的啟動子區(qū)域這么洶涌澎湃的H3K27ac修飾,說明他的表達(dá)量本身就很高,不大可能是個壞分子,要么就是他在癌中突變了,要么就是他啟動子在癌癥中被過度激活了,我只是說可能
那么就會有個子課題產(chǎn)生:

H3K27ac組蛋白乙?;揎棿偈筕DAC1基因啟動子激活從而升高其表達(dá)


  • 另外一個問題,這個基因在乳腺癌中的功能是什么?

可以嘗試用生物信息學(xué)找到共表達(dá)的基因,之前已經(jīng)列出來了,再去預(yù)測他可能有什么功能,
也可以直接構(gòu)建慢病毒shRNA敲減后看看他的表型,
可是這不是你想要的,我們需要的是短平快,怎么辦呢?查文獻(xiàn),
恰好我剛知道那個寫過Hallmars of Cancer這篇文章老爺爺Weinberg在nature發(fā)表了一篇文章,時間是2017年3月30日,他們找到了乳腺癌中一個新的抑癌基因
叫做LACTB,他能夠調(diào)控脂質(zhì)代謝抑制乳腺癌,LACTB是一個線粒體相關(guān)的蛋白,VDAC1也是個線粒體相關(guān)的蛋白,他們之間可能有聯(lián)系么?

他們的聯(lián)系可能多種多樣,我們嘗試用現(xiàn)成的工具看一下,相關(guān)性分析


點擊plot試一下


居然他們還有相關(guān)性,歡天喜地慶豐收,畢業(yè)在望。可是他們他們應(yīng)該表達(dá)呈負(fù)相關(guān)才合理呀,
這么來把這些結(jié)果整合到一起呢?VDAC1和LACTB相關(guān),抑制癌癥的產(chǎn)生,藍(lán)后不知怎么的他的啟動子就過度活化了
然后他就促發(fā)了癌癥?
我覺得自己都說服不了,我們還是換一種思路吧,用string數(shù)據(jù)庫來看一看


VDAC1居然跟BAX,BCL2L1相關(guān),表明其可能跟細(xì)胞的凋亡相關(guān)
好了最終的課題就是
H3K27ac修飾使VDAC1的啟動子過度乙酰化促進(jìn)其表達(dá)從而抑制細(xì)胞凋亡促進(jìn)乳腺癌的發(fā)展。
我覺得這時候真的可以搞一搞了,什么,你沒有shRNA?
不是說了跟別人合作么,你怎么又搞忘了。
藍(lán)后檢索一下VDAC1和乳腺癌的文章,發(fā)現(xiàn)少之又少,開始吧。

這個過程中好像文獻(xiàn)閱讀并不重要,但是不要忘了LACTB是Weinberg文章里面的
LACTB在乳腺癌中的表達(dá)和調(diào)控還沒有研究呢,上面那個課題要是實在弄不好,就換這一個吧。
Note: 表觀遺傳那一塊我是不嚴(yán)謹(jǐn)?shù)模瑧?yīng)該選乳腺的數(shù)據(jù)看看修飾,ENCODE數(shù)據(jù)庫就支持。
藍(lán)后,我覺得科研結(jié)果的呈現(xiàn)最基本的要求就是

自洽

四個字就是自圓其說,不要前后矛盾,你自己構(gòu)建了一個體系,一定要讓自己信服。
自己都不相信的東西還想讓別人相信,你把我當(dāng)什么了。

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多