|

解螺旋公眾號·陪伴你科研的第2048天
KEGG數(shù)據(jù)庫是由京都大學(xué)化學(xué)研究所提出建立并維護(hù)的,該數(shù)據(jù)庫的特色是一系列經(jīng)人手繪制而成KEGG代謝路徑圖的構(gòu)成,以代表關(guān)于代謝以及其他細(xì)胞與生物機(jī)能的實驗成果。總之,KEGG是從代謝通路這方面起家的,后來慢慢壯大,其他的通路也做得不錯了。如果你研究代謝,那么KEGG是最佳選擇。如果你研究的是其他,那KEGG也個不錯的選擇,至少審稿人不會懟你用的是KEGG。KEGG的網(wǎng)址:https://www./kegg/。進(jìn)入網(wǎng)頁后,主要關(guān)注下圖方框里的內(nèi)容,KEGG的主要數(shù)據(jù)就在這里了,包括系統(tǒng)信息:Pathway(信號通路)、BRITE(生物實體的階層分類)、MODULE(基因模組與功能分類);基因組信息:ORTHOLOGY(基因直系同源組別)、GENOME(基因組)、GENES(基因與蛋白列表);化學(xué)信息:COMPOUND(化合物)、GLYCAN(聚糖)、REACTION(生化反應(yīng))、ENZYME(酶);健康信息:NETWORK(疾病相關(guān)的網(wǎng)絡(luò)元素)、 DISEASE(疾?。?、Drugs(藥物)、MEDICUS(健康信息資源)。或者大家也可以從KEGG2進(jìn)入,網(wǎng)址為:https://www./kegg/kegg2.html 網(wǎng)頁顯示如下,內(nèi)容分門別類,看上去較為整齊。在KEGG2有一個比較重要的搜索框,用戶可以直接在此搜索,選項“KEGG”表示在此表示在KEGG整個數(shù)據(jù)庫中搜索,其他的選項則表示只針對該選項下的內(nèi)容進(jìn)行過濾篩選。這部分應(yīng)該就是大家最熟悉的啦,也是KEGG數(shù)據(jù)庫最核心的部分。它包含了與通路相關(guān)的各種信息,我們解螺旋也有相關(guān)課程教大家使用,在此就不贅述。這部分是一個手動創(chuàng)建的分層文本文件的集合,捕獲各種生物對象的功能層次結(jié)構(gòu)。它包含5個部分:基因和蛋白、化合物和反應(yīng)、藥物、疾病、物種和細(xì)胞。與局限于分子間相互作用和反應(yīng)的KEGG PATHWAY比,KEGG BRITE包含了許多不同的關(guān)系類型。大家可以根據(jù)自己的研究方向在對應(yīng)的部分進(jìn)行查找。KEGG MODULE是人工手動定義的功能單元的集合,編號為M開頭,用于基因組的注釋和生物學(xué)解釋。KEGG MODULE有三種類型:通路模塊、結(jié)構(gòu)復(fù)合體和功能集合。大家可以點擊下圖紅色箭頭所指的深藍(lán)色字進(jìn)一步查看。總得來說,KEGG把分子網(wǎng)絡(luò)的相關(guān)信息關(guān)聯(lián)到基因組中,而推進(jìn)物種間的注釋流程。數(shù)據(jù)庫會把功能已知的基因以及它們的同源基因作為一類,也就是一個KO,然后加上一個數(shù)字,將這個基因的功能當(dāng)作這個KO的功能。假設(shè)同源基因具有相似的功能,那么每個基因的功能多樣性就得到了拓展,若A基因在甲物種中研究得很清楚了,和乙物種中的B基因是同源基因,那么AB是同源基因,定義為一個orthology,將A基因作為這個orthology的功能。這樣不同物種間的基因功能研究就聯(lián)系起來了,研究結(jié)果得到充分利用。截止9月1日,這部分共收集了6105種物種(534 eukaryotes, 5272 bacteria, 299 archaea)的基因組信息和完整的基因組序列,并會根據(jù)EST數(shù)據(jù)集進(jìn)行補(bǔ)充。這部分收集了真核生物、原核生物和病毒的基因在基因組上的信息,同時可進(jìn)行基因聚類,搜索同源基因、旁系同源基因以及基因的motif。這部分是基因組中蛋白編碼基因的氨基酸序列相似性的數(shù)據(jù)庫,同時可將相似的基因進(jìn)行聚類。并且這部分還提供一個做聚類樹的功能。輸入基因,并點擊“Draw dendrogram”即可。例圖如下:在這個部分,疾病被視為分子系統(tǒng)的擾動狀態(tài)。我們可以點擊“Human diseases”、“Infectious diseases”、“Human diseases in ICD-11 classification”查看與疾病有關(guān)的通路。KEGG會展示每個疾病的描述、分類、相關(guān)的基因、病原、致癌物等信息。這部分和上面的KEGG DISEASE比較像,它是KEGG嘗試從擾亂的分子網(wǎng)絡(luò)中獲取有關(guān)疾病和藥物的信息。這部分主要包含了癌癥、內(nèi)分泌和代謝性疾病、病毒和細(xì)菌感染三部分內(nèi)容。這部分包含的藥物為在日本和美國上市的藥物。大家可以在上面的搜索框進(jìn)行搜索或者查看下面的藥物分類。點擊藍(lán)色的搜索結(jié)果里的藍(lán)色超鏈接可以進(jìn)一步查看具體藥物和疾病的信息。這部分主要是一些“原料藥,精油和其他促進(jìn)健康的物質(zhì)”,收集了它們的分子結(jié)構(gòu)、分子量、靶點、影響通路等信息。這也是這個數(shù)據(jù)庫的一個對“什么才叫藥物”的態(tài)度吧,我們?nèi)粘UJ(rèn)為的一些活絡(luò)油,中草藥等等就在不在上面說的“藥物”范疇,而在這個里面了,研究中草藥的同學(xué)可以看看。另外,這部分也收集了一些有害健康的物質(zhì)。這部分是疾病,藥物和與健康有關(guān)的物質(zhì)的綜合信息資源,其目標(biāo)是將基因組革命帶入社會。目標(biāo)還是很宏大,也做了一些整合,就是將所有的信息放在了一個框架里,搜索的時候就會將每個部分的信息展示出來。至于怎么看待這種整合,就仁者見仁智者見智了。點下“在看”,多根頭發(fā)
|