大神一句話,菜鳥跑半年。我不是大神,但我可以縮短你走彎路的半年~
就像歌兒唱的那樣,如果你不知道該往哪兒走,就留在這學點生信好不好~
這里有豆豆和花花的學習歷程,從新手到進階,生信路上有你有我!
豆豆開始寫于19.2.4
之前從未涉足這個領域,但確實是未來發(fā)展方向 還是老規(guī)矩,流程學習很快,重點在于為什么做以及做完怎么解讀 先補充背景知識吧,春晚之前發(fā)出來生信星球祝大家春節(jié)快樂咯!明年進步會更大!一起加油吧
背景知識 NGS與轉錄
轉錄組即某個物種或特定細胞在某一功能狀態(tài)下產(chǎn)生的所有RNA的總和 (哪些序列能夠表達,何時何處表達, 轉錄活躍程度)
部分基因是能夠轉錄 =》染色質(zhì)多為開放狀態(tài);其余基因抑制 狀態(tài)=》染色質(zhì)狀態(tài)較為緊密【基因開啟、關閉:基因調(diào)控】
基因表達調(diào)控 :信號轉導、轉錄前(染色質(zhì)構象和表觀調(diào)控等)、轉錄調(diào)控、轉錄后調(diào)控(剪切、編輯、轉運等)、翻譯和翻譯后調(diào)控【針對DNA序列:順式元件Cis; 針對結合因子包括蛋白和非蛋白因子:反式作用因子Trans】
非編碼區(qū)大量組織特異性調(diào)控序列 :增強子enhancer、沉默子silencer、絕緣子insulator等+幾個/幾十/幾百調(diào)控因子(轉錄因子、染色質(zhì)調(diào)控蛋白、組蛋白、RNA分子)+三維結構
目前技術:
分離純化多拷貝的基因組重復序列,如染色體端粒(telomere):locked nucleic acids (LNAs )和transcription activator-like (TAL )
常規(guī)技術:ChIP-seq 和ChIA-PE 依賴于單個調(diào)控因子或組蛋白修飾【不能純化、分析單個調(diào)控序列所結合的多個調(diào)控因子及三維結構】
挑戰(zhàn):native狀態(tài)下 區(qū)分結合調(diào)控序列的特異性調(diào)控因子 和細胞內(nèi)大量的非特異性 因子
文獻綜述一定要看 PPT大體印象;綜述幫助理解;文獻獲取流程
PPT: Basics of ChIP-Seq https://www.msi./sites/default/files/basics_chip_seq_0.pdf
Basic workflow ChIP-seq Data Analysis https:///slide/3385783/
ChIP overview 圖中可以看到,基本原理是:特定時間點上用甲醛交聯(lián) 等方式“固定”細胞內(nèi)所有DNA結合蛋白的活動,細胞內(nèi)蛋白和DNA相互作用的關系被“截屏”了=》然后裂解 細胞、斷裂DNA(此時存在蛋白、與蛋白相連的DNA、游離的DNA)=》加上特定抗體 取出蛋白及相連的DNA=》將與蛋白相連的DNA解離、純化 =》測序=》看到蛋白質(zhì)抓取的片段們就是IGV中形成的峰,而游離的DNA們就沒有峰
綜述: ChIP-seq guidelines and practices of the ENCODE and modENCODE consortia (2012) https://www.ncbi.nlm./pubmed/22955991
首先就介紹了ChIP的歷史【染色質(zhì)免疫沉淀(Chromatin immunoprecipitation ,ChIP)技術誕生很早,由Orlando等人創(chuàng)立于1997 年,發(fā)表于2000 年,先利用Microarray技術 ChIP-chip ,后2007 年利用DNA sequencing技術 ChIP-seq 。雖然技術在進步,但都是要先通過免疫沉淀拉下來DNA】
它用來研究細胞內(nèi)DNA與蛋白質(zhì)相互作用,確定特定蛋白(如轉錄因子)是否結合特定基因組區(qū)域(如啟動子或其它DNA結合位點),或確定基因組上與組蛋白修飾相關的特定位點
然后提到兩個組織:ENCODE(http:///ENCODE/ )和modENCODE(http://www./ for small genomes),他們在4個物種(果蠅、秀麗隱桿線蟲、人、小鼠)的100多種細胞做了超過1000次ChIP-seq實驗,發(fā)現(xiàn)了140多種不同的因子和組蛋白修飾 【與外顯子測序不一樣,ChIP-seq不是通過設計好的探針來捕獲序列,而是通過特異的RNApoly酶、組蛋白、轉錄因子來捕獲,哪里結合蛋白就捕獲哪里。每做一次實驗,換一個蛋白,所捕獲的序列是不一樣的】
ChIP workflow 文獻: Getting-Started-with-ChIP-Seq(2013)
http:///wp-content/uploads/2013/02/Getting-Started-with-ChIP-Seq.pdf
Key steps:
Experimental design sequencing platform; the number of sequence reads (standard 20-40M); biological replication
Controls for ChIP-seq experiments
Reference genome alignment of ChIP-seq reads
(mapping)
Background estimation
Peak finding
Quality control of ChIP-seq experiments
Differential binding analysis
Motif analysis