你會用到的網(wǎng)站:
IGV 官網(wǎng)http://software./software/igv/download~ Broadinstitute出品
Java version8 下載: https://www./en/download/mac_download.jsp
IGV內(nèi)置的物種基因組及基因組來源:http://software./software/igv/Genomes
完整的官方幫助文檔:http://software./software/igv/book/export/html/6
寫在前面:
之前mac不小心升級了一下java,然后igv就不能用了,要寫教程必須降級java
首先,看官方說明,需要安裝Java -8,9以上版本不支持。我的mac不知道什么時候更新到了java 10,按說可以向下兼容,但是事與愿違,igv不能正常使用了。
需要降級Java,mac用戶可以直接參考,windows可以試下直接下載安裝IGV:
先刪除原來的java
terminal打開終端,復(fù)制粘貼一下三條命令:
sudo rm -fr /Library/Internet\ Plug-Ins/JavaAppletPlugin.plugin
sudo rm -fr /Library/PreferencesPanes/JavaControlPanel.prefPane
sudo rm -fr ~/Library/Application\ Support/Java
??:不要通過/usr/bin 刪除 Java 工具來卸載 Java。此目錄是系統(tǒng)軟件的一部分,下次對操作系統(tǒng)執(zhí)行更新時,Apple 會重置所有更改。
finder中進(jìn)入 /Library/Java/JavaVirtualMachines,然后刪除之前的jdk.版本號
下載安裝新的Java version8
【Windows用戶下載,解壓后,點(diǎn)擊igv.bat文件即可啟動;如果啟動失敗,用記事本打開并編輯igv.bat文件,在文件的最后新起一行輸入pause,保存后,再嘗試打開,就可以在Windows下的命令行界面(cmd命令提示符)看到錯誤信息,再根據(jù)信息提示去解決問題;不過一般問題不大】
正文開始:
好啦,問題解決啦,開始正式IGV介紹!
什么是IGV
它是一款本地的探索基因組數(shù)據(jù)的可視化瀏覽器,有多個系統(tǒng)版本,支持多種不同類型的輸入格式,包括芯片測序、二代測序、基因組注釋文件等。推薦使用BAM與SAM格式,主要格式見下表
| 數(shù)據(jù)來源 | 文件格式 |
|---|
| 序列比對 | SAM/BAM |
| 顯示覆蓋率 | TDF |
| 拷貝數(shù) | SNP、CN |
| 基因表達(dá) | GCT、RES |
| 基因注釋 | GFF3/GTF、BED |
| 突變數(shù)據(jù) | MUT |
| 追蹤參考基因組覆蓋度、測序深度(UCSC) | WIG、BW |
一睹IGV
每次打開會自動加載hg19.fa文件,也就是人類基因組,一會進(jìn)入主界面
自己構(gòu)建基因組信息
這里我會舉一個昆蟲中一種——棉鈴蟲,這個基因組是17年2月更新在NCBI傷的,屬于小眾物種,IGV并沒有收錄。正好拿來練手,當(dāng)然如果你研究的領(lǐng)域也有基因組被測出來,也可以試一試【注意:在提交基因組文件到IGV之前,要先構(gòu)建索引】
這些工作都可以在本地進(jìn)行,只需要打開你本地的git_bash或者putty/xshell或者terminal,解壓縮基因組文件=》下載samtools(推薦用conda管理)=>構(gòu)建索引samtools faidx genome.fasta=>IGV中 輸入fasta文件路徑=》提供注釋文件(可以是組裝基因組預(yù)測的基因注釋文件,也可以是拼接轉(zhuǎn)錄組用的gtf文件)=〉其他選項(xiàng)可以忽略=》點(diǎn)擊OK推彈出一個框讓你輸入存儲路徑
查看注釋文件
這里以人類基因組注釋文件為例,下載gtf到電腦
下載完不要急著導(dǎo)入,需要先構(gòu)建索引
然后會生成gff3.idx或者gtf.idx文件,說明構(gòu)建了索引,接著導(dǎo)入File -> Load from file,選擇sorted的注釋文件
查看bam文件
我這里準(zhǔn)備的bam文件大小是2.8G,是由人類轉(zhuǎn)錄組測序數(shù)據(jù)得到的,準(zhǔn)備的參考基因組是hg19,注釋文件是gencode.v28lift37.annotation.sorted.gff3
bam文件在導(dǎo)入前,要先使用samtools進(jìn)行sort和index,samtools sort test.bam test.sort``samtools index test.sort.bam,生成一個后綴為“.fai”的文件,它根據(jù)文件名自動和.bam關(guān)聯(lián), 另外這兩個文件要在一個文件夾下,最后將bam導(dǎo)入IGV中
載入bam后,默認(rèn)會出現(xiàn)兩個track(翻譯的話,可以理解為不同的軌道,顯示不同的信息)Coverage track和Alignment track。
另外基因組信息也可以有collapsed、expanded、squished三種展示形式
查看Coverage track
它的意思是顯示比對文件的覆蓋率和測序深度。橫坐標(biāo)是基因組上的位置,縱坐標(biāo)是該位置的測序深度。【鼠標(biāo)放在每一個位點(diǎn)都會顯示一個小方框,其中的的內(nèi)容就是顯示總共有多少reads在這個位置,每個堿基各是什么】
點(diǎn)右上角+放大reads可視化窗口后,track會以灰色的條形圖來顯示每個位點(diǎn)的測序深度。如果某一個核苷酸與參考序列相比,有超過20%的reads是不同的,條形圖會顯示不同的顏色
關(guān)于上圖中的右鍵菜單,解釋如下
| 功能 | 含義 |
|---|
| Rename Track | 更改track名 |
| Change Track Color | 更改背景色,比如把Coverage Track灰色變紫色 |
| Change Track Height | 改變每一個track的高度 |
| Change Font Size | 改變IGV最左側(cè)字體大小 |
| Set Data Range | 覆蓋深度的范圍設(shè)置 |
| Log scale | 用對數(shù)尺度作圖 |
| AutoScale | 是否自動縮放 |
- 比較多個基因
這里看到有許多顏色,這些顏色是根據(jù)定義不同比對類型而不同,
查找結(jié)構(gòu)變異
灰色:與參看基因組可以比對的reads
紫色I:插入(鼠標(biāo)查看插入的堿基信息)
黑色橫線:——缺失
歡迎關(guān)注我們的公眾號~_~
我們是兩個農(nóng)轉(zhuǎn)生信的小碩,打造生信星球,想讓它成為一個不拽術(shù)語、通俗易懂的生信知識平臺。需要幫助或提出意見請后臺留言或發(fā)送郵件到Bioplanet520@outlook.com
Welcome to our bioinfoplanet!