從零學(xué)測(cè)序癌癥基因組重測(cè)序第六講之circos圖的繪制_第1頁(yè)
從零學(xué)測(cè)序癌癥基因組重測(cè)序第六講之circos圖的繪制_第2頁(yè)
從零學(xué)測(cè)序癌癥基因組重測(cè)序第六講之circos圖的繪制_第3頁(yè)
從零學(xué)測(cè)序癌癥基因組重測(cè)序第六講之circos圖的繪制_第4頁(yè)
從零學(xué)測(cè)序癌癥基因組重測(cè)序第六講之circos圖的繪制_第5頁(yè)
已閱讀5頁(yè),還剩24頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、【測(cè)序中國(guó)測(cè)序中國(guó)-從零學(xué)測(cè)序從零學(xué)測(cè)序】癌癥基因組癌癥基因組重測(cè)序分析第六講之重測(cè)序分析第六講之circos圖的繪制圖的繪制卜德超卜德超微信微信/QQ: 530242830郵郵箱箱: 中國(guó)科學(xué)院計(jì)算技術(shù)研究所中國(guó)科學(xué)院計(jì)算技術(shù)研究所2015-01-07 Circos 是一個(gè)Perl語(yǔ)言開(kāi)發(fā)的自由可視化軟件,使用GPL協(xié)議分發(fā),以繪制輸出圈圖繪制輸出圈圖(原型 Circos 是由加拿大的一位生物信息科學(xué)家 Martin Krzywinski 所開(kāi)發(fā),他同時(shí)是一位專(zhuān)業(yè)攝影師,最初他主要從事Linux系統(tǒng)管理等工作風(fēng)格的圖)為最大特色Circos介紹Circos案例基因組基因組數(shù)據(jù)數(shù)據(jù)的可視化的可

2、視化Linux內(nèi)核內(nèi)核發(fā)展的可發(fā)展的可視化視化影視作品影視作品人物關(guān)系人物關(guān)系的可視化的可視化Circos繪圖流程Perl 安裝Circos 安裝LinksHighlightHeatmapHistogramCircos.confPatterns.confColors.confImage.confFonts.confHousekeeping.conf安裝配置文件配置文件導(dǎo)入圖形類(lèi)型。Scatter plot Circos產(chǎn)生靜態(tài)圖片。這些圖片的產(chǎn)生過(guò)程是通過(guò)一個(gè)配置文件來(lái)實(shí)現(xiàn)的。這個(gè)配置文件通常會(huì)導(dǎo)入其他配置文件,形成一個(gè)個(gè)分級(jí)結(jié)構(gòu)。設(shè)置好這個(gè)配置文件,基本上就掌握了circos。Windows

3、上安裝Circos安裝安裝Strawberry Perl或者ActiveState Perl (不低于5.8)DOS命令行下perl v檢測(cè)perl是否安裝成功及查看版本下載Circos包,解壓DOS命令行下即可運(yùn)行Circos,例如在circos/example下執(zhí)行perl .bincircos conf etccircos.conf如果運(yùn)行失敗,用perl自帶的安裝包管理程序(PPM)繼續(xù)安裝完成即可Unix上安裝Circos安裝Unix系統(tǒng)一般都安裝有perl,perl版本不應(yīng)低于5.8下載Circos包,解壓,根據(jù)circos包自帶的README安裝circos如果運(yùn)行失敗,繼續(xù)將為

4、安裝的perl模塊安裝完成即可在circos/example下執(zhí)行perl /path/to/circos/bin/circos conf etccircos.conf配置語(yǔ)法:變量名=變量值配置塊:配置文件 thickness = 30p fill_color = white fill_color = grey 形成一個(gè)配置塊,一些重要的配置塊單獨(dú)寫(xiě)在一個(gè)配置文件中,便于其他配置文件的導(dǎo)入。例如ideogram.conf只有ideogram一個(gè)配置塊??梢跃哂卸鄠€(gè)實(shí)例,如此有了全局變量和局部變量,左邊f(xié)ill_color = white對(duì)中所有實(shí)例都有效,除非實(shí)例內(nèi)部自己用局部變量進(jìn)行定義,

5、如左邊的fill_color = grey。如果實(shí)例比較多,全局變量變得格外的事半功倍。 在circos/etc目錄下有些現(xiàn)成的設(shè)置會(huì)經(jīng)常用到,從不或很少改變,學(xué)會(huì)運(yùn)用這些配置文件對(duì)學(xué)習(xí)circos有很大幫助,也省去了很多麻煩,如colors.conf、fonts.conf等。寫(xiě)配置文件的時(shí)候可以直接導(dǎo)入使用。配置文件colors.conffonts.confpatterns.confHousekeeping.conf顏色配置顏色配置文件,導(dǎo)入了colors.brewer.conf、 colors.hsv.conf和colors.ucsc.conf。在circos中,顏色除了絕對(duì)路徑,還有很多

6、表達(dá)方式,如hs1,red, reds-9-seq-1等,是因?yàn)檫@些字符在colors配置文件中已經(jīng)賦予了特定的絕對(duì)路徑。 字體配置字體配置文件,其中,代表字體的標(biāo)簽與circos/fonts文件夾下的otf或ttf文件一一對(duì)應(yīng)。模式配置模式配置文件,其中,標(biāo)簽與circos/tites文件夾下的png文件一一對(duì)應(yīng),然后根據(jù)patterns.svg.conf生成相應(yīng)的svg文件。基本框架配置基本框架配置,circos必不可少的配置文件,一般直接導(dǎo)入即可。 還有一些設(shè)置是也是經(jīng)常用到,但會(huì)根據(jù)個(gè)人喜好或繪圖要求不同而有細(xì)微差別,如ideogram.conf、 ticks.conf等。除此之外,也

7、可以把經(jīng)常用到的設(shè)置寫(xiě)成配置文件,便于其它配置文件反復(fù)導(dǎo)入,提高效率。配置文件ideogram.confticks.confimage.conf染色體展示染色體展示的配置文件,包括是否展示bands,染色體展示位置、染色體間距離、染色體標(biāo)簽位置等。染色體數(shù)據(jù)在哪?畫(huà)哪一些?后面實(shí)例中有說(shuō)明,這里是簡(jiǎn)單介紹配置文件的作用??潭葮?biāo)簽刻度標(biāo)簽配置文件,可以導(dǎo)入到ideogram.conf中,也可以直接導(dǎo)入到主配置文件中。對(duì)image大小、背景顏色、輸出目錄、輸出文件形式以及染色體在圓周上的起始位置等進(jìn)行設(shè)置。 對(duì)于上述提到的那些配置文件,主配置文件可以用來(lái)導(dǎo)入,這樣在主配置文件中就不必再對(duì)xxx.c

8、onf文件中的變量進(jìn)行定義了。如此一來(lái),既可以使這些重要配置文件得以重復(fù)利用,也大大簡(jiǎn)化了主配置文件。除此之外,被導(dǎo)入的配置文件它自己也可以導(dǎo)入其它的配置文件。配置文件導(dǎo)入karyotype = data/karyotype/karyotype.mouse.mm9.txtchromosomes_units = 1000000chromosomes_display_default = yes colors_fonts_patterns.confcircos.conf嵌套配置文件導(dǎo)入white = 255,255,255 colors.confcolors.brewer.confblues-3-s

9、eq = blues-3-seq-(d+)blues-3-seq-rev = rev(blues-3-seq-(d+)blues-3-seq-1 = 222,235,247blues-3-seq-2 = 158,202,225blues-3-seq-3 = 49,130,189 colors_fonts_patterns.confcolors.confcolors.brewer.conf實(shí)例繪制初級(jí):核型圖繪制 上面學(xué)習(xí)了配置文件和配置文件導(dǎo)入的相關(guān)知識(shí),現(xiàn)在我們一起來(lái)完成一個(gè)沒(méi)有data的circos,即只有染色體的只有染色體的circos圖圖。 首先準(zhǔn)備好需要被導(dǎo)入的配置文件:circos

10、/etc目錄下的文件直接可以用,一般不需要改動(dòng)。 etc/background.black.conf etc/background.white.conf etc/colors.brewer.conf etc/colors.conf etc/colors.hsv.conf etc/colors.ucsc.conf etc/colors_fonts_patterns.conf etc/fonts.conf etc/housekeeping.conf etc/image.black.conf etc/image.conf etc/image.generic.conf etc/patterns.con

11、f etc/patterns.svg.conf 除此之外,再創(chuàng)建ideogram.conf和ticks.conf配置文件,與后面創(chuàng)建的主配置文件circos.conf放在同一個(gè)目錄下,下面是ideogram.conf 和ticks.conf 模板。default = 0.005rradius = 0.9rthickness = 40pfill = yesfill_color = blackstroke_thickness = 2stroke_color = blackshow_label = yeslabel_font = default label_radius = 1r + 75plabe

12、l_size = 30label_parallel = yeslabel_case = upper label_format = eval(sprintf(chr%s,var(label)show_bands = yesfill_bands = yesband_stroke_thickness = 2band_stroke_color = whiteband_transparency = 4show_ticks = yesshow_tick_labels = yesradius = 1rcolor = blackthickness = 2pmultiplier = 1e-6format = %

13、dspacing = 5usize = 10pspacing = 25usize = 15pshow_label = yeslabel_size = 20plabel_offset = 10pformat = %dideogram.confticks.conf染色體間的空隙染色體所在位置、厚度、邊框厚度及顏色染色體標(biāo)簽位置、字體等Bands顯示與否、bands邊框厚度、顏色、透明度等主刻度次刻度(小刻度)刻度所在位置、顏色、厚度等是否顯示刻度實(shí)例繪制初級(jí):核型圖繪制 然后,創(chuàng)建一個(gè)主配置文件,導(dǎo)入核型文件和其它配置文件:karyotype = data/karyotype/karyotype.

14、mouse.mm9.txtchromosomes_units = 1000000chromosomes_display_default = yesCircos.conf核型文件是必須的。它定義了需要展示的染色體的名稱(chēng)、大小和顏色等,可以根據(jù)自己的要求創(chuàng)建自己想要的核型,不僅僅是染色體,也可以是contigs、genesi等其他可以量化的基于坐標(biāo)系統(tǒng)的東西。Circos常用的核型數(shù)據(jù)文件在circos/data/karyotype目錄下。定義距離單位u是否顯示默認(rèn)染色體實(shí)例繪制初級(jí):核型圖繪制 最后,運(yùn)行circos:perl bin/circos -conf circos.conf次刻度,5u

15、,不顯示刻度標(biāo)簽主刻度,25u,顯示刻度標(biāo)簽default = 0.005rshow_label = yeslabel_font = default label_radius = 1r + 75plabel_size = 30label_parallel = yeslabel_case = upper label_format = eval(sprintf(chr%s,var(label)實(shí)例繪制初級(jí):核型圖繪制 畫(huà)出基本的核型圖之后,就要開(kāi)始往圖里面添加需要顯示的數(shù)據(jù)了。circos圖形典型的有Scatter Plots、Line Plots、Histograms、Heatmaps 、Con

16、nectors 、Highlights、Links。 Scatter Plots、Line Plots、Histograms、Heatmaps數(shù)據(jù)數(shù)據(jù)格式: chr start end value options,options是在數(shù)據(jù)內(nèi)部,單單對(duì)它所在行的數(shù)據(jù)進(jìn)行設(shè)置,多項(xiàng)設(shè)置用逗號(hào)隔開(kāi), options可有可無(wú)。 hs1 0 99999 0.01044hs1 100000 199999 0.00512hs1 200000 299999 0.00214 fill_color=red,z=68hs1 300000 399999 0.00902hs1 400000 499999 0.00448h

17、s1 500000 599999 0.00879 實(shí)例繪制中級(jí):數(shù)據(jù)圖繪制Scatter Plotstype=scatterfile=data/6/snp.density.txtfill_color=greystroke_color=blackglyph=circleglyph_size=10max=0.013min=0r1=0.95rr0=0.65rtype=scatterfile=indata/6/snp.density.txtfill_color=greenstroke_color=dgreenglyph=rectangleglyph_size=8max=0.013min=0.007r1

18、=1.175rr0=1.075rtype=scatterfile=data/6/snp.density.txtfill_color=greystroke_color=blackglyph=circleglyph_size=10max=0.013min=0r1=0.95rr0=0.65rfile=indata/6/snp.density.txtfill_color=greenstroke_color=dgreenglyph=rectangleglyph_size=8max=0.013min=0.007r1=1.175rr0=1.075r設(shè)置plot類(lèi)型,可以是scatter、line、 hist

19、ogram, heatmap 等。指定數(shù)據(jù)文件設(shè)置圖形填充顏色及邊框顏色設(shè)置點(diǎn)的形狀及大小設(shè)置value數(shù)據(jù)范圍,出界將被忽視掉設(shè)置繪畫(huà)區(qū)域,r0是內(nèi)半徑,r1是外半徑,value中的“r”代表circos半徑不同的實(shí)例一般不設(shè)置重復(fù)區(qū)域核心配置塊: 形成主配置文件:將核心配置塊插入到前面實(shí)例circos.conf中即可,其它2D數(shù)據(jù)同樣的方法。karyotype=data/karyotype/karyotype.human.txtchromosomes_units=1000000chromosomes_display_default=nochromosomes=hs1;hs4;hs5不顯示默

20、認(rèn)染色體設(shè)置展示的染色體,人染色體符號(hào)是hs,小鼠是mm,這是在核型文件中設(shè)置好的。type=scatterfile=data/6/snp.density.txtfill_color=greystroke_color=blackglyph=circleglyph_size=10max=0.013min=0r1=0.95rr0=0.65rfile=indata/6/snp.density.txtfill_color=greenstroke_color=dgreenglyph=rectangleglyph_size=8max=0.013min=0.007r1=1.175rr0=1.075r第一個(gè)實(shí)

21、例,灰色第二個(gè)實(shí)例,綠色Scatter Plotstype = linethickness = 2max_gap = 1ufile = data/6/snp.density.250kb.txtcolor = redmin = 0max = 0.015r0 = 0.5rr1 = 0.8rfill_color = vdredmax_gap = 1ufile = data/6/snp.density.txtcolor = yellowmin = 0max = 0.015r0 = 0.25rr1 = 0.45rthickness = 1fill_color = vdyellowLine Plots核心

22、配置塊Histograms核心配置塊type = histogramfile = data/C_fpkm.txtcolor = redmin = 0max = 500r0 = 0.75rr1 = 0.95rthickness = 10pfill_under = yesfill_color = redorientation = outtype = histogramfile = data/D_fpkm.txtcolor = greenmin = 0max = 500r0 = 0.40rr1 = 0.60rthickness = 10pfill_under = yesfill_color = gr

23、eenorientation = in控制方向,向外控制方向,向內(nèi)Heatmaps核心配置塊type = heatmapfile = indata/6/variation.heatmap.txtcolor = spectral-9-divstroke_thickness = 1stroke_color = blackmin = 2000max = 25000r0 = 0.80rr1 = 0.90rfile = indata/6/variation.heatmap.txtcolor = spectral-9-divstroke_thickness = 1stroke_color = blackm

24、in = 10000max = 500000r0 = 0.60rr1 = 0.70rfile = indata/6/variation.heatmap.txtcolor = orrd-9-seqstroke_thickness = 1stroke_color = blackmin = 10000max = 500000r0 = 0.40rr1 = 0.50r顏色是一組顏色(多個(gè)),根據(jù)min到max,賦予從左至右的顏色三個(gè)實(shí)例用的是同一組數(shù)據(jù),第一個(gè)實(shí)例min-max設(shè)置偏小,圖形顏色偏深第二個(gè)實(shí)例顏色設(shè)置與第一個(gè)相同,min-max設(shè)置加大,圖形顏色適中第三個(gè)實(shí)例min-max設(shè)置與第二個(gè)相

25、同,顏色設(shè)置為另一組顏色。type = connectorfile = indata/6/connectors.txtr0 = 0.70rr1 = 0.90rconnector_dims = 0,0.3,0.4,0.3,0thickness = 2color = blacktype = connectorfile = indata/6/connectors.txtr0 = 0.40rr1 = 0.60rconnector_dims = 0,0,0.8,0.2,0thickness = 2color = greenConnectors 數(shù)據(jù)格式:chr firstLocal secondLoca

26、l 這兩個(gè)locals需要在同一染色體上,沒(méi)有要求一個(gè)必須大于另一個(gè)。 hs22 14743362 14737115hs22 20339724 20339258hs22 14758082 14790652 核心設(shè)置快:connector_dims = 0,0.3,0.4,0.3,0color = blackconnector_dims = 0,0,0.8,0.2,0color = greenHighlights 數(shù)據(jù)格式:chr start end fill_color=color, hs1 1298972 1300443 fill_color=blue hs1 1311738 1324571

27、 fill_color=red,r0=0.6r,r1=0.6r+50p hs1 1397026 1421444 fill_color=green,r0=1.1r,r1=1.15r hs1 1437417 1459927 fill_color=green,r0=1.1r,r1=1.15r hs1 1540746 1555847 fill_color=yellow hs1 1560962 1645635 hs1 1624179 1645623 核心配置塊:有兩種設(shè)置方式,一種是以是方式,用變量設(shè)置type=highlight,實(shí)例是;另外一種是以配置塊來(lái)設(shè)置,實(shí)例是。一下是兩種核心配置塊。file

28、 = indata/3/chr.highlights.txtr0 = 0.80rr1 = 0.90rfile = indata/3/h.variation.txtr0 = 0.40rr1 = 0.70rHighlightstype = highlightfile = indata/3/chr.highlights.txtr0 = 0.80rr1 = 0.90rtype = highlightfile = indata/3/h.variation.txtr0 = 0.40rr1 = 0.70r默認(rèn)的顏色是grey默認(rèn)顏色是black對(duì)于有fill_color的數(shù)據(jù),和畫(huà)出的圖案是一樣的。file

29、 = huan_chr1_links.txtradius = 0.95rcolor = redbezier_radius = 0.1rthickness = 1file = human_chr1_links.txtradius = 0.95rcolor = greenbezier_radius = 0.4rthickness = 1Links 數(shù)據(jù)格式:firstChr start end secondChr start end,染色體1和染色體2可以相同,也可以不同。 hs11475914759hs11499914999hs1564465564465hs1564652564652hs1564

30、483564483hs2566317566317 核心配置塊:數(shù)據(jù)綜合繪制 所有類(lèi)型circos圖可以穿插在一起,下邊的circos是上述圖形所用到的數(shù)據(jù),綜合在一起畫(huà)的一個(gè)circos。Scatter PlotsLine PlotsHighlightsLinksHeatmapsConnectorsHistograms數(shù)據(jù)綜合繪制karyotype = data/karyotype/karyotype.human.txtchromosomes_units = 1000000chromosomes_display_default = nochromosomes = hs1;hs2;hs3;hs4;

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論