Bioedit使用說(shuō)明書(shū)課件_第1頁(yè)
Bioedit使用說(shuō)明書(shū)課件_第2頁(yè)
Bioedit使用說(shuō)明書(shū)課件_第3頁(yè)
Bioedit使用說(shuō)明書(shū)課件_第4頁(yè)
Bioedit使用說(shuō)明書(shū)課件_第5頁(yè)
已閱讀5頁(yè),還剩60頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

綜合序列分析軟件BioEdit

2003級(jí)高芳鑾Bioedit使用說(shuō)明書(shū)B(niǎo)ioEdit簡(jiǎn)介BioEdit是一個(gè)性能優(yōu)良的免費(fèi)的生物序列編輯器,可在Windows95/98/NT/2000中運(yùn)行,它的基本功能是提供蛋白質(zhì)、核酸序列的編輯、排列、處理和分析。與DNAMAN相比,其分析內(nèi)容相對(duì)豐富一些,而且提供了很多網(wǎng)絡(luò)程序的分析界面和接口,與DNAMAN等軟件配合使用更好。尤其值得一提是利用BioEdit能夠十分方面地根據(jù)指定的核酸序列繪制相應(yīng)的質(zhì)粒圖譜。Bioedit使用說(shuō)明書(shū)序列的常規(guī)操作:序列輸入:多種序列輸入方式;序列分類(lèi):按標(biāo)題、位置、定義、參數(shù)、注釋等分類(lèi);成對(duì)排列:兩序列的最佳排列及計(jì)算同一性和類(lèi)似性;序列屏蔽:僅采用聯(lián)配中部分區(qū)域進(jìn)行分析而排除其他。核酸分析:組成、互補(bǔ)、反轉(zhuǎn)、翻譯、質(zhì)粒、限制性內(nèi)切酶;蛋白質(zhì)分析:氨基酸成分、疏水性輪廓、疏水力矩平均數(shù)翻譯或反翻譯:把DNA或RNA翻譯成蛋白質(zhì);切換翻譯:在核酸和編碼蛋白質(zhì)序列中切換核苷酸序列;點(diǎn)圖[成對(duì)比較]:相互比較兩序列的矩陣,生成一個(gè)點(diǎn)圖。Bioedit使用說(shuō)明書(shū)B(niǎo)LAST本地使用BLAST創(chuàng)建本地?cái)?shù)據(jù)庫(kù)本地BLAST搜尋BLASTINTERNET客戶端程序ClustalW

使用互聯(lián)網(wǎng)工具

HTMLBLAST網(wǎng)絡(luò)瀏覽器PSI-BLASTnnPredict…進(jìn)化分析Bioedit使用說(shuō)明書(shū)主要內(nèi)容繪制質(zhì)粒圖限制性內(nèi)切酶圖

蛋白質(zhì)分析

組成分析熵圖疏水性輪廓聯(lián)配中搜尋保守區(qū)

根據(jù)密碼子的使用翻譯核苷酸

RNA比較分析共變潛在配對(duì)互交信息分析

Bioedit使用說(shuō)明書(shū)一、繪制質(zhì)粒圖(Plasminddrawing)使用BioEdit質(zhì)粒繪圖功能,序列可以通過(guò)自動(dòng)的位置標(biāo)記,自動(dòng)修改成環(huán)形質(zhì)粒。特征、多連接位點(diǎn)和限制性位點(diǎn)可以通過(guò)使用對(duì)話框增加。當(dāng)將一個(gè)序列進(jìn)入質(zhì)粒圖時(shí),在背景上出現(xiàn)一個(gè)限制性內(nèi)切酶圖譜,所以可以通過(guò)對(duì)話框選擇可以增加限制性位點(diǎn)。它們自動(dòng)增加到當(dāng)前的位點(diǎn)。質(zhì)粒功能提供簡(jiǎn)單的繪制和標(biāo)記工具。標(biāo)簽和繪圖可以通過(guò)鼠標(biāo)移動(dòng)和縮放。想要編輯目標(biāo)性質(zhì),雙擊目標(biāo)。想要從一個(gè)DNA序列產(chǎn)生一個(gè)質(zhì)粒,從“Sequence”菜單中“NucleicAcid”子菜單中選擇“CreatePlasmidfromSequence”選項(xiàng)。選擇這個(gè)選項(xiàng)時(shí),限制性內(nèi)切酶圖譜將會(huì)使用通常商業(yè)化的,儲(chǔ)存在存儲(chǔ)器中的限制性內(nèi)切酶。質(zhì)粒第一次產(chǎn)生時(shí),它顯示成有10個(gè)位點(diǎn)標(biāo)記的圓圈,中央是標(biāo)題。Bioedit使用說(shuō)明書(shū)B(niǎo)ioedit使用說(shuō)明書(shū)1.Restrictionsites:(限制性位點(diǎn))

想要增加限制性位點(diǎn),從“Vector”菜單中選擇“RestrictionSites”選項(xiàng)。將會(huì)顯示一下對(duì)話框:

Bioedit使用說(shuō)明書(shū)想要顯示圖譜中的限制性內(nèi)切酶,從右邊(“Don'tShow”中)選擇任何想要的酶,用按鈕將它們移動(dòng)到左邊。按下“Apply&Close”時(shí),這個(gè)位點(diǎn)就會(huì)增加到圖譜中。指定的酶如果只有一個(gè)酶切位點(diǎn),就會(huì)在酶切位點(diǎn)上出現(xiàn)一個(gè)“U”。如果沒(méi)有“U”,將會(huì)顯示第一個(gè)酶切位點(diǎn)。想要移動(dòng)圖譜中酶的位置,在“Show”中增加選擇的酶的亮度,按下按鈕將它們移動(dòng)另一邊。

Bioedit使用說(shuō)明書(shū)2.Positionalmarks(位置標(biāo)記):

點(diǎn)擊“Vector”菜單中的“PositionalMarks”選項(xiàng),可以出現(xiàn)以下對(duì)話框:

可以通過(guò)移動(dòng)位置標(biāo)記到“Show”中,單獨(dú)增加位置標(biāo)記,或者設(shè)定應(yīng)用的分割標(biāo)記數(shù)量。想要沒(méi)有標(biāo)記,選擇“Divideinto:”中的下拉菜單頂端的“None”。Bioedit使用說(shuō)明書(shū)3.Features(特征):想要增加一個(gè)特征,如抗生素抵抗標(biāo)記,從“Vector”菜單選擇“AddFeature”。將顯示以下對(duì)話框:選擇的類(lèi)型是“NormalArrow”、“WideArrow”、“NormalBox”和、“WideBox”。在上面例子中的所有特征是“常規(guī)”寬度的。如果特征是一個(gè)箭頭,箭頭的方向?qū)⑹菑钠瘘c(diǎn)位置到終點(diǎn)位置。增加特征或酶時(shí),他們各自的標(biāo)記增加在外面,中心是可能的尺寸。標(biāo)記可以被選擇工具選擇、移動(dòng)、編輯和縮放。Bioedit使用說(shuō)明書(shū)4.GeneralVectorproperties

載體屬性可通過(guò)選“Vector”菜單中的“Properties”來(lái)更改:Bioedit使用說(shuō)明書(shū)可以通過(guò)指定起點(diǎn)和末端位置,來(lái)增加多接頭按鈕。多接頭顯示為“CourierNew”字體。在這個(gè)對(duì)話框中,特征可以被編輯、增加或者刪除。想要編輯或刪除一個(gè)現(xiàn)存的特征,在“Features”下拉式菜單中選擇特征,并點(diǎn)擊合適的按鈕。點(diǎn)擊“AddNew”按鈕,可以增加一個(gè)新的特征?,F(xiàn)在只有一個(gè)圓形、單鏈質(zhì)粒是有效的。在以后的版本中中將會(huì)改進(jìn)?!癋ont”按鈕改變指示的默認(rèn)字體。特征標(biāo)記的字體將可以單獨(dú)改變,但是位置標(biāo)記不能單獨(dú)改變。Bioedit使用說(shuō)明書(shū)二、RestrictionMaps(限制性內(nèi)切酶圖)

BioEdit提供兩種方法產(chǎn)生核苷酸序列的限制性內(nèi)切酶圖。一種內(nèi)在的限制性內(nèi)切酶圖功能允許產(chǎn)生序列最多為65,536個(gè)核苷酸的限制性內(nèi)切酶圖。實(shí)際上,只能檢測(cè)大約35Kb,而且在速度慢的計(jì)算機(jī)上會(huì)要消耗很長(zhǎng)的時(shí)間。你也可以通過(guò)萬(wàn)維網(wǎng)直接鏈接到WebCutter限制性內(nèi)切酶圖上。

Bioedit使用說(shuō)明書(shū)1.WebCutter:點(diǎn)亮你想要

圖譜的序列

標(biāo)題,從

“World

WideWeb”

菜單中選擇

“Auto-fed

WebCutter

Restriction

Mapping”Bioedit使用說(shuō)明書(shū)2.BioEdit:

點(diǎn)亮你想要圖譜的序列標(biāo)題,從“Sequence”菜單選擇“RestrictionMap”。以下選項(xiàng)將會(huì)顯示在一個(gè)界面窗口:

Bioedit使用說(shuō)明書(shū)—顯示圖譜:顯示或省略序列的全圖譜,互補(bǔ)鏈顯示每個(gè)酶的酶切位點(diǎn).默認(rèn)值:yes—按照字母順序排列名稱(chēng):顯示關(guān)于所有內(nèi)切酶、它們的識(shí)別序列、切割頻率和所有位置(5’末端開(kāi)始是1)的列表.默認(rèn)值:yes—位置數(shù):關(guān)于酶切位點(diǎn)的列表.默認(rèn)值:no—唯一位點(diǎn)列表:在全部序列中只有一個(gè)酶切位點(diǎn)的內(nèi)切酶列表.默認(rèn)值:no—切割5次或更少的酶

.默認(rèn)值:yes—頻率匯總表:關(guān)于所有正確選擇的內(nèi)切酶和它們切割序列的次數(shù)。默認(rèn)值:no—不能切割的內(nèi)切酶。默認(rèn)值:yes—4-堿基內(nèi)切酶:想要包括這些酶,必須點(diǎn)擊這個(gè)選項(xiàng).默認(rèn)值:no(不包括本身)—5-堿基內(nèi)切酶:與4-basecutters相同.—非嚴(yán)格識(shí)別序列的酶:有時(shí)你可排除它們.默認(rèn)值:yes—大的識(shí)別位點(diǎn):通常用于克隆,只有共同的6-堿基識(shí)別酶被使用.—同裂酶:若只顯示一個(gè)特殊識(shí)別位點(diǎn)的一個(gè)內(nèi)切酶,不選(默認(rèn)值=不選擇).—翻譯:顯示沿著排列中的序列翻譯(5’端到3’端的由左到右的翻譯)—互補(bǔ)翻譯:互補(bǔ)鏈的翻譯方向相反.—編號(hào)方式:是酶切位點(diǎn)的核酸的號(hào)碼,而不是識(shí)別位點(diǎn)的起點(diǎn).Bioedit使用說(shuō)明書(shū)3.RestrictionEnzymeBrowser(限制性內(nèi)切酶瀏覽器)從核酸序列中得到內(nèi)切酶譜時(shí),顯示酶的生產(chǎn)公司是很有用的。通過(guò)在內(nèi)切酶圖譜中選擇制造廠商和按下按鈕,可以手動(dòng)瀏覽內(nèi)切酶。你也可以通過(guò)選擇“Options”菜單中的“ViewRestrictionEnzymesbyManufacturer”選擇,在任何時(shí)候檢查內(nèi)切酶。顯示如右對(duì)話框:Bioedit使用說(shuō)明書(shū)在這個(gè)例子中,所有來(lái)源于Stratagene的限制性內(nèi)切酶顯示在左邊的列表中,KpnI的亮度增加。KpnI的識(shí)別序列顯示在頂端,同裂酶顯示在它的下方,其他提供KpnI的公司顯示在同裂酶的下方。BioEdit使用ReBase提供的gcgenz表,限制性內(nèi)切酶數(shù)據(jù)在萬(wàn)維網(wǎng)的地址是:

??梢詮腞eBase下載最新的gcgenz表,將其命名為“enzyme.tab”,并且替代在BioEdit安裝文件夾中“tables”目錄下的舊文件。

注意:表必須是gcgenz格式的。你可以從tables文件夾中打開(kāi)“enzyme.tab”文件查看格式,或者查看“RestrictionMaps”。限制性內(nèi)切酶表格文件名必須是“enzyme.tab”,而且必須在BioEdit的“tables”文件夾里。Bioedit使用說(shuō)明書(shū)1.氨基酸的組成從“Sequence”菜單下進(jìn)入“Protein”,再進(jìn)入“aminaacidcomposition”,可對(duì)序列的氨基酸組成分析,結(jié)果以摘要和圖例的形式給出。圖例中的柱形條表示每種氨基酸在序列中的摩爾比,如下圖:三、蛋白質(zhì)分析Bioedit使用說(shuō)明書(shū)以RGDV的minoroutercapsidprotein-AAS66885為例:Bioedit使用說(shuō)明書(shū)2.熵圖在聯(lián)配文件中有專(zhuān)欄用熵圖來(lái)衡量可變性。它衡量的是在聯(lián)配中每個(gè)位置的“信息量”的缺乏。準(zhǔn)確地說(shuō),是每個(gè)位置的可預(yù)測(cè)性的缺乏。

Bioedit使用說(shuō)明書(shū)3.疏水性輪廓(profile)平均疏水性輪廓采用Kyte&Doolittle的方法,平均分值(總和/窗口大小)作為序列中各個(gè)位置的疏水性值,并以窗口中中間殘基的疏水性值作圖。Bioedit使用說(shuō)明書(shū)4.瞬間疏水性輪廓(hydrophobicmomentprofile)Bioedit使用說(shuō)明書(shū)5.平均瞬間疏水性輪廓Bioedit使用說(shuō)明書(shū)6.在聯(lián)配中搜尋保守區(qū)

有時(shí),即使序列之間的變化很大時(shí),在幾個(gè)序列中搜尋保守區(qū)是有用的。例如,根據(jù)一系列同源序列發(fā)現(xiàn)通用的PCR引物。BioEdiot查找的是低平均“熵”的區(qū)域。

首先選擇你的序列,從“Aligment”->“FindConservedRegion”,對(duì)話框中各選項(xiàng)的內(nèi)容:Bioedit使用說(shuō)明書(shū)B(niǎo)ioEditversion5.0.9ConservedregionsearchAlignmentfile:Q:\Ribosomal_RNA\some_methanos.bio5/10/048:57:33PM

Minimumsegmentlength(actualforeachsequence):15Maximumaverageentropy:0.2Maximumentropyperposition:0.2Gapslimitedto2persegmentContiguousgapslimitedto1inanysegment

2conservedregionsfound

Region1:Position755to774Consensus:755AUUAGAUACCCGGGUAGUCC774

Bioedit使用說(shuō)明書(shū)SegmentLength:20Averageentropy(Hx):0.0155Position755:0.0000Position756:0.0000Position757:0.0000Position758:0.0708Position759:0.0000Position760:0.0000Position761:0.0000Position762:0.0000Position763:0.0000Position764:0.0708Position765:0.0000Position766:0.1679Position767:0.0000Position768:0.0000Position769:0.0000Position770:0.0000Position771:0.0000Position772:0.0000Position773:0.0000Position774:0.0000Bioedit使用說(shuō)明書(shū)Region2:Position1206to1222Consensus:1206ACACGCGGGCUACAAUG1222

SegmentLength:17Averageentropy(Hx):0.0182Position1206:0.0000Position1207:0.0000Position1208:0.0000Position1209:0.0000Position1210:0.0708Position1211:0.0708Position1212:0.0000Position1213:0.1679Position1214:0.0000Position1215:0.0000Position1216:0.0000Position1217:0.0000Position1218:0.0000Position1219:0.0000Position1220:0.0000Position1221:0.0000Position1222:0.0000Bioedit使用說(shuō)明書(shū)B(niǎo)ioEditversion5.0.9ConservedregionsearchAlignmentfile:G:\Ribosomal_RNA\some_methanos.bio5/10/999:34:06PM

Minimumsegmentlength

(actualforeachsequence):10Maximumaverageentropy:0.4Maximumentropyperposition:

0.4with2exceptionsallowedGapslimitedto2persegmentContiguousgapslimitedto1inanysegment

36conservedregionsfound結(jié)果:Bioedit使用說(shuō)明書(shū)7.根據(jù)密碼子的使用翻譯核苷酸

核苷酸序列可根據(jù)三聯(lián)體密碼翻譯預(yù)測(cè)的蛋白序列。從“Sequence”->“Protein”->“Translation”,選擇要按何種讀框翻譯。例如,以下是一個(gè)假設(shè)的Methanobacterium(甲烷細(xì)菌)的ORF(開(kāi)放閱讀框架)。

Bioedit使用說(shuō)明書(shū)>MTH671codingregionATGGTTGCAGTACCCGGCAGTGAGATACTGAGCGGTGCACTACACGTTGTCTCCCAGAGCCTCCTCATACCGGTTATAGCAGGTCTACTGTTATTCATGGTATACGCCATAGTGACCCTCGGAGGGCTCATATCAGAGTACTCTGGAAGGATAAGGACTGATGTTAAGGAACTTGAATCGGCAATAAAATCAATTTCAAACCCAGGAACCCCTGAAAAGATAATTGAGGTCGTCGATTCGATGGACATACCACAGAGCCAGAAGGCCGTGCTCACTGATATCGCAGGGACAGCTGAACTCGGACCAAAATCAAGGGAGGCCCTCGCAAGGAAGTTGATAGAGAATGAGGAACTCAGGGCTGCCAAGAGCCTTGAGAAGACAGACATTGTAACCAGACTCGGCCCAACCCTTGGACTGATGGGGACACTCATACCCATGGGTCCAGGACTCGCAGCCCTCGGGGCAGGTGACATCAATACACTGGCCCAGGCCATCATCATAGCCTTCGATACAACAGTTGTGGGACTTGCATCAGGGGGTATAGCATACATCATCTCCAAGGTCAGGAGAAGATGGTATGAGGAGTACCTCTCAAATCTTGAGACAATGGCCGAGGCAGTGCTGGAGGTGATGGATAATGCCACTCAGACGCCGGCGAAGGCTCCTCTCGGATCAAAABioedit使用說(shuō)明書(shū)Aframe1ofthissequenceisdisplayedasfollowsintheBioEdittexteditor:>MTH671codingregion

1ATGGTTGCAGTACCCGGCAGTGAGATACTGAGCGGTGCACTACAC451MetValAlaValProGlySerGluIleLeuSerGlyAlaLeuHis15

46GTTGTCTCCCAGAGCCTCCTCATACCGGTTATAGCAGGTCTACTG9016ValValSerGlnSerLeuLeuIleProValIleAlaGlyLeuLeu30

91TTATTCATGGTATACGCCATAGTGACCCTCGGAGGGCTCATATCA13531LeuPheMetValTyrAlaIleValThrLeuGlyGlyLeuIleSer45

136GAGTACTCTGGAAGGATAAGGACTGATGTTAAGGAACTTGAATCG18046GluTyrSerGlyArgIleArgThrAspValLysGluLeuGluSer60

181GCAATAAAATCAATTTCAAACCCAGGAACCCCTGAAAAGATAATT22561AlaIleLysSerIleSerAsnProGlyThrProGluLysIleIle75

226GAGGTCGTCGATTCGATGGACATACCACAGAGCCAGAAGGCCGTG27076GluValValAspSerMetAspIleProGlnSerGlnLysAlaVal90

…Bioedit使用說(shuō)明書(shū)|ACGT|-----------------------------A|37313|A|0.760.120.040.07||LysThrArgIle|-----------------------------A|1446|C|0.610.430.270.46||AsnThrSerIle|-----------------------------A|8167|G|0.240.230.031||LysThrArgMet|-----------------------------A|4313|T|0.390.210.130.47||AsnThrSerIle|-----------------------------………Bioedit使用說(shuō)明書(shū)四、RNA的比較分析

RNA的結(jié)構(gòu)定義為核苷酸的堿基的相互作用。最簡(jiǎn)單情況下,即螺旋中的堿基對(duì)之間的Waltson-Crick堿基配對(duì)。RNA結(jié)構(gòu)的系統(tǒng)發(fā)育比較分析方法建立在如下假定上,即在進(jìn)化中核苷酸改變,但重要的RNA二級(jí)和三級(jí)結(jié)構(gòu)保持不變。一個(gè)可能破壞結(jié)構(gòu)的堿基變化可以由序列中另一處的變化補(bǔ)償以保持結(jié)構(gòu)穩(wěn)定。所以不同物種的同源RNA中將包含“補(bǔ)償堿基變化”或“共變化,協(xié)變(covariation)”。所以通過(guò)檢查來(lái)自各個(gè)不同生物的同源RNA,確定這些“補(bǔ)償堿基變化”,從而闡明結(jié)構(gòu)。例如,一給定的序列,GAAGA將可能與序列中任一UCUUC配對(duì),而后者可能在序列中出現(xiàn)數(shù)次。如何確定到底是和哪一個(gè)配對(duì)呢?可以檢查不同生物的同源RNA序列,找出“補(bǔ)償堿基變化”。Bioedit使用說(shuō)明書(shū)organism#1?????GAAGA?????????UCUUC????????UCUUC?????????UCUUC???????organism#2?????GAUGA?????????UCUUC????????UCUGC?????????UCAUC???????organism#2?????GAUGA?????????GCUUC????????UCUAC?????????UCAUC???????organism#2?????GACGA?????????UCUUC????????UCUGC?????????UCGUC???????在此例中,只有最后一個(gè)UCUUC才可和GAAGA配對(duì)。象這樣在序列中2個(gè)位置出現(xiàn)“補(bǔ)償堿基變化”,被認(rèn)為是螺旋存在的證據(jù)。兩條序列不能形成互補(bǔ),表明不存在配對(duì)。在“系統(tǒng)發(fā)育比較分析”中關(guān)鍵是序列聯(lián)配,同源序列必須適當(dāng)聯(lián)配。此處同源性是嚴(yán)格意義的:同源的核苷酸來(lái)自一個(gè)共同的祖先。所以開(kāi)始時(shí),先使用關(guān)系緊密的序列進(jìn)行聯(lián)配,這樣在序列相似性基礎(chǔ)上聯(lián)配,不需要加入許多聯(lián)配的空位。聯(lián)配后互補(bǔ)序列的“協(xié)變”可被立即發(fā)現(xiàn),從而開(kāi)始構(gòu)建二級(jí)結(jié)構(gòu),然后差異大的序列可以添進(jìn)聯(lián)配中。這樣持續(xù)添加新序列,進(jìn)行“協(xié)變”分析,直到聯(lián)配和二級(jí)結(jié)構(gòu)模型出現(xiàn)此過(guò)程的完全描述。一旦一個(gè)完整的二級(jí)結(jié)構(gòu)模型形成,“協(xié)變”分析可以鑒定非螺旋區(qū)的核苷酸之間的相互作用以及不規(guī)則的相互作用。之所以可以被鑒定,是因?yàn)樯婕暗暮塑账峒词共恍纬梢?guī)則的堿基配對(duì)或是一個(gè)螺旋的一部分,也仍一致的變化。Bioedit使用說(shuō)明書(shū)1.共變化(Covariation)

共變化指序列中兩個(gè)殘基步調(diào)一致地變化。嚴(yán)格地講即每當(dāng)聯(lián)配序列中x變化時(shí),y也變化,兩者是一致的。(例如,當(dāng)x變?yōu)锳,y變?yōu)門(mén)。每次x變?yōu)锳,y一定變?yōu)門(mén))。殘基間的共變化表明,它們之間一定有重要的相互作用,當(dāng)重要結(jié)構(gòu)殘基突變時(shí),自然選擇保留了那些有補(bǔ)償突變的序列。共變化的例子

假設(shè)我們現(xiàn)有一個(gè)聯(lián)配序列,它表示了幾種物種共有的一個(gè)特定的RNA的保守的結(jié)構(gòu)。我們希望從聯(lián)配中包含的信息推測(cè)出RNA二級(jí)結(jié)構(gòu)。

Bioedit使用說(shuō)明書(shū)

....|....|....|....|....|....1020

sample1CCGGAUACGAUCGUCGGGUACGUAUCCGGsample2CCGGAUACUAUCUUGGCGAAAGUAUCUGGsample3CGGGAUACGAUCGACGCGUACGUAUCCCGsample4CGCGGUACCAUCCACCCCUAGGUACCGCGsample5CCGGAUACGAUCGUCCCGUUCGUAUCCGGsample6CCGGAUACGAUCGUCGGGUACGUAUCCGGsample7CCGGACACGAUCGUCGGGUACGUAUCCGGsample8CCAGAUACGAUCGAAACUUUCGUAUCUGGsample9CCGGUUACCAUCGUCGGGUAGGUAACCGGsample9CCGGAUACGAUCGACAGGAACGUAUCCGGsample10CCGGAUACGAUCGUCCCGUACGUAUCCGGsample11CCGGAUACGAUCGUCGGGUACGUAUCCGGsample12CCUGAUACUAUCGUCGCCUAAGUAUCGGGsample13CGGGGUACGAUCGAGGCCUACGUACCCCGsample14CCCGCUACGAUCGAGGCCUUCGUAGCGGGsample15CCGGAUACGAUCGAGGCCUUCGUAUCCGG下面是一個(gè)聯(lián)配的例子

Bioedit使用說(shuō)明書(shū)CovariationanalysisInputfile:I:\BioEdit\help\samples.gbPositionnumberingisrelativetothealignmentnumbering.Nomaskwasused.

1CCCCCCCCCCCCCCCC????????????????????????

Position2:????????????????????????2CCGGCCCCCCCCCGCC28GGCCGGGGGGGGGCGGAllpotentialWatsonCrickorG?Upairs????????????????????????3GGGCGGGAGGGGUGCG????????????????????????4GGGGGGGGGGGGGGGG????????????????????????

Position5:????????????????????????5AAAGAAAAUAAAAGCA25UUUCUUUUAUUUUCGUAllpotentialWatsonCrickorG?Upairs????????????????????????6UUUUUUCUUUUUUUUU????????????????????????7AAAAAAAAAAAAAAAA????????????????????????8CCCCCCCCCCCCCCCC????????????????????????Bioedit使用說(shuō)明書(shū)Position9:????????????????????????9GUGCGGGGCGGGUGGG21CACGCCCCGCCCACCCAllpotentialWatsonCrickorG?Upairs????????????????????????10AAAAAAAAAAAAAAAA????????????????????????11UUUUUUUUUUUUUUUU????????????????????????12CCCCCCCCCCCCCCCC????????????????????????13GUGCGGGGGGGGGGGG????????????????????????14UUAAUUUAUAUUUAAA????????????????????????15CGCCCCCACCCCCGGG????????????????????????16GGGCCGGAGACGGGGG????????????????????????17GCCCCGGCGGCGCCCC????????????????????????18GGGCGGGUGGGGCCCC????????????????????????19UAUUUUUUUAUUUUUU????????????????????????20AAAAUAAUAAAAAAUU????????????????????????Bioedit使用說(shuō)明書(shū)Position21:????????????????????????21CACGCCCCGCCCACCC9GUGCGGGGCGGGUGGGAllpotentialWatsonCrickorG?Upairs????????????????????????22GGGGGGGGGGGGGGGG????????????????????????23UUUUUUUUUUUUUUUU????????????????????????24AAAAAAAAAAAAAAAA????????????????????????

Position25:????????????????????????25UUUCUUUUAUUUUCGU5AAAGAAAAUAAAAGCAAllpotentialWatsonCrickorG?Upairs????????????????????????26CCCCCCCCCCCCCCCC????????????????????????27CUCGCCCUCCCCGCGC????????????????????????Position28:????????????????????????28GGCCGGGGGGGGGCGG2CCGGCCCCCCCCCGCCAllpotentialWatsonCrickorG?Upairs????????????????????????29GGGGGGGGGGGGGGGG????????????????????????Bioedit使用說(shuō)明書(shū)在上述聯(lián)配中共有3對(duì)“共變化”的位置點(diǎn):2/28,5/25,9/21。兩個(gè)堿基共變表明它們很可能相互作用。如果一個(gè)突變發(fā)生在與其他堿基有重要作用的堿基上(常是堿基對(duì)),選擇壓力可能會(huì)只保留在另一處堿基上發(fā)生補(bǔ)償突變的堿基。事實(shí)上,上述的堿基共變化都發(fā)生在規(guī)則的堿基對(duì)(Watson-Crick堿基對(duì)或在RNA中G-U)表明它們可能是堿基配對(duì)。共變化堿基對(duì)2/5分別和5/25的距離相同,而5/25分別和9/21的距離也相同,而且界于它們之間的堿基也可形成堿基互補(bǔ),這都表明聯(lián)配序列的兩端可能閉合形成螺旋如下是“Sample1”形成的結(jié)構(gòu)。

UCAG--CCGGATACGU--GGCCTATGCCAGUGGBioedit使用說(shuō)明書(shū)2.潛在配對(duì)分析potentialpairing

當(dāng)RNA分子中兩個(gè)核苷酸之間存在配對(duì)堿基的相互作用力。一個(gè)堿基發(fā)生突變,另一個(gè)堿基為了補(bǔ)償這一突變,可能不僅僅是某一特定核苷酸突變(例如原來(lái)的A-T配對(duì)可能在一序列中轉(zhuǎn)換為G-C,而另一序列中為G-U,)這在共變化分析中將被忽略。因?yàn)榇朔N改變并不遵循完全相同的模式。要鑒定這種情況,可以在潛在配對(duì)中選定堿基配對(duì)的規(guī)則。

仍用上例中的序列(

sample1-sample15

略)

BioEdit中并不要求有位置變化,所以未改變的位置上只要可以形成堿基對(duì),也能被發(fā)現(xiàn)同時(shí)也可在“preference”中設(shè)置以濾出未改變的位置之間的堿基配對(duì)。以下是一個(gè)聯(lián)配序列它和在共變化分析中使用的相同。設(shè)置允許A-U/G-C/G-U堿基配對(duì)規(guī)則以及1個(gè)錯(cuò)配,產(chǎn)生下列的結(jié)果(以清單格式,濾除了未變化位置的潛在配對(duì))比較這一結(jié)果和共變化的結(jié)果,發(fā)現(xiàn)位置3/27有一潛在的配對(duì),而共變化的結(jié)果未檢出。潛在配對(duì)的數(shù)據(jù)也可以按允許的配對(duì)出現(xiàn)的頻率或原始允許配對(duì)的數(shù)目列出一個(gè)(二維矩陣)表。Bioedit使用說(shuō)明書(shū)PotentialPairingsListInputFile:I:\BioEdit\help\samples.gbAllowedMispairings=116totalsequences,29nucleotidespersequence.Axesreflectnumberingoftheentirealignment.NoMaskwasused.Hitsoninvariantpairshavebeenfilteredout.

????????????????????????1CCCCCCCCCCCCCCCC????????????????????????Position:2????????????????????????2CCGGCCCCCCCCCGCC28GGCCGGGGGGGGGCGG0mis?matches????????????????????????Bioedit使用說(shuō)明書(shū)Position:3????????????????????????3GGGCGGGAGGGGUGCG27CUCGCCCUCCCCGCGC0mis?matches????????????????????????

Position:4????????????????????????4GGGGGGGGGGGGGGGG6UUUUUUCUUUUUUUUU0mis?matches????????????????????????

Position:5????????????????????????5AAAGAAAAUAAAAGCA25UUUCUUUUAUUUUCGU0mis?matches????????????????????????Bioedit使用說(shuō)明書(shū)Position:6????????????????????????6UUUUUUCUUUUUUUUU4GGGGGGGGGGGGGGGG0mis?matches????????????????????????6UUUUUUCUUUUUUUUU7AAAAAAAAAAAAAAAA1mis?matches????????????????????????6UUUUUUCUUUUUUUUU10AAAAAAAAAAAAAAAA1mis?matches????????????????????????6UUUUUUCUUUUUUUUU22GGGGGGGGGGGGGGGG0mis?matches????????????????????????6UUUUUUCUUUUUUUUU24AAAAAAAAAAAAAAAA1mis?matches????????????????????????6UUUUUUCUUUUUUUUU29GGGGGGGGGGGGGGGG0mis?matches????????????????????????Bioedit使用說(shuō)明書(shū)Position:7????????????????????????7AAAAAAAAAAAAAAAA6UUUUUUCUUUUUUUUU1mis?matches????????????????????????

8CCCCCCCCCCCCCCCC????????????????????????Position:9????????????????????????9GUGCGGGGCGGGUGGG21CACGCCCCGCCCACCC0mis?matches????????????????????????

Position:10????????????????????????10AAAAAAAAAAAAAAAA6UUUUUUCUUUUUUUUU1mis?matches????????????????????????Bioedit使用說(shuō)明書(shū)11UUUUUUUUUUUUUUUU????????????????????????12CCCCCCCCCCCCCCCC????????????????????????13GUGCGGGGGGGGGGGG????????????????????????14UUAAUUUAUAUUUAAA????????????????????????15CGCCCCCACCCCCGGG????????????????????????16GGGCCGGAGACGGGGG????????????????????????17GCCCCGGCGGCGCCCC????????????????????????18GGGCGGGUGGGGCCCC????????????????????????19UAUUUUUUUAUUUUUU????????????????????????20AAAAUAAUAAAAAAUU????????????????????????Bioedit使用說(shuō)明書(shū)Position:22????????????????????????22GGGGGGGGGGGGGGGG6UUUUUUCUUUUUUUUU0mis?matches????????????????????????

23UUUUUUUUUUUUUUUU????????????????????????Position:24????????????????????????24AAAAAAAAAAAAAAAA6UUUUUUCUUUUUUUUU1mis?matches????????????????????????

Position:25????????????????????????25UUUCUUUUAUUUUCGU5AAAGAAAAUAAAAGCA0mis?matches????????????????????????

26CCCCCCCCCCCCCCCC????????????????????????Position:27????????????????????????27CUCGCCCUCCCCGCGC3GGGCGGGAGGGGUGCG0mis?matches????????????????????????Bioedit使用說(shuō)明書(shū)Position:28????????????????????????28GGCCGGGGGGGGGCGG2CCGGCCCCCCCCCGCC0mis?matches????????????????????????

Position:29????????????????????????29GGGGGGGGGGGGGGGG6UUUUUUCUUUUUUUUU0mis?matches????????????????????????Bioedit使用說(shuō)明書(shū)3.交互信息分析(MutualInformationAnalysis)

概述

交互信息,象在系統(tǒng)發(fā)育比較分析中的應(yīng)用一樣,主要是衡量在一個(gè)適當(dāng)聯(lián)配中兩個(gè)位置共有信息的信息量。符號(hào)是M(x,y)(位置x,y的相互信息)。M(x,y)表明兩個(gè)位置相關(guān)的緊密程度。此相關(guān)程度顯示了兩位置的直接相互作用,如堿基配對(duì)。BioEdit另外計(jì)算R1和R2兩個(gè)參數(shù),它們分別表示位置x,y對(duì)M(x,y)的貢獻(xiàn)。Bioedit使用說(shuō)明書(shū)什么是交互信息交互信息分析是以下思想的拓展--即對(duì)某個(gè)特定位置的不確定性表示是信息含量的下降。在預(yù)先對(duì)某位置一無(wú)所知的情況下(如RNA中核苷酸),不確定性最大。但一旦確定了某位置是什么核苷酸時(shí),不確定性消除了,此位置的信息量達(dá)到最大?,F(xiàn)在考慮有多條序列,在某位置均含有一個(gè)同源核苷酸。知道第一條序列上此位置上的核苷酸并不能為確定第二條或隨機(jī)的一條序列中此序列的核苷酸提供多少信息。但是如果已知此位置在許多乃至幾乎所有序列中均為某一特定堿基(如C),而不是其它的堿基(如G),則我們積累了相當(dāng)多的“信息”,可預(yù)測(cè)另一個(gè)未檢測(cè)的序列中,在此位置某核苷酸出現(xiàn)的可能性。即在另一未檢測(cè)的序列中,此位置核苷酸的不確定性下降了。Bioedit使用說(shuō)明書(shū)交互信息進(jìn)一步拓展了這一思想,對(duì)配對(duì)位置的信息量進(jìn)行檢查,此信息量依賴于并聯(lián)系每個(gè)位置單獨(dú)的信息量,但不能將兩者混淆。總的講,它衡量不確定性的下降,此不確定性指兩種事物相互影響相互作用的程度。RobinGutell發(fā)展了用交互信息預(yù)測(cè)RNA結(jié)構(gòu)的方法,也很適合系統(tǒng)發(fā)育比較分析,因?yàn)閮蓚€(gè)位置交互信息高也提示這2個(gè)殘基直接相互作用。1234ACGUACGUAGCUAUAUAUAUAAUUAAUUAGCU如左圖總共8個(gè)序列,其中位置1,4是不改變的,信息量最大。位置2,3中C/G/U/A各出現(xiàn)了2次,信息量為0,我們無(wú)法預(yù)測(cè)下一個(gè)序列中這兩個(gè)位置的核苷酸,但位置2,3都含有它們之間是如何影響彼此的共有信息。我們不能猜出新一序列中位置2的核苷酸,但如果告訴我位置3是C,我們可以推斷出位置2是G,這即建立在“交互信息分析”(它們遵循共同的配對(duì)模式)交互信息

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論