核酸序列使用說明書_第1頁
核酸序列使用說明書_第2頁
核酸序列使用說明書_第3頁
核酸序列使用說明書_第4頁
核酸序列使用說明書_第5頁
已閱讀5頁,還剩59頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

核酸序列使用說明書第1頁,共64頁,2023年,2月20日,星期一BioEdit簡介BioEdit是一個性能優(yōu)良的免費的生物序列編輯器,可在Windows95/98/NT/2000中運行,它的基本功能是提供蛋白質(zhì)、核酸序列的編輯、排列、處理和分析。與DNAMAN相比,其分析內(nèi)容相對豐富一些,而且提供了很多網(wǎng)絡程序的分析界面和接口,與DNAMAN等軟件配合使用更好。尤其值得一提是利用BioEdit能夠十分方面地根據(jù)指定的核酸序列繪制相應的質(zhì)粒圖譜。第2頁,共64頁,2023年,2月20日,星期一序列的常規(guī)操作:序列輸入:多種序列輸入方式;序列分類:按標題、位置、定義、參數(shù)、注釋等分類;成對排列:兩序列的最佳排列及計算同一性和類似性;序列屏蔽:僅采用聯(lián)配中部分區(qū)域進行分析而排除其他。核酸分析:組成、互補、反轉(zhuǎn)、翻譯、質(zhì)粒、限制性內(nèi)切酶;蛋白質(zhì)分析:氨基酸成分、疏水性輪廓、疏水力矩平均數(shù)翻譯或反翻譯:把DNA或RNA翻譯成蛋白質(zhì);切換翻譯:在核酸和編碼蛋白質(zhì)序列中切換核苷酸序列;點圖[成對比較]:相互比較兩序列的矩陣,生成一個點圖。第3頁,共64頁,2023年,2月20日,星期一BLAST本地使用BLAST創(chuàng)建本地數(shù)據(jù)庫

本地BLAST搜尋

BLASTINTERNET客戶端程序

ClustalW

使用互聯(lián)網(wǎng)工具

HTMLBLAST網(wǎng)絡瀏覽器

PSI-BLASTnnPredict…進化分析第4頁,共64頁,2023年,2月20日,星期一主要內(nèi)容繪制質(zhì)粒圖限制性內(nèi)切酶圖

蛋白質(zhì)分析

組成分析熵圖疏水性輪廓聯(lián)配中搜尋保守區(qū)

根據(jù)密碼子的使用翻譯核苷酸

RNA比較分析共變潛在配對互交信息分析

第5頁,共64頁,2023年,2月20日,星期一一、繪制質(zhì)粒圖(Plasminddrawing)使用BioEdit質(zhì)粒繪圖功能,序列可以通過自動的位置標記,自動修改成環(huán)形質(zhì)粒。特征、多連接位點和限制性位點可以通過使用對話框增加。當將一個序列進入質(zhì)粒圖時,在背景上出現(xiàn)一個限制性內(nèi)切酶圖譜,所以可以通過對話框選擇可以增加限制性位點。它們自動增加到當前的位點。質(zhì)粒功能提供簡單的繪制和標記工具。標簽和繪圖可以通過鼠標移動和縮放。想要編輯目標性質(zhì),雙擊目標。想要從一個DNA序列產(chǎn)生一個質(zhì)粒,從“Sequence”菜單中“NucleicAcid”子菜單中選擇“CreatePlasmidfromSequence”選項。選擇這個選項時,限制性內(nèi)切酶圖譜將會使用通常商業(yè)化的,儲存在存儲器中的限制性內(nèi)切酶。質(zhì)粒第一次產(chǎn)生時,它顯示成有10個位點標記的圓圈,中央是標題。第6頁,共64頁,2023年,2月20日,星期一第7頁,共64頁,2023年,2月20日,星期一1.Restrictionsites:(限制性位點)

想要增加限制性位點,從“Vector”菜單中選擇“RestrictionSites”選項。將會顯示一下對話框:

第8頁,共64頁,2023年,2月20日,星期一想要顯示圖譜中的限制性內(nèi)切酶,從右邊(“Don'tShow”中)選擇任何想要的酶,用

按鈕將它們移動到左邊。按下“Apply&Close”時,這個位點就會增加到圖譜中。指定的酶如果只有一個酶切位點,就會在酶切位點上出現(xiàn)一個“U”。如果沒有“U”,

將會顯示第一個酶切位點。想要移動圖譜中酶的位置,在“Show”中增加選擇的酶的亮度,按下

按鈕將它們移動另一邊。

第9頁,共64頁,2023年,2月20日,星期一2.Positionalmarks(位置標記):

點擊“Vector”菜單中的“PositionalMarks”選項,可以出現(xiàn)以下對話框:

可以通過移動位置標記到“Show”中,單獨增加位置標記,或者設定應用的分割標記數(shù)量。想要沒有標記,選擇“Divideinto:”中的下拉菜單頂端的“None”。第10頁,共64頁,2023年,2月20日,星期一3.Features(特征):想要增加一個特征,如抗生素抵抗標記,從“Vector”菜單選擇“AddFeature”。將顯示以下對話框:選擇的類型是“NormalArrow”、“WideArrow”、“NormalBox”和、“WideBox”。在上面例子中的所有特征是“常規(guī)”寬度的。如果特征是一個箭頭,箭頭的方向?qū)⑹菑钠瘘c位置到終點位置。增加特征或酶時,他們各自的標記增加在外面,中心是可能的尺寸。標記可以被選擇工具選擇、移動、編輯和縮放。第11頁,共64頁,2023年,2月20日,星期一4.GeneralVectorproperties

載體屬性可通過選“Vector”菜單中的“Properties”來更改

第12頁,共64頁,2023年,2月20日,星期一可以通過指定起點和末端位置,來增加多接頭按鈕。多接頭顯示為“CourierNew”字體。在這個對話框中,特征可以被編輯、增加或者刪除。想要編輯或刪除一個現(xiàn)存的特征,在“Features”下拉式菜單中選擇特征,并點擊合適的按鈕。點擊“AddNew”按鈕,可以增加一個新的特征。現(xiàn)在只有一個圓形、單鏈質(zhì)粒是有效的。在以后的版本中中將會改進。

“Font”按鈕改變指示的默認字體。特征標記的字體將可以單獨改變,但是位置標記不能單獨改變。

第13頁,共64頁,2023年,2月20日,星期一二、RestrictionMaps(限制性內(nèi)切酶圖)BioEdit提供兩種方法產(chǎn)生核苷酸序列的限制性內(nèi)切酶圖。一種內(nèi)在的限制性內(nèi)切酶圖功能允許產(chǎn)生序列最多為65,536個核苷酸的限制性內(nèi)切酶圖。實際上,只能檢測大約35Kb,而且在速度慢的計算機上會要消耗很長的時間。你也可以通過萬維網(wǎng)直接鏈接到WebCutter限制性內(nèi)切酶圖上。

第14頁,共64頁,2023年,2月20日,星期一1.WebCutter:點亮你想要

圖譜的序列

標題,從

“World

WideWeb”

菜單中選擇

“Auto-fed

WebCutter

Restriction

Mapping”第15頁,共64頁,2023年,2月20日,星期一2.BioEdit:

點亮你想要圖譜的序列標題,從“Sequence”菜單選擇“RestrictionMap”。

以下選項將會顯示在一個界面窗口:

第16頁,共64頁,2023年,2月20日,星期一—

顯示圖譜:顯示或省略序列的全圖譜,互補鏈顯示每個酶的酶切位點.默認值:yes—按照字母順序排列名稱:顯示關(guān)于所有內(nèi)切酶、它們的識別序列、切割頻率和所有位置(5’末端開始是1)的列表.默認值:yes—位置數(shù):關(guān)于酶切位點的列表.默認值:no—唯一位點列表:在全部序列中只有一個酶切位點的內(nèi)切酶列表.默認值:no—切割5次或更少的酶.默認值:yes—頻率匯總表:關(guān)于所有正確選擇的內(nèi)切酶和它們切割序列的次數(shù)。默認值:no—不能切割的內(nèi)切酶。默認值:yes—

4-堿基內(nèi)切酶:想要包括這些酶,必須點擊這個選項.默認值:no(不包括本身)—

5-堿基內(nèi)切酶:與4-basecutters相同.—非嚴格識別序列的酶:有時你可排除它們.默認值:yes—大的識別位點:通常用于克隆,只有共同的6-堿基識別酶被使用.—同裂酶:若只顯示一個特殊識別位點的一個內(nèi)切酶,不選(默認值=不選擇).—翻譯:顯示沿著排列中的序列翻譯(5’端到3’端的由左到右的翻譯)—互補翻譯:互補鏈的翻譯方向相反.—編號方式:是酶切位點的核酸的號碼,而不是識別位點的起點.第17頁,共64頁,2023年,2月20日,星期一3.RestrictionEnzymeBrowser(限制性內(nèi)切酶瀏覽器)從核酸序列中得到內(nèi)切酶譜時,顯示酶的生產(chǎn)公司是很有用的。通過在內(nèi)切酶圖譜中選擇制造廠商和按下按鈕,可以手動瀏覽內(nèi)切酶。你也可以通過選擇“Options”菜單中的“ViewRestrictionEnzymesbyManufacturer”選擇,在任何時候檢查內(nèi)切酶。顯示如右對話框:

第18頁,共64頁,2023年,2月20日,星期一在這個例子中,所有來源于Stratagene的限制性內(nèi)切酶顯示在左邊的列表中,KpnI的亮度增加。KpnI的識別序列顯示在頂端,同裂酶顯示在它的下方,其他提供KpnI的公司顯示在同裂酶的下方。BioEdit使用ReBase提供的gcgenz表,限制性內(nèi)切酶數(shù)據(jù)在萬維網(wǎng)的地址是:

??梢詮腞eBase下載最新的gcgenz表,將其命名為“enzyme.tab”,

并且替代在BioEdit安裝文件夾中“tables”目錄下的舊文件。

注意:表必須是gcgenz格式的。你可以從tables文件夾中打開“enzyme.tab”文件查看格式,或者查看“RestrictionMaps”。限制性內(nèi)切酶表格文件名必須是“enzyme.tab”,而且必須在BioEdit的“tables”文件夾里。

第19頁,共64頁,2023年,2月20日,星期一1.氨基酸的組成從“Sequence”菜單下進入“Protein”,再進入“aminaacidcomposition”,可對序列的氨基酸組成分析,結(jié)果以摘要和圖例的形式給出。圖例中的柱形條表示每種氨基酸在序列中的摩爾比,如下圖:三、蛋白質(zhì)分析第20頁,共64頁,2023年,2月20日,星期一以RGDV的minoroutercapsidprotein-AAS66885為例:第21頁,共64頁,2023年,2月20日,星期一2.熵圖在聯(lián)配文件中有專欄用熵圖來衡量可變性。它衡量的是在聯(lián)配中每個位置的“信息量”的缺乏。準確地說,是每個位置的可預測性的缺乏。

第22頁,共64頁,2023年,2月20日,星期一3.疏水性輪廓(profile)平均疏水性輪廓采用Kyte&Doolittle的方法,平均分值(總和/窗口大小)作為序列中各個位置的疏水性值,并以窗口中中間殘基的疏水性值作圖。

第23頁,共64頁,2023年,2月20日,星期一4.瞬間疏水性輪廓(hydrophobicmomentprofile)第24頁,共64頁,2023年,2月20日,星期一5.平均瞬間疏水性輪廓第25頁,共64頁,2023年,2月20日,星期一6.在聯(lián)配中搜尋保守區(qū)

有時,即使序列之間的變化很大時,在幾個序列中搜尋保守區(qū)是有用的。例如,根據(jù)一系列同源序列發(fā)現(xiàn)通用的PCR引物。BioEdiot查找的是低平均“熵”的區(qū)域。

首先選擇你的序列,從“Aligment”->“FindConservedRegion”,對話框中各選項的內(nèi)容:

第26頁,共64頁,2023年,2月20日,星期一BioEditversion5.0.9ConservedregionsearchAlignmentfile:Q:\Ribosomal_RNA\some_methanos.bio5/10/048:57:33PM

Minimumsegmentlength(actualforeachsequence):15Maximumaverageentropy:0.2Maximumentropyperposition:0.2Gapslimitedto2persegmentContiguousgapslimitedto1inanysegment

2conservedregionsfound

Region1:Position755to774Consensus:755AUUAGAUACCCGGGUAGUCC774

第27頁,共64頁,2023年,2月20日,星期一SegmentLength:20Averageentropy(Hx):0.0155Position755:0.0000Position756:0.0000Position757:0.0000Position758:0.0708Position759:0.0000Position760:0.0000Position761:0.0000Position762:0.0000Position763:0.0000Position764:0.0708Position765:0.0000Position766:0.1679Position767:0.0000Position768:0.0000Position769:0.0000Position770:0.0000Position771:0.0000Position772:0.0000Position773:0.0000Position774:0.0000第28頁,共64頁,2023年,2月20日,星期一Region2:Position1206to1222Consensus:1206ACACGCGGGCUACAAUG1222

SegmentLength:17Averageentropy(Hx):0.0182Position1206:0.0000Position1207:0.0000Position1208:0.0000Position1209:0.0000Position1210:0.0708Position1211:0.0708Position1212:0.0000Position1213:0.1679Position1214:0.0000Position1215:0.0000Position1216:0.0000Position1217:0.0000Position1218:0.0000Position1219:0.0000Position1220:0.0000Position1221:0.0000Position1222:0.0000第29頁,共64頁,2023年,2月20日,星期一BioEditversion5.0.9ConservedregionsearchAlignmentfile:G:\Ribosomal_RNA\some_methanos.bio5/10/999:34:06PM

Minimumsegmentlength

(actualforeachsequence):10Maximumaverageentropy:0.4Maximumentropyperposition:

0.4with2exceptionsallowedGapslimitedto2persegmentContiguousgapslimitedto1inanysegment

36conservedregionsfound結(jié)果:第30頁,共64頁,2023年,2月20日,星期一7.根據(jù)密碼子的使用翻譯核苷酸

核苷酸序列可根據(jù)三聯(lián)體密碼翻譯預測的蛋白序列。從“Sequence”->“Protein”->“Translation”,選擇要按何種讀框翻譯。例如,以下是一個假設的Methanobacterium(甲烷細菌)的ORF(開放閱讀框架)。

第31頁,共64頁,2023年,2月20日,星期一>MTH671codingregionATGGTTGCAGTACCCGGCAGTGAGATACTGAGCGGTGCACTACACGTTGTCTCCCAGAGCCTCCTCATACCGGTTATAGCAGGTCTACTGTTATTCATGGTATACGCCATAGTGACCCTCGGAGGGCTCATATCAGAGTACTCTGGAAGGATAAGGACTGATGTTAAGGAACTTGAATCGGCAATAAAATCAATTTCAAACCCAGGAACCCCTGAAAAGATAATTGAGGTCGTCGATTCGATGGACATACCACAGAGCCAGAAGGCCGTGCTCACTGATATCGCAGGGACAGCTGAACTCGGACCAAAATCAAGGGAGGCCCTCGCAAGGAAGTTGATAGAGAATGAGGAACTCAGGGCTGCCAAGAGCCTTGAGAAGACAGACATTGTAACCAGACTCGGCCCAACCCTTGGACTGATGGGGACACTCATACCCATGGGTCCAGGACTCGCAGCCCTCGGGGCAGGTGACATCAATACACTGGCCCAGGCCATCATCATAGCCTTCGATACAACAGTTGTGGGACTTGCATCAGGGGGTATAGCATACATCATCTCCAAGGTCAGGAGAAGATGGTATGAGGAGTACCTCTCAAATCTTGAGACAATGGCCGAGGCAGTGCTGGAGGTGATGGATAATGCCACTCAGACGCCGGCGAAGGCTCCTCTCGGATCAAAA第32頁,共64頁,2023年,2月20日,星期一Aframe1ofthissequenceisdisplayedasfollowsintheBioEdittexteditor:>MTH671codingregion

1ATGGTTGCAGTACCCGGCAGTGAGATACTGAGCGGTGCACTACAC451MetValAlaValProGlySerGluIleLeuSerGlyAlaLeuHis15

46GTTGTCTCCCAGAGCCTCCTCATACCGGTTATAGCAGGTCTACTG9016ValValSerGlnSerLeuLeuIleProValIleAlaGlyLeuLeu30

91TTATTCATGGTATACGCCATAGTGACCCTCGGAGGGCTCATATCA13531LeuPheMetValTyrAlaIleValThrLeuGlyGlyLeuIleSer45

136GAGTACTCTGGAAGGATAAGGACTGATGTTAAGGAACTTGAATCG18046GluTyrSerGlyArgIleArgThrAspValLysGluLeuGluSer60

181GCAATAAAATCAATTTCAAACCCAGGAACCCCTGAAAAGATAATT22561AlaIleLysSerIleSerAsnProGlyThrProGluLysIleIle75

226GAGGTCGTCGATTCGATGGACATACCACAGAGCCAGAAGGCCGTG27076GluValValAspSerMetAspIleProGlnSerGlnLysAlaVal90

…第33頁,共64頁,2023年,2月20日,星期一|ACGT|-----------------------------A|37313|A|0.760.120.040.07||LysThrArgIle|-----------------------------A|1446|C|0.610.430.270.46||AsnThrSerIle|-----------------------------A|8167|G|0.240.230.031||LysThrArgMet|-----------------------------A|4313|T|0.390.210.130.47||AsnThrSerIle|-----------------------------………第34頁,共64頁,2023年,2月20日,星期一四、RNA的比較分析RNA的結(jié)構(gòu)定義為核苷酸的堿基的相互作用。最簡單情況下,即螺旋中的堿基對之間的Waltson-Crick堿基配對。RNA結(jié)構(gòu)的系統(tǒng)發(fā)育比較分析方法建立在如下假定上,即在進化中核苷酸改變,但重要的RNA二級和三級結(jié)構(gòu)保持不變。一個可能破壞結(jié)構(gòu)的堿基變化可以由序列中另一處的變化補償以保持結(jié)構(gòu)穩(wěn)定。所以不同物種的同源RNA中將包含“補償堿基變化”或“共變化,協(xié)變(covariation)”。所以通過檢查來自各個不同生物的同源RNA,確定這些“補償堿基變化”,從而闡明結(jié)構(gòu)。

例如,一給定的序列,GAAGA將可能與序列中任一UCUUC配對,而后者可能在序列中出現(xiàn)數(shù)次。如何確定到底是和哪一個配對呢?可以檢查不同生物的同源RNA序列,找出“補償堿基變化”。

第35頁,共64頁,2023年,2月20日,星期一organism#1?????GAAGA?????????UCUUC????????UCUUC?????????UCUUC???????organism#2?????GAUGA?????????UCUUC????????UCUGC?????????UCAUC???????organism#2?????GAUGA?????????GCUUC????????UCUAC?????????UCAUC???????organism#2?????GACGA?????????UCUUC????????UCUGC?????????UCGUC???????在此例中,只有最后一個UCUUC才可和GAAGA配對。象這樣在序列中2個位置出現(xiàn)“補償堿基變化”,被認為是螺旋存在的證據(jù)。兩條序列不能形成互補,表明不存在配對。在“系統(tǒng)發(fā)育比較分析”中關(guān)鍵是序列聯(lián)配,同源序列必須適當聯(lián)配。此處同源性是嚴格意義的:同源的核苷酸來自一個共同的祖先。所以開始時,先使用關(guān)系緊密的序列進行聯(lián)配,這樣在序列相似性基礎上聯(lián)配,不需要加入許多聯(lián)配的空位。聯(lián)配后互補序列的“協(xié)變”可被立即發(fā)現(xiàn),從而開始構(gòu)建二級結(jié)構(gòu),然后差異大的序列可以添進聯(lián)配中。這樣持續(xù)添加新序列,進行“協(xié)變”分析,直到聯(lián)配和二級結(jié)構(gòu)模型出現(xiàn)此過程的完全描述。一旦一個完整的二級結(jié)構(gòu)模型形成,“協(xié)變”分析可以鑒定非螺旋區(qū)的核苷酸之間的相互作用以及不規(guī)則的相互作用。之所以可以被鑒定,是因為涉及的核苷酸即使不形成規(guī)則的堿基配對或是一個螺旋的一部分,也仍一致的變化。

第36頁,共64頁,2023年,2月20日,星期一1.共變化(Covariation)

共變化指序列中兩個殘基步調(diào)一致地變化。嚴格地講即每當聯(lián)配序列中x變化時,y也變化,兩者是一致的。(例如,當x變?yōu)锳,y變?yōu)門。每次x變?yōu)锳,y一定變?yōu)門)。殘基間的共變化表明,它們之間一定有重要的相互作用,當重要結(jié)構(gòu)殘基突變時,自然選擇保留了那些有補償突變的序列。共變化的例子

假設我們現(xiàn)有一個聯(lián)配序列,它表示了幾種物種共有的一個特定的RNA的保守的結(jié)構(gòu)。我們希望從聯(lián)配中包含的信息推測出RNA二級結(jié)構(gòu)。

第37頁,共64頁,2023年,2月20日,星期一

....|....|....|....|....|....1020

sample1CCGGAUACGAUCGUCGGGUACGUAUCCGGsample2CCGGAUACUAUCUUGGCGAAAGUAUCUGGsample3CGGGAUACGAUCGACGCGUACGUAUCCCGsample4CGCGGUACCAUCCACCCCUAGGUACCGCGsample5CCGGAUACGAUCGUCCCGUUCGUAUCCGGsample6CCGGAUACGAUCGUCGGGUACGUAUCCGGsample7CCGGACACGAUCGUCGGGUACGUAUCCGGsample8CCAGAUACGAUCGAAACUUUCGUAUCUGGsample9CCGGUUACCAUCGUCGGGUAGGUAACCGGsample9CCGGAUACGAUCGACAGGAACGUAUCCGGsample10CCGGAUACGAUCGUCCCGUACGUAUCCGGsample11CCGGAUACGAUCGUCGGGUACGUAUCCGGsample12CCUGAUACUAUCGUCGCCUAAGUAUCGGGsample13CGGGGUACGAUCGAGGCCUACGUACCCCGsample14CCCGCUACGAUCGAGGCCUUCGUAGCGGGsample15CCGGAUACGAUCGAGGCCUUCGUAUCCGG下面是一個聯(lián)配的例子

第38頁,共64頁,2023年,2月20日,星期一CovariationanalysisInputfile:I:\BioEdit\help\samples.gbPositionnumberingisrelativetothealignmentnumbering.Nomaskwasused.

1CCCCCCCCCCCCCCCC????????????????????????

Position2:????????????????????????2CCGGCCCCCCCCCGCC28GGCCGGGGGGGGGCGGAllpotentialWatsonCrickorG?Upairs????????????????????????3GGGCGGGAGGGGUGCG????????????????????????4GGGGGGGGGGGGGGGG????????????????????????

Position5:????????????????????????5AAAGAAAAUAAAAGCA25UUUCUUUUAUUUUCGUAllpotentialWatsonCrickorG?Upairs????????????????????????6UUUUUUCUUUUUUUUU????????????????????????7AAAAAAAAAAAAAAAA????????????????????????8CCCCCCCCCCCCCCCC????????????????????????第39頁,共64頁,2023年,2月20日,星期一Position9:????????????????????????9GUGCGGGGCGGGUGGG21CACGCCCCGCCCACCCAllpotentialWatsonCrickorG?Upairs????????????????????????10AAAAAAAAAAAAAAAA????????????????????????11UUUUUUUUUUUUUUUU????????????????????????12CCCCCCCCCCCCCCCC????????????????????????13GUGCGGGGGGGGGGGG????????????????????????14UUAAUUUAUAUUUAAA????????????????????????15CGCCCCCACCCCCGGG????????????????????????16GGGCCGGAGACGGGGG????????????????????????17GCCCCGGCGGCGCCCC????????????????????????18GGGCGGGUGGGGCCCC????????????????????????19UAUUUUUUUAUUUUUU????????????????????????20AAAAUAAUAAAAAAUU????????????????????????第40頁,共64頁,2023年,2月20日,星期一Position21:????????????????????????21CACGCCCCGCCCACCC9GUGCGGGGCGGGUGGGAllpotentialWatsonCrickorG?Upairs????????????????????????22GGGGGGGGGGGGGGGG????????????????????????23UUUUUUUUUUUUUUUU????????????????????????24AAAAAAAAAAAAAAAA????????????????????????

Position25:????????????????????????25UUUCUUUUAUUUUCGU5AAAGAAAAUAAAAGCAAllpotentialWatsonCrickorG?Upairs????????????????????????26CCCCCCCCCCCCCCCC????????????????????????27CUCGCCCUCCCCGCGC????????????????????????Position28:????????????????????????28GGCCGGGGGGGGGCGG2CCGGCCCCCCCCCGCCAllpotentialWatsonCrickorG?Upairs????????????????????????29GGGGGGGGGGGGGGGG????????????????????????第41頁,共64頁,2023年,2月20日,星期一在上述聯(lián)配中共有3對“共變化”的位置點:2/28,5/25,9/21。兩個堿基共變表明它們很可能相互作用。如果一個突變發(fā)生在與其他堿基有重要作用的堿基上(常是堿基對),選擇壓力可能會只保留在另一處堿基上發(fā)生補償突變的堿基。事實上,上述的堿基共變化都發(fā)生在規(guī)則的堿基對(Watson-Crick堿基對或在RNA中G-U)表明它們可能是堿基配對。共變化堿基對2/5分別和5/25的距離相同,而5/25分別和9/21的距離也相同,而且界于它們之間的堿基也可形成堿基互補,這都表明聯(lián)配序列的兩端可能閉合形成螺旋如下是“Sample1”形成的結(jié)構(gòu)。

UCAG--CCGGATACGU--GGCCTATGCCAGUGG

第42頁,共64頁,2023年,2月20日,星期一2.潛在配對分析potentialpairing

當RNA分子中兩個核苷酸之間存在配對堿基的相互作用力。一個堿基發(fā)生突變,另一個堿基為了補償這一突變,可能不僅僅是某一特定核苷酸突變(例如原來的A-T配對可能在一序列中轉(zhuǎn)換為G-C,而另一序列中為G-U,)這在共變化分析中將被忽略。因為此種改變并不遵循完全相同的模式。要鑒定這種情況,可以在潛在配對中選定堿基配對的規(guī)則。

仍用上例中的序列(

sample1-sample15

略)BioEdit中并不要求有位置變化,所以未改變的位置上只要可以形成堿基對,也能被發(fā)現(xiàn)同時也可在“preference”中設置以濾出未改變的位置之間的堿基配對。以下是一個聯(lián)配序列它和在共變化分析中使用的相同。設置允許A-U/G-C/G-U堿基配對規(guī)則以及1個錯配,產(chǎn)生下列的結(jié)果(以清單格式,濾除了未變化位置的潛在配對)比較這一結(jié)果和共變化的結(jié)果,發(fā)現(xiàn)位置3/27有一潛在的配對,而共變化的結(jié)果未檢出。潛在配對的數(shù)據(jù)也可以按允許的配對出現(xiàn)的頻率或原始允許配對的數(shù)目列出一個(二維矩陣)表。

第43頁,共64頁,2023年,2月20日,星期一PotentialPairingsListInputFile:I:\BioEdit\help\samples.gbAllowedMispairings=116totalsequences,29nucleotidespersequence.Axesreflectnumberingoftheentirealignment.NoMaskwasused.Hitsoninvariantpairshavebeenfilteredout.

????????????????????????1CCCCCCCCCCCCCCCC????????????????????????Position:2????????????????????????2CCGGCCCCCCCCCGCC28GGCCGGGGGGGGGCGG0mis?matches????????????????????????第44頁,共64頁,2023年,2月20日,星期一Position:3????????????????????????3GGGCGGGAGGGGUGCG27CUCGCCCUCCCCGCGC0mis?matches????????????????????????

Position:4????????????????????????4GGGGGGGGGGGGGGGG6UUUUUUCUUUUUUUUU0mis?matches????????????????????????

Position:5????????????????????????5AAAGAAAAUAAAAGCA25UUUCUUUUAUUUUCGU0mis?matches????????????????????????第45頁,共64頁,2023年,2月20日,星期一Position:6????????????????????????6UUUUUUCUUUUUUUUU4GGGGGGGGGGGGGGGG0mis?matches????????????????????????6UUUUUUCUUUUUUUUU7AAAAAAAAAAAAAAAA1mis?matches????????????????????????6UUUUUUCUUUUUUUUU10AAAAAAAAAAAAAAAA1mis?matches????????????????????????6UUUUUUCUUUUUUUUU22GGGGGGGGGGGGGGGG0mis?matches????????????????????????6UUUUUUCUUUUUUUUU24AAAAAAAAAAAAAAAA1mis?matches????????????????????????6UUUUUUCUUUUUUUUU29GGGGGGGGGGGGGGGG0mis?matches????????????????????????第46頁,共64頁,2023年,2月20日,星期一Position:7????????????????????????7AAAAAAAAAAAAAAAA6UUUUUUCUUUUUUUUU1mis?matches????????????????????????

8CCCCCCCCCCCCCCCC????????????????????????Position:9????????????????????????9GUGCGGGGCGGGUGGG21CACGCCCCGCCCACCC0mis?matches????????????????????????

Position:10????????????????????????10AAAAAAAAAAAAAAAA6UUUUUUCUUUUUUUUU1mis?matches????????????????????????第47頁,共64頁,2023年,2月20日,星期一11UUUUUUUUUUUUUUUU????????????????????????12CCCCCCCCCCCCCCCC????????????????????????13GUGCGGGGGGGGGGGG????????????????????????14UUAAUUUAUAUUUAAA????????????????????????15CGCCCCCACCCCCGGG????????????????????????16GGGCCGGAGACGGGGG????????????????????????17GCCCCGGCGGCGCCCC????????????????????????18GGGCGGGUGGGGCCCC????????????????????????19UAUUUUUUUAUUUUUU????????????????????????20AAAAUAAUAAAAAAUU????????????????????????第48頁,共64頁,2023年,2月20日,星期一Position:22????????????????????????22GGGGGGGGGGGGGGGG6UUUUUUCUUUUUUUUU0mis?matches????????????????????????

23UUUUUUUUUUUUUUUU????????????????????????Position:24????????????????????????24AAAAAAAAAAAAAAAA6UUUUUUCUUUUUUUUU1mis?matches????????????????????????

Position:25????????????????????????25UUUCUUUUAUUUUCGU5AAAGAAAAUAAAAGCA0mis?matches????????????????????????

26CCCCCCCCCCCCCCCC????????????????????????Position:27????????????????????????27CUCGCCCUCCCCGCGC3GGGCGGGAGGGGUGCG0mis?matches????????????????????????第49頁,共64頁,2023年,2月20日,星期一Position:28????????????????????????28GGCCGGGGGGGGGCGG2CCGGCCCCCCCCCGCC0mis?matches????????????????????????

Position:29????????????????????????29GGGGGGGGGGGGGGGG6UUUUUUCUUUUUUUUU0mis?matches????????????????????????第50頁,共64頁,2023年,2月20日,星期一3.交互信息分析(MutualInformationAnalysis)

概述

交互信息,象在系統(tǒng)發(fā)育比較分析中的應用一樣,主要是衡量在一個適當聯(lián)配中兩個位置共有信息的信息量。符號是M(x,y)(位置x,y的相互信息)。M(x,y)表明兩個位置相關(guān)的緊密程度。此相關(guān)程度顯示了兩位置的直接相互作用,如堿基配對。BioEdit另外計算R1和R2兩個參數(shù),它們分別表示位置x,y對M(x,y)的貢獻。

第51頁,共64頁,2023年,2月20日,星期一什么是交互信息交互信息分析是以下思想的拓展--即對某個特定位置的不確定性表示是信息含量的下降。在預先對某位置一無所知的情況下(如RNA中核苷酸),不確定性最大。但一旦確定了某位置是什么核苷酸時,不確定性消除了,此位置的信息量達到最大。現(xiàn)在考慮有多條序列,在某位置均含有一個同源核苷酸。知道第一條序列上此位置上的核苷酸并不能為確定第二條或隨機的一條序列中此序列的核苷酸提供多少信息。但是如果已知此位置在許多乃至幾乎所有序列中均為某一特定堿基(如C),而不是其它的堿基(如G),

則我們積累了相當多的“信息”,可預測另一個未檢測的序列中,在此位置某核苷酸出現(xiàn)的可能性。即在另一未檢測的序列中,此位置核苷酸的不確定性下降了。第52頁,共64頁,2023年,2月20日,星期一交互信息進一步拓展了這一思想,對配對位置的信息量進行檢查,此信息量依賴于并聯(lián)系每個位置單獨的信息量,但不能將兩者混淆。總的講,它衡量不確定性的下降,此不確定性指兩種事物相互影響相互作用的程度。RobinGutell發(fā)展了用交互信息預測RNA結(jié)構(gòu)的方法,也很適合系統(tǒng)發(fā)育比較分析,因為兩個位置交互信息高也提示這2個殘基直接相互作用。

1234ACGUACGUAGCUAUAUAUAUAAUUAAUUAGCU如左圖總共8個序列,其中位置1,4是不改變的,信息量最大。位置2,3中C/G/U/A各出現(xiàn)了2次,信息量為0,我們無法預測下一個序列中這兩個位置的核苷酸,但位置2,3都含有它們之間是如何影響彼此的共有信息。我們不能猜出新一序列中位置2的核苷酸,但如果告訴我位置3是C,

我們可以推斷出位置2是G,這即建立在“交互信息分析”(它們遵循共同的配對模式)交互信息也表明這些堿基可能相互作用。第53頁,共64頁,2023年,2月20日,星期一交互信息

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論