核酸序列使用說(shuō)明書(shū)_第1頁(yè)
核酸序列使用說(shuō)明書(shū)_第2頁(yè)
核酸序列使用說(shuō)明書(shū)_第3頁(yè)
核酸序列使用說(shuō)明書(shū)_第4頁(yè)
核酸序列使用說(shuō)明書(shū)_第5頁(yè)
已閱讀5頁(yè),還剩59頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、核酸序列使用說(shuō)明書(shū)第1頁(yè),共64頁(yè),2022年,5月20日,5點(diǎn)27分,星期四BioEdit簡(jiǎn)介BioEdit是一個(gè)性能優(yōu)良的免費(fèi)的生物序列編輯器,可在Windows 95/98/NT/2000中運(yùn)行,它的基本功能是提供蛋白質(zhì)、核酸序列的編輯、排列、處理和分析。與DNAMAN相比,其分析內(nèi)容相對(duì)豐富一些,而且提供了很多網(wǎng)絡(luò)程序的分析界面和接口,與DNAMAN等軟件配合使用更好。尤其值得一提是利用BioEdit能夠十分方面地根據(jù)指定的核酸序列繪制相應(yīng)的質(zhì)粒圖譜。第2頁(yè),共64頁(yè),2022年,5月20日,5點(diǎn)27分,星期四序列的常規(guī)操作:序列輸入:多種序列輸入方式;序列分類:按標(biāo)題、位置 、定義、

2、參數(shù)、注釋等分類;成對(duì)排列:兩序列的最佳排列及計(jì)算同一性和類似性;序列屏蔽:僅采用聯(lián)配中部分區(qū)域進(jìn)行分析而排除其他。核酸分析:組成、互補(bǔ)、反轉(zhuǎn)、翻譯、質(zhì)粒、限制性內(nèi)切酶;蛋白質(zhì)分析:氨基酸成分、疏水性輪廓 、疏水力矩平均數(shù)翻譯或反翻譯:把DNA或RNA翻譯成蛋白質(zhì);切換翻譯:在核酸和編碼蛋白質(zhì)序列中切換核苷酸序列;點(diǎn)圖成對(duì)比較:相互比較兩序列的矩陣,生成一個(gè)點(diǎn)圖。第3頁(yè),共64頁(yè),2022年,5月20日,5點(diǎn)27分,星期四BLAST本地使用BLAST 創(chuàng)建本地?cái)?shù)據(jù)庫(kù) 本地BLAST 搜尋 BLAST INTERNET 客戶端程序 ClustalW 使用互聯(lián)網(wǎng)工具 HTML BLAST 網(wǎng)絡(luò)瀏覽

3、器 PSI-BLAST nnPredict 進(jìn)化分析第4頁(yè),共64頁(yè),2022年,5月20日,5點(diǎn)27分,星期四主要內(nèi)容繪制質(zhì)粒圖限制性內(nèi)切酶圖 蛋白質(zhì)分析 組成分析熵圖疏水性輪廓聯(lián)配中搜尋保守區(qū) 根據(jù)密碼子的使用翻譯核苷酸 RNA比較分析共變潛在配對(duì)互交信息分析 第5頁(yè),共64頁(yè),2022年,5月20日,5點(diǎn)27分,星期四一、繪制質(zhì)粒圖(Plasmind drawing)使用BioEdit質(zhì)粒繪圖功能,序列可以通過(guò)自動(dòng)的位置標(biāo)記,自動(dòng)修改成環(huán)形質(zhì)粒。特征、多連接位點(diǎn)和限制性位點(diǎn)可以通過(guò)使用對(duì)話框增加。當(dāng)將一個(gè)序列進(jìn)入質(zhì)粒圖時(shí),在背景上出現(xiàn)一個(gè)限制性內(nèi)切酶圖譜,所以可以通過(guò)對(duì)話框選擇可以增加限

4、制性位點(diǎn)。它們自動(dòng)增加到當(dāng)前的位點(diǎn)。質(zhì)粒功能提供簡(jiǎn)單的繪制和標(biāo)記工具。標(biāo)簽和繪圖可以通過(guò)鼠標(biāo)移動(dòng)和縮放。想要編輯目標(biāo)性質(zhì),雙擊目標(biāo)。想要從一個(gè)DNA序列產(chǎn)生一個(gè)質(zhì)粒,從“Sequence ”菜單中“Nucleic Acid ”子菜單中選擇“Create Plasmid from Sequence ”選項(xiàng)。選擇這個(gè)選項(xiàng)時(shí),限制性內(nèi)切酶圖譜將會(huì)使用通常商業(yè)化的,儲(chǔ)存在存儲(chǔ)器中的限制性內(nèi)切酶。質(zhì)粒第一次產(chǎn)生時(shí),它顯示成有10個(gè)位點(diǎn)標(biāo)記的圓圈,中央是標(biāo)題 。 第6頁(yè),共64頁(yè),2022年,5月20日,5點(diǎn)27分,星期四第7頁(yè),共64頁(yè),2022年,5月20日,5點(diǎn)27分,星期四1.Restrictio

5、n sites:(限制性位點(diǎn)) 想要增加限制性位點(diǎn),從“Vector ”菜單中選擇“Restriction Sites ”選項(xiàng)。將會(huì)顯示一下對(duì)話框: 第8頁(yè),共64頁(yè),2022年,5月20日,5點(diǎn)27分,星期四想要顯示圖譜中的限制性內(nèi)切酶,從右邊(“Dont Show ”中)選擇任何想要的酶,用 按鈕將它們移動(dòng)到左邊。按下“Apply & Close ”時(shí),這個(gè)位點(diǎn)就會(huì)增加到圖譜中。指定的酶如果只有一個(gè)酶切位點(diǎn),就會(huì)在酶切位點(diǎn)上出現(xiàn)一個(gè)“U ”。如果沒(méi)有“U”, 將會(huì)顯示第一個(gè)酶切位點(diǎn)。想要移動(dòng)圖譜中酶的位置,在“Show ”中增加選擇的酶的亮度,按下 按鈕將它們移動(dòng)另一邊。 第9頁(yè),共64頁(yè)

6、,2022年,5月20日,5點(diǎn)27分,星期四2.Positional marks (位置標(biāo)記): 點(diǎn)擊“Vector ”菜單中的“Positional Marks ”選項(xiàng),可以出現(xiàn)以下對(duì)話框:可以通過(guò)移動(dòng)位置標(biāo)記到“Show” 中,單獨(dú)增加位置標(biāo)記,或者設(shè)定應(yīng)用的分割標(biāo)記數(shù)量。想要沒(méi)有標(biāo)記,選擇“Divide into: ” 中的下拉菜單頂端的“None”。第10頁(yè),共64頁(yè),2022年,5月20日,5點(diǎn)27分,星期四3.Features (特征): 想要增加一個(gè)特征,如抗生素抵抗標(biāo)記,從“Vector” 菜單選擇“Add Feature”。 將顯示以下對(duì)話框:選擇的類型是“Normal Ar

7、row ”、“Wide Arrow ”、“Normal Box” 和、“Wide Box ”。在上面例子中的所有特征是“常規(guī)”寬度的。如果特征是一個(gè)箭頭,箭頭的方向?qū)⑹菑钠瘘c(diǎn)位置到終點(diǎn)位置。 增加特征或酶時(shí),他們各自的標(biāo)記增加在外面,中心是可能的尺寸。標(biāo)記可以被選擇工具選擇、移動(dòng)、編輯和縮放。第11頁(yè),共64頁(yè),2022年,5月20日,5點(diǎn)27分,星期四4.General Vector properties 載體屬性可通過(guò)選 “Vector” 菜單中的“Properties ”來(lái)更改 : 第12頁(yè),共64頁(yè),2022年,5月20日,5點(diǎn)27分,星期四可以通過(guò)指定起點(diǎn)和末端位置,來(lái)增加多接頭按鈕

8、。多接頭顯示為“Courier New ”字體。在這個(gè)對(duì)話框中,特征可以被編輯、增加或者刪除。想要編輯或刪除一個(gè)現(xiàn)存的特征,在“Features”下拉式菜單中選擇特征,并點(diǎn)擊合適的按鈕。點(diǎn)擊“Add New” 按鈕,可以增加一個(gè)新的特征。 現(xiàn)在只有一個(gè)圓形、單鏈質(zhì)粒是有效的。在以后的版本中中將會(huì)改進(jìn)。 “Font”按鈕改變指示的默認(rèn)字體。特征標(biāo)記的字體將可以單獨(dú)改變,但是位置標(biāo)記不能單獨(dú)改變。 第13頁(yè),共64頁(yè),2022年,5月20日,5點(diǎn)27分,星期四二、Restriction Maps(限制性內(nèi)切酶圖) BioEdit提供兩種方法產(chǎn)生核苷酸序列的限制性內(nèi)切酶圖。一種內(nèi)在的限制性內(nèi)切酶圖功

9、能允許產(chǎn)生序列最多為65,536個(gè)核苷酸的限制性內(nèi)切酶圖。實(shí)際上,只能檢測(cè)大約35Kb, 而且在速度慢的計(jì)算機(jī)上會(huì)要消耗很長(zhǎng)的時(shí)間。 你也可以通過(guò)萬(wàn)維網(wǎng)直接鏈接到WebCutter 限制性內(nèi)切酶圖上。 第14頁(yè),共64頁(yè),2022年,5月20日,5點(diǎn)27分,星期四1.WebCutter:點(diǎn)亮你想要圖譜的序列標(biāo)題,從“World Wide Web”菜單中選擇“Auto-fed WebCutter Restriction Mapping” 第15頁(yè),共64頁(yè),2022年,5月20日,5點(diǎn)27分,星期四2.BioEdit: 點(diǎn)亮你想要圖譜的序列標(biāo)題,從“Sequence” 菜單選擇“Restrict

10、ion Map” 。 以下選項(xiàng)將會(huì)顯示在一個(gè)界面窗口: 第16頁(yè),共64頁(yè),2022年,5月20日,5點(diǎn)27分,星期四 顯示圖譜:顯示或省略序列的全圖譜,互補(bǔ)鏈顯示每個(gè)酶的酶切位點(diǎn).默認(rèn)值:yes 按照字母順序排列名稱:顯示關(guān)于所有內(nèi)切酶、它們的識(shí)別序列、切割頻率和所有位置(5末端開(kāi)始是1) 的列表.默認(rèn)值:yes 位置數(shù):關(guān)于酶切位點(diǎn)的列表.默認(rèn)值:no 唯一位點(diǎn)列表:在全部序列中只有一個(gè)酶切位點(diǎn)的內(nèi)切酶列表.默認(rèn)值:no 切割5次或更少的酶 .默認(rèn)值:yes 頻率匯總表:關(guān)于所有正確選擇的內(nèi)切酶和它們切割序列的次數(shù)。默認(rèn)值:no 不能切割的內(nèi)切酶。默認(rèn)值:yes 4-堿基內(nèi)切酶: 想要包括

11、這些酶,必須點(diǎn)擊這個(gè)選項(xiàng).默認(rèn)值:no (不包括本身) 5-堿基內(nèi)切酶:與4-base cutters相同. 非嚴(yán)格識(shí)別序列的酶:有時(shí)你可排除它們.默認(rèn)值:yes 大的識(shí)別位點(diǎn):通常用于克隆,只有共同的6-堿基識(shí)別酶被使用.同裂酶:若只顯示一個(gè)特殊識(shí)別位點(diǎn)的一個(gè)內(nèi)切酶,不選(默認(rèn)值=不選擇). 翻譯 :顯示沿著排列中的序列翻譯(5端到3端的由左到右的翻譯)互補(bǔ)翻譯 :互補(bǔ)鏈的翻譯方向相反. 編號(hào)方式 :是酶切位點(diǎn)的核酸的號(hào)碼,而不是識(shí)別位點(diǎn)的起點(diǎn).第17頁(yè),共64頁(yè),2022年,5月20日,5點(diǎn)27分,星期四3.Restriction Enzyme Browser (限制性內(nèi)切酶瀏覽器 )從核

12、酸序列中得到內(nèi)切酶譜時(shí),顯示酶的生產(chǎn)公司是很有用的。通過(guò)在內(nèi)切酶圖譜中選擇制造廠商和按下按鈕,可以手動(dòng)瀏覽內(nèi)切酶。你也可以通過(guò)選擇“Options ”菜單中的“View Restriction Enzymes by Manufacturer”選擇,在任何時(shí)候檢查內(nèi)切酶。顯示如右對(duì)話框: 第18頁(yè),共64頁(yè),2022年,5月20日,5點(diǎn)27分,星期四 在這個(gè)例子中,所有來(lái)源于Stratagene的限制性內(nèi)切酶顯示在左邊的列表中,KpnI的亮度增加。KpnI的識(shí)別序列顯示在頂端,同裂酶顯示在它的下方,其他提供KpnI的公司顯示在同裂酶的下方。BioEdit使用ReBase提供的gcgenz表,限制

13、性內(nèi)切酶數(shù)據(jù)在萬(wàn)維網(wǎng)的地址是: ??梢詮腞eBase 下載最新的gcgenz 表,將其命名為“enzyme.tab”, 并且替代在BioEdit安裝文件夾中“tables ”目錄下的舊文件。 注意:表必須是gcgenz格式的。你可以從tables文件夾中打開(kāi)“enzyme.tab ”文件查看格式,或者查看“Restriction Maps ”。限制性內(nèi)切酶表格文件名必須是“enzyme.tab ”,而且必須在BioEdit的“tables ”文件夾里。 第19頁(yè),共64頁(yè),2022年,5月20日,5點(diǎn)27分,星期四1.氨基酸的組成從“Sequence” 菜單下進(jìn)入“Protein”, 再進(jìn)入“

14、amina acid composition”, 可對(duì)序列的氨基酸組成分析,結(jié)果以摘要和圖例的形式給出。圖例中的柱形條表示每種氨基酸在序列中的摩爾比,如下圖: 三、蛋白質(zhì)分析第20頁(yè),共64頁(yè),2022年,5月20日,5點(diǎn)27分,星期四以RGDV的minor outer capsid proteinAAS66885為例:第21頁(yè),共64頁(yè),2022年,5月20日,5點(diǎn)27分,星期四2.熵圖在聯(lián)配文件中有專欄用熵圖來(lái)衡量可變性。它衡量的是在聯(lián)配中每個(gè)位置的“信息量”的缺乏。準(zhǔn)確地說(shuō),是每個(gè)位置的可預(yù)測(cè)性的缺乏。 第22頁(yè),共64頁(yè),2022年,5月20日,5點(diǎn)27分,星期四3.疏水性輪廓(pro

15、file) 平均疏水性輪廓采用Kyte &Doolittle 的方法,平均分值(總和/窗口大小)作為序列中各個(gè)位置的疏水性值,并以窗口中中間殘基的疏水性值作圖。 第23頁(yè),共64頁(yè),2022年,5月20日,5點(diǎn)27分,星期四4.瞬間疏水性輪廓(hydrophobic moment profile)第24頁(yè),共64頁(yè),2022年,5月20日,5點(diǎn)27分,星期四5.平均瞬間疏水性輪廓第25頁(yè),共64頁(yè),2022年,5月20日,5點(diǎn)27分,星期四6.在聯(lián)配中搜尋保守區(qū) 有時(shí),即使序列之間的變化很大時(shí),在幾個(gè)序列中搜尋保守區(qū)是有用的。例如,根據(jù)一系列同源序列發(fā)現(xiàn)通用的PCR 引物。BioEdiot 查

16、找的是低平均“熵”的區(qū)域。 首先選擇你的序列,從“Aligment”-“Find Conserved Region”,對(duì)話框中各選項(xiàng)的內(nèi)容: 第26頁(yè),共64頁(yè),2022年,5月20日,5點(diǎn)27分,星期四Conserved region searchAlignment file: Q:Ribosomal_RNAsome_methanos.bio5/10/04 8:57:33 PMMinimum segment length (actual for each sequence): 15Maximum average entropy: 0.2Maximum entropy per position

17、: 0.2Gaps limited to 2 per segmentContiguous gaps limited to 1 in any segment2 conserved regions foundRegion 1: Position 755 to 774Consensus:755 AUUAGAUACCCGGGUAGUCC 774 第27頁(yè),共64頁(yè),2022年,5月20日,5點(diǎn)27分,星期四Segment Length: 20Average entropy (Hx): 0.0155Position 755 : 0.0000Position 756 : 0.0000Position 75

18、7 : 0.0000Position 758 : 0.0708Position 759 : 0.0000Position 760 : 0.0000Position 761 : 0.0000Position 762 : 0.0000Position 763 : 0.0000Position 764 : 0.0708Position 765 : 0.0000Position 766 : 0.1679Position 767 : 0.0000Position 768 : 0.0000Position 769 : 0.0000Position 770 : 0.0000Position 771 : 0.

19、0000Position 772 : 0.0000Position 773 : 0.0000Position 774 : 0.0000第28頁(yè),共64頁(yè),2022年,5月20日,5點(diǎn)27分,星期四Region 2: Position 1206 to 1222Consensus:1206 ACACGCGGGCUACAAUG 1222Segment Length: 17Average entropy (Hx): 0.0182Position 1206 : 0.0000Position 1207 : 0.0000Position 1208 : 0.0000Position 1209 : 0.0000

20、Position 1210 : 0.0708Position 1211 : 0.0708Position 1212 : 0.0000Position 1213 : 0.1679Position 1214 : 0.0000Position 1215 : 0.0000Position 1216 : 0.0000Position 1217 : 0.0000Position 1218 : 0.0000Position 1219 : 0.0000Position 1220 : 0.0000Position 1221 : 0.0000Position 1222 : 0.0000第29頁(yè),共64頁(yè),2022

21、年,5月20日,5點(diǎn)27分,星期四Conserved region searchAlignment file: G:Ribosomal_RNAsome_methanos.bio5/10/99 9:34:06 PMMinimum segment length (actual for each sequence): 10Maximum average entropy:0.4Maximum entropy per position: 0.4 with 2 exceptions allowed Gaps limited to 2 per segment Contiguous gaps limited

22、to 1 in any segment36 conserved regions found結(jié)果:第30頁(yè),共64頁(yè),2022年,5月20日,5點(diǎn)27分,星期四7.根據(jù)密碼子的使用翻譯核苷酸 核苷酸序列可根據(jù)三聯(lián)體密碼翻譯預(yù)測(cè)的蛋白序列。從“Sequence”-“Protein”-“Translation”, 選擇要按何種讀框翻譯。例如,以下是一個(gè)假設(shè)的Methanobacterium(甲烷細(xì)菌)的ORF(開(kāi)放閱讀框架)。 第31頁(yè),共64頁(yè),2022年,5月20日,5點(diǎn)27分,星期四MTH671 coding regionATGGTTGCAGTACCCGGCAGTGAGATACTGAGCGGT

23、GCACTACACGTTGTCTCCCAGAGCCTCCTCATACCGGTTATAGCAGGTCTACTGTTATTCATGGTATACGCCATAGTGACCCTCGGAGGGCTCATATCAGAGTACTCTGGAAGGATAAGGACTGATGTTAAGGAACTTGAATCGGCAATAAAATCAATTTCAAACCCAGGAACCCCTGAAAAGATAATTGAGGTCGTCGATTCGATGGACATACCACAGAGCCAGAAGGCCGTGCTCACTGATATCGCAGGGACAGCTGAACTCGGACCAAAATCAAGGGAGGCCCTCGCAAGGAAGTTG

24、ATAGAGAATGAGGAACTCAGGGCTGCCAAGAGCCTTGAGAAGACAGACATTGTAACCAGACTCGGCCCAACCCTTGGACTGATGGGGACACTCATACCCATGGGTCCAGGACTCGCAGCCCTCGGGGCAGGTGACATCAATACACTGGCCCAGGCCATCATCATAGCCTTCGATACAACAGTTGTGGGACTTGCATCAGGGGGTATAGCATACATCATCTCCAAGGTCAGGAGAAGATGGTATGAGGAGTACCTCTCAAATCTTGAGACAATGGCCGAGGCAGTGCTGGAGGTGATGGAT

25、AATGCCACTCAGACGCCGGCGAAGGCTCCTCTCGGATCAAAA 第32頁(yè),共64頁(yè),2022年,5月20日,5點(diǎn)27分,星期四A frame 1 of this sequence is displayed as follows in the BioEdit text editor:MTH671 coding region1 ATG GTT GCA GTA CCC GGC AGT GAG ATA CTG AGC GGT GCA CTA CAC 451 Met Val Ala Val Pro Gly Ser Glu Ile Leu Ser Gly Ala Leu His 15

26、46 GTT GTC TCC CAG AGC CTC CTC ATA CCG GTT ATA GCA GGT CTA CTG 9016 Val Val Ser Gln Ser Leu Leu Ile Pro Val Ile Ala Gly Leu Leu 3091 TTA TTC ATG GTA TAC GCC ATA GTG ACC CTC GGA GGG CTC ATA TCA 13531 Leu Phe Met Val Tyr Ala Ile Val Thr Leu Gly Gly Leu Ile Ser 45136 GAG TAC TCT GGA AGG ATA AGG ACT GAT

27、 GTT AAG GAA CTT GAA TCG 18046 Glu Tyr Ser Gly Arg Ile Arg Thr Asp Val Lys Glu Leu Glu Ser 60181 GCA ATA AAA TCA ATT TCA AAC CCA GGA ACC CCT GAA AAG ATA ATT 22561 Ala Ile Lys Ser Ile Ser Asn Pro Gly Thr Pro Glu Lys Ile Ile 75226 GAG GTC GTC GAT TCG ATG GAC ATA CCA CAG AGC CAG AAG GCC GTG 27076 Glu V

28、al Val Asp Ser Met Asp Ile Pro Gln Ser Gln Lys Ala Val 90第33頁(yè),共64頁(yè),2022年,5月20日,5點(diǎn)27分,星期四 |A C G T |- A |3 7 3 13 |A |0.76 0.12 0.04 0.07 | |Lys Thr Arg Ile |- A |1 4 4 6 |C |0.61 0.43 0.27 0.46 | |Asn Thr Ser Ile |- A |8 1 6 7 |G |0.24 0.23 0.03 1 | |Lys Thr Arg Met |- A |4 3 1 3 |T |0.39 0.21 0.13

29、0.47 | |Asn Thr Ser Ile |- 第34頁(yè),共64頁(yè),2022年,5月20日,5點(diǎn)27分,星期四四、RNA 的比較分析RNA 的結(jié)構(gòu)定義為核苷酸的堿基的相互作用。最簡(jiǎn)單情況下,即螺旋中的堿基對(duì)之間的Waltson-Crick 堿基配對(duì)。RNA 結(jié)構(gòu)的系統(tǒng)發(fā)育比較分析方法建立在如下假定上,即在進(jìn)化中核苷酸改變,但重要的RNA 二級(jí)和三級(jí)結(jié)構(gòu)保持不變。一個(gè)可能破壞結(jié)構(gòu)的堿基變化可以由序列中另一處的變化補(bǔ)償以保持結(jié)構(gòu)穩(wěn)定。所以不同物種的同源RNA 中將包含“補(bǔ)償堿基變化”或“共變化,協(xié)變(covariation) ”。所以通過(guò)檢查來(lái)自各個(gè)不同生物的同源RNA ,確定這些“補(bǔ)償堿基

30、變化”,從而闡明結(jié)構(gòu)。 例如,一給定的序列,GAAGA 將可能與序列中任一UCUUC 配對(duì),而后者可能在序列中出現(xiàn)數(shù)次。如何確定到底是和哪一個(gè)配對(duì)呢?可以檢查不同生物的同源RNA 序列,找出“補(bǔ)償堿基變化”。 第35頁(yè),共64頁(yè),2022年,5月20日,5點(diǎn)27分,星期四organism #1 GAAGAUCUUCUCUUCUCUUCorganism #2 GAUGAUCUUCUCUGCUCAUCorganism #2 GAUGAGCUUCUCUACUCAUCorganism #2 GACGAUCUUCUCUGCUCGUC在此例中,只有最后一個(gè)UCUUC 才可和GAAGA 配對(duì)。象這樣在序列中

31、2 個(gè)位置出現(xiàn)“補(bǔ)償堿基變化”,被認(rèn)為是螺旋存在的證據(jù)。兩條序列不能形成互補(bǔ),表明不存在配對(duì)。在“系統(tǒng)發(fā)育比較分析”中關(guān)鍵是序列聯(lián)配,同源序列必須適當(dāng)聯(lián)配。此處同源性是嚴(yán)格意義的:同源的核苷酸來(lái)自一個(gè)共同的祖先。所以開(kāi)始時(shí),先使用關(guān)系緊密的序列進(jìn)行聯(lián)配,這樣在序列相似性基礎(chǔ)上聯(lián)配,不需要加入許多聯(lián)配的空位。聯(lián)配后互補(bǔ)序列的“協(xié)變”可被立即發(fā)現(xiàn),從而開(kāi)始構(gòu)建二級(jí)結(jié)構(gòu),然后差異大的序列可以添進(jìn)聯(lián)配中。這樣持續(xù)添加新序列,進(jìn)行“協(xié)變”分析,直到聯(lián)配和二級(jí)結(jié)構(gòu)模型出現(xiàn)此過(guò)程的完全描述。一旦一個(gè)完整的二級(jí)結(jié)構(gòu)模型形成,“協(xié)變”分析可以鑒定非螺旋區(qū)的核苷酸之間的相互作用以及不規(guī)則的相互作用。之所以可以被鑒

32、定,是因?yàn)樯婕暗暮塑账峒词共恍纬梢?guī)則的堿基配對(duì)或是一個(gè)螺旋的一部分,也仍一致的變化。 第36頁(yè),共64頁(yè),2022年,5月20日,5點(diǎn)27分,星期四1.共變化(Covariation) 共變化指序列中兩個(gè)殘基步調(diào)一致地變化。嚴(yán)格地講即每當(dāng)聯(lián)配序列中x 變化時(shí),y 也變化,兩者是一致的。(例如,當(dāng)x 變?yōu)锳 ,y 變?yōu)門(mén) 。每次x 變?yōu)锳,y 一定變?yōu)門(mén))。 殘基間的共變化表明,它們之間一定有重要的相互作用,當(dāng)重要結(jié)構(gòu)殘基突變時(shí),自然選擇保留了那些有補(bǔ)償突變的序列。共變化的例子 假設(shè)我們現(xiàn)有一個(gè)聯(lián)配序列,它表示了幾種物種共有的一個(gè)特定的RNA 的保守的結(jié)構(gòu)。我們希望從聯(lián)配中包含的信息推測(cè)出RNA

33、 二級(jí)結(jié)構(gòu)。 第37頁(yè),共64頁(yè),2022年,5月20日,5點(diǎn)27分,星期四 .|.| .|.| .|. 10 20 sample 1 CCGGAUACGA UCGUCGGGUA CGUAUCCGGsample 2 CCGGAUACUA UCUUGGCGAA AGUAUCUGGsample 3 CGGGAUACGA UCGACGCGUA CGUAUCCCGsample 4 CGCGGUACCA UCCACCCCUA GGUACCGCGsample 5 CCGGAUACGA UCGUCCCGUU CGUAUCCGGsample 6 CCGGAUACGA UCGUCGGGUA CGUAUCCGGs

34、ample 7 CCGGACACGA UCGUCGGGUA CGUAUCCGGsample 8 CCAGAUACGA UCGAAACUUU CGUAUCUGGsample 9 CCGGUUACCA UCGUCGGGUA GGUAACCGGsample 9 CCGGAUACGA UCGACAGGAA CGUAUCCGGsample 10 CCGGAUACGA UCGUCCCGUA CGUAUCCGGsample 11 CCGGAUACGA UCGUCGGGUA CGUAUCCGGsample 12 CCUGAUACUA UCGUCGCCUA AGUAUCGGGsample 13 CGGGGUAC

35、GA UCGAGGCCUA CGUACCCCGsample 14 CCCGCUACGA UCGAGGCCUU CGUAGCGGGsample 15 CCGGAUACGA UCGAGGCCUU CGUAUCCGG下面是一個(gè)聯(lián)配的例子 第38頁(yè),共64頁(yè),2022年,5月20日,5點(diǎn)27分,星期四Covariation analysisInput file: I:BioEdithelpsamples.gbPosition numbering is relative to the alignment numbering.No mask was used.1 CCCCCCCCCCCCCCCCPosit

36、ion 2:2 CCGGCCCCCCCCCGCC28 GGCCGGGGGGGGGCGG All potential Watson Crick or GU pairs3 GGGCGGGAGGGGUGCG4 GGGGGGGGGGGGGGGGPosition 5:5 AAAGAAAAUAAAAGCA25 UUUCUUUUAUUUUCGU All potential Watson Crick or GU pairs6 UUUUUUCUUUUUUUUU7 AAAAAAAAAAAAAAAA8 CCCCCCCCCCCCCCCC第39頁(yè),共64頁(yè),2022年,5月20日,5點(diǎn)27分,星期四Position 9

37、:9 GUGCGGGGCGGGUGGG21 CACGCCCCGCCCACCC All potential Watson Crick or GU pairs10 AAAAAAAAAAAAAAAA11 UUUUUUUUUUUUUUUU12 CCCCCCCCCCCCCCCC13 GUGCGGGGGGGGGGGG14 UUAAUUUAUAUUUAAA15 CGCCCCCACCCCCGGG16 GGGCCGGAGACGGGGG17 GCCCCGGCGGCGCCCC18 GGGCGGGUGGGGCCCC19 UAUUUUUUUAUUUUUU20 AAAAUAAUAAAAAAUU第40頁(yè),共64頁(yè),2022

38、年,5月20日,5點(diǎn)27分,星期四Position 21:21 CACGCCCCGCCCACCC9 GUGCGGGGCGGGUGGG All potential Watson Crick or GU pairs22 GGGGGGGGGGGGGGGG23 UUUUUUUUUUUUUUUU24 AAAAAAAAAAAAAAAAPosition 25:25 UUUCUUUUAUUUUCGU5 AAAGAAAAUAAAAGCA All potential Watson Crick or GU pairs26 CCCCCCCCCCCCCCCC27 CUCGCCCUCCCCGCGCPosition 28:

39、28 GGCCGGGGGGGGGCGG2 CCGGCCCCCCCCCGCC All potential Watson Crick or GU pairs29 GGGGGGGGGGGGGGGG 第41頁(yè),共64頁(yè),2022年,5月20日,5點(diǎn)27分,星期四在上述聯(lián)配中共有3 對(duì)“共變化”的位置點(diǎn):2/28, 5/25 ,9/21。兩個(gè)堿基共變表明它們很可能相互作用。如果一個(gè)突變發(fā)生在與其他堿基有重要作用的堿基上(常是堿基對(duì)),選擇壓力可能會(huì)只保留在另一處堿基上發(fā)生補(bǔ)償突變的堿基。事實(shí)上,上述的堿基共變化都發(fā)生在規(guī)則的堿基對(duì)(Watson-Crick 堿基對(duì)或在RNA 中G-U )表明它們可能是堿

40、基配對(duì)。共變化堿基對(duì)2/5 分別和5/25 的距離相同,而5/25 分別和9/21 的距離也相同,而且界于它們之間的堿基也可形成堿基互補(bǔ),這都表明聯(lián)配序列的兩端可能閉合形成螺旋如下是“Sample1”形成的結(jié)構(gòu)。 U C A G- C C G G A T A C G U - G G C C T A T G C C A G U G G 第42頁(yè),共64頁(yè),2022年,5月20日,5點(diǎn)27分,星期四2.潛在配對(duì)分析potential pairing 當(dāng)RNA 分子中兩個(gè)核苷酸之間存在配對(duì)堿基的相互作用力。一個(gè)堿基發(fā)生突變,另一個(gè)堿基為了補(bǔ)償這一突變,可能不僅僅是某一特定核苷酸突變(例如原來(lái)的A-T

41、 配對(duì)可能在一序列中轉(zhuǎn)換為G-C,而另一序列中為G-U, )這在共變化分析中將被忽略。因?yàn)榇朔N改變并不遵循完全相同的模式。要鑒定這種情況,可以在潛在配對(duì)中選定堿基配對(duì)的規(guī)則。 仍用上例中的序列( sample 1 sample 15 略)BioEdit 中并不要求有位置變化,所以未改變的位置上只要可以形成堿基對(duì),也能被發(fā)現(xiàn)同時(shí)也可在“preference”中設(shè)置以濾出未改變的位置之間的堿基配對(duì)。以下是一個(gè)聯(lián)配序列它和在共變化分析中使用的相同。設(shè)置允許A-U/G-C/G-U 堿基配對(duì)規(guī)則以及1 個(gè)錯(cuò)配,產(chǎn)生下列的結(jié)果(以清單格式,濾除了未變化位置的潛在配對(duì))比較這一結(jié)果和共變化的結(jié)果,發(fā)現(xiàn)位置3

42、/27 有一潛在的配對(duì),而共變化的結(jié)果未檢出。潛在配對(duì)的數(shù)據(jù)也可以按允許的配對(duì)出現(xiàn)的頻率或原始允許配對(duì)的數(shù)目列出一個(gè)(二維矩陣)表。 第43頁(yè),共64頁(yè),2022年,5月20日,5點(diǎn)27分,星期四Potential Pairings ListInput File: I:BioEdithelpsamples.gbAllowed Mispairings = 116 total sequences, 29 nucleotides per sequence.Axes reflect numbering of the entire alignment.No Mask was used.Hits on i

43、nvariant pairs have been filtered out.1 CCCCCCCCCCCCCCCCPosition: 22 CCGGCCCCCCCCCGCC28 GGCCGGGGGGGGGCGG 0 mismatches第44頁(yè),共64頁(yè),2022年,5月20日,5點(diǎn)27分,星期四Position: 33 GGGCGGGAGGGGUGCG27 CUCGCCCUCCCCGCGC 0 mismatchesPosition: 44 GGGGGGGGGGGGGGGG6 UUUUUUCUUUUUUUUU 0 mismatchesPosition: 55 AAAGAAAAUAAAAGCA25

44、 UUUCUUUUAUUUUCGU 0 mismatches第45頁(yè),共64頁(yè),2022年,5月20日,5點(diǎn)27分,星期四Position: 66 UUUUUUCUUUUUUUUU4 GGGGGGGGGGGGGGGG 0 mismatches6 UUUUUUCUUUUUUUUU7 AAAAAAAAAAAAAAAA 1 mismatches6 UUUUUUCUUUUUUUUU10 AAAAAAAAAAAAAAAA 1 mismatches6 UUUUUUCUUUUUUUUU22 GGGGGGGGGGGGGGGG 0 mismatches6 UUUUUUCUUUUUUUUU24 AAAAAAAAA

45、AAAAAAA 1 mismatches6 UUUUUUCUUUUUUUUU29 GGGGGGGGGGGGGGGG 0 mismatches 第46頁(yè),共64頁(yè),2022年,5月20日,5點(diǎn)27分,星期四Position: 77 AAAAAAAAAAAAAAAA6 UUUUUUCUUUUUUUUU 1 mismatches8 CCCCCCCCCCCCCCCCPosition: 99 GUGCGGGGCGGGUGGG21 CACGCCCCGCCCACCC 0 mismatchesPosition: 1010 AAAAAAAAAAAAAAAA6 UUUUUUCUUUUUUUUU 1 mismatc

46、hes第47頁(yè),共64頁(yè),2022年,5月20日,5點(diǎn)27分,星期四11 UUUUUUUUUUUUUUUU12 CCCCCCCCCCCCCCCC13 GUGCGGGGGGGGGGGG14 UUAAUUUAUAUUUAAA15 CGCCCCCACCCCCGGG16 GGGCCGGAGACGGGGG17 GCCCCGGCGGCGCCCC18 GGGCGGGUGGGGCCCC19 UAUUUUUUUAUUUUUU20 AAAAUAAUAAAAAAUU第48頁(yè),共64頁(yè),2022年,5月20日,5點(diǎn)27分,星期四Position: 2222 GGGGGGGGGGGGGGGG6 UUUUUUCUUUUU

47、UUUU 0 mismatches23 UUUUUUUUUUUUUUUUPosition: 2424 AAAAAAAAAAAAAAAA6 UUUUUUCUUUUUUUUU 1 mismatchesPosition: 2525 UUUCUUUUAUUUUCGU5 AAAGAAAAUAAAAGCA 0 mismatches26 CCCCCCCCCCCCCCCCPosition: 2727 CUCGCCCUCCCCGCGC3 GGGCGGGAGGGGUGCG 0 mismatches第49頁(yè),共64頁(yè),2022年,5月20日,5點(diǎn)27分,星期四Position: 2828 GGCCGGGGGGGGG

48、CGG2 CCGGCCCCCCCCCGCC 0 mismatchesPosition: 2929 GGGGGGGGGGGGGGGG6 UUUUUUCUUUUUUUUU 0 mismatches第50頁(yè),共64頁(yè),2022年,5月20日,5點(diǎn)27分,星期四3.交互信息分析(Mutual Information Analysis) 概述 交互信息,象在系統(tǒng)發(fā)育比較分析中的應(yīng)用一樣,主要是衡量在一個(gè)適當(dāng)聯(lián)配中兩個(gè)位置共有信息的信息量。符號(hào)是M(x,y)(位置x,y 的相互信息) 。M(x,y)表明兩個(gè)位置相關(guān)的緊密程度。此相關(guān)程度顯示了兩位置的直接相互作用,如堿基配對(duì)。BioEdit 另外計(jì)算R1

49、和R2 兩個(gè)參數(shù),它們分別表示位置x,y 對(duì)M(x,y)的貢獻(xiàn)。 第51頁(yè),共64頁(yè),2022年,5月20日,5點(diǎn)27分,星期四什么是交互信息 交互信息分析是以下思想的拓展-即對(duì)某個(gè)特定位置的不確定性表示是信息含量的下降。在預(yù)先對(duì)某位置一無(wú)所知的情況下(如RNA 中核苷酸),不確定性最大。但一旦確定了某位置是什么核苷酸時(shí),不確定性消除了,此位置的信息量達(dá)到最大?,F(xiàn)在考慮有多條序列,在某位置均含有一個(gè)同源核苷酸。知道第一條序列上此位置上的核苷酸并不能為確定第二條或隨機(jī)的一條序列中此序列的核苷酸提供多少信息。但是如果已知此位置在許多乃至幾乎所有序列中均為某一特定堿基(如C ),而不是其它的堿基(如

50、G), 則我們積累了相當(dāng)多的“信息”,可預(yù)測(cè)另一個(gè)未檢測(cè)的序列中,在此位置某核苷酸出現(xiàn)的可能性。即在另一未檢測(cè)的序列中,此位置核苷酸的不確定性下降了。第52頁(yè),共64頁(yè),2022年,5月20日,5點(diǎn)27分,星期四交互信息進(jìn)一步拓展了這一思想,對(duì)配對(duì)位置的信息量進(jìn)行檢查,此信息量依賴于并聯(lián)系每個(gè)位置單獨(dú)的信息量,但不能將兩者混淆。總的講,它衡量不確定性的下降,此不確定性指兩種事物相互影響相互作用的程度。Robin Gutell 發(fā)展了用交互信息預(yù)測(cè)RNA 結(jié)構(gòu)的方法,也很適合系統(tǒng)發(fā)育比較分析,因?yàn)閮蓚€(gè)位置交互信息高也提示這2 個(gè)殘基直接相互作用。 1 2 3 4 A C G U A C G U

51、A G C U A U A U A U A U A A U U A A U U A G C U如左圖總共8 個(gè)序列,其中位置1, 4 是不改變的,信息量最大。位置2 ,3 中C/G/U/A 各出現(xiàn)了2 次,信息量為0 ,我們無(wú)法預(yù)測(cè)下一個(gè)序列中這兩個(gè)位置的核苷酸,但位置2 ,3都含有它們之間是如何影響彼此的共有信息。我們不能猜出新一序列中位置2 的核苷酸,但如果告訴我位置3 是C, 我們可以推斷出位置2 是G,這即建立在“交互信息分析” (它們遵循共同的配對(duì)模式)交互信息也表明這些堿基可能相互作用。第53頁(yè),共64頁(yè),2022年,5月20日,5點(diǎn)27分,星期四交互信息示例 以下是分析細(xì)菌RNase P RNA 的部分序列的一個(gè)例子。點(diǎn)擊(Aligment)可以觀察此聯(lián)配。設(shè)置輸出是全部列表(full table)顯示M(x,y)的數(shù)值。Nbest 列出各個(gè)位置5 個(gè)高分值。序列和編號(hào)mask 都是根據(jù)E.coli. 。序列的編號(hào)是根據(jù)E.coli的mask序列。此序列中包含了一個(gè)RNase P RNA 結(jié)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論