生物工程專業(yè) 口蹄疫病毒基因組密碼子使用偏好性及其進(jìn)化分析研究_第1頁
生物工程專業(yè) 口蹄疫病毒基因組密碼子使用偏好性及其進(jìn)化分析研究_第2頁
生物工程專業(yè) 口蹄疫病毒基因組密碼子使用偏好性及其進(jìn)化分析研究_第3頁
生物工程專業(yè) 口蹄疫病毒基因組密碼子使用偏好性及其進(jìn)化分析研究_第4頁
生物工程專業(yè) 口蹄疫病毒基因組密碼子使用偏好性及其進(jìn)化分析研究_第5頁
已閱讀5頁,還剩24頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、口蹄疫病毒基因組密碼子使用偏好性及其進(jìn)化 摘 要:分析了 FMDV 基因編碼起始區(qū)與終止區(qū)的密碼子使用偏好性。 實驗主要選擇了FMDV中最具代表性以及感染率最高的O型與A型進(jìn)行密碼子偏好性的分析以及進(jìn)化方向的討論。通過實驗的數(shù)據(jù)可以得到初步的結(jié)論:在O血清型與A血清型的基因群落當(dāng)中,并不存在固定同義密碼子的使用模式。同時,即使這幾個同義密碼子屬于同一種氨基酸,他們的使用頻率也是不相同的,也從一方面說明了,基因組中存在著“優(yōu)勢密碼子”和“稀有密碼子”的現(xiàn)象。FMDV各血清型中的稀有密碼子傾向出現(xiàn)于編碼起始區(qū),而終止區(qū)附近稀有密碼子出現(xiàn)的傾向較弱。 關(guān)于進(jìn)化學(xué)方面的研究,本實驗也采用了生物信息學(xué)軟

2、件SPSS,將FMDV基因組密碼子參考序列的同源性進(jìn)行了分析與對比,構(gòu)建了A血清型的VP1基因的進(jìn)化樹,同時也可以通過對O型、A型繪制的進(jìn)化譜圖得到:目前已知的A型口蹄疫毒株與其它毒株序列差異較大。口蹄疫病毒的每種血清型都集中在一個家族中。通過本次研究對FMDV基因組密碼子的分析,可以更加清晰的認(rèn)識到FMDV的遺傳多樣性,在基因序列上相差也是比較大的。同時也從一方面證實了加強(qiáng)口蹄疫病理學(xué)的分析與調(diào)查,對FMDV的變異與進(jìn)化進(jìn)行實時的監(jiān)測對于防控FMD起著非常重要的作用。 關(guān)鍵詞:口蹄疫病毒(FMDV);密碼子偏好性;密碼子相對使用概率;方差分析;進(jìn)化FOOT-AND-MOUTH DISEASE

3、 VIRUS GENOME CODON USAGE PREFERENCE AND ITS EVOLUTION Abstract: The codon usage preference of the FMDV gene coding initiation region and termination region was analyzed. The experiment mainly selected the most representative of the FMDV and the highest infection rate of O-type and A-type for codon

4、preference analysis and the discussion of evolutionary direction. The use of all synonymous codons in the gene pools of these two serotypes was found to vary randomly. Moreover, the frequency of use of several different synonymous codes belonging to the same amino acid is different, among which ther

5、e are dominant codons (RSCU1) and rare codons (RSCU1的時候,這就意味著密碼子為偏好性強(qiáng)的密碼子,與之相反也是成立的。第一個氨基酸的第j個密碼子,計算他的同義密碼子使用度的計算公式為公式2-1:RSCUij=Xij1nj=1niij(2-1)在公式2-1中, X ij為編碼第一個氨基酸的密碼子 X ij出現(xiàn)的次數(shù), n i為編碼第二個氨基酸的同義密碼子的數(shù)目(16)。 對于高表達(dá)基因的RSCU值,通??梢杂糜诮⒖急砀?。(2) 密碼子適應(yīng)指數(shù)(Codon Adaptation Index, CAI) 基于已知的高表達(dá)基因的序列對未知的基因的密

6、碼子采用的偏好進(jìn)行估測。CAI的值范圍在0到1之間,如果CAI的值越高,那么其基因的密碼子采用的偏好就會越強(qiáng)。CAI值通常用于預(yù)測物種中基因表達(dá)的水準(zhǔn),也可用于外來物種基因表達(dá)水準(zhǔn)的估測。 W ij 代表密碼子相對適應(yīng)度(The relative adaptiveness of a codon)。Wij=RSCUijRSCUimax=XijXimax(2-2)公式2-2中 RSCU imax、X imax這兩個分別代表了編碼第i個氨基酸的使用頻率最高密碼子的RSCU值和X值。CAI=(K=1LWk)1L(2-3)L代表的是基因中所采用的密碼子數(shù)量。(3) 有效密碼子數(shù)(Effective Nu

7、mber of Codon, ENC) ENC描述了密碼子采用偏離隨機(jī)選取的程度,并且密碼子家族當(dāng)中同義密碼子的非平衡運用的偏好程度也可以由ENC充分反映出。如果ENC值在20到61的范圍之間,ENC值越近,偏差越強(qiáng)。高表達(dá)基因密碼子的偏好較大,因此ENC值相對較?。坏捅磉_(dá)的基因中含有更多種類、更稀有的密碼子,所以ENC的值更大。通常比較ENC的值來確定內(nèi)源基因表達(dá)的相對水準(zhǔn)。一般情況下,如果ENC值越小,那就說明與其相對應(yīng)的內(nèi)源基因的表達(dá)性也就越高。 n 代表了基因組中使用的密碼子的總數(shù),K代表同義密碼子的數(shù)量,P i是使用第一密碼子的使用頻率( n i / n )。 ENC值同時也是會受到

8、氨基酸的構(gòu)成與基因長度的影響。ENC=2+9F2+1F3+5F4+3F6(2-4)F=ni=1kPi2n-1 n1,Pi=nin(2-5)(4) 密碼子偏好參數(shù)(Codon Preference Parameter, CPP)CPP的數(shù)值在0至18之間, 越接近最大值18,就表示密碼子被非隨機(jī)采用的概率越高。但是它相對于基因編碼整體性區(qū)域的堿基構(gòu)成的敏感度并不精確, 適合比較基因之間或者物種間密碼子采用偏性的大小。CPP=i=118|xij-j=1nixijni|j=1nixijni(2ni-2)(2-6)Xij代表了編碼第i個氨基酸密碼子(j)出現(xiàn)的次數(shù),ni代表編碼第ni個(當(dāng)值為2-6且

9、 ni= 1的時候應(yīng)被排除)氨基酸同義密碼子的數(shù)目。2.2 研究過程 2.2.1 選取的基因樣本在本實驗中的FMDV O型和A型的完整編碼基因的相關(guān)信息來自于Gen- Bank(列舉如下)。其中,F(xiàn)MDV O型、A型均為27條,同時都含有完整的多聚蛋白質(zhì)編碼序列。O型EF552697,EF552696,EF552694, EF552693,EF552692,EU400597,EUl40964, AF026168,NC004004,AJ539139,AY593819, AY593835,AFl89157,AFl89157,AY593836, AF511039, EFl75732,DQ248888

10、, AJ320488, AJ633821,AY312588S2,AB079061,AFl89157, AF511039,AY317098,AY312586S2。A型NC011450,EF494488,EF494487, EF494486,AY593751,AY593789,AY593767, AY593770,AY593782,AY593783,AY593784, AY593785,AY593790,AY593801,AY593802, AY593787,AY593788,AY593803,AY593753, AY593756,AY593757,AY593768,AY593794, AY593

11、771,AY593758,AY593775,AY593751。 2.2.2 在給定的區(qū)域分析密碼子偏好性由于目標(biāo)區(qū)域的每個位點產(chǎn)生的突變現(xiàn)象,可以通過定義密碼子使用趨勢(TCU Tendency of Codon Usage)的變體進(jìn)而分析編碼序列中給定區(qū)域的密碼子使用趨勢,計算TCU值:TCU是特定區(qū)域(即起始位點)每個位置的值的累積值。TCU=RUCU=RSCUij-RSCU0(2-7)表示一個密碼子使用偏好性的值,對應(yīng)于a中的特定氨基酸。n表示此研究中的所有樣本。當(dāng)所有RSCU值根據(jù)區(qū)域中的特定位置為時,TCB為零。這意味著在該位置存在很少的顯性密碼子或次要密碼子,相反地,當(dāng)TCB的絕對

12、值遠(yuǎn)大于時,意味著優(yōu)化密碼子或次要密碼子用于特定位置。翻譯的初始區(qū)域起始位點到第30個下游密碼子和從翻譯終止的終端區(qū)域點到第30個上游密碼子。TTC值計算相應(yīng)的基因組和計算相應(yīng)基因組的值與TCU值進(jìn)行比較以解決問題特定區(qū)域某些密碼子之間的關(guān)系和一個相應(yīng)的基因組。2.3 研究結(jié)果 2.3.1 翻譯起始區(qū)附近密碼子的使用偏好性圖2-2表現(xiàn)了每個從第三十個密碼子起始的特定位點之間的關(guān)系,以及FMDV七種亞型的TCU值。每個條形代表特定位點中密碼子的使用趨勢。TCU值如果越高就說明其對應(yīng)s位點對在翻譯起始區(qū)域中出現(xiàn)具有強(qiáng)傾向的密碼子。在所有感興趣的區(qū)域中存在幾個具有負(fù)密碼子使用傾向的位點。這表明了,即

13、使他們對整個基因組的血清型的優(yōu)先使用性更強(qiáng),一些次要密碼子更加容易在在翻譯起始區(qū)域出現(xiàn)。AA*CodonRSCUAaaCodonRSCUAla+GCA1.02Leu*CUA0.17GCC1.45CUC1.95GCG0.59CUG1.65GCU0.94CUU1.1Arg*AGA1.46UUA0.05AGG0.8UUG1.05Asn*Asp*CysGlnGlu+GlyHis*Ile*CGACGCCGGCGUAACAAUGACGAUUGCUGUCAACAGGAAGAGGGAGGCGGGGGUCACCAUAUAAUCAUU0.331.770.660.971.720.281.50.51.170.830.

14、891.150.711.291.041.20.820.941.750.250.171.81.1LysPheProSer+Thr+Tyr*Val*AAAAAGUUCUUUCCACCCCCGCCUAGCAGUUCAUCCUCGUCUACAACCACGACUUACUAUGUAGUCGUTGUU0.861.141.230.770.821.290.781.11.230.651.021.560.890.760.91.560.60.941.710.290.271.131.620.98表2-1 FMDV中同義密碼子使用偏性和密碼子偏性Table 2-1 Synonymous codon usage bias

15、and codon bias in FMDV*:aAA是氨基酸的縮寫; bRSCU值是平均值; 每個氨基酸的優(yōu)先使用的密碼子以粗體描述;氨基酸包括同義密碼子使用之間的差異; 氨基酸包括同義密碼子使用中的相對差異。七種血清型中具有負(fù)TCU值如圖4-1所示。這種現(xiàn)象特別是在下列血清型的不同位點可以體現(xiàn)。血清型A血清型O亞洲型I血清型C血清型SAT-I血清型SAT-II 血清型SAT-III 第2 第3 第3 第2 第3 第2 第3第3 第4 第6 第3 第4 第3 第4第4 第6 第7 第4 第6 第4 第6第5 第9 第9 第6 第14 第6 第7第6 第13 第21 第7 第16 第7 第9第

16、9 第18 第2 第9 第20 第9 第14第18 第19 第24 第11 第23 第20 第16第19 第23 第25 第17 第28 第22 第20第22 第26 第26 第18 第23 第23第23 第28 第22 第26 第28第24 第30 第23 第29 第30第26 第26 第30第30 第28 從某種程度上來說,這些密碼子偏好性弱的位點常集中在末端,以及閱讀框中部,許多位點存在著較高的偏好性。圖4-1 翻譯區(qū)域中每個位點密碼子使用的趨勢Fig.1 The tendency of codon usage at each site in the initial translatio

17、n region2.3.2 翻譯終止區(qū)附近的密碼子的偏好性位點圖4-2描述了密碼子末端翻譯區(qū)位點的TCU值。將圖4-2和圖4-1進(jìn)行比較可以發(fā)現(xiàn),與起始翻譯區(qū)附近密碼子使用的位點一樣,這些翻譯終止位點沒有被優(yōu)先使用。通過圖表發(fā)現(xiàn),只有少數(shù)幾個具有負(fù)偏好性的位點,其他很大一部分位點都更加傾向于使用具有高RSCU值的密碼子。圖4-2 末端翻譯區(qū)每個位點密碼子使用的趨勢Fig.2 The tendency of codon usage at each site in the terminal translation region 2.3.3 方差分析對2.2.1 里由Gen-bank提供的FMDV2

18、7條O型基因與27條A型基因,利用SPSS9.0系統(tǒng)多變量解析軟件實現(xiàn)密碼子使用偏差與氨基酸采用偏差的方差解析。根據(jù)方差分析的數(shù)據(jù),將每個基因的59個密碼子的相對采用概率當(dāng)成其屬性。進(jìn)行方差分析時,首先得到2個總體,F(xiàn)MDV的O型毒株的基因序列X1和FMDV A型毒株的基因序列X2 。分別用u1,u2來表示O型、A型單個密碼子的RSCU平均值,同時總體性的將每個密碼子的RSCU值的平方和,分解成組間平方和SSA與組內(nèi)平方和SSE,將總自由度分解為,組間自由度(dfA)和組內(nèi)自由度(dfE)。假設(shè)從而建立Ho:u1=u2 :假設(shè)密碼子的屬性沒有影響到蛋白質(zhì)的分類以及蛋白質(zhì)的計算統(tǒng)計量,最終從F可

19、以得到明顯的說明。當(dāng)顯著性水平1)和稀有密碼子RSCU1。如果不將二者進(jìn)行相似性比較的話,單獨從圖4-1還是4-2中,很難發(fā)現(xiàn)各自在密碼子使用上的規(guī)律。圖4-1 FMDV A基因密碼子使用模式Fig.1 The pattern of codon usage of FMDV serotype A圖4-2 FMDV O基因密碼子使用模式Fig.2 The pattern of codon usage of FMDV serotype O通過圖4-1與4-2,將這兩種血清型的密碼子的使用相對概率進(jìn)行比較,可以明顯得觀察到:從整體上來講氨基酸所擁有的相同密碼子的使用模式,也通過上述的現(xiàn)象得出這樣的結(jié)論

20、:口蹄疫病毒(FMDV) O型和A型在基因中密碼子的選擇機(jī)制可能與易感動物細(xì)胞內(nèi)的tRNA豐度是相關(guān)的。 2.3.2 FMDV A型和O型基因群落中密碼子使用方面的差異對表4-2列出的54條基因序列的密碼子,進(jìn)行使用相對概率的單因素方差分析,密碼子使用相對概率有顯著差異的F值和顯著性水平的關(guān)系的數(shù)據(jù)在表2-1中。從表2-1中能夠看出,這些密碼子在兩種血清型基因群落中的使用偏好性是不同的。很多研究也指出,蛋白質(zhì)的二級結(jié)構(gòu)與同義密碼子的使用這二者之間的關(guān)系是非常密切的。利用密碼子使用偏性對FMDV O、A兩個血清型進(jìn)行分析,基因群落在分子水平上的變異將獲得只通過氨基酸結(jié)構(gòu)類型特征分析或同義密碼子使

21、用的宏觀分析(見圖4-1,4-2)。Amino acidcodonF valueSig.Amino acidcodonF valueSig.AlaGCA2.5750.103LeuCUA3.6980.06AlaGCC14.1390CUC1.1850.281AlaGCG15.5440CUG15.960AlaGCU0.0520.821CUU0.380.54ArgAGA4.720.034UUA0.9060.346ArgAGG2.8330.098UUG0.6670.481ArgArgArgAsnAspCysCysGlnGlnGluGluGlyGlyGlyGlyHisHisIleIleIleCGACGCC

22、GGCGUAACAAUGACGAUCAGGAAGAGGGAGGCGGGGGUCACCAUAUAAUCAUU0.3760.6676.3970.0190.0490.0561.2242.1421.023201860.243.1510.4660.4172.49849.5430.3348.2895.0274.9714.5931.246.1670.5420.4180.0150.9820.8270.8140.2740.1490.3170.1450.6260.0820.4980.5110.12T00.5660.0060.0290.030.0370.2710.016ProSerThryrTyrValPheLys

23、CCACCCCCGCCUAGCAGUUCAUCCUCGUCUACAACCACGACUUACUAUGUAGUCGUGGUUUUCUUUAAAAAG0.9834.840.8013.69913.4340.9041.5440.4090.01815.516163.26694.2646.275504160.0370.5040.1751.1590.0010.0581.2591.5251.8240.080.3260.0320.3750.060.0010.3460.220.5250.8950000.0150.0240.8490.4810.6780.2870.9840.810.2670.2220.1830.778

24、表2-1 密碼子使用的F值和顯著性水平值Table 4-1. The value of F and significance of the codon usage 2.3.3 密碼子使用偏好性在口蹄疫病毒(FMDV)中RSCU的 RSCU總值為59個密碼子,分別顯示在表2-2中。具有強(qiáng)烈偏好性的密碼子和相對偏好行的相對偏好性的密碼子分別被星號*標(biāo)記。對于他們來說有具強(qiáng)偏好性的密碼子以及弱偏好性的密碼子存在于相同的氨基酸中。表2-2代表了每個特定位點之間存在的關(guān)系(從起始密碼子到第30個密碼子和FMDV0中TCU的七種血清型。每個條形代表在特定地點使用密碼子的傾向。TCU如果較高就說明在起0始區(qū)

25、域相應(yīng)位點傾斜,在翻譯中出現(xiàn)具有強(qiáng)烈偏好性。這個現(xiàn)象說明了有一些負(fù)偏好性的位點也會出現(xiàn)在偏好性區(qū)域。這意味著一些次要密碼子趨向于出現(xiàn)在翻譯起始區(qū)域,而它們是低優(yōu)0.015先用于這些的全基因組血清型。大部分參考毒株L氨基酸片段的插入或缺失相對來說都是比較少的。起始密碼子是高度保守的,同時發(fā)現(xiàn)了2個密碼子之間只有1個氨基酸殘基,C6 沒有發(fā)生變化;L 氨基酸的替換主要集中在i末端,其余的71維持原樣不變;凸顯位點像L52,149,165,77,110與139都是非常保守的。2A氨基酸的同源性大概為75; 2B片段當(dāng)中的131個殘基始終保持不變,尤其是在跨膜區(qū);2C更加保守,84氨基酸保持不變,保守

26、基序分別是GKSGQGK,DDLG和NKLD; 3A插入或者缺失時常產(chǎn)生于3A的80-110和130-153中,這充分證實了3A為FMDV的可變蛋白。 51的殘留物保持不變;3B片段相對保守,突變重點發(fā)生在C末端; 3D突變率是14,重點集中于序列GVFNPEFGPAALSNKD,跨膜CRCAADYASRLHSVLGT和HGVFNPEFG-PAALSNKDP; 其他的主要的保守位點為245D,295G,307N,337G,338D,339D,和保守的基序KDEIR,YGDD,PSG,F(xiàn)LKR還有抗原表位。 GLIVDTRDVEER,EDKALLFRR。第3章 口蹄疫病毒的進(jìn)化3.1 口蹄疫病毒

27、基因組的進(jìn)化關(guān)系分析對20個口蹄疫病毒O 型 和5個亞洲1型多聚蛋白的氨基酸序列進(jìn)行比較,構(gòu)建口蹄疫病毒(FMD)菌株的分子系統(tǒng)發(fā)育樹。 進(jìn)化方法(圖3-1)。 結(jié)果表明,口蹄疫病毒的每種血清型都集中在一個家族中,系統(tǒng)發(fā)育樹分為兩個支鏈,一個是O 型口蹄疫病毒,另一個是足趾病毒。亞洲1型口disease病病毒,口蹄疫O / CHA / 99株與O NY00株最密切相關(guān)。圖3-1 O型口蹄疫病毒基因組進(jìn)化樹Figure 3-1 O type foot-and-mouth disease virus genome evolution tree3.2 構(gòu)建A型FMDV VP1的系統(tǒng)樹從NCBI下載了

28、A型口蹄疫病毒的VP1 基因,構(gòu)建了A型I=1蹄疫VP1的系統(tǒng)樹(圖3-2)。建立的進(jìn)化樹中,1079條VP1序列被分為3個大群 (Cluster),24個亞群。圖3-2 A型口蹄疫病毒VP1 基因的系統(tǒng)進(jìn)化樹Fig.3-2 The phylogenetic tree of A type FMDV constructed on VP1 gene使用Mega 6.0對HY-VPI與1077個參考毒株和疫苗株 AF/72進(jìn)行了系統(tǒng)進(jìn)化分析,發(fā)現(xiàn)中國報道的毒株均處于 Cluster 3.6和3.8分支中可以通過FMDV A血清型VP1基因的進(jìn)化樹以及O血清型基因的進(jìn)化樹得出這樣的結(jié)論:口蹄疫病毒的特點是:亞群數(shù)量眾多、具有較高的復(fù)制突變率、同時繁殖率較高耗時短等生物學(xué)特征,可以作為非常好的材料與模型用以物種進(jìn)化的研究。利用FMDV基因組密碼子的多種機(jī)制以及環(huán)境壓力的作用, FMDV始終保持著適應(yīng)性的進(jìn)化過程,從而也展現(xiàn)出豐富的遺傳多樣性。第4章 FMDV基因組密碼子偏好性與進(jìn)化的討論4.1 FMDV基因組密碼子偏好性的討論tRNA豐度也是影響密碼子偏好性的一個重要因素。對密碼子的選擇會隨著tRNA豐度的變化而選擇相應(yīng)的同義密碼子,高表達(dá)基因偏好使用tRNA豐富的密碼子或者能夠與tRNA更好結(jié)合的密碼子,這些現(xiàn)象可能與密碼子的使用

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論