密碼子偏好性分析_第1頁
密碼子偏好性分析_第2頁
密碼子偏好性分析_第3頁
密碼子偏好性分析_第4頁
密碼子偏好性分析_第5頁
已閱讀5頁,還剩23頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、密碼子偏好性分析 陳永紅 孟如月 制密碼子是核酸攜帶信息和蛋白質(zhì)攜帶信息間對應(yīng)的基本原則, 是生物體內(nèi)信息傳遞的基本環(huán)節(jié)。在生物的遺傳密碼中, 除色氨酸和甲硫氨酸只有一個密碼子外, 其余氨基酸都有一個以上的簡并密碼子。對同一物種, 不同蛋白編碼密碼子在基因中出現(xiàn)的頻率不同; 就同一種氨基酸而言, 編碼該氨基酸的不同密碼子的比率在不同的蛋白中也有差異, 因此生物體基因?qū)啿⒚艽a子的選擇具有一定的偏愛性。同義密碼子(Synonymous Codons):編碼同一氨基酸的密碼子。在蛋白質(zhì)編碼過程中, 某一物種或某一基因通常傾向于使用一種或幾種特定的同義密碼子, 這種現(xiàn)象稱為同義密碼子的使用偏性(Sy

2、nony mous Codon Usage Bias)研究密碼子使用偏性的意義:(一)作為預(yù)測真核生物核糖體在細(xì)胞內(nèi)定位的一種手段 ,通過比較核基因編碼的核糖體蛋白和線粒體基因編碼的核糖體蛋白上密碼子使用模式的差異來預(yù)測未知蛋白的基因所在基因組位置。(二)通過密碼子使用偏好性的研究, 可以判定一些最優(yōu)密碼子,針對這些密碼子設(shè)計基因工程表達(dá)載體可以提高目的基因的表達(dá)量 。(三)利用密碼子使用偏好性和某種功能的關(guān)聯(lián)程度對某些未知功能基因進(jìn)行預(yù)測利用已知的密碼子偏好知識對未知表達(dá)水平 的 基 因 進(jìn)行 判 定 初步判斷該基因的表達(dá)水平高或低。(四)利用編碼區(qū)和非編碼區(qū)的基因組特征差異進(jìn)行全基因組掃描

3、,發(fā)現(xiàn)新基因。密碼子使用偏性的影響因素:(一)基因序列堿基組成的偏好性 在不存在自然選擇壓力 的 情 況 下, 一定方向的突變壓會影響序列本身的堿基組成 ,而這一效應(yīng)同時也會反映在同義密碼子的第 3位上。這樣 的偏好性僅僅是反映了序列組成的特征,而與蛋白功能或表達(dá)水平無關(guān)。(二)弱的自然選擇效應(yīng) 對于所有密碼子家族來講,即使存在密碼子偏好性,由于同義密碼子并不改變最終的蛋白產(chǎn) 物。所以對于那些頻繁被使用的密碼子的選擇性被認(rèn)為是很弱的。但是這種弱的選擇會體現(xiàn)在基因表達(dá)水平上。在高表達(dá)的基因中,密碼子使用偏好性要強(qiáng)過一 般表達(dá)的基因。(三)tRNA豐度密碼子在蛋白翻譯過程中需要和攜帶對應(yīng)反密碼子的

4、tRNA相互識別作用,才能把游離的氨基酸殘基轉(zhuǎn)移到多肽鏈上因 此這 些對應(yīng)的的 tRNA豐度就決定了蛋白質(zhì)合成的資源。密碼子使用的偏性與細(xì)胞內(nèi)tRNA 的含量呈正相關(guān)。(四)基因長度 基因長度越長,能夠容納的密碼子越多。在沒有其他壓力的情況下,則同義密碼子被選擇的概率不會受樣本容量限制而出現(xiàn)統(tǒng)計上的誤差;相 反基因長度越短,可以編碼的密碼子數(shù)量和種類越少,甚至有的密碼子 根本不會出現(xiàn) 。(五)蛋白質(zhì)的結(jié)構(gòu)功能 基因密碼子的使用與基因編碼的蛋白的結(jié)構(gòu)和功能有關(guān) ,蛋白質(zhì)的折疊方式與序列之間存在一定的相關(guān)性 ,蛋白質(zhì)的三級結(jié)構(gòu)與密碼子使用概 率有密切的關(guān)系。在不同物種中類型相同的基因具有相近的密碼

5、子使用 模式 。對于同一類型的基因由物種引起的同義密碼子使用偏性的差異較小。(六)蛋白的疏水性水平以及氨基酸 保守性不同的基因編碼序列其氨基酸含量有可能不同,一 方 面 ,稀有氨基酸由于本身出現(xiàn)幾率小,一旦使用某種密碼子而其他密碼子出現(xiàn)幾率更??;另 一 方 ,面對 于 比 較 保 守 的氨基酸不容易發(fā)生突變則其密碼子使用模式固定為序列本身組成。研究方法(一)研究指標(biāo)同義密碼子相對使用度(Relative synonymous codon usage, RSCU):它是指對于某一特定的密碼子,在編碼對應(yīng)氨基酸的同義密碼子間的相對概率,去除了氨基酸組成對密碼子使用的影響。該值的計算方法為某一密碼子

6、所使用的頻率與其在無偏使用時預(yù)期頻率之間的比值,如果密碼子的使用沒有偏好性,該密碼子的RSCU值等于1,當(dāng)某一密碼子的RSCU值大于1時,代表該密碼子為使用相對較多的密碼子,反之亦然 。其中,n表示這個密碼子所代表的氨基酸的同義密碼子種類數(shù)目(1n6),戈代表第i個密碼子的出現(xiàn)次數(shù)。RSCU是衡量密碼子偏性較直觀的一個參數(shù)。密碼子適應(yīng)指數(shù)( Codon adaption index , CAI )該指數(shù)以一組具高表達(dá)水平的基因?yàn)閰⒖?, 測量某一個基因的密碼子偏好情況和這些高表達(dá)基因密碼子偏好情況的接近程度 , 如果一個基因完全使用高表達(dá)基因中所用的密碼子 , 則其 C AI 值為 1 。目前

7、這個指數(shù)已被廣泛用來預(yù)測基 因 的 表 達(dá) 水平。其中RSCUmax、是高表達(dá)參照基因中,每一個氨基酸里使用頻率最高的密碼子的相對同義密碼子使用頻率,L是基因中密碼子的個數(shù)高 頻 密 碼 子與最優(yōu)密碼子某一密碼子相對同義密碼子使用頻率單值超過60% 或者超過該組同義密碼子平均占有頻率的1.5 倍的密碼子即為高頻碼子。最后采用高表達(dá)優(yōu)越密碼子分析方法先,計算每個基因的密碼子有效數(shù)和相對同義密碼子用法, 然后再根據(jù)各 Nc值確 定高表達(dá)和低表達(dá)樣本組,計算出這兩個樣本組中各個密碼子各自的值,最后通過卡方檢驗(yàn)確定出高表達(dá)基因的優(yōu)越密碼子確定最優(yōu)密碼子。最有密碼子鑒定原則:1,密碼子的可變位點(diǎn) (wo

8、bblebase)與細(xì)胞內(nèi)濃度最高的tRNA的反義密碼子第一位互補(bǔ);2,tRNA的反密碼子的可變位點(diǎn)為或5一梭甲基尿啼陡時相對于G更偏好結(jié)尾為A的密碼子;3,反義密碼子的可變位點(diǎn)為l(Inosine)時,更偏好結(jié)尾為U或C的密碼子;4,密碼子若第一、二位均為A或U,則第三位更加偏好C。有效密碼子數(shù) ( Effective Number of Codon ,Nc)C AI 測量的是某個基因所用的密碼子與高表達(dá)基因所用密碼子的接近程度 。 和 C AI 不同 ,Nc測量的是某個基因的密碼子偏好程度 , 如果一個基因平均使用每一個密碼子 ,則其 Nc 為 61 ,如果一個基因只使用每組同義密碼子中的

9、一個 ,則其 Nc 為 20 。理論上講 ,一個具有低 C AI 的基因也可以同時具有低 Nc 值 ,換句話說 , 該基因具有較強(qiáng)的密碼子偏好性 ,只不過其偏向的并不是高表達(dá)基因所用的密碼子 。計算公式:其中p,表示密碼子i的使用頻率,n是所有密碼子的數(shù)目GC 和 GC3sG C 測量的是基因中 G 和 C 的含量 。G C 3s 則計算密碼子第三個堿基中出現(xiàn) G 或 C 的頻率 。一般認(rèn)為這兩個因素對基因的密碼子選擇有重要影響。 GC content不同物種不同物種GC含量變化很大含量變化很大識別基因水平轉(zhuǎn)移,判斷外源基因識別基因水平轉(zhuǎn)移,判斷外源基因GC skew(G-C)/(G+C)%預(yù)

10、測細(xì)菌或古細(xì)菌復(fù)制起點(diǎn)預(yù)測細(xì)菌或古細(xì)菌復(fù)制起點(diǎn)由于密碼子偏性的研究近年來一直是一個熱點(diǎn),因此研究的指標(biāo)也出現(xiàn)得很多,如可以衡量特定基因偏性大小的密碼子偏愛指CBI(Morton1993)和最優(yōu)密碼子使用頻率 FOp(LavnerandKotlar2005),彌補(bǔ)了密碼子的相對嫡值的加Ew(Suzukietal.2004)等。多種多樣的技術(shù)和方法促進(jìn)了密碼子偏性的研究,但是也產(chǎn)生了一些的研究結(jié)果之間存在了的不一致,特別是有些方法僅僅能運(yùn)用于局限的物種或某些特定的基因中。因此在使用這些新開發(fā)的方法時,必須了解每一種方法背后的假設(shè)和推論,才能確保結(jié)果的正確性。研究方法基因樣本的選擇 GeneBank

11、 ( http: / /www.ncbi.nlmnihgov / ) 中獲得,樣本選擇原則:樣本為全長蛋白質(zhì)編碼基因序列( CodonDNA sequence,CDS) ; CDS 長度大于 300bp; 對于基因家族成員仍包含于分析樣本內(nèi); 不包括非研究類別基因序列;如何在如何在genebank中查找一基因的序列中查找一基因的序列(1)(1)如果擁有基因如果擁有基因accessionaccession號即可,在下拉按鈕中選中號即可,在下拉按鈕中選中NucleotideNucleotide,SearchSearch前輸入前輸入accessionaccession號,直接會輸出所需的基因序列。號

12、,直接會輸出所需的基因序列。 (2 2)如果擁有基因)如果擁有基因IDID號,也可以用號,也可以用IDID號來查詢,例如我們要查詢一個號來查詢,例如我們要查詢一個IDID號為號為16151096 的基因進(jìn)行查詢?nèi)缰恍枰蛐蛄卸恍枰敿?xì)信息,則需點(diǎn)擊TASTA如需進(jìn)行圖文分析,則點(diǎn)擊Graphics計算同義密碼子相對使用度(Relative synonymous codon usage, RSCU)在genebank中取出序列后,用codonw進(jìn)行在線分析結(jié)果如下:利用cusp計算密碼子Franction和Frequency。Franction:各個密碼子在編碼該氨基酸的密碼子中所占的比例。Frequency:該密碼子在編碼總基因密碼子中出現(xiàn)的頻率。如圖分析結(jié)果如下:結(jié)果如下:同樣,可計算出密碼子適應(yīng)指數(shù):Sequence: AY047586.1 CAI: 0.109

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論