生物信息學題矩陣的構(gòu)建_第1頁
生物信息學題矩陣的構(gòu)建_第2頁
生物信息學題矩陣的構(gòu)建_第3頁
生物信息學題矩陣的構(gòu)建_第4頁
生物信息學題矩陣的構(gòu)建_第5頁
已閱讀5頁,還剩29頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、Exchange your mind張閃閃關(guān)于PAM矩陣的討論歷史蹤跡 最大的成績或許就是得分矩陣的出現(xiàn), Dayhoff被稱作生物信息學之父或許更合適。 Dr. Margaret Oakley Dayhoff, credited as the founder of Bio-Informatics, ca. 1980 Margaret Dayhoff, 1978; Accepted point mutation :(可接受的點突變PAM)若蛋白質(zhì)序列中的一個點突變不會改變或僅有微小改變蛋白質(zhì)的功能,且這樣的突變能夠通過遺傳傳給下一代,稱這樣的點突變?yōu)榭山邮艿狞c突變。 蛋白質(zhì)進化中哪些點突變是可

2、接受的呢? 34個蛋白質(zhì)超家族的71個蛋白質(zhì)組中的1572種變化; 序列相似性 85%; 功能同源的蛋白質(zhì) 通過中性進化,引入可接受的點突變; PAM:設(shè)有兩條蛋白質(zhì)序列s和t,使用一系列的可接受突變將s變換為t,若平均每100個殘基發(fā)生一次點突變,則稱這兩條序列相距1個PAM單位。 Dayhoff等計算了各氨基酸的相對突變能力,這只是描述了在較短進化時期內(nèi)每個氨基酸發(fā)生變化的頻度。為了計算相對突變的能力,他們把每種氨基酸發(fā)生突變的次數(shù)除以該氨基酸出現(xiàn)的總次數(shù)。氨基酸相對突變的可能性(氨基酸相對突變的可能性(Mj)丙氨酸的值主觀設(shè)定為100 每種氨基酸相對突變率mi1002iifAAim總替換

3、數(shù)所有總共發(fā)生替換數(shù)氨基酸100iifMi:第i種氨基酸;Mi :氨基酸i的突變率fi :每種氨基酸出現(xiàn)的頻率;100:每100個殘基發(fā)生一次突變(1%)氨基酸歸一化頻率(fj)甘氨酸丙氨酸亮氨酸賴氨酸絲氨酸纈氨酸蘇氨酸脯氨酸谷氨酸天冬氨酸0.0890.0870.0850.0810.0700.0650.0580.0510.0500.047精氨酸天冬酰胺苯丙氨酸谷氨酰胺異亮氨酸組氨酸半胱氨酸酪氨酸甲硫氨酸色氨酸0.0410.0400.0400.0380.0370.0340.0330.0300.0150,010總共發(fā)生替換數(shù)氨基酸相互替換的次數(shù)與氨基酸ijimmiji氨基酸氨基酸i替換為替換為j的

4、突變率的突變率mij ( )ji突變Q2:iiimm1:時ji :時ji 總共發(fā)生替換數(shù)氨基酸相互替換的次數(shù)與氨基酸總替換數(shù)總共發(fā)生替換數(shù)氨基酸ijifij1002因此,因此,mij與與mji差別僅是由差別僅是由fi fi 和和fjfj的不同而引起的的不同而引起的總共發(fā)生替換數(shù)氨基酸相互替換的次數(shù)與氨基酸ijimmiji1002jfji總替換數(shù)相互替換的次數(shù)與氨基酸表示i的突變率PAM1矩陣的構(gòu)建 1. 兩個蛋白質(zhì)序列的1%氨基酸發(fā)生變化的時間; 2. 定義進化時間以氨基酸的變異比例為準,而不是時間;因為各個蛋白質(zhì)家族進化的速度并不相等; 3. PAM2 = PAM1*PAM1 PAM3 =

5、(PAM1)3 PAM250= (PAM1)250PAM2矩陣 1. 基本假設(shè):每個氨基酸的突變的概率獨立于前次突變。因此,PAM2=PAM1*PAM1舉個例子 已知3個蛋白質(zhì)家族若干保守序列片段: 家族一:FKILK,F(xiàn)KIKK,F(xiàn)FILL,F(xiàn)FIKL 家族二:IIFFF, IIFIF , IKFFL , IKFIL 家族三: KIFKK,KIFLK,KLFKL,KLFLL按Doyhoff方法構(gòu)建PAM1矩陣 位置對齊,多重比對(不考慮空位) 統(tǒng)計每種氨基酸出現(xiàn)的頻率;fi = 氨基酸i的數(shù)目/總氨基酸數(shù)目fL = 12/60 = 0.200 fK = 16/60 = 0.267 .家族一家

6、族二家族三F K I L KI I F F FK I F K KF K I K KI I F I FK I F L KF F I L LI K F F LK L F K LF F I K LI K F I LK L F L L 最大簡約法(N代表氨基酸互換次數(shù))家族一:N(LK) = 3 N(KF) = 1家族二: N(FI) = 2 N(KI) = 1 N(FL) = 1家族三: N(LK) = 3 N(IL) = 1FKILKFKIKKFKIKKFFIKLFFILLFFIKL(LK)(KF)(LK)(LK) 計算每種氨基酸轉(zhuǎn)換成其它氨基酸的次數(shù)。 假設(shè)兩種氨基酸間相互轉(zhuǎn)換一樣。e.g. N

7、(LK)= 3 + 0 + 3 = 6KFILK116F121I121L611 每種氨基酸相對突變率mi i:第i種氨基酸; :氨基酸i的突變率fi :每種氨基酸出現(xiàn)的頻率;mK = 8/(122 fK 100) = 0.0125 fK = 16/60=0.267mF =4/(122 fK 100) =0.0056.1001002iiiifMfim總替換數(shù)總共發(fā)生替換數(shù)氨基酸iM 氨基酸i替換為j的突變率mije.g.mKK = 1- mK = 0.9875mKF = mK 1/4 = 0.001389 iiiiijmmjijjimmji1時,總共發(fā)生替換數(shù)氨基酸相互替換的次數(shù)與氨基酸時, 氨基酸突變概率一步轉(zhuǎn)移概率矩陣M1ij原氨基酸KFIL替換氨基酸K0.98750.0015630.0015630.009375F0.0013890.9944440.0027780.001389I0.0017860.0035710.9928570.001786L0.01250.0020830.0020830.983333 由突變率mij計算計分矩陣中的分值rij: 將rij 和rji取平均值,再取整數(shù);(按先前假設(shè), rij = rji) rKK = 10 log(mkk/ fk) = 10 log (0.9875/0.267

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論