用Polyphen2和SIFT進行突變預測_第1頁
用Polyphen2和SIFT進行突變預測_第2頁
用Polyphen2和SIFT進行突變預測_第3頁
用Polyphen2和SIFT進行突變預測_第4頁
用Polyphen2和SIFT進行突變預測_第5頁
已閱讀5頁,還剩14頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、三個網(wǎng)址三個網(wǎng)址 Polyphen2:/pph2/ SIFT:/ Uniport database: http:/ 這個網(wǎng)址用于查找蛋白質序列和獲取這個網(wǎng)址用于查找蛋白質序列和獲取FASTA格式格式數(shù)據(jù)準備數(shù)據(jù)準備 兩個網(wǎng)站均為在線提交數(shù)據(jù),提交的數(shù)據(jù)文件格式可有以下兩種:第一種為蛋白質的氨基酸序列,按照格式編寫第二種為蛋白質在Uniport database中的ID獲取蛋白質序列或獲取蛋白質序列或ID 可以在NCBI中查找,也可以直接在Uniport database中查找查詢結果 仔細核對以上

2、數(shù)據(jù),ID就是所在polyphen2中需要號碼,以human DAX-1為例,ID為P51843IDID蛋白質名稱蛋白質名稱種屬種屬 點擊所需要的蛋白質ID鏈接,在出現(xiàn)的頁面中可以詳細查看DAX-1的信息,再次核對是否正確,注意右上角的幾列標簽,如圖點擊,獲取點擊,獲取FASTAFASTA格式數(shù)據(jù),此數(shù)據(jù)可能會被下載,格式數(shù)據(jù),此數(shù)據(jù)可能會被下載,下載后可以用記事本程序打開,或者有時會在瀏覽器下載后可以用記事本程序打開,或者有時會在瀏覽器中直接打開,可以將其中數(shù)據(jù)全部復制備用,下方即中直接打開,可以將其中數(shù)據(jù)全部復制備用,下方即是打開的是打開的FASTAFASTA數(shù)據(jù),最上面是蛋白質的信息(含

3、數(shù)據(jù),最上面是蛋白質的信息(含IDID、名稱、種屬),下方是氨基酸序列名稱、種屬),下方是氨基酸序列sp|P51843|NR0B1_HUMAN Nuclear receptor subfamily 0 group B member 1 OS=Homo sapiens GN=NR0B1 PE=1 SV=2MAGENHQWQGSILYNMLMSAKQTRAAPEAPETRLVDQCWGCSCGDEPGVGREGLLGGRNVALLYRCCFCGKDHPRQGSILYSMLTSAKQTYAAPKAPEATLGPCWGCSCGSDPGVGRAGLPGGRPVALLYRCCFCGEDHPRQGSILYS

4、LLTSSKQTHVAPAAPEARPGGAWWDRSYFAQRPGGKEALPGGRATALLYRCCFCGEDHPQQGSTLYCVPTSTNQAQAAPEERPRAPWWDTSSGALRPVALKSPQVVCEAASAGLLKTLRFVKYLPCFQVLPLDQQLVLVRNCWASLLMLELAQDRLQFETVEVSEPSMLQKILTTRRRETGGNEPLPVPTLQHHLAPPAEARKVPSASQVQAIKCFLSKCWSLNISTKEYAYLKGTVLFNPDVPGLQCVKYIQGLQWGTQQILSEHTRMTHQGPHDRFIELNSTLFLLRFINANVIAELF

5、FRPIIGTVSMDDMMLEMLCTKI成都家教,成都家教網(wǎng)Polyphen2應用 進入網(wǎng)站:/pph2/在這里以我們以前在這里以我們以前發(fā)現(xiàn)的發(fā)現(xiàn)的DAX-1 DAX-1 L262PL262P這個突變舉這個突變舉例,在紅框出填入例,在紅框出填入已經(jīng)查到的已經(jīng)查到的IDID,下,下方方FASTAFASTA數(shù)據(jù)可以數(shù)據(jù)可以不用輸;綠框中輸不用輸;綠框中輸入突變氨基酸位置;入突變氨基酸位置;在在AA1AA1中選擇中選擇L L,AA2AA2中選擇突變后中選擇突變后的的P P,最后點,最后點SubmitSubmit運行畫面每隔每隔5-10

6、5-10秒點秒點refreshrefresh刷新頁刷新頁面,直至面,直至ResultsResults中出現(xiàn)中出現(xiàn)ViewView,然后點擊然后點擊ViewView結果一般突變預測一般突變預測看第二條圖看第二條圖HumVarHumVar的結果,的結果,分數(shù)越接近分數(shù)越接近1.01.0,損害可能越大,損害可能越大,越接近越接近0 0,損害,損害可能性越?。嚎赡苄栽叫。航Y果分為結果分為benignbenign,possibly possibly damagingdamaging以及以及probably probably damagingdamaging注:注:possiblypossibly為為有可

7、能,有可能,probablyprobably為很可為很可能能成都家教,成都家教網(wǎng)練習 小常所發(fā)現(xiàn)的SF-1基因一處SNP:G146A,請用Polyphen2 進行預測,蛋白質功能是否受到影響? 最后結果SIFT 進入網(wǎng)站:/ 在single protein tools中找到SIFT sequence,點擊打開進入數(shù)據(jù)提交新頁面填入自己填入自己emailemail,SIFTSIFT運算時間在運算時間在20min20min左右,你左右,你可以等,也可以讓他把郵件發(fā)送過來可以等,也可以讓他把郵件發(fā)送過來蛋白質蛋白質FASTAFASTA數(shù)據(jù),將下載好的蛋白質數(shù)據(jù),

8、將下載好的蛋白質FastaFasta數(shù)據(jù)上傳即可數(shù)據(jù)上傳即可或者將用記事本或瀏覽器打開的或者將用記事本或瀏覽器打開的FastaFasta數(shù)數(shù)據(jù)據(jù)copycopy至此數(shù)據(jù)框中,蛋白質序列可以至此數(shù)據(jù)框中,蛋白質序列可以截選,但必須有截選,但必須有第一行的蛋白質信息數(shù)第一行的蛋白質信息數(shù)據(jù)據(jù)此處填蛋白質突變或此處填蛋白質突變或SNPSNP位點信息,位點信息,如如S578NS578N,L262PL262P,G146AG146A等等成都家教,成都家教網(wǎng)SIFT預測AR S578N功能變化 在Uniport中搜索Androgen Receptor,下載FASTA數(shù)據(jù),如下圖為瀏覽器打開后的結果sp|P1

9、0275|ANDR_HUMAN Androgen receptor OS=Homo sapiens GN=AR PE=1 SV=2MEVQLGLGRVYPRPPSKTYRGAFQNLFQSVREVIQNPGPRHPEAASAAPPGASLLLLQQQQQQQQQQQQQQQQQQQQQETSPRQQQQQQGEDGSPQAHRRGPTGYLVLDEEQQPSQPQSALECHPERGCVPEPGAAVAASKGLPQQLPAPPDEDDSAAPSTLSLLGPTFPGLSSCSADLKDILSEASTMQLLQQQQQEAVSEGSSSGRAREASGAPTSSKDNYLGGTSTISDNAK

10、ELCKAVSVSMGLGVEALEHLSPGEQLRGDCMYAPLLGVPPAVRPTPCAPLAECKGSLLDDSAGKSTEDTAEYSPFKGGYTKGLEGESLGCSGSAAAGSSGTLELPSTLSLYKSGALDEAAAYQSRDYYNFPLALAGPPPPPPPPHPHARIKLENPLDYGSAWAAAAAQCRYGDLASLHGAGAAGPGSGSPSAAASSSWHTLFTAEEGQLYGPCGGGGGGGGGGGGGGGGGGGGGGGGEAGAVAPYGYTRPPQGLAGQESDFTAPDVWYPGGMVSRVPYPSPTCVKSEMGPWMDSYSGPYG

11、DMRLETARDHVLPIDYYFPPQKTCLICGDEASGCHYGALTCGSCKVFFKRAAEGKQKYLCASRNDCTIDKFRRKNCPSCRLRKCYEAGMTLGARKLKKLGNLKLQEEGEASSTTSPTEETTQKLTVSHIEGYECQPIFLNVLEAIEPGVVCAGHDNNQPDSFAALLSSLNELGERQLVHVVKWAKALPGFRNLHVDDQMAVIQYSWMGLMVFAMGWRSFTNVNSRMLYFAPDLVFNEYRMHKSRMYSQCVRMRHLSQEFGWLQITPQEFLCMKALLLFSIIPVDGLKNQKFFDELRMNYI

12、KELDRIIACKRKNPTSCSRRFYQLTKLLDSVQPIARELHQFTFDLLIKSHMVSVDFPEMMAEIISVQVPKILSGKVKPIYFHTQ此為第一行蛋白質信息,如果采用此為第一行蛋白質信息,如果采用copycopy至數(shù)據(jù)輸入框,而不是采用文件上傳方法,至數(shù)據(jù)輸入框,而不是采用文件上傳方法,紅框中數(shù)據(jù)必須黏貼進輸入框,而后面的蛋白質序列只需黏貼需要部分紅框中數(shù)據(jù)必須黏貼進輸入框,而后面的蛋白質序列只需黏貼需要部分注意:一般來說用文件上傳方注意:一般來說用文件上傳方法比較簡單,但法比較簡單,但SIFTSIFT對氨基酸序對氨基酸序列有要求,大于列有要求,大于500500

13、的氨基酸序的氨基酸序列不能分析,故像列不能分析,故像ARAR這種有這種有919919個個AAAA的就不能采用直接上傳模的就不能采用直接上傳模式,而要將氨基酸序列裁剪過式,而要將氨基酸序列裁剪過后按后按FastaFasta格式黏貼至數(shù)據(jù)框中格式黏貼至數(shù)據(jù)框中成都家教,成都家教網(wǎng)sp|P10275|ANDR_HUMAN Androgen receptor OS=Homo sapiens GN=AR PE=1 SV=2MEVQLGLGRVYPRPPSKTYRGAFQNLFQSVREVIQNPGPRHPEAASAAPPGASLLLLQQQQQQQQQQQQQQQQQQQQQETSPRQQQQQQGED

14、GSPQAHRRGPTGYLVLDEEQQPSQPQSALECHPERGCVPEPGAAVAASKGLPQQLPAPPDEDDSAAPSTLSLLGPTFPGLSSCSADLKDILSEASTMQLLQQQQQEAVSEGSSSGRAREASGAPTSSKDNYLGGTSTISDNAKELCKAVSVSMGLGVEALEHLSPGEQLRGDCMYAPLLGVPPAVRPTPCAPLAECKGSLLDDSAGKSTEDTAEYSPFKGGYTKGLEGESLGCSGSAAAGSSGTLELPSTLSLYKSGALDEAAAYQSRDYYNFPLALAGPPPPPPPPHPHARIKLENPLD

15、YGSAWAAAAAQCRYGDLASLHGAGAAGPGSGSPSAAASSSWHTLFTAEEGQLYGPCGGGGGGGGGGGGGGGGGGGGGGGGEAGAVAPYGYTRPPQGLAGQESDFTAPDVWYPGGMVSRVPYPSPTCVKSEMGPWMDSYSGPYGDMRLETARDHVLPIDYYFPPQKTCLICGDEASGCHYGALTCG CKVFFKRAAEGKQKYLCASRNDCTIDKFRRKNCPSCRLRKCYEAGMTLGARKLKKLGNLKLQEEGEASSTTSPTEETTQKLTVSHIEGYECQPIFLNVLEAIEPGVVCAGHDNN

16、QPDSFAALLSSLNELGERQLVHVVKWAKALPGFRNLHVDDQMAVIQYSWMGLMVFAMGWRSFTNVNSRMLYFAPDLVFNEYRMHKSRMYSQCVRMRHLSQEFGWLQITPQEFLCMKALLLFSIIPVDGLKNQKFFDELRMNYIKELDRIIACKRKNPTSCSRRFYQLTKLLDSVQPIARELHQFTFDLLIKSHMVSVDFPEMMAEIISVQVPKILSGKVKPIYFHTQ我們需要先編輯我們需要先編輯FASTAFASTA數(shù)據(jù),在記事本中打開,首先找到第數(shù)據(jù),在記事本中打開,首先找到第578578位的位的S S(紅色標

17、出),(紅色標出),因為因為SIFTSIFT最佳預測大小為最佳預測大小為300-400300-400左右的氨基酸序列,那么我們將之前的左右的氨基酸序列,那么我們將之前的400400個氨基個氨基酸刪除(藍色部分),那么我們的突變位點就從酸刪除(藍色部分),那么我們的突變位點就從S578NS578N變?yōu)樽優(yōu)镾178NS178N,最后將末尾的,最后將末尾的139139個氨基酸也一并刪除(咖啡色),保留中間個氨基酸也一并刪除(咖啡色),保留中間389389個氨基酸,加上第一行的蛋白質個氨基酸,加上第一行的蛋白質信息,這就是我們需要提交的數(shù)據(jù)信息,這就是我們需要提交的數(shù)據(jù)成都家教,成都家教網(wǎng)將剛才編輯好

18、的數(shù)據(jù)填入這個框中(之前介紹過將剛才編輯好的數(shù)據(jù)填入這個框中(之前介紹過這個數(shù)據(jù)輸入框)這個數(shù)據(jù)輸入框)此框中填入突變信息此框中填入突變信息S178NS178N頁面中其他選項保持默認就可頁面中其他選項保持默認就可以,一般不需要更改,最后提以,一般不需要更改,最后提交就可以交就可以成都家教,成都家教網(wǎng) 現(xiàn)在大家可以泡杯咖啡或茶,聊聊天,過個5-10分鐘就可以出結果,一般不超過20分鐘,如果出錯,會有錯誤信息提示給你。如果你填好了郵箱,也可以不必等,過一會收郵件就可以。 結果會有一堆英文,看了頭痛,直接找到Scaled Probabilities for Entire Protein和Predictions of substitutions entered兩處鏈接,分別點擊進去。 Scaled Probabilities for Entire Protein給出了所提交氨基酸每個位點發(fā)生突變后的計算分數(shù),只要分數(shù)小于0.05就認為可

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論