用Polyphen2和SIFT進行突變預測_第1頁
用Polyphen2和SIFT進行突變預測_第2頁
用Polyphen2和SIFT進行突變預測_第3頁
用Polyphen2和SIFT進行突變預測_第4頁
用Polyphen2和SIFT進行突變預測_第5頁
已閱讀5頁,還剩14頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

用Polyphen2和SIFT進行突變 SNP功能預測 三個網(wǎng)址 Polyphen2 http genetics bwh harvard edu pph2 SIFT http sift jcvi org 以上兩個在線應用的軟件 主要對SNP以及點突變進行功能預測 但預測限于錯義突變 其他無義突變 突變?yōu)榻K止密碼 堿基缺失 插入所造成的框移突變 以及起始密碼子的突變均不可以預測 Uniportdatabase 數(shù)據(jù)準備 兩個網(wǎng)站均為在線提交數(shù)據(jù) 提交的數(shù)據(jù)文件格式可有以下兩種 第一種為蛋白質的氨基酸序列 按照FASTA格式編寫第二種為蛋白質在Uniportdatabase中的ID 獲取蛋白質序列或ID 可以在NCBI中查找 也可以直接在Uniportdatabase中查找 此處填寫蛋白質名稱 查詢結果 仔細核對以上數(shù)據(jù) ID就是所在polyphen2中需要號碼 以humanDAX 1為例 ID為P51843 ID 蛋白質名稱 種屬 點擊所需要的蛋白質ID鏈接 在出現(xiàn)的頁面中可以詳細查看DAX 1的信息 再次核對是否正確 注意右上角的幾列標簽 如圖 點擊 獲取FASTA格式數(shù)據(jù) 此數(shù)據(jù)可能會被下載 下載后可以用記事本程序打開 或者有時會在瀏覽器中直接打開 可以將其中數(shù)據(jù)全部復制備用 下方即是打開的FASTA數(shù)據(jù) 最上面是蛋白質的信息 含ID 名稱 種屬 下方是氨基酸序列 sp P51843 NR0B1 HUMANNuclearreceptorsubfamily0groupBmember1OS HomosapiensGN NR0B1PE 1SV 2MAGENHQWQGSILYNMLMSAKQTRAAPEAPETRLVDQCWGCSCGDEPGVGREGLLGGRNVALLYRCCFCGKDHPRQGSILYSMLTSAKQTYAAPKAPEATLGPCWGCSCGSDPGVGRAGLPGGRPVALLYRCCFCGEDHPRQGSILYSLLTSSKQTHVAPAAPEARPGGAWWDRSYFAQRPGGKEALPGGRATALLYRCCFCGEDHPQQGSTLYCVPTSTNQAQAAPEERPRAPWWDTSSGALRPVALKSPQVVCEAASAGLLKTLRFVKYLPCFQVLPLDQQLVLVRNCWASLLMLELAQDRLQFETVEVSEPSMLQKILTTRRRETGGNEPLPVPTLQHHLAPPAEARKVPSASQVQAIKCFLSKCWSLNISTKEYAYLKGTVLFNPDVPGLQCVKYIQGLQWGTQQILSEHTRMTHQGPHDRFIELNSTLFLLRFINANVIAELFFRPIIGTVSMDDMMLEMLCTKI 成都家教 成都家教網(wǎng) Polyphen2應用 進入網(wǎng)站 http genetics bwh harvard edu pph2 在這里以我們以前發(fā)現(xiàn)的DAX 1L262P這個突變舉例 在紅框出填入已經(jīng)查到的ID 下方FASTA數(shù)據(jù)可以不用輸 綠框中輸入突變氨基酸位置 在AA1中選擇L AA2中選擇突變后的P 最后點Submit 運行畫面 每隔5 10秒點refresh刷新頁面 直至Results中出現(xiàn)View 然后點擊View 結果 一般突變預測看第二條圖HumVar的結果 分數(shù)越接近1 0 損害可能越大 越接近0 損害可能性越小 結果分為benign possiblydamaging以及probablydamaging注 possibly為有可能 probably為很可能 成都家教 成都家教網(wǎng) 練習 小常所發(fā)現(xiàn)的SF 1基因一處SNP G146A 請用Polyphen2進行預測 蛋白質功能是否受到影響 最后結果 SIFT 進入網(wǎng)站 http sift jcvi org 在singleproteintools中找到SIFTsequence 點擊打開進入數(shù)據(jù)提交新頁面 填入自己email SIFT運算時間在20min左右 你可以等 也可以讓他把郵件發(fā)送過來 蛋白質FASTA數(shù)據(jù) 將下載好的蛋白質Fasta數(shù)據(jù)上傳即可 或者將用記事本或瀏覽器打開的Fasta數(shù)據(jù)copy至此數(shù)據(jù)框中 蛋白質序列可以截選 但必須有第一行的蛋白質信息數(shù)據(jù) 此處填蛋白質突變或SNP位點信息 如S578N L262P G146A等 成都家教 成都家教網(wǎng) SIFT預測ARS578N功能變化 在Uniport中搜索AndrogenReceptor 下載FASTA數(shù)據(jù) 如下圖為瀏覽器打開后的結果 sp P10275 ANDR HUMANAndrogenreceptorOS HomosapiensGN ARPE 1SV 2MEVQLGLGRVYPRPPSKTYRGAFQNLFQSVREVIQNPGPRHPEAASAAPPGASLLLLQQQQQQQQQQQQQQQQQQQQQETSPRQQQQQQGEDGSPQAHRRGPTGYLVLDEEQQPSQPQSALECHPERGCVPEPGAAVAASKGLPQQLPAPPDEDDSAAPSTLSLLGPTFPGLSSCSADLKDILSEASTMQLLQQQQQEAVSEGSSSGRAREASGAPTSSKDNYLGGTSTISDNAKELCKAVSVSMGLGVEALEHLSPGEQLRGDCMYAPLLGVPPAVRPTPCAPLAECKGSLLDDSAGKSTEDTAEYSPFKGGYTKGLEGESLGCSGSAAAGSSGTLELPSTLSLYKSGALDEAAAYQSRDYYNFPLALAGPPPPPPPPHPHARIKLENPLDYGSAWAAAAAQCRYGDLASLHGAGAAGPGSGSPSAAASSSWHTLFTAEEGQLYGPCGGGGGGGGGGGGGGGGGGGGGGGGEAGAVAPYGYTRPPQGLAGQESDFTAPDVWYPGGMVSRVPYPSPTCVKSEMGPWMDSYSGPYGDMRLETARDHVLPIDYYFPPQKTCLICGDEASGCHYGALTCGSCKVFFKRAAEGKQKYLCASRNDCTIDKFRRKNCPSCRLRKCYEAGMTLGARKLKKLGNLKLQEEGEASSTTSPTEETTQKLTVSHIEGYECQPIFLNVLEAIEPGVVCAGHDNNQPDSFAALLSSLNELGERQLVHVVKWAKALPGFRNLHVDDQMAVIQYSWMGLMVFAMGWRSFTNVNSRMLYFAPDLVFNEYRMHKSRMYSQCVRMRHLSQEFGWLQITPQEFLCMKALLLFSIIPVDGLKNQKFFDELRMNYIKELDRIIACKRKNPTSCSRRFYQLTKLLDSVQPIARELHQFTFDLLIKSHMVSVDFPEMMAEIISVQVPKILSGKVKPIYFHTQ 此為第一行蛋白質信息 如果采用copy至數(shù)據(jù)輸入框 而不是采用文件上傳方法 紅框中數(shù)據(jù)必須黏貼進輸入框 而后面的蛋白質序列只需黏貼需要部分 注意 一般來說用文件上傳方法比較簡單 但SIFT對氨基酸序列有要求 大于500的氨基酸序列不能分析 故像AR這種有919個AA的就不能采用直接上傳模式 而要將氨基酸序列裁剪過后按Fasta格式黏貼至數(shù)據(jù)框中 成都家教 成都家教網(wǎng) sp P10275 ANDR HUMANAndrogenreceptorOS HomosapiensGN ARPE 1SV 2MEVQLGLGRVYPRPPSKTYRGAFQNLFQSVREVIQNPGPRHPEAASAAPPGASLLLLQQQQQQQQQQQQQQQQQQQQQETSPRQQQQQQGEDGSPQAHRRGPTGYLVLDEEQQPSQPQSALECHPERGCVPEPGAAVAASKGLPQQLPAPPDEDDSAAPSTLSLLGPTFPGLSSCSADLKDILSEASTMQLLQQQQQEAVSEGSSSGRAREASGAPTSSKDNYLGGTSTISDNAKELCKAVSVSMGLGVEALEHLSPGEQLRGDCMYAPLLGVPPAVRPTPCAPLAECKGSLLDDSAGKSTEDTAEYSPFKGGYTKGLEGESLGCSGSAAAGSSGTLELPSTLSLYKSGALDEAAAYQSRDYYNFPLALAGPPPPPPPPHPHARIKLENPLDYGSAWAAAAAQCRYGDLASLHGAGAAGPGSGSPSAAASSSWHTLFTAEEGQLYGPCGGGGGGGGGGGGGGGGGGGGGGGGEAGAVAPYGYTRPPQGLAGQESDFTAPDVWYPGGMVSRVPYPSPTCVKSEMGPWMDSYSGPYGDMRLETARDHVLPIDYYFPPQKTCLICGDEASGCHYGALTCGSCKVFFKRAAEGKQKYLCASRNDCTIDKFRRKNCPSCRLRKCYEAGMTLGARKLKKLGNLKLQEEGEASSTTSPTEETTQKLTVSHIEGYECQPIFLNVLEAIEPGVVCAGHDNNQPDSFAALLSSLNELGERQLVHVVKWAKALPGFRNLHVDDQMAVIQYSWMGLMVFAMGWRSFTNVNSRMLYFAPDLVFNEYRMHKSRMYSQCVRMRHLSQEFGWLQITPQEFLCMKALLLFSIIPVDGLKNQKFFDELRMNYIKELDRIIACKRKNPTSCSRRFYQLTKLLDSVQPIARELHQFTFDLLIKSHMVSVDFPEMMAEIISVQVPKILSGKVKPIYFHTQ 我們需要先編輯FASTA數(shù)據(jù) 在記事本中打開 首先找到第578位的S 紅色標出 因為SIFT最佳預測大小為300 400左右的氨基酸序列 那么我們將之前的400個氨基酸刪除 藍色部分 那么我們的突變位點就從S578N變?yōu)镾178N 最后將末尾的139個氨基酸也一并刪除 咖啡色 保留中間389個氨基酸 加上第一行的蛋白質信息 這就是我們需要提交的數(shù)據(jù) 成都家教 成都家教網(wǎng) 將剛才編輯好的數(shù)據(jù)填入這個框中 之前介紹過這個數(shù)據(jù)輸入框 此框中填入突變信息S178N 頁面中其他選項保持默認就可以 一般不需要更改 最后提交就可以 成都家教 成都家教網(wǎng) OK 現(xiàn)在大家可以泡杯咖啡或茶 聊聊天 過個5 10分鐘就可以出結果 一般不超過20分鐘 如果出錯 會有錯誤信息提示給你 如果你填好了郵箱 也可以不必等 過一會收郵件就可以 結果會有一堆英文 看了頭痛 直接找到ScaledProbabilitiesforEntireProtein和Predictionsofsubstitutionsentered兩處鏈接 分別點擊進去 ScaledProbabilitiesforEntireProtein給出了所提交氨基酸每個位點發(fā)生突變后的計算分數(shù) 只要分數(shù)小于0 05就認為可能影響到蛋白質功能而Predictionsofsub

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論