




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、1如何做序列的如何做序列的BLAST分析分析2內(nèi)容提要內(nèi)容提要 Blast簡(jiǎn)介簡(jiǎn)介 Blast相關(guān)問(wèn)題 Blast的應(yīng)用的應(yīng)用 示例3Blast簡(jiǎn)介簡(jiǎn)介 BLAST 是是NCBI中用來(lái)將一個(gè)蛋白質(zhì)或中用來(lái)將一個(gè)蛋白質(zhì)或DNA序列和各種數(shù)據(jù)庫(kù)中序列和各種數(shù)據(jù)庫(kù)中的其他序列進(jìn)行比對(duì)的主要工具。的其他序列進(jìn)行比對(duì)的主要工具。 BLAST搜索搜索是研究一個(gè)蛋白質(zhì)是研究一個(gè)蛋白質(zhì)和基因的最基本的方法之一。和基因的最基本的方法之一。 Blast具有非常廣泛的運(yùn)用具有非常廣泛的運(yùn)用確定特定的蛋白質(zhì)或核酸序列有哪些已知的直系同源或旁系同源序列確定哪些蛋白質(zhì)和基因在特定的物種中出現(xiàn)確定一個(gè)DNA或蛋白質(zhì)序列身份
2、發(fā)現(xiàn)新基因 確定一個(gè)特定基因或蛋白質(zhì)有哪些已經(jīng)發(fā)現(xiàn)了的變種研究可能存在多種剪切方式的表達(dá)序列標(biāo)簽尋找對(duì)于一個(gè)蛋白質(zhì)的功能和/或結(jié)構(gòu)起關(guān)鍵作用的氨基酸殘基 4主要的主要的blast程序程序5主要的主要的blast程序程序程序名程序名查詢序列查詢序列數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)搜索方法搜索方法Blastn核酸核酸核酸序列搜索逐一核酸數(shù)據(jù)庫(kù)中的序列Blastp蛋白質(zhì)蛋白質(zhì)蛋白質(zhì)序列搜索逐一蛋白質(zhì)數(shù)據(jù)庫(kù)中的序列Blastx核酸蛋白質(zhì)核酸序列6框翻譯成蛋白質(zhì)序列后和蛋白質(zhì)數(shù)據(jù)庫(kù)中的序列逐一搜索。Tblastn蛋白質(zhì)核酸蛋白質(zhì)序列和核酸數(shù)據(jù)庫(kù)中的核酸序列6框翻譯后的蛋白質(zhì)序列逐一比對(duì)。TBlastx核酸核酸核酸序列6框翻
3、譯成蛋白質(zhì)序列,再和核酸數(shù)據(jù)庫(kù)中的核酸序列6框翻譯成的蛋白質(zhì)序列逐一進(jìn)行比對(duì)。6具體步驟具體步驟1. 登陸blast主頁(yè) /Blast.cgi2. 根據(jù)已有序列類型和搜索目標(biāo),選擇合適的blast程序Blastn,Blastp,Blastx等3. 填寫(xiě)表單信息選擇要搜索的數(shù)據(jù)庫(kù),并修改一些可選參數(shù)等4. 提交任務(wù)5. 查看和分析結(jié)果7具體步驟具體步驟 輸入要分析的序列輸入要分析的序列NP_006735三種三種主要的輸入方式主要的輸入方式 剪切然后粘貼DNA或蛋白質(zhì)序列 使用FASTA格式的序列 簡(jiǎn)單地使用索引號(hào)碼(如一個(gè)RefSeq 或Gen
4、Bank (GI)的序號(hào))8具體步驟具體步驟 選擇要搜索的數(shù)據(jù)庫(kù)選擇要搜索的數(shù)據(jù)庫(kù) (blastp)去冗余GenBank編碼序列PDB + SwissProt + PIR + PRFNr數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù) 合并了若干個(gè)主要的蛋白質(zhì) 或DNA數(shù)據(jù)庫(kù) 數(shù)據(jù)庫(kù)有相同的序列,但nr 數(shù)據(jù)庫(kù)只收錄一個(gè) 典型和常用的數(shù)據(jù)庫(kù)9具體步驟具體步驟 選擇要搜索的數(shù)據(jù)庫(kù)(選擇要搜索的數(shù)據(jù)庫(kù)(blastn)10具體步驟具體步驟 調(diào)整可選參數(shù)調(diào)整可選參數(shù)1. Limit by Entrez Query可以可以用任何一種范圍限定詞用任何一種范圍限定詞來(lái)限定來(lái)限定NCBI BLAST搜索的范圍搜索的范圍11具體步驟具體步驟 調(diào)整
5、可選參數(shù)調(diào)整可選參數(shù)2. Max target sequences:比對(duì)之后顯示的最大的比對(duì)序列的數(shù)目12具體步驟具體步驟 調(diào)整可選參數(shù)調(diào)整可選參數(shù)3. Expect threshold:期望值E是得分大于或等于某個(gè)分值S的不同的比對(duì)的數(shù)目在隨機(jī)的數(shù)據(jù)庫(kù)搜索中發(fā)生的可能性。 默認(rèn)值是10,表示隨機(jī)出現(xiàn)得分等于 或高于比對(duì)得分S的期望數(shù)為10個(gè)。 當(dāng)將期望選項(xiàng)值調(diào)小時(shí),返回的數(shù)據(jù) 庫(kù)搜索結(jié)果將變少,匹配被搜索到的 概率也會(huì)變小。 增大E值將返回更多的結(jié)果。13具體步驟具體步驟 調(diào)整可選參數(shù)調(diào)整可選參數(shù)4. Word size(字段長(zhǎng)度) 蛋白質(zhì)搜索,默認(rèn)值是3 核酸序列搜索,默認(rèn)值是11 改變字
6、段長(zhǎng)度可以影響搜索 精度和速度14具體步驟具體步驟 調(diào)整可選參數(shù)調(diào)整可選參數(shù)5. Matrix (打分矩陣) 在一次BLAST搜索中,可以嘗試使用幾種不同的打分矩陣 高PAM值取代矩陣適合于差異較大的序列 低BLOSUM62值的取代矩陣適合于差異較大的序列15具體步驟具體步驟 調(diào)整可選參數(shù)調(diào)整可選參數(shù)6. Compositional adjustments,默認(rèn)選擇,一般來(lái)說(shuō)可改善E值的統(tǒng)計(jì)計(jì)算和提高靈敏度(減少返回的假陽(yáng)性結(jié)果的數(shù)目)16具體步驟具體步驟 調(diào)整可選參數(shù)調(diào)整可選參數(shù)7. Filter (選擇性過(guò)濾條件), 過(guò)濾器將鎖定諸如組成低復(fù)雜序列區(qū)(如Alu序列),用一系列N(任意堿基)
7、替代這些程序 過(guò)濾對(duì)絕大多數(shù)序列是有利的, 可以幫助避免那些假的數(shù)據(jù)庫(kù)匹配 但某些情況下可信的匹配也會(huì)過(guò)濾掉17具體步驟具體步驟 Blast輸出結(jié)果輸出結(jié)果上部上部BLAST搜索的類型、關(guān)于查詢內(nèi)容和所搜索的數(shù)據(jù)庫(kù)的描述以及一個(gè)分類連接可以將結(jié)果按照物種進(jìn)行分類中部中部數(shù)據(jù)庫(kù)中序列與查詢序列相匹配的項(xiàng)的列表,分為圖像和列表兩種描述方式下部下部一系列的兩兩序列比對(duì), 4種衡量的分?jǐn)?shù):比特分?jǐn)?shù)、期望分?jǐn)?shù)、一致性百分比、正性(相似性百分比)18具體步驟具體步驟 Blast輸出結(jié)果輸出結(jié)果databaseprogramquerytaxonomy19具體步驟具體步驟 Blast輸出結(jié)果輸出結(jié)果每一個(gè)條帶
8、表示數(shù)據(jù)庫(kù)中的一個(gè)與查詢序列相匹配的蛋白質(zhì)或核酸序列,被標(biāo)以不同顏色表示親緣關(guān)系的遠(yuǎn)近(根據(jù)比對(duì)的分),最接近匹配用紅色表示。High scoreslow e values20具體步驟具體步驟Blast輸出結(jié)果輸出結(jié)果Score 使用打分矩陣對(duì)匹配的片段進(jìn)行打分,這是對(duì)各對(duì)氨基酸殘基(或堿基)打分求和的結(jié)果,一般來(lái)說(shuō),匹配片段越長(zhǎng)、 相似性越高則Score值越大。E value 在相同長(zhǎng)度的情況下,兩個(gè)氨基酸殘基(或堿基)隨機(jī)排列的序列進(jìn)行打分,得到上述Score值的概率的大小。E值越小表示隨機(jī)情況下得到該Score值的可能性越低。21具體步驟具體步驟 Blast輸出結(jié)果,改變格式輸出結(jié)果,改
9、變格式22 BLAST搜索策略總圖示例搜索策略總圖示例23如何處理過(guò)多的結(jié)果在“l(fā)imit Entrez query”窗口輸入“refseq”,這樣所有返回結(jié)果都帶 有一個(gè)refseq號(hào),可去掉冗余的數(shù)據(jù)庫(kù)匹配結(jié)果。利用生物體的種類對(duì)數(shù)據(jù)庫(kù)返回結(jié)果作出限制。利用序列的一部分進(jìn)行搜索。如利用獨(dú)立的結(jié)構(gòu)域序列就可進(jìn)行多結(jié)構(gòu)域蛋白的檢索。調(diào)整打分矩陣使其更恰當(dāng)?shù)伢w現(xiàn)你的query和數(shù)據(jù)庫(kù)匹配之間的相似度。調(diào)整期望值。降低E值可減少返回的數(shù)據(jù)庫(kù)中的匹配項(xiàng)。BLAST 搜索的一些策略搜索的一些策略24 如何處理過(guò)少的結(jié)果很多基因或蛋白在數(shù)據(jù)庫(kù)中沒(méi)有或只有極少數(shù)的匹配項(xiàng)。當(dāng)新的微生物基因組測(cè)序完成時(shí),預(yù)測(cè)到的蛋白質(zhì)有一半不和其他任何蛋白相匹配。用于提高BLAST搜索得到的數(shù)據(jù)庫(kù)匹配項(xiàng)數(shù)目的策略:去
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年張家口貨運(yùn)資格證考試有哪些項(xiàng)目
- 加工衣服合同范本
- 2025年重慶貨運(yùn)從業(yè)資格證模擬考試保過(guò)版
- 買(mǎi)方解除合同范本
- 個(gè)人服裝采購(gòu)合同范本
- 個(gè)人庭院出租合同范本
- 基槽土夾石換填施工方案
- 臨沂制砂機(jī)采購(gòu)合同范本
- 免責(zé)任勞務(wù)合同范本
- 買(mǎi)賣(mài)農(nóng)村房屋合同范本
- ??翟诰€測(cè)評(píng)題
- 維修電工題庫(kù)(300道)
- 幼兒園數(shù)學(xué)《比較物體的大小》課件
- 住院證明模板
- DB37-T3953-2020醫(yī)療衛(wèi)生機(jī)構(gòu)安全風(fēng)險(xiǎn)分級(jí)管控體系實(shí)施指南
- T-CSPSTC 111-2022 表層混凝土低滲透高密實(shí)化施工技術(shù)規(guī)程
- 食品經(jīng)營(yíng)安全管理制度目錄
- 南通大學(xué)開(kāi)題報(bào)告模版
- 醫(yī)院急救中心勞務(wù)外包采購(gòu)項(xiàng)目評(píng)標(biāo)辦法(評(píng)分細(xì)則表)
- JTG H12-2015 公路隧道養(yǎng)護(hù)技術(shù)規(guī)范
- 2024天津工業(yè)職業(yè)學(xué)院教師招聘考試筆試試題
評(píng)論
0/150
提交評(píng)論