



下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、.基因序列分析核酸和蛋白質(zhì)序列分析 在獲得一個基因序列后,需要對其進(jìn)行生物信息學(xué)分析,從中盡量發(fā)掘信息,從而指導(dǎo)進(jìn)一步的實驗研究。通過染色體定位分析、內(nèi)含子外顯子分析、ORF分析、表達(dá)譜分析等,能夠闡明基因的基本信息。通過啟動子預(yù)測、CpG島分析和轉(zhuǎn)錄因子分析等,識別調(diào)控區(qū)的順式作用元件,可以為基因的調(diào)控研究提供基礎(chǔ)。通過蛋白質(zhì)基本性質(zhì)分析,疏水性分析,跨膜區(qū)預(yù)測,信號肽預(yù)測,亞細(xì)胞定位預(yù)測,抗原性位點預(yù)測,可以對基因編碼蛋白的性質(zhì)作出初步判斷和預(yù)測。尤其通過疏水性分析和跨膜區(qū)預(yù)測可以預(yù)測基因是否為膜蛋白,這對確定實驗研究方向有重要的參考意義。此外,通過相似性搜索、功能位點分析、結(jié)構(gòu)分析、查詢
2、基因表達(dá)譜聚簇數(shù)據(jù)庫、基因敲除數(shù)據(jù)庫、基因組上下游鄰居等,盡量挖掘網(wǎng)絡(luò)數(shù)據(jù)庫中的信息,可以對基因功能作出推論。上述技術(shù)路線可為其它類似分子的生物信息學(xué)分析提供借鑒。本路線圖及推薦網(wǎng)址已建立超級鏈接,放在北京大學(xué)人類疾病基因研究中心網(wǎng)站(/science/bioinfomatics.htm),可以直接點擊進(jìn)入檢索網(wǎng)站。 下面介紹其中一些基本分析。值得注意的是,在對序列進(jìn)行分析時,首先應(yīng)當(dāng)明確序列的性質(zhì),是mRNA序列還是基因組序列?是計算機(jī)拼接得到還是經(jīng)過PCR擴(kuò)增測序得到?是原核生物還是真核生物?這些決定了分析方法的選擇和分析結(jié)果的解釋。 (一)核酸
3、序列分析 1、雙序列比對(pairwise alignment)雙序列比對是指比較兩條序列的相似性和尋找相似堿基及氨基酸的對應(yīng)位置,它是用計算機(jī)進(jìn)行序列分析的強(qiáng)大工具,分為全局比對和局部比對兩類,各以Needleman-Wunsch算法和Smith-Waterman算法為代表。由于這些算法都是啟發(fā)式(heuristic)的算法,因此并沒有最優(yōu)值。根據(jù)比對的需要,選用適當(dāng)?shù)谋葘ぞ?,在比對時適當(dāng)調(diào)整空格罰分(gap penalty)和空格延伸罰分(gap extension penalty),以獲得更優(yōu)的比對。 除了利用BLAST、FASTA等局部比對工具進(jìn)行序列對數(shù)據(jù)庫的搜索外,我們還推薦使用
4、EMBOSS軟件包中的Needle軟件(http:/bioinfo.pbi.nrc.ca:8090/EMBOSS/),和Pairwise BLAST(/BLAST/)。 以上介紹的這些雙序列比對工具的使用都比較簡單,一般輸入所比較的序列即可。 (1)BLAST和FASTA FASTA(http:/www.ebi.ac.uk/fasta33/)和BLAST(/BLAST/)是目前運用較為廣泛的相似性搜索工具。這兩個工具都采用局部比對的方法,選擇計分矩陣對序列計分,通過分值的大小和統(tǒng)計學(xué)顯著性分
5、析確定有意義的局部比對。使用FASTA和BLAST,進(jìn)行數(shù)據(jù)庫搜索,找到與查詢序列有一定相似性的序列。一般認(rèn)為,如果蛋白的序列一致性為25-30%,則可認(rèn)為序列同源。BLAST根據(jù)搜索序列和數(shù)據(jù)庫的不同類型分為5種(表2),另外PSI-BLAST通過迭代搜索,可以搜索到與查詢序列相似性較低的序列。其中BLASTN、BLASTP在實踐中最為常用,TBLASTN在搜索相似序列進(jìn)行新基因預(yù)測時特別有用。使用BLAST時,先選擇需要使用的BLAST程序,然后提供相應(yīng)的查詢序列,選擇所比對的數(shù)據(jù)庫即可。 (2)Needle和Pairwise BLAST:其中Needle適用于蛋白質(zhì)和DNA序列,而Pai
6、rwise BLAST僅適用于DNA序列 (3)相似性和同源性:必須指出,相似性(similarity)和同源性( homology)是兩個完全不同的概念。同源序列是指從某一共同祖先經(jīng)過趨異進(jìn)化而形成的不同序列。相似性是指序列比對過程中檢測序列和目標(biāo)序列之間相同堿基或氨基酸殘基序列所占比例的大小。經(jīng)過比對,當(dāng)相似性高于一定程度,可以推測序列可能是同源序列,具有一定同源性。 2、多序列比對和進(jìn)化樹 在研究生物問題時,常常需要同時對兩個以上的序列進(jìn)行比對,這就是多序列比對。多序列比對可用于研究一組相關(guān)基因或蛋白,推斷基因的進(jìn)化關(guān)系,還可用于發(fā)現(xiàn)一組功能或結(jié)構(gòu)相關(guān)基因之間的共有模式(pattern)
7、。最常用的多序列比對工具為ClustalW(http:/www.ebi.ac.uk/clustalw/),多用于比較蛋白序列。 ClustalW用法: (1)輸入:序列以FastA格式輸入。 (2)輸出:除了以文本形式外,還可以通過JalView顯示和編輯結(jié)果。此外,還可以另外使用GeneDoc(常見于文獻(xiàn))及DNAStar軟件等顯示結(jié)果。多序列比對的結(jié)果還用于進(jìn)一步繪制進(jìn)化樹。 3、ORF(Open Reading Frame)分析 從核酸序列翻譯得到蛋白質(zhì)序列,需要進(jìn)行ORF分析,每個生物信息學(xué)分析軟件包幾乎都帶有翻譯功能。推薦使用NCBI的ORF Finder(http:/www.ncb
8、/gorf/gorf.html)軟件或EMBOSS中的getorf(http:/bioinfo.pbi.nrc.ca:8090/EMBOSS/)軟件。ORF Finder以圖形方式,分為正鏈+1、2、3和反鏈1、2、3六個相位預(yù)測ORF;Getorf可指定預(yù)測ORF的長度下限和指定預(yù)測正反鏈。進(jìn)行ORF分析雖然比較簡單,但應(yīng)注意以下幾點: (1)序列的準(zhǔn)確性:尤其是通過計算機(jī)拼接的序列,需要根據(jù)EST和基因組序列進(jìn)行反復(fù)校正。 (2)ORF是否完整:看在ORF上游同一相位是否具有終止碼,或者具有起始密碼子。 (3)參考Kozak一致性規(guī)律,即起始密碼子位點符合A/GC
9、CATGG。 (4)不要忽略反義讀框。 4、染色體定位根據(jù)基因組圖譜對序列進(jìn)行染色體定位和瀏覽其基因組上下游基因。具體方法為:(1)進(jìn)行Genomic BLAST搜索。(2)通過“Genome view”觀察基因組結(jié)構(gòu)。(3)點擊相應(yīng)染色體區(qū)域,通過表意圖(ideogram)和相應(yīng)區(qū)域上下游的基因進(jìn)行精確定位。 5、基因結(jié)構(gòu)分析根據(jù)基因的mRNA序列及基因組序列,可以進(jìn)行基因結(jié)構(gòu)的分析。推薦使用BLAST或BLAT(/cgi-bin/hgBlat?command=start)進(jìn)行分析。由于真核生物轉(zhuǎn)錄后內(nèi)含子將被剪切,因此將mRNA和基因組進(jìn)行比對以后
10、,會發(fā)現(xiàn)mRNA的每個外顯子與基因組序列片斷匹配,根據(jù)這些片段可以判斷外顯子的數(shù)目和大小。外顯子和內(nèi)含子具體邊界的確定,可以參考GT/AG一致性規(guī)則。BLAT的結(jié)果直接顯示外顯子數(shù)目、大小及邊界。 6、基因上游調(diào)控區(qū)分析 (1)啟動子預(yù)測:推薦使用冷泉港開發(fā)的FIRSTEF程序(/tools/FirstEF/)進(jìn)行啟動子預(yù)測。用RT-PCR等實驗方法獲得的mRNA往往缺少完整的5端,采用FirstEF程序可以對第一外顯子(尤其是非編碼的第一外顯子)和CpG相關(guān)啟動子進(jìn)行預(yù)測。 方法:以FastA格式輸入起始密碼子上游序列。 (2)轉(zhuǎn)錄因子結(jié)合位點分析:推
11、薦使用TFSEARCH程序(http:/www.cbrc.jp/research/db/TFSEARCH.html)及MATCH程序 (/pub/programs.html#match)對轉(zhuǎn)錄因子數(shù)據(jù)庫TRANSFAC(http:/transfac.gbf.de/TRANSFAC/)進(jìn)行搜索,尋找可能的轉(zhuǎn)錄因子結(jié)合位點。 方法:輸入起始密碼子上游序列。結(jié)果將給出很多可能的轉(zhuǎn)錄因子結(jié)合位點,注意選擇其中分值較高的位點。 (二)蛋白質(zhì)序列分析 1、跨膜區(qū)預(yù)測 各個物種的膜蛋白的比例差別不大,約四分之一的人類已知蛋白為膜蛋白。由于膜蛋白不溶于
12、水,分離純化困難,不容易生長晶體,很難確定其結(jié)構(gòu)。因此,對膜蛋白的跨膜螺旋進(jìn)行預(yù)測是生物信息學(xué)的重要應(yīng)用。 推薦使用TMHMM軟件(http:/www.cbs.dtu.dk/services/TMHMM/)對蛋白進(jìn)行跨膜預(yù)測。TMHMM綜合了跨膜區(qū)疏水性、電荷偏倚、螺旋長度和膜蛋白拓?fù)鋵W(xué)限制等性質(zhì),采用隱馬氏模型(Hidden Markov Models),對跨膜區(qū)及膜內(nèi)外區(qū)進(jìn)行整體的預(yù)測。TMHMM是目前最好的進(jìn)行跨膜區(qū)預(yù)測的軟件,它尤其長于區(qū)分可溶性蛋白和膜蛋白,因此首選它來判定一個蛋白是否為膜蛋白。所有跨膜區(qū)預(yù)測軟件的準(zhǔn)確性都不超過52,但86的跨膜區(qū)可以通過不同的軟件進(jìn)行正確預(yù)測。因此
13、,綜合分析不同的軟件預(yù)測結(jié)果和疏水性圖以獲得更好的預(yù)測結(jié)果。 方法:輸入待分析的蛋白序列即可。 2、信號肽預(yù)測 信號肽位于分泌蛋白的N端,當(dāng)?shù)鞍卓缒まD(zhuǎn)移位置時被切掉。信號肽的特征是包括一個正電荷區(qū)域、一個疏水性區(qū)域和不帶電荷但具有極性的區(qū)域。信號肽切割位點的-3和-1位為小而中性氨基酸。 推薦使用SignalP軟件2.0版(http:/www.cbs.dtu.dk/services/SignalP-2.0/)對PDCD5N端序列進(jìn)行信號肽分析。SignalP2.0根據(jù)信號肽序列特征,采用神經(jīng)網(wǎng)絡(luò)方法或隱馬氏模型方法,根據(jù)物種的不同,分別選擇用真核和原核序列進(jìn)行訓(xùn)練,對信號肽位置及切割位點進(jìn)行預(yù)測。信號肽切割位點預(yù)測用Y-score maximum來判斷,對是否分泌蛋白用mean S-score來判斷:如果mean S-score大于0.5,則預(yù)測為分泌蛋白,存在信號肽,但I(xiàn)I型跨膜蛋白的N端序列可能被錯誤預(yù)測為分泌蛋白的信號肽。 方法:輸入待分析的蛋白序列,如為原核基因選擇原核訓(xùn)練集,否則選擇真核訓(xùn)練集。 3、亞細(xì)胞定位預(yù)測 亞細(xì)胞定位與蛋白質(zhì)的功能存在著非常重要的聯(lián)系。亞細(xì)胞定位預(yù)測基于如下原理:(1)不同的細(xì)胞器往往具有不同的理化環(huán)境,它根據(jù)蛋白質(zhì)的結(jié)構(gòu)及表面理化特征,選擇性容納蛋白。(2)蛋白質(zhì)表面直接暴露
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 印刷業(yè)互聯(lián)網(wǎng)+與融合發(fā)展考核試卷
- 冷藏車運輸企業(yè)風(fēng)險管理與內(nèi)部控制系統(tǒng)考核試卷
- 天然氣藏動態(tài)模擬與預(yù)測考核試卷
- 影視錄放設(shè)備顯示技術(shù)考核試卷
- 文化藝術(shù)與城市品牌建設(shè)考核試卷
- 木片干燥技術(shù)與木材應(yīng)力釋放考核試卷
- 健身器材行業(yè)企業(yè)文化建設(shè)與品牌形象提升考核試卷
- 保險業(yè)與新能源保險市場的機(jī)遇與挑戰(zhàn)應(yīng)對策略案例分析考核試卷
- 制糖業(yè)的可持續(xù)發(fā)展評估考核試卷
- 木材的采伐和森林管理考核試卷
- 中國古代餐具
- 電動執(zhí)行機(jī)構(gòu)安裝施工工藝標(biāo)準(zhǔn)
- 儒釋道文化秒解詳解課件
- 施工日志模板
- 粗原料氣的凈化-二氧化碳的脫除(合成氨生產(chǎn))
- Agilent7820A氣相色譜儀操作規(guī)程知識講解
- 中醫(yī)適宜技術(shù)模擬試題(附答案)
- 加涅的信息加工理論-課件
- 400字作文稿紙(方格)A4打印模板
- 不領(lǐng)證的夫妻離婚協(xié)議書
- 鋁型材企業(yè)組織架構(gòu)及部門職能
評論
0/150
提交評論