生物信息學(xué)軟件使用技巧_第1頁
生物信息學(xué)軟件使用技巧_第2頁
生物信息學(xué)軟件使用技巧_第3頁
生物信息學(xué)軟件使用技巧_第4頁
生物信息學(xué)軟件使用技巧_第5頁
已閱讀5頁,還剩47頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、生物信息學(xué)軟件的主要功能簡介1.1. 分析和處理實驗數(shù)據(jù)和公共數(shù)據(jù),加快研究分析和處理實驗數(shù)據(jù)和公共數(shù)據(jù),加快研究進(jìn)度,縮短科研時間進(jìn)度,縮短科研時間2.2. 提示、指導(dǎo)、替代實驗操作,利用對實驗數(shù)提示、指導(dǎo)、替代實驗操作,利用對實驗數(shù)據(jù)的分析所得的結(jié)論設(shè)計下一階段的實驗據(jù)的分析所得的結(jié)論設(shè)計下一階段的實驗3.3. 用計算機(jī)管理實驗數(shù)據(jù)用計算機(jī)管理實驗數(shù)據(jù)4.4. 尋找、預(yù)測新基因及預(yù)測其結(jié)構(gòu)、功能尋找、預(yù)測新基因及預(yù)測其結(jié)構(gòu)、功能5.5. 蛋白高級結(jié)構(gòu)預(yù)測蛋白高級結(jié)構(gòu)預(yù)測二.生物學(xué)軟件部分常見功能使用技巧PCR PCR 引物設(shè)計引物設(shè)計DNADNA、蛋白質(zhì)序列同源分析及進(jìn)化樹構(gòu)建、蛋白質(zhì)序列

2、同源分析及進(jìn)化樹構(gòu)建ContigContig Express-DNA Express-DNA 序列片斷拼接序列片斷拼接DNA DNA 模擬電泳模擬電泳重要生物數(shù)據(jù)庫簡介重要生物數(shù)據(jù)庫簡介3生物信息學(xué)服務(wù) 生物信息學(xué)是一門新興的交叉學(xué)科,它將數(shù)學(xué)和計算機(jī)知識應(yīng)用于生物學(xué),以獲取、加工、存儲、分類、檢索與分析生物大分子的信息,從而理解這些信息的生物學(xué)意義。lhttp:/ IRACE (基因拉長功能)lBLAST同源序列檢索lENTREZ SYSTEM (集成信息檢索系統(tǒng))1.分析和處理實驗數(shù)據(jù)和公共數(shù)據(jù),加快研究進(jìn)度,縮短科研時間2.提示、指導(dǎo)、替代實驗操作,利用對實驗數(shù)據(jù)的分析所得的結(jié)論設(shè)計下一

3、階段的實驗3.實驗數(shù)據(jù)的自動化管理4.尋找、預(yù)測新基因及其結(jié)構(gòu)、功能5.蛋白質(zhì)高級結(jié)構(gòu)及功能預(yù)測(三維建模,目前研究的焦點(diǎn)和難點(diǎn))核酸:序列同源性比較,分子進(jìn)化樹構(gòu)建,結(jié)構(gòu)信息分析,包括基元(Motif)、酶切點(diǎn)、重復(fù)片斷、堿基組成和分布、開放閱讀框(ORF),蛋白編碼區(qū)(CDS)及外顯子預(yù)測、RNA二級結(jié)構(gòu)預(yù)測、DNA片段的拼接蛋白:序列同源性比較,結(jié)構(gòu)信息分析(包括Motif,限制酶切點(diǎn),內(nèi)部重復(fù)序列的查找,氨基酸殘基組成及其親水性及疏水性分析),等電點(diǎn)及二級結(jié)構(gòu)預(yù)測等等本地序列與公共序列的聯(lián)接,成果擴(kuò)大 用軟件設(shè)計PCR引物,測序引物或雜交探針,設(shè)計克隆策略,構(gòu)建載體,做模擬電泳實驗,即

4、模擬核酸內(nèi)切酶或內(nèi)肽酶對相應(yīng)的底物分子切割后的電泳行為。蛋白跨膜區(qū)域分析,信號肽潛在斷裂點(diǎn)預(yù)測。l實驗室結(jié)果的儲存、管理和申報工作l從網(wǎng)絡(luò)數(shù)據(jù)庫獲得的序列文件(由ENTREZ集成檢索系統(tǒng)所得的數(shù)據(jù)文件可以進(jìn)入EndNote 或者Reference Manager 儲存管理)或資料文獻(xiàn)的管理v軟件: EndNote,Reference Manager l對CDS(Coding Sequence)蛋白編碼區(qū)的預(yù)測準(zhǔn)確率已達(dá)到90%以上l對整個基因結(jié)構(gòu)的預(yù)測存在一定難度vPWM(位置權(quán)重矩陣)算法由物化原理技術(shù)開發(fā),側(cè)重于找基因表達(dá)系統(tǒng)和核酸相互作用的位點(diǎn)。給信號序列各個位置每種可能出現(xiàn)的核苷酸分配

5、一個分?jǐn)?shù),將各位置分?jǐn)?shù)相加后得出該序列作為潛在作用位點(diǎn)的分?jǐn)?shù)。l該項技術(shù)算法十分復(fù)雜,尚未成熟。PDB及MMDB數(shù)據(jù)庫目前仍然禁止收錄軟件預(yù)測出來的蛋白高級結(jié)構(gòu)模型。lX射線晶體學(xué)技術(shù)和多維核磁共振技術(shù)是當(dāng)前人們認(rèn)識蛋白高級結(jié)構(gòu)的主要手段,但兩種技術(shù)都有不足之處。前者要求必需得到高標(biāo)準(zhǔn)的蛋白晶體,后者對分子量大于3萬的大蛋白不能測定。因此理論模擬和結(jié)構(gòu)預(yù)測顯得十分重要。l序列與結(jié)構(gòu)關(guān)系的根源在于“蛋白質(zhì)折疊的問題”,這是近期研究關(guān)注的焦點(diǎn)。1.同源預(yù)測(一級結(jié)構(gòu)決定高級結(jié)構(gòu))2.結(jié)構(gòu)與結(jié)構(gòu)相對比(DALI算法)3.當(dāng)前最先進(jìn)的結(jié)構(gòu)預(yù)測方法:結(jié)構(gòu)類識別(fold recognition) 先建立

6、一個已知的結(jié)構(gòu)類數(shù)據(jù)庫(fold library),將待測序列“穿過”該數(shù)據(jù)庫構(gòu)成的坐標(biāo),并根據(jù)事先確定的物理限制,逐個位置移動(threading, sequence-structure alignment) ,由一個函數(shù)(sequence-structure fitness alignment) 判斷序列與結(jié)構(gòu)類的符合程度,找出未知序列在目標(biāo)結(jié)構(gòu)上的能量最優(yōu)和構(gòu)象最穩(wěn)固的比對位置。對計算機(jī)要求很高。l引物設(shè)計的原則引物設(shè)計的原則l 首先引物要跟模板緊密結(jié)合;l 其次引物與引物之間不能有穩(wěn)定的二聚體或發(fā)夾結(jié)構(gòu)存在;l最后引物不能在別的非目的位點(diǎn)引起高效DNA聚合反應(yīng)(即錯配)。圍繞這幾條基本

7、原則,設(shè)計引物需要考慮諸多因素,如:l引物長度(primer length),l產(chǎn)物長度(product length),l序列Tm值 (melting temperature),lG值(internal stability),l引物二聚體及發(fā)夾結(jié)構(gòu)(duplex formation and hairpin),l錯誤引發(fā)位點(diǎn)(false priming site),l引物及產(chǎn)物GC含量(composition),有時還要對引物進(jìn)行修飾,如增加限制酶切點(diǎn),引進(jìn)突變等。l一般引物的長度為16-23bp,常用的長度為18-21bp,過長或過短都不合適。l引物3端的堿基一般不用A,因為A在錯誤引發(fā)位點(diǎn)

8、的引發(fā)效率相對比較高,而其它三種堿基的錯誤引發(fā)效率相對小一些。l引物的GC含量一般為45-55%,過高或過低都不利于引發(fā)反應(yīng)。上下游引物的GC含量不能相差太大。l引物所對應(yīng)模板序列的Tm值最好在72左右,當(dāng)然由于模板序列本身的組成決定其Tm值可能偏低或偏高,可根據(jù)具體情況靈活運(yùn)用。 lG值反映了引物與模板結(jié)合的強(qiáng)弱程度,也是一個重要的引物評價指標(biāo),一般情況下,在Oligo 5.0軟件的G值窗口中,引物的G值最好呈正弦曲線形狀,即5端和中間部分G值較高,而3端G值相對較低,且不要超過9(G值為負(fù)值,這里取絕對值),如此則有利于正確引發(fā)反應(yīng)而可防止錯誤引發(fā)。分析其原理,引物與模板應(yīng)具有較高的結(jié)合能

9、量,這樣有利于引物與模板序列的整合,因此5端與中間段的G值應(yīng)較高,而3端G值影響DNA聚合酶對模板DNA的解鏈,過高則不利于這一步驟。l可能的錯誤引發(fā)位點(diǎn)決定于引物序列組成與模板序列組成的相似性,相似性高則錯誤引發(fā)率高,錯誤引發(fā)的引發(fā)率一般不要高過100,最好沒有錯誤引發(fā)位點(diǎn),如此可以保證不出非目的產(chǎn)物的假帶。l引物二聚體及發(fā)夾結(jié)構(gòu)的能量一般不要超過4.5,否則容易產(chǎn)生引物二聚體帶而且會降低引物濃度從而導(dǎo)致PCR正常反應(yīng)不能進(jìn)行。l對引物的修飾一般是增加酶切位點(diǎn),應(yīng)參考載體的限制酶識別序列確定,常常對上下游引物修飾的序列選用不同限制酶的識別序列,以有利于以后的工作。 l推薦使用自動搜索軟件:P

10、rimer Premier 5.0 l推薦使用引物評價軟件:Oligo 5/6l相似性是指一種很直接的數(shù)量關(guān)系,比如部分相同或相似的百分比或其它一些合適的度量??蛇M(jìn)行自身局部比較。如 Dot Plot (點(diǎn)陣序列比較)l同源性指從一些數(shù)據(jù)中推斷出的兩個基因或蛋白質(zhì)序列具而共同祖先的結(jié)論,屬于質(zhì)的判斷。如 Alignment (同源性分析)l相似性分析相似性分析l Peptool Litel同源性分析同源性分析Vector NTI 6-AlignXlContig Express-DNA 序列序列片斷拼接片斷拼接一點(diǎn)體會lDNA模擬電泳具有一定實驗預(yù)示功能,l模擬電泳不能作為實驗結(jié)果或依據(jù)Vect

11、or NTI Suit 5.5 模擬電泳三大數(shù)據(jù)庫lNCBI (美國)lDDBJ (日本)http:/www.ddbj.nig.ac.jplEBI (歐洲)http:/www.ebi.ac.uk/index.htmll酵母基因組數(shù)據(jù)庫(SGD)l酵母蛋白質(zhì)數(shù)據(jù)庫(YPD)l擬南芥數(shù)據(jù)庫(AtDB)l醫(yī)學(xué)數(shù)據(jù)庫(OMIM)l線蟲數(shù)據(jù)庫(ACEDB)1. PCR引物、測序引物及雜交探針的設(shè)計及評價2. DNA,蛋白質(zhì)序列同源分析及進(jìn)化樹構(gòu)建3. 生物大分子二級結(jié)構(gòu)模擬顯示及基本序列分析4. 有關(guān)蛋白質(zhì)親疏水性,等電點(diǎn),抗原性,跨膜蛋白,信號肽等分析以及Dot Plot服務(wù)5. 質(zhì)粒載體構(gòu)建及克隆策略6.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論