生物信息數(shù)據(jù)庫(kù)及生物信息分析軟件應(yīng)用課件_第1頁(yè)
生物信息數(shù)據(jù)庫(kù)及生物信息分析軟件應(yīng)用課件_第2頁(yè)
生物信息數(shù)據(jù)庫(kù)及生物信息分析軟件應(yīng)用課件_第3頁(yè)
生物信息數(shù)據(jù)庫(kù)及生物信息分析軟件應(yīng)用課件_第4頁(yè)
生物信息數(shù)據(jù)庫(kù)及生物信息分析軟件應(yīng)用課件_第5頁(yè)
已閱讀5頁(yè),還剩38頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

實(shí)驗(yàn)一

生物信息數(shù)據(jù)庫(kù)及

生物信息分析軟件應(yīng)用現(xiàn)代分子生物學(xué)大實(shí)驗(yàn)實(shí)驗(yàn)一

生物信息數(shù)據(jù)庫(kù)及

生物信息分析軟件應(yīng)用現(xiàn)代分子生物1實(shí)驗(yàn)?zāi)康恼莆丈镄畔W(xué)基本概念、原理及方法應(yīng)用生物信息學(xué)的一些工具進(jìn)行初步的生物信息分析運(yùn)用PrimerPrimier5進(jìn)行引物設(shè)計(jì)實(shí)驗(yàn)?zāi)康恼莆丈镄畔W(xué)基本概念、原理及方法2實(shí)驗(yàn)主要內(nèi)容分子生物學(xué)數(shù)據(jù)庫(kù):掌握數(shù)據(jù)庫(kù)的種類(lèi)、功能,文獻(xiàn)查找方法相似序列的數(shù)據(jù)庫(kù)搜索:掌握NCBI中幾種基本局部序列比對(duì)方法及幾種單機(jī)軟件的使用方法(Blastn;Blastp;Blastx;tBlastn)。生物信息學(xué)單機(jī)軟件介紹:PrimerPrimier5實(shí)驗(yàn)主要內(nèi)容分子生物學(xué)數(shù)據(jù)庫(kù):掌握數(shù)據(jù)庫(kù)的種類(lèi)、功能,文獻(xiàn)查3歐洲分子生物學(xué)實(shí)驗(yàn)室EMBL(EuropeanMolecularBiologyLaboratory)美國(guó)生物技術(shù)信息中心NCBI(NationalCenterforBiotechnologyInformation)日本遺傳研究所DDBJ(DNADataBankofJapan)國(guó)際權(quán)威數(shù)據(jù)庫(kù)歐洲分子生物學(xué)實(shí)驗(yàn)室國(guó)際權(quán)威數(shù)據(jù)庫(kù)4國(guó)際權(quán)威數(shù)據(jù)庫(kù)國(guó)際權(quán)威數(shù)據(jù)庫(kù)5蛋白質(zhì)數(shù)據(jù)庫(kù)

SWISS-PROTTrEMBL(translationofEMBL)PIR(Promoterinformationresource)PRF(Promoterresearchfoundation)PDBSTR(Re-organizedProteindataBank)Prosite結(jié)構(gòu)數(shù)據(jù)庫(kù)

PDB(ProteinDataBank)NDB(NucleicAcidDatabase)DNA-bindProteindatabase

swiss-3DIMAGE酶和代謝數(shù)據(jù)庫(kù)

KEGG(KyotoEneyclopedinofgenes&genemes)PKR(ProteinKinaseResource)

文獻(xiàn)數(shù)據(jù)庫(kù)

PubMedOMIMAgricola常用數(shù)據(jù)庫(kù)蛋白質(zhì)數(shù)據(jù)庫(kù)常用數(shù)據(jù)庫(kù)6孟德?tīng)柸祟?lèi)遺傳(OMIM),三維蛋白質(zhì)結(jié)構(gòu)的分子模型數(shù)據(jù)庫(kù)(MMDB),唯一人類(lèi)基因序列集合(UniGene),人類(lèi)基因組基因圖譜,分類(lèi)學(xué)瀏覽器,同國(guó)立癌癥研究所合作的癌癥基因組剖析計(jì)劃(CGAP)。Entrez是NCBI的為用戶(hù)提供整合的訪問(wèn)序列,定位,分類(lèi)和結(jié)構(gòu)數(shù)據(jù)的搜索和檢索系統(tǒng)。Entrez同時(shí)也提供序列和染色體圖譜的圖形視圖。Entrez是一個(gè)用以整合NCBI數(shù)據(jù)庫(kù)中信息的搜尋和檢索工具。這些數(shù)據(jù)庫(kù)包括核酸序列,蛋白序列,大分子結(jié)構(gòu),全基因組,和通過(guò)PubMed檢索的MEDLINE。Entrez的一個(gè)強(qiáng)大和獨(dú)特的特點(diǎn)是檢索相關(guān)的序列,結(jié)構(gòu)和參考文獻(xiàn)的能力。雜志文獻(xiàn)通過(guò)PubMed獲得,PubMed是一個(gè)網(wǎng)絡(luò)搜索界面,可以提供對(duì)在MEDLINE上的九百萬(wàn)雜志引用的訪問(wèn),包含了鏈接到參與的出版商網(wǎng)絡(luò)站點(diǎn)的全文文章。BLAST是一個(gè)NCBI開(kāi)發(fā)的序列相似搜索程序,還可作為鑒別基因和遺傳特點(diǎn)的手段。BLAST能夠在小于15秒的時(shí)間內(nèi)對(duì)整個(gè)DNA數(shù)據(jù)庫(kù)執(zhí)行序列搜索。NCBI提供的附加的軟件工具有:開(kāi)放閱讀框?qū)ひ捚鳎∣RFFinder),電子PCR,和序列提交工具,Sequin和BankIt。所有的NCBI數(shù)據(jù)庫(kù)和軟件工具可以從WWW或FTP來(lái)獲得。NCBI還有E-mail服務(wù)器,提供用文本搜索或序列相似搜索訪問(wèn)數(shù)據(jù)庫(kù)一種可選方法。NCBI相關(guān)介紹孟德?tīng)柸祟?lèi)遺傳(OMIM),三維蛋白質(zhì)結(jié)構(gòu)的分子模型數(shù)據(jù)庫(kù)(7生物信息數(shù)據(jù)庫(kù)及生物信息分析軟件應(yīng)用ppt課件8核苷酸數(shù)據(jù)庫(kù)dbEST

EST來(lái)源于mRNA

-基因長(zhǎng)度(300-400bp,數(shù)據(jù)長(zhǎng)度足以分析編碼的產(chǎn)物)或者全基因(已知)

-5’端或3’端的cDNA序列(EST)

-300-400bpsingle-passsequence(可能有誤,如果要求<0.1%的錯(cuò)誤率,需要測(cè)序8-10次)

-GenBank中71%以上的是EST序列。UniGene

來(lái)源于同一基因的非重復(fù)EST,組成基因序列群(contig)

dbSTS

(sequencetaggedsites)

a.短序列(200-500bp)b.已完成染色體上的定位c.可以與電子PCR相連用dbGSS

(genomesurveysequence)

a.基因組短序列b.cosmid、BAC、YAC外源插入片斷末端序列c.AluPCR序列

HTG(high-throughputgenomesequence)

尚未完成測(cè)序的重疊群(>2kb)dbSNP

每100-300bp有一個(gè)SNPEPD(EukaryoticPromoterDatabase)啟動(dòng)子數(shù)據(jù)庫(kù)核苷酸數(shù)據(jù)庫(kù)dbEST

EST來(lái)源于mRNA

-基因長(zhǎng)度(9生物信息數(shù)據(jù)庫(kù)及生物信息分析軟件應(yīng)用ppt課件10文獻(xiàn)數(shù)據(jù)庫(kù)文獻(xiàn)數(shù)據(jù)庫(kù)11序列相關(guān)檢索操作序列查詢(xún)登錄號(hào)(如X58929)序列名稱(chēng)(如SCARGC)核酸同源性搜索

BLAST分析瀏覽整個(gè)基因組直觀顯示各染色體,可以在染色體水平上選擇感興趣的位點(diǎn),逐層放大序列相關(guān)檢索操作序列查詢(xún)12生物信息數(shù)據(jù)庫(kù)及生物信息分析軟件應(yīng)用ppt課件13生物信息數(shù)據(jù)庫(kù)及生物信息分析軟件應(yīng)用ppt課件14瀏覽染色體瀏覽染色體15瀏覽染色體瀏覽染色體16瀏覽染色體瀏覽染色體17Blastp:氨基酸序列檢索蛋白質(zhì)庫(kù)將待查詢(xún)的蛋白質(zhì)序列及其互補(bǔ)序列一起對(duì)蛋白質(zhì)序列數(shù)據(jù)庫(kù)進(jìn)行查詢(xún);(Searchanucleotidedatabaseusinganucleotidequery)Blastn:核苷酸序列檢索核苷酸庫(kù)將待查詢(xún)的核酸序列及其互補(bǔ)序列一起對(duì)核酸序列數(shù)據(jù)庫(kù)進(jìn)行查詢(xún);(Searchanucleotidedatabaseusinganucleotidequery)

Blastx:核苷酸序列

氨基酸序列

蛋白質(zhì)庫(kù)先將待查詢(xún)的核酸序列按6種可讀框架(逐個(gè)向前3個(gè)堿基和逐個(gè)向后3個(gè)堿基讀碼)翻譯成蛋白質(zhì)序列,然后將翻譯結(jié)果對(duì)蛋白質(zhì)序列數(shù)據(jù)庫(kù)進(jìn)行查詢(xún);(Searchproteindatabaseusingatranslatednucleotidequery)tBlastn先將核酸序列數(shù)據(jù)庫(kù)中的核酸序列按6種可讀框架翻譯成蛋白質(zhì)序列,然后將待查詢(xún)的蛋白質(zhì)序列及其互補(bǔ)序列對(duì)其翻譯結(jié)果進(jìn)行查詢(xún);(Searchtranslatednucleotidedatabaseusingaproteinquery)tBlastx先將待查詢(xún)的核酸序列和核酸序列數(shù)據(jù)庫(kù)中的核酸序列按6種可讀框架翻譯成蛋白質(zhì)序列,然后再將2種翻譯結(jié)果從蛋白質(zhì)水平進(jìn)行查詢(xún)。(Searchtranslatednucleotidedatabaseusingatranslatednucleotidequery)同源性搜索(BasicLocalAlignmentSearchTool)Blastp:氨基酸序列檢索蛋白質(zhì)庫(kù)同源性搜索(Basic18序列特征注釋

Annotationbysequencefeatures序列特征注釋

Annotationbysequence19SubcellularLocalizationSubcellularLocalization20NoneSignalpeptideNoneobvioustransmembraneregionNoneSignalpeptideNoneobviou21MotifsMotifs22DomainsPfamInterProDomainsPfamInterPro23CoiledCoilRegionsCoiledCoilRegions24STRUCTURECannotfinddatainPDBPredictedinGTDSTRUCTURECannotfinddatain25

多序列比對(duì)

Multiplesequencealignmentanalysis

多序列比對(duì)

Multiplesequencealign26生物信息數(shù)據(jù)庫(kù)及生物信息分析軟件應(yīng)用ppt課件27ClustalW,viewasJalViewClustalW,viewasJalView28生物信息數(shù)據(jù)庫(kù)及生物信息分析軟件應(yīng)用ppt課件29引物設(shè)計(jì)-primerprimer5軟件引物設(shè)計(jì)的一般步驟序列查詢(xún)單基因序列多基因序列引物設(shè)計(jì)引物確定引物設(shè)計(jì)-primerprimer5軟件引物設(shè)計(jì)的一30引物的設(shè)計(jì)原則引物與模板的序列要緊密互補(bǔ)引物與引物之間避免形成穩(wěn)定的二聚體或發(fā)夾結(jié)構(gòu)引物不能在模板的非目的位點(diǎn)引發(fā)DNA聚合反應(yīng)(即錯(cuò)配)引物的設(shè)計(jì)原則引物與模板的序列要緊密互補(bǔ)31引物的長(zhǎng)度一般為15-30bp,常用的是18-27bp,但不應(yīng)大于38,因?yàn)檫^(guò)長(zhǎng)會(huì)導(dǎo)致其延伸溫度大于74℃,不適于TaqDNA聚合酶進(jìn)行反應(yīng)。引物所對(duì)應(yīng)模板位置序列的Tm值在72℃左右可使復(fù)性條件最佳。Tm值的計(jì)算有多種方法,如按公式Tm=4(G+C)+2(A+T),在Oligo軟件中使用的是最鄰近法(thenearestneighbormethod)。Tm值:50%的引物和互補(bǔ)序列表現(xiàn)為雙鏈DNA分子時(shí)的溫度引物的設(shè)計(jì)原則引物的長(zhǎng)度一般為15-30bp,常用的是18-27bp,32引物序列在模板內(nèi)應(yīng)當(dāng)沒(méi)有相似性較高,尤其是3’端相似性較高的序列,否則容易導(dǎo)致錯(cuò)配。引物3’端出現(xiàn)3個(gè)以上的連續(xù)堿基,如GGG或CCC,也會(huì)使錯(cuò)誤引發(fā)機(jī)率增加。引物3’端的末位堿基對(duì)Taq酶的DNA合成效率有較大的影響。不同的末位堿基在錯(cuò)配位置導(dǎo)致不同的擴(kuò)增效率,末位堿基為A的錯(cuò)配效率明顯高于其他3個(gè)堿基,因此應(yīng)當(dāng)避免在引物的3’端使用堿基A。引物的設(shè)計(jì)原則引物序列在模板內(nèi)應(yīng)當(dāng)沒(méi)有相似性較高,尤其是3’端相似性較高的33引物二聚體及發(fā)夾結(jié)構(gòu)的能值過(guò)高(超過(guò)4.5kcal/mol)易導(dǎo)致產(chǎn)生引物二聚體帶,并且降低引物有效濃度而使PCR反應(yīng)不能正常進(jìn)行。5’端序列對(duì)PCR影響不太大,因此常用來(lái)引進(jìn)修飾位點(diǎn)或標(biāo)記物。對(duì)引物的修飾一般是在5’端增加酶切位點(diǎn),應(yīng)根據(jù)下一步實(shí)驗(yàn)中要插入PCR產(chǎn)物的載體的相應(yīng)序列而確定。引物的設(shè)計(jì)原則引物二聚體及發(fā)夾結(jié)構(gòu)的能值過(guò)高(超過(guò)4.5kcal/mol)34primerprimer5軟件的使用primerprimer5軟件的使用35primerprimer5軟件的使用primerprimer5軟件的使用36primerprimer5軟件的使用primerprimer5軟件的使用37primerprimer5軟件的使用primerprimer5軟件的使用38primerprimer5軟件的使用primerprimer5軟件的使用39primerprimer5軟件的使用primerpri

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論