生物信息學(xué)數(shù)據(jù)庫(kù)課件_第1頁(yè)
生物信息學(xué)數(shù)據(jù)庫(kù)課件_第2頁(yè)
生物信息學(xué)數(shù)據(jù)庫(kù)課件_第3頁(yè)
生物信息學(xué)數(shù)據(jù)庫(kù)課件_第4頁(yè)
生物信息學(xué)數(shù)據(jù)庫(kù)課件_第5頁(yè)
已閱讀5頁(yè),還剩95頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

生物信息學(xué)數(shù)據(jù)庫(kù)生物信息學(xué)數(shù)據(jù)庫(kù)一:重要生物信息中心簡(jiǎn)介二:重要生物信息數(shù)據(jù)庫(kù)

生物數(shù)據(jù)庫(kù)序列數(shù)據(jù)庫(kù)flatfile格式三:數(shù)據(jù)庫(kù)檢索工具簡(jiǎn)介

Entrez,SRS一、生物信息數(shù)據(jù)庫(kù)引言生物分子數(shù)據(jù)高速增長(zhǎng)

分子生物學(xué)及相關(guān)領(lǐng)域研究人員迅速獲得最新實(shí)驗(yàn)數(shù)據(jù)

建立生物分子數(shù)據(jù)庫(kù)

生物分子數(shù)據(jù)庫(kù)應(yīng)滿足5個(gè)方面的主要需求

〔1〕時(shí)間性〔2〕注釋〔3〕支撐數(shù)據(jù)〔4〕數(shù)據(jù)質(zhì)量〔5〕集成性生物分子數(shù)據(jù)庫(kù)幾個(gè)明顯的特征:〔1〕數(shù)據(jù)庫(kù)的更新速度不斷加快數(shù)據(jù)量呈指數(shù)增長(zhǎng)趨勢(shì)〔2〕數(shù)據(jù)庫(kù)使用頻率增長(zhǎng)更快〔3〕數(shù)據(jù)庫(kù)的復(fù)雜程度不斷增加〔4〕數(shù)據(jù)庫(kù)網(wǎng)絡(luò)化〔5〕面向應(yīng)用〔6〕先進(jìn)的軟硬件配置生物分子數(shù)據(jù)庫(kù)一級(jí)數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)中的數(shù)據(jù)直接來(lái)源于實(shí)驗(yàn)獲得的原始數(shù)據(jù),只經(jīng)過(guò)簡(jiǎn)單的歸類(lèi)整理和注釋二級(jí)數(shù)據(jù)庫(kù)對(duì)原始生物分子數(shù)據(jù)進(jìn)行整理、分類(lèi)的結(jié)果,是在一級(jí)數(shù)據(jù)庫(kù)、實(shí)驗(yàn)數(shù)據(jù)和理論分析的根底上針對(duì)特定的應(yīng)用目標(biāo)而建立的二、重要生物信息中心

BioinformaticsCentresNCBI NationalCenterforBiotechnologyInformation(US) :///EBI EuropeanBioinformaticsInstitute(EU) :///EMBnetEuropeanMolecularBiologyNetwork ://HGMPHumanGenomeMappingProjectResourceCentre(UK) ://重要生物信息中心

BioinformaticsCentresExPASyExpertofProteinAnalysisSystem(Switzerland):///NIG NationalInstituteofGenetics(Japan) :///EMBLEuropeanMolecularBiologyLaboratory(Germany)/NCBI

美國(guó)國(guó)家生物技術(shù)信息中心:///PubMedPubMed〔:///〕是NCBI維護(hù)的生物學(xué)、醫(yī)學(xué)文獻(xiàn)引用數(shù)據(jù)庫(kù),提供對(duì)MEDLINE、Pre-MEDLINE等文獻(xiàn)數(shù)據(jù)庫(kù)的引用查詢(xún)和對(duì)大量網(wǎng)絡(luò)科學(xué)類(lèi)電子期刊的鏈接。利用Entrez系統(tǒng)可以對(duì)PubMed進(jìn)行方便的查詢(xún)檢索。EMBL歐洲分子生物學(xué)實(shí)驗(yàn)室歐洲分子生物學(xué)網(wǎng)絡(luò)組織(EMBnet)

EuropeanMolecularBiologyNetworkEMBnet為國(guó)際著名生物信息學(xué)組織,為世界各國(guó)提供生物信息資源,并合作進(jìn)行生物信息的研究、開(kāi)發(fā)、應(yīng)用和人才培訓(xùn)。:///:///TheNationalnodes

DDBJ日本核酸數(shù)據(jù)庫(kù):///ExPaSy瑞士蛋白質(zhì)分析專(zhuān)家系統(tǒng):///:///:///:///:///:///:///三、重要生物信息數(shù)據(jù)庫(kù)序列數(shù)據(jù)庫(kù)〔EMBL,GENBANK,SWISSPROT,PIR)結(jié)構(gòu)數(shù)據(jù)庫(kù)(PDB)基因組數(shù)據(jù)庫(kù)(GDB,ACeDB)其它〔EPD、TRANSTAC)生物數(shù)據(jù)庫(kù)的種類(lèi)DBCatDBCat是生物信息數(shù)據(jù)庫(kù)的目錄數(shù)據(jù)庫(kù),它收集了500多個(gè)生物信息學(xué)數(shù)據(jù)庫(kù)的信息,并根據(jù)它們的應(yīng)用領(lǐng)域進(jìn)行了分類(lèi)DNARNA蛋白質(zhì)基因組圖譜蛋白質(zhì)結(jié)構(gòu)文獻(xiàn)著作等根本類(lèi)型,〔:///〕ftp://數(shù)據(jù)庫(kù)目錄(一)Dbcat統(tǒng)計(jì)的生物信息數(shù)據(jù)庫(kù)的數(shù)目分類(lèi)數(shù)據(jù)庫(kù)數(shù)目分類(lèi)數(shù)據(jù)庫(kù)數(shù)目DNA87 RNA29蛋白質(zhì)94基因組58基因圖譜29蛋白質(zhì)結(jié)構(gòu)18文獻(xiàn)43其他153Currenttotal:511序列數(shù)據(jù)庫(kù)

核酸序列數(shù)據(jù)庫(kù)(EMBL、GenBank)常用蛋白質(zhì)序列數(shù)據(jù)庫(kù)(Swissprot,PIR)結(jié)構(gòu)數(shù)據(jù)庫(kù)

蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(kù)(PDB)蛋白質(zhì)分類(lèi)數(shù)據(jù)庫(kù)(SCOP,CATH)基因組數(shù)據(jù)庫(kù)

GDB

ACeDB二次數(shù)據(jù)庫(kù)

序列數(shù)據(jù)庫(kù)主要核酸序列數(shù)據(jù)庫(kù):EMBL、GenBank,DDBJ主要蛋白質(zhì)序列數(shù)據(jù)庫(kù):Swissprot,PIR核酸序列數(shù)據(jù)庫(kù)國(guó)際上權(quán)威的核酸序列數(shù)據(jù)庫(kù)〔1〕歐洲分子生物學(xué)實(shí)驗(yàn)室的EMBL

〔2〕美國(guó)生物技術(shù)信息中心的GenBank://〔3〕日本遺傳研究所的DDBJ:///核酸序列數(shù)據(jù)庫(kù)三個(gè)數(shù)據(jù)庫(kù)中的數(shù)據(jù)根本一致,僅在數(shù)據(jù)格式上有所差異。對(duì)于特定的查詢(xún),三個(gè)數(shù)據(jù)庫(kù)的響應(yīng)結(jié)果一樣。這三個(gè)數(shù)據(jù)庫(kù)是綜合性的DNA和RNA序列數(shù)據(jù)庫(kù),每條記錄代表一個(gè)單獨(dú)、連續(xù)、附有注釋的DNA或RNA片段。美國(guó)的核酸數(shù)據(jù)庫(kù)GenBank〖Banson,D.A.etal.(1998)NucleicAcidsRes.26,1-7〗從1979年開(kāi)始建設(shè),1982年正式運(yùn)行;歐洲分子生物學(xué)實(shí)驗(yàn)室的EMBL數(shù)據(jù)庫(kù)也于1982年開(kāi)始效勞;日本于1984年開(kāi)始建立國(guó)家級(jí)的核酸數(shù)據(jù)庫(kù)DDBJ,并于1987年正式效勞InformationOverload從那個(gè)時(shí)候以來(lái),DNA序列的數(shù)據(jù)已經(jīng)從80年代初期的百余條序列,幾十萬(wàn)堿基上升至現(xiàn)在的100x109堿基!這就是說(shuō),在短短的約23年間,數(shù)據(jù)量增長(zhǎng)了近百萬(wàn)倍。蛋白質(zhì)數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)說(shuō)明網(wǎng)址鏈接PDB蛋白質(zhì)三維結(jié)構(gòu)/pdbSWISS-PROT蛋白質(zhì)序列數(shù)據(jù)庫(kù)/sprot/PIR蛋白質(zhì)序列數(shù)據(jù)庫(kù)/OWL非冗余蛋白質(zhì)序列http://www.bioinf.man.ac.uk/dbbrowser/OWL/EMBL核酸序列數(shù)據(jù)庫(kù)http://www.embl-heidelberg.de/TrEMBLEMBL的翻譯數(shù)據(jù)庫(kù)/sprot/GenBANK核酸序列數(shù)據(jù)庫(kù)/Genbank/蛋白質(zhì)數(shù)據(jù)庫(kù)PROSITE蛋白質(zhì)功能位點(diǎn)/prosite/SWISS-MODEL從序列模建結(jié)構(gòu)http///swissmod/SWISS-MODEL.htmlSWISS-3DIMAGE三維結(jié)構(gòu)圖示/sw3d/DSSP蛋白質(zhì)二級(jí)結(jié)構(gòu)參數(shù)http://www.cmbi.kun.nl/gv/dssp/FSSP已知空間結(jié)構(gòu)的蛋白質(zhì)家族http://www.bioinfo.biocenter.helsinki.fiSCOP蛋白質(zhì)分類(lèi)數(shù)據(jù)庫(kù)http://scop.mrc-lmb.cam.ac.uk/scop//CATH蛋白質(zhì)分類(lèi)數(shù)據(jù)庫(kù)http://www.biochem.ucl.ac.uk/bsm/cath/Pfam蛋白質(zhì)家族和結(jié)構(gòu)域/蛋白質(zhì)數(shù)據(jù)庫(kù)種類(lèi)和特點(diǎn)名稱(chēng)維護(hù)單位注釋冗余度數(shù)據(jù)量更新PIRNCBI、JIPID、MIPS部分完善較大較大較慢SwissProtEBI、SIB完善小不大較慢NRL3DNCBI完善小小較慢TrEMBLEBI、SIB不完善大大快GenPeptNCBI不完善大大快NRDBEBI一般小大較快OWLHGMP一般小大較慢目的: 幫助研究者鑒別和解釋蛋白質(zhì)序列信息, 研究分子進(jìn)化、功能基因組。它是一個(gè)全面的、經(jīng)過(guò)注釋的、非冗余的蛋白質(zhì)序列數(shù)據(jù)庫(kù)。所有序列數(shù)據(jù)都經(jīng)過(guò)整理,超過(guò)99%的序列已按蛋白質(zhì)家族分類(lèi),一半以上還按蛋白質(zhì)超家族進(jìn)行了分類(lèi)。1、PIR〔ProteinInformationResource〕除了蛋白質(zhì)序列數(shù)據(jù)之外,PIR還包含以下信息:(1)蛋白質(zhì)名稱(chēng)、蛋白質(zhì)的分類(lèi)、蛋白質(zhì)的來(lái)源;(2)關(guān)于原始數(shù)據(jù)的參考文獻(xiàn);(3)蛋白質(zhì)功能和蛋白質(zhì)的一般特征,包括基因表達(dá)、翻譯后處理、活化等;(4)序列中相關(guān)的位點(diǎn)、功能區(qū)域。PIR提供三種類(lèi)型的檢索效勞:一是基于文本的交互式查詢(xún),用戶(hù)通過(guò)關(guān)鍵字進(jìn)行數(shù)據(jù)查詢(xún)。二是標(biāo)準(zhǔn)的序列相似性搜索,包括BLAST、FastA等。三是結(jié)合序列相似性、注釋信息和蛋白質(zhì)家族信息的高級(jí)搜索,包括按注釋分類(lèi)的相似性搜索、結(jié)構(gòu)域搜索等。三個(gè)子數(shù)據(jù)庫(kù)2、SWISS-PROT

SWISS-PROT(〕是目前國(guó)際上比較權(quán)威的蛋白質(zhì)序列數(shù)據(jù)庫(kù),其中的蛋白質(zhì)序列是經(jīng)過(guò)注釋的SWISS-PROT中的數(shù)據(jù)來(lái)源于不同源地:〔1〕從核酸數(shù)據(jù)庫(kù)經(jīng)過(guò)翻譯推導(dǎo)而來(lái);〔2〕從蛋白質(zhì)數(shù)據(jù)庫(kù)PIR挑選出適宜的數(shù)據(jù);〔3〕從科學(xué)文獻(xiàn)中摘錄;〔4〕研究人員直接提交的蛋白質(zhì)序列數(shù)據(jù)SWISS-PROT有三個(gè)明顯的特點(diǎn):〔1〕注釋在SWISS-PROT中,數(shù)據(jù)分為核心數(shù)據(jù)和注釋兩大類(lèi)。核心數(shù)據(jù)包括:序列數(shù)據(jù)、參考文獻(xiàn)、分類(lèi)信息〔蛋白質(zhì)生物來(lái)源的描述〕注釋包括:〔A)蛋白質(zhì)的功能描述;(B)翻譯后修飾;(C)域和功能位點(diǎn),如鈣結(jié)合區(qū)域、ATP結(jié)合位點(diǎn)等;(D)蛋白質(zhì)的二級(jí)結(jié)構(gòu);(E)蛋白質(zhì)的四級(jí)結(jié)構(gòu),如同構(gòu)二聚體、異構(gòu)三聚體等;(F)與其它蛋白質(zhì)的相似性;(G)由于缺乏該蛋白質(zhì)而引起的疾病;(H)序列的矛盾、變化等?!?〕最小冗余盡量將相關(guān)的數(shù)據(jù)歸并,降低數(shù)據(jù)庫(kù)的冗余程度。如果不同來(lái)源的原始數(shù)據(jù)有矛盾,那么在相應(yīng)序列特征表中加以注釋?!?〕與其它數(shù)據(jù)庫(kù)的連接

對(duì)于每一個(gè)登錄項(xiàng),有許多指向其它數(shù)據(jù)庫(kù)相關(guān)數(shù)據(jù)的指針,這便于用戶(hù)迅速得到相關(guān)的信息。現(xiàn)有的交叉索引有:到EMBL核酸序列數(shù)據(jù)庫(kù)的索引,到PROSITE模式數(shù)據(jù)庫(kù)的索引,到生物大分子結(jié)構(gòu)數(shù)據(jù)庫(kù)PDB的索引等。TrEMBL(://)是與SWISS-PROT相關(guān)的一個(gè)數(shù)據(jù)庫(kù)。包含從EMBL核酸數(shù)據(jù)庫(kù)中根據(jù)編碼序列(CDS)翻譯而得到的蛋白質(zhì)序列,并且這些序列尚未集成到SWISS-PROT數(shù)據(jù)庫(kù)中。TrEMBL有兩個(gè)局部:〔1〕SP-TrEMBL(SWISS-PROTTrEMBL)包含最終將要集成到SWISS-PROT的數(shù)據(jù),所有的SP-TrEMBL序列都已被賦予SWISS-PROT的登錄號(hào)?!?〕REM-TrEMBL(REMainingTrEMBL)包括所有不準(zhǔn)備放入SWISS-PROT的數(shù)據(jù),因此這局部數(shù)據(jù)都沒(méi)有登錄號(hào)。3、TrEMBL4、PROSITEPROSITE(:///)是蛋白質(zhì)家族和結(jié)構(gòu)域數(shù)據(jù)庫(kù),包含具有生物學(xué)意義的位點(diǎn)、模式、可幫助識(shí)別蛋白質(zhì)家族的統(tǒng)計(jì)特征。PROSITE中涉及的序列模式包括酶的催化位點(diǎn)、配體結(jié)合位點(diǎn)、與金屬離子結(jié)合的殘基、二硫鍵的半胱氨酸、與小分子或其它蛋白質(zhì)結(jié)合的區(qū)域等。PROSITE還包括根據(jù)多序列比對(duì)而構(gòu)建的序列統(tǒng)計(jì)特征,能更敏感地發(fā)現(xiàn)一個(gè)序列是否具有相應(yīng)的特征。包括:

Swiss-ProtTrEMBLPIR

用戶(hù)可以通過(guò)文本查詢(xún)數(shù)據(jù)庫(kù),可以利用BLAST程序搜索數(shù)據(jù)庫(kù),也可以直接通過(guò)FTP下載數(shù)據(jù)。5、蛋白質(zhì)數(shù)據(jù)倉(cāng)庫(kù)UniProtUniProt包含3個(gè)局部:〔1〕UniProtKnowledgebase〔UniProt〕蛋白質(zhì)序列、功能、分類(lèi)、交叉引用等信息存取中心〔2〕UniProtNon-redundantReference〔UniRef〕數(shù)據(jù)庫(kù)將密切相關(guān)的蛋白質(zhì)序列組合到一條記錄中以便提高搜索速度;〔3〕UniProtArchive〔UniParc〕資源庫(kù),記錄所有蛋白質(zhì)序列的歷史。結(jié)構(gòu)數(shù)據(jù)庫(kù)蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(kù)PDB

蛋白質(zhì)分類(lèi)數(shù)據(jù)庫(kù)SCOP和CATHPDB〔ProteinDataBank〕PDB中含有通過(guò)實(shí)驗(yàn)〔X射線晶體衍射,核磁共振NMR〕測(cè)定的生物大分子的三維結(jié)構(gòu)蛋白質(zhì)核酸糖類(lèi)其它復(fù)合物://PDBContentGrowth

蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(kù)PDB中不同種類(lèi)數(shù)據(jù)統(tǒng)計(jì)引自://網(wǎng)頁(yè)RCSB(美國(guó))結(jié)構(gòu)生物信息學(xué)合作研究組織(ResearchCollaborationforStructuralBioinformatics)://PDBHoldingsList:27-Sep-2005顯示分子結(jié)構(gòu)〔RasMol,ChemView〕MMDB(MolecularModelingDatabase)分子模型MMDB是〔NCBI〕所開(kāi)發(fā)的生物信息數(shù)據(jù)庫(kù)集成系統(tǒng)Entrez的一個(gè)局部,數(shù)據(jù)庫(kù)的內(nèi)容包括來(lái)自于實(shí)驗(yàn)的生物大分子結(jié)構(gòu)數(shù)據(jù)。與PDB相比,對(duì)于數(shù)據(jù)庫(kù)中的每一個(gè)生物大分子結(jié)構(gòu),MMDB具有許多附加的信息,如分子的生物學(xué)功能、產(chǎn)生功能的機(jī)制、分子的進(jìn)化歷史等。還提供生物大分子三維結(jié)構(gòu)模型顯示、結(jié)構(gòu)分析和結(jié)構(gòu)比較工具。MMDB實(shí)用工具蛋白質(zhì)結(jié)構(gòu)分類(lèi)數(shù)據(jù)庫(kù)SCOP(StructuralClassificationofProteins)CATH(Class,Architecture,Topology,Homology)分類(lèi)層次SCOP

CATHROOT(根)

CLASS(類(lèi))CLASS(類(lèi))

ARCCHITECTURE(構(gòu)架)FOLD(折疊)

TOPOLOGY(拓?fù)浣Y(jié)構(gòu))SUPERFAMILY(超家族)

HOMOLOGY(同源性)FAMILY(家族)PROTEIN(蛋白)SPECIES(種)蛋白質(zhì)結(jié)構(gòu)分類(lèi)數(shù)據(jù)庫(kù)SCOPSCOP數(shù)據(jù)庫(kù)(〕的目標(biāo)是提供關(guān)于結(jié)構(gòu)的蛋白質(zhì)之間結(jié)構(gòu)和進(jìn)化關(guān)系的詳細(xì)描述,包括蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(kù)PDB中的所有條目。SCOP數(shù)據(jù)庫(kù)除了提供蛋白質(zhì)結(jié)構(gòu)和進(jìn)化關(guān)系信息外,對(duì)于每一個(gè)蛋白質(zhì)還包括下述信息:到PDB的連接,序列,參考文獻(xiàn),結(jié)構(gòu)的圖像等??梢园唇Y(jié)構(gòu)和進(jìn)化關(guān)系對(duì)蛋白質(zhì)分類(lèi),分類(lèi)結(jié)果是一個(gè)具有層次結(jié)構(gòu)的樹(shù),其主要的層次是家族、超家族和折疊:(1)家族:具有明顯的進(jìn)化關(guān)系(2)超家族:具有遠(yuǎn)源進(jìn)化關(guān)系,具有共同的進(jìn)化源(3)折疊類(lèi):主要結(jié)構(gòu)相似//://://基因組數(shù)據(jù)庫(kù)〔GDB〕人類(lèi)基因組方案所得到的圖譜數(shù)據(jù)目前GDB包含對(duì)下述三種對(duì)象的描述:〔1〕人類(lèi)基因組區(qū)域包括基因、克隆、PCR標(biāo)記物、斷點(diǎn)、細(xì)胞遺傳學(xué)標(biāo)記、易碎位點(diǎn)、EST、綜合區(qū)域、contigs、重復(fù)等;〔2〕人類(lèi)基因組圖譜,包含細(xì)胞遺傳學(xué)圖譜、連接圖譜、輻射混合圖譜、contig圖譜、集成圖譜,所有這些圖譜都可以被直觀地顯示出來(lái);〔3〕人類(lèi)基因組中的變化,

包括基因突變和基因多態(tài)性,加上等位基因頻率數(shù)據(jù)。與染色體相關(guān)的信息基因組數(shù)據(jù)庫(kù)GDB

人類(lèi)基因組數(shù)據(jù)庫(kù)AceDB

線蟲(chóng)(Caenorhabditiselegans)基因組數(shù)據(jù)庫(kù):///其它模式生物基因組數(shù)據(jù)庫(kù)如:鼠基因組數(shù)據(jù)庫(kù)MGD〔〕酵母基因組數(shù)據(jù)庫(kù)SGD〔://genome-/〕Ensembl(〕3、人類(lèi)基因組數(shù)據(jù)庫(kù)EnsemblEnsembl包括所有公開(kāi)的人類(lèi)基因組DNA序列,通過(guò)注釋形成的關(guān)于序列的特征?,F(xiàn)在包括其他基因組,如大鼠、小鼠、線蟲(chóng)、果蠅等。例如:基因通過(guò)實(shí)驗(yàn)發(fā)現(xiàn)的或者是通過(guò)GenScan程序預(yù)測(cè)的其他的特征: 單核苷酸多態(tài)性〔SNP〕、重復(fù)序列等Ensembl數(shù)據(jù)庫(kù)結(jié)構(gòu)圖Ensembl提供多種查詢(xún)方式

通過(guò)關(guān)鍵字查詢(xún)用BLAST進(jìn)行相似序列的搜索

另一種更直觀的方式是顯示各染色體 用戶(hù)可以在染色體水平上選擇感興趣的位點(diǎn), 逐層放大 瀏覽整個(gè)基因組人的第9號(hào)染色體及大鼠對(duì)應(yīng)的染色體片段其它生物分子數(shù)據(jù)庫(kù)核酸序列變化單堿基多態(tài)性SNPs〔Singlenucleotidepolymorphisms〕SNPs對(duì)人類(lèi)遺傳學(xué)研究和醫(yī)學(xué)應(yīng)用具有重要的意義無(wú)論對(duì)于人類(lèi)種群遺傳學(xué)的研究,還是對(duì)疾病性狀分析或個(gè)體化醫(yī)療,都需要深入地研究SNPs。單堿基多態(tài)性數(shù)據(jù)庫(kù)dbSNP〔:///SNP/),表達(dá)序列標(biāo)記數(shù)據(jù)庫(kù)dbESTEST〔ExpressedSequenceTags〕方法已被證明是識(shí)別轉(zhuǎn)錄序列的最有效方法,EST序列大約覆蓋了人類(lèi)基因的90%。DbEST(〕是GenBank的一個(gè)局部,該數(shù)據(jù)庫(kù)包括不同生物的EST序列數(shù)據(jù)及其它相關(guān)信息,主要是從大量不同組織和器官得到的短mRNA片段。WEB頁(yè)面或emailFTP有關(guān)EST的數(shù)據(jù)dbEST數(shù)據(jù)庫(kù)序列標(biāo)記位點(diǎn)數(shù)據(jù)庫(kù)dbSTSSTS〔SequenceTaggedSites〕是序列標(biāo)記位點(diǎn)dbSTS〔〕是NCBI的一個(gè)數(shù)據(jù)源,包含基因組短標(biāo)記序列〔STS〕的組成和定位信息??梢酝ㄟ^(guò)BLAST搜索STS序列。面向基因聚類(lèi)數(shù)據(jù)庫(kù)UniGeneUniGene(:///)數(shù)據(jù)庫(kù)將GenBank中的序列進(jìn)行自動(dòng)分類(lèi),形成面向基因群的非冗余集合。每個(gè)UniGene群包含:代表一個(gè)唯一基因的多個(gè)序列,附有該基因相關(guān)的信息,如基因表達(dá)的組織類(lèi)型、定位圖譜除了基因的序列之外,還包括大量的EST序列。目前,UniGene中包括人類(lèi)、大鼠、小鼠、牛的相關(guān)數(shù)據(jù),因?yàn)檫@些生物有大量的EST數(shù)據(jù)。蛋白質(zhì)二級(jí)結(jié)構(gòu)數(shù)據(jù)庫(kù)DSSPDSSP〔/〕是一個(gè)二級(jí)結(jié)構(gòu)推導(dǎo)數(shù)據(jù)庫(kù)。對(duì)生物大分子數(shù)據(jù)庫(kù)PDB中的任何一個(gè)蛋白質(zhì),根據(jù)其三維結(jié)構(gòu)推導(dǎo)出對(duì)應(yīng)的二級(jí)結(jié)構(gòu)。對(duì)研究蛋白質(zhì)序列與蛋白質(zhì)二級(jí)結(jié)構(gòu)及空間結(jié)構(gòu)的關(guān)系非常有用除了二級(jí)結(jié)構(gòu)以外,DSSP還包括蛋白質(zhì)的幾何特征及溶劑可及外表。蛋白質(zhì)同源序列比對(duì)數(shù)據(jù)庫(kù)HSSPHSSP(/〕二級(jí)數(shù)據(jù)庫(kù)。數(shù)據(jù)來(lái)源于PDB,或來(lái)源于SWISS-PROT對(duì)于PDB中的每一個(gè)蛋白質(zhì),HSSP將與其同源的所有蛋白質(zhì)序列比照排列起來(lái),從而將相似序列的蛋白質(zhì)聚集成結(jié)構(gòu)同源的家族。HSSP有助于分析蛋白質(zhì)的保守區(qū)域,研究蛋白質(zhì)的進(jìn)化關(guān)系,有助于蛋白質(zhì)的分子設(shè)計(jì)。FromPDBFromSwiss-prot多重序列比對(duì)結(jié)構(gòu)→未知結(jié)構(gòu)OMIMOMIM(OnlineMendelianInheritanceinMan),是關(guān)于人類(lèi)基因和遺傳疾病的分類(lèi)數(shù)據(jù)庫(kù)。該數(shù)據(jù)庫(kù)收集了的人類(lèi)基因及由于這些基因突變或者缺失而導(dǎo)致的遺傳疾病。OMIM的使用非常方便查詢(xún)程序根據(jù)輸入到檢索窗口的一個(gè)或幾個(gè)詞執(zhí)行簡(jiǎn)單的查詢(xún),返回含有該詞的文檔的列表,用戶(hù)可以在列表中選擇一個(gè)或更多的異常查看其OMIM記錄的全文://:80/entrez/query.fcgi?db=OMIMEPDEPD(/)是真核基因啟動(dòng)子數(shù)據(jù)庫(kù) 提供從EMBL中得到的真核基因的啟動(dòng)子序列,目標(biāo)是幫助實(shí)驗(yàn)研究人員、生物信息學(xué)研究人員分析真核基因的轉(zhuǎn)錄信號(hào)。TRRDTRRD是一個(gè)關(guān)于基因調(diào)控信息的集成數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)搜集真核生物基因轉(zhuǎn)錄調(diào)控區(qū)域結(jié)構(gòu)和功能的信息。每一個(gè)TRRD的條目對(duì)應(yīng)于一個(gè)基因,包含特定基因各種結(jié)構(gòu)-功能特性TRRD6.0包括七個(gè)相關(guān)的數(shù)據(jù)表:〔1〕基因描述表TRRDGENES〔2〕控制區(qū)域表TRRDLCR〔3〕調(diào)控區(qū)域表T

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論