生物信息數(shù)據(jù)庫(kù)類型_第1頁(yè)
生物信息數(shù)據(jù)庫(kù)類型_第2頁(yè)
生物信息數(shù)據(jù)庫(kù)類型_第3頁(yè)
生物信息數(shù)據(jù)庫(kù)類型_第4頁(yè)
生物信息數(shù)據(jù)庫(kù)類型_第5頁(yè)
已閱讀5頁(yè),還剩64頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第二章生物信息數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)的類型11:412第一節(jié)引言生物分子數(shù)據(jù)高速增長(zhǎng)分子生物學(xué)及相關(guān)領(lǐng)域研究人員迅速獲得最新實(shí)驗(yàn)數(shù)據(jù)

建立生物分子數(shù)據(jù)庫(kù)

序列數(shù)據(jù)庫(kù)結(jié)構(gòu)數(shù)據(jù)庫(kù)基因組數(shù)據(jù)庫(kù)一次數(shù)據(jù)庫(kù)DNA序列蛋白質(zhì)序列蛋白質(zhì)結(jié)構(gòu)人類基因組以及其它生物基因組生物信息學(xué)數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)管理系統(tǒng)Oracle/sybase大型計(jì)算機(jī)服務(wù)器大容量磁盤空間序列數(shù)據(jù)庫(kù)結(jié)構(gòu)數(shù)據(jù)庫(kù)基因組數(shù)據(jù)庫(kù)二次數(shù)據(jù)庫(kù)文獻(xiàn)數(shù)據(jù)庫(kù)專家生物信息學(xué)數(shù)據(jù)庫(kù)11:415生物分子數(shù)據(jù)庫(kù)應(yīng)滿足5個(gè)方面的主要需求(1)時(shí)間性(2)注釋(3)支撐數(shù)據(jù)(4)數(shù)據(jù)質(zhì)量(5)集成性11:416生物分子數(shù)據(jù)庫(kù)幾個(gè)明顯的特征(1)數(shù)據(jù)庫(kù)的更新速度不斷加快數(shù)據(jù)量呈指數(shù)增長(zhǎng)趨勢(shì)(2)數(shù)據(jù)庫(kù)使用頻率增長(zhǎng)更快(3)數(shù)據(jù)庫(kù)的復(fù)雜程度不斷增加(4)數(shù)據(jù)庫(kù)網(wǎng)絡(luò)化(5)面向應(yīng)用(6)先進(jìn)的軟硬件配置11:417生物分子數(shù)據(jù)庫(kù)

一級(jí)數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)中的數(shù)據(jù)直接來源于實(shí)驗(yàn)獲得的原始數(shù)據(jù),只經(jīng)過簡(jiǎn)單的歸類整理和注釋

二級(jí)數(shù)據(jù)庫(kù)對(duì)原始生物分子數(shù)據(jù)進(jìn)行整理、分類的結(jié)果,是在一級(jí)數(shù)據(jù)庫(kù)、實(shí)驗(yàn)數(shù)據(jù)和理論分析的基礎(chǔ)上針對(duì)特定的應(yīng)用目標(biāo)而建立的。11:418第二節(jié)核酸序列數(shù)據(jù)庫(kù)國(guó)際上權(quán)威的核酸序列數(shù)據(jù)庫(kù)(1)歐洲分子生物學(xué)實(shí)驗(yàn)室的EMBL

http://www.embl-heidelberg.de

(2)美國(guó)生物技術(shù)信息中心的GenBank/Web/Genbank/index.html

(3)日本遺傳研究所的DDBJ

http://www.ddbj.nig.ac.jp/1、核酸序列數(shù)據(jù)庫(kù)1988,由此三家組成了國(guó)際核酸序列數(shù)據(jù)庫(kù)協(xié)作組織(INSDC),規(guī)定:數(shù)據(jù)交換與共享(每24小時(shí)進(jìn)行一次),使用統(tǒng)一的數(shù)據(jù)記錄格式處理提交數(shù)據(jù),以保證各數(shù)據(jù)庫(kù)相應(yīng)記錄在內(nèi)容上的一致性,數(shù)據(jù)的維護(hù)與更新。三個(gè)數(shù)據(jù)庫(kù)中的數(shù)據(jù)基本一致,僅在數(shù)據(jù)格式上有所差別,對(duì)于特定的查詢,三個(gè)數(shù)據(jù)庫(kù)的響應(yīng)結(jié)果一樣。這三個(gè)數(shù)據(jù)庫(kù)是綜合性的DNA和RNA序列數(shù)據(jù)庫(kù),每條記錄代表一個(gè)單獨(dú)、連續(xù)、附有注釋的DNA或RNA片段。GenBank:/Genbank/EMBL

http://www.embl-heidelberg.deDDBJ

http://www.ddbj.nig.ac.jp/

22November2010

Totalnucleotides:301,588,430,60822November2010Numberofentries:199,575,97111:411611:4117“ID”為序列的標(biāo)識(shí)符行,包括登錄號(hào)、類型,分子的長(zhǎng)度

“AC”為登錄號(hào)行;“XX”為分隔符號(hào)行;

“DT”為創(chuàng)建和更新日期行“DE”為序列描述行;“KW”為關(guān)鍵字行;“OG”行描述細(xì)胞組織;“OS”行描述生物體種屬;“OC”行描述生物體分類信息;“RN”描述參考文獻(xiàn)的編號(hào);“RP”描述參考文獻(xiàn)的頁(yè)碼;“RA”描述參考文獻(xiàn)的作者;“RT”描述參考文獻(xiàn)的題目;“RL”描述參考文獻(xiàn)的出處;“RC”描述參考文獻(xiàn)的注解;“RX”、“DR”行描述交叉引用信息;“FH”為特征開始符號(hào);“FT”為特征表行(1)FeatureKey,它是描述域生物功能的關(guān)鍵字;(2)Location,指明特征在序列中的特定位置;(3)Qualifiers,描述關(guān)于一個(gè)特征的輔助信息;文件體由序列本身所組成,由“SQ”標(biāo)志的行開始。序列結(jié)束的標(biāo)記是“//”。EMBL核酸數(shù)據(jù)庫(kù)中的每一個(gè)序列數(shù)據(jù)被賦予一個(gè)登錄號(hào),它是一個(gè)永久性的唯一標(biāo)識(shí)

EMBL的序列數(shù)據(jù)用外在的ASCII文本文件來表示,而每一個(gè)文件分為文件頭和文件體兩大部分文件頭由一系列的信息描述行所組成,文件頭實(shí)際上對(duì)應(yīng)于一個(gè)序列的注釋(annotation)11:4118使用EMBL(1)CD-ROM形式(2)ftp服務(wù)器(3)Gopher服務(wù)器(4)WWW服務(wù)器這是目前最常用的一種形式

11:4119EMBL提供一些與序列相關(guān)的檢索操作(基于3W服務(wù)器)(1)序列查詢最簡(jiǎn)單的查詢就是通過序列的登錄號(hào)(如X58929)或序列名稱(如SCARGC)直接查詢。(2)核酸同源性搜索3W服務(wù)器支持用戶使用FastA程序進(jìn)行核酸同源搜索。FastA根據(jù)給定的目標(biāo)序列在數(shù)據(jù)庫(kù)中搜索其同源序列。11:4120基因組數(shù)據(jù)庫(kù)(GDB)人類基因組數(shù)據(jù)庫(kù)Ensembl表達(dá)序列標(biāo)記數(shù)據(jù)庫(kù)dbEST面向基因聚類數(shù)據(jù)庫(kù)UniGene11:41212、基因組數(shù)據(jù)庫(kù)(GDB)

人類基因組計(jì)劃所得到的圖譜數(shù)據(jù)

目前GDB包含對(duì)下述三種對(duì)象的描述:(1)人類基因組區(qū)域

包括基因、克隆、PCR標(biāo)記物、斷點(diǎn)、細(xì)胞遺傳學(xué)標(biāo)記、易碎位點(diǎn)、EST、綜合區(qū)域、contigs、重復(fù)等;

(2)人類基因組圖譜,

包含細(xì)胞遺傳學(xué)圖譜、連接圖譜、輻射混合圖譜、contig圖譜、集成圖譜,所有這些圖譜都可以被直觀地顯示出來;(3)人類基因組中的變化,

包括基因突變和基因多態(tài)性,加上等位基因頻率數(shù)據(jù)。11:4122與染色體相關(guān)的信息11:4123其它模式生物基因組數(shù)據(jù)庫(kù)如:鼠基因組數(shù)據(jù)庫(kù)MGD(/)酵母基因組數(shù)據(jù)庫(kù)SGD(/Saccharomyces/)11:4124Ensembl(/)3、人類基因組數(shù)據(jù)庫(kù)EnsemblEnsembl包括所有公開的人類基因組DNA序列,通過注釋形成的關(guān)于序列的特征?,F(xiàn)在包括其他基因組,如大鼠、小鼠、線蟲、果蠅等。例如:基因通過實(shí)驗(yàn)發(fā)現(xiàn)的或者是通過GenScan程序預(yù)測(cè)的其他的特征: 單核苷酸多態(tài)性(SNP)、重復(fù)序列等11:4125Ensembl數(shù)據(jù)庫(kù)結(jié)構(gòu)圖11:4126Ensembl提供多種查詢方式

通過關(guān)鍵字查詢用BLAST進(jìn)行相似序列的搜索

另一種更直觀的方式是顯示各染色體 用戶可以在染色體水平上選擇感興趣的位點(diǎn), 逐層放大 瀏覽整個(gè)基因組11:412711:4128人的第9號(hào)染色體及大鼠對(duì)應(yīng)的染色體片段11:41294、表達(dá)序列標(biāo)記數(shù)據(jù)庫(kù)dbESTEST(ExpressedSequenceTags)方法已被證明是識(shí)別轉(zhuǎn)錄序列的最有效方法,EST序列大約覆蓋了人類基因的90%。

DbEST(/dbEST/)是GenBank的一個(gè)部分,該數(shù)據(jù)庫(kù)包括不同生物的EST序列數(shù)據(jù)及其它相關(guān)信息,主要是從大量不同組織和器官得到的短mRNA片段。

WEB頁(yè)面或emailFTP有關(guān)EST的數(shù)據(jù)dbEST數(shù)據(jù)庫(kù)11:41305、面向基因聚類數(shù)據(jù)庫(kù)UniGeneUniGene(/UniGene/)數(shù)據(jù)庫(kù)將GenBank中的序列進(jìn)行自動(dòng)分類,形成面向基因群的非冗余集合。每個(gè)UniGene群包含:代表一個(gè)唯一基因的多個(gè)序列,附有該基因相關(guān)的信息,如基因表達(dá)的組織類型、定位圖譜除了基因的序列之外,還包括大量的EST序列。目前,UniGene中包括人類、大鼠、小鼠、牛的相關(guān)數(shù)據(jù),因?yàn)檫@些生物有大量的EST數(shù)據(jù)。11:4131第三節(jié)蛋白質(zhì)序列數(shù)據(jù)庫(kù)目的: 幫助研究者鑒別和解釋蛋白質(zhì)序列信息, 研究分子進(jìn)化、功能基因組。它是一個(gè)全面的、經(jīng)過注釋的、非冗余的蛋白質(zhì)序列數(shù)據(jù)庫(kù)。所有序列數(shù)據(jù)都經(jīng)過整理,超過99%的序列已按蛋白質(zhì)家族分類,一半以上還按蛋白質(zhì)超家族進(jìn)行了分類。1、PIR(ProteinInformationResource)11:4132除了蛋白質(zhì)序列數(shù)據(jù)之外,PIR還包含以下信息:

(1)蛋白質(zhì)名稱、蛋白質(zhì)的分類、蛋白質(zhì)的來源;

(2)關(guān)于原始數(shù)據(jù)的參考文獻(xiàn);

(3)蛋白質(zhì)功能和蛋白質(zhì)的一般特征,包括基因表達(dá)、翻譯后處理、活化等;

(4)序列中相關(guān)的位點(diǎn)、功能區(qū)域。11:4133PIR提供三種類型的檢索服務(wù):一是基于文本的交互式查詢,用戶通過關(guān)鍵字進(jìn)行數(shù)據(jù)查詢。二是標(biāo)準(zhǔn)的序列相似性搜索,包括BLAST、FastA等。三是結(jié)合序列相似性、注釋信息和蛋白質(zhì)家族信息的高級(jí)搜索,包括按注釋分類的相似性搜索、結(jié)構(gòu)域搜索等。11:4134三個(gè)子數(shù)據(jù)庫(kù)11:41352、SWISS-PROT

SWISS-PROT(http://www.expasy.ch/sprot/sprot-top.html)是目前國(guó)際上比較權(quán)威的蛋白質(zhì)序列數(shù)據(jù)庫(kù),其中的蛋白質(zhì)序列是經(jīng)過注釋的SWISS-PROT中的數(shù)據(jù)來源于不同源地:(1)從核酸數(shù)據(jù)庫(kù)經(jīng)過翻譯推導(dǎo)而來;(2)從蛋白質(zhì)數(shù)據(jù)庫(kù)PIR挑選出合適的數(shù)據(jù);(3)從科學(xué)文獻(xiàn)中摘錄;(4)研究人員直接提交的蛋白質(zhì)序列數(shù)據(jù)

11:4136

(1)注釋在SWISS-PROT中,數(shù)據(jù)分為核心數(shù)據(jù)和注釋兩大類。核心數(shù)據(jù)包括:序列數(shù)據(jù)、參考文獻(xiàn)、分類信息(蛋白質(zhì)生物來源的描述)注釋包括:

(A)蛋白質(zhì)的功能描述;

(B)翻譯后修飾;

(C)域和功能位點(diǎn);

(D)蛋白質(zhì)的二級(jí)結(jié)構(gòu);

(E)蛋白質(zhì)的四級(jí)結(jié)構(gòu);

(F)與其它蛋白質(zhì)的相似性;

(G)由于缺乏該蛋白質(zhì)而引起的疾?。?/p>

(H)序列的矛盾、變化等。SWISS-PROT有三個(gè)明顯的特點(diǎn):(2)最小冗余(3)與其它數(shù)據(jù)庫(kù)的連接11:413711:413811:4139

提交序列數(shù)據(jù)(a)編輯電子表格(b)利用Authorin程序(c)WWW服務(wù)器使用SWISS-PROT(a)CD-ROM形式(b)ftp服務(wù)器(c)Gopher服務(wù)器(d)WWW服務(wù)器(SRS)與序列相關(guān)的操作(a)序列查詢(b)搜索同源蛋白質(zhì)序列 11:4140TrEMBL(http://www.ebi.ac.uk/trembl/index.html)包含從EMBL核酸數(shù)據(jù)庫(kù)中根據(jù)編碼序列(CDS)翻譯而得到的蛋白質(zhì)序列,并且這些序列尚未集成到SWISS-PROT數(shù)據(jù)庫(kù)中。TrEMBL有兩個(gè)部分:(1)SP-TrEMBL(SWISS-PROTTrEMBL)(2)REM-TrEMBL(REMainingTrEMBL)3、TrEMBL11:4141第四節(jié)生物大分子結(jié)構(gòu)數(shù)據(jù)庫(kù)1、PDB(ProteinDataBank)蛋白質(zhì)核酸糖類其它復(fù)合物

一種是顯式序列信息(explicitsequence)一種是隱式序列信息(implicitsequence)11:4142CurrentHoldingDataSubmitDataKeywordSearchIntroductiontoselectedmolecularData11:4143DownloadDataPDBFileFormatRelatedSoftware11:4144HEADERHYDROLASE19-FEB-971ADZTITLETHESOLUTIONSTRUCTUREOFTHESECONDKUNITZDOMAINOFTITLE2TISSUEFACTORPATHWAYINHIBITOR,NMR,30STRUCTURESCOMPNDMOL_ID:1;COMPND2MOLECULE:TISSUEFACTORPATHWAYINHIBITOR;。。。。。。COMPND8BIOLOGICAL_UNIT:MONOMERSOURCEMOL_ID:1;。。。。。。SOURCE7EXPRESSION_SYSTEM_PLASMID:PFLAGKEYWDSHYDROLASE,INHIBITOR,COAGULATIONEXPDTANMR,30STRUCTURESAUTHORM.J.M.BURGERING,L.P.M.ORBONSREVDAT125-FEB-981ADZ0JRNLAUTHM.J.BURGERING,L.P.ORBONS,A.VANDERDOELEN,。。。。。。REMARK1REFERENCE1REMARK1AUTHM.T.STUBBSIIREMARK1TITLSTRUCTURALASPECTSOFFACTORXAINHIBITION。。。。。。REMARK999SEQUENCEREMARK9991ADZSWSP106461-111NOTINATOMSLISTREMARK9991ADZSWSP10646183-304NOTINATOMSLISTREMARK999THEFIRSTNINERESIDUESARENOTPARTOFTHETFPIDOMAINIIREMARK999SEQUENCEBUTAREFROMTHEPFLAGPEPTIDECLONINGVECTOR.DBREF1ADZ171SWSP10646TFPI_HUMAN112182SEQADV1ADZASP1SWSP10646ILE112ENGINEEREDSEQADV1ADZTYR2SWSP10646ILE113ENGINEEREDSEQRES171ASPTYRLYSASPASPASPASPLYSLEULYSPROASPPHESEQRES271CYSPHELEUGLUGLUASPPROGLYILECYSARGGLYTYRSEQRES371ILETHRARGTYRPHETYRASNASNGLNTHRLYSGLNCYSSEQRES471GLUARGPHELYSTYRGLYGLYCYSLEUGLYASNMETASNSEQRES571ASNPHEGLUTHRLEUGLUGLUCYSLYSASNILECYSGLUSEQRES671ASPGLYPROASNGLYPHEHELIX11ASP12PHE1554HELIX22ASN34THR3653HELIX33LEU57ILE6317SHEET1A2ARG29ASN330SHEET2A2GLN38PHE42-1NPHE42OARG29CRYST11.0001.0001.00090.0090.0090.00P11ORIGX11.0000000.0000000.0000000.00000ORIGX20.0000001.0000000.0000000.00000ORIGX30.0000000.0000001.0000000.00000SCALE11.0000000.0000000.0000000.00000SCALE20.0000001.0000000.0000000.00000SCALE30.0000000.0000001.0000000.00000

圖4.5PDB文件PDB文件示意11:4145顯示分子結(jié)構(gòu)(RasMol,ChemView)11:41462、MMDB(MolecularModelingDatabase)分子模型MMDB是(NCBI)所開發(fā)的生物信息數(shù)據(jù)庫(kù)集成系統(tǒng)Entrez的一個(gè)部分,數(shù)據(jù)庫(kù)的內(nèi)容包括來自于實(shí)驗(yàn)的生物大分子結(jié)構(gòu)數(shù)據(jù)。與PDB相比,對(duì)于數(shù)據(jù)庫(kù)中的每一個(gè)生物大分子結(jié)構(gòu),MMDB具有許多附加的信息,如分子的生物學(xué)功能、產(chǎn)生功能的機(jī)制、分子的進(jìn)化歷史等。還提供生物大分子三維結(jié)構(gòu)模型顯示、結(jié)構(gòu)分析和結(jié)構(gòu)比較工具。11:4147MMDB實(shí)用工具11:4148第五節(jié)其它生物分子數(shù)據(jù)庫(kù)單堿基多態(tài)性數(shù)據(jù)庫(kù)dbSNP蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫(kù)SCOP蛋白質(zhì)二級(jí)結(jié)構(gòu)數(shù)據(jù)庫(kù)DSSP蛋白質(zhì)同源序列比對(duì)數(shù)據(jù)庫(kù)HSSP人類基因和遺傳疾病的分類數(shù)據(jù)庫(kù)OMIM11:4149真核基因啟動(dòng)子數(shù)據(jù)庫(kù)EPD基因調(diào)控信息的集成數(shù)據(jù)庫(kù)TRRD真核基因順式調(diào)控元件和反式作用因子數(shù)據(jù)庫(kù)TRANSFAC人和老鼠基因表達(dá)信息數(shù)據(jù)庫(kù)BODYMAP蛋白質(zhì)家族和結(jié)構(gòu)域數(shù)據(jù)庫(kù)PROSITE京都基因和基因組百科全書生物信息數(shù)據(jù)庫(kù)的目錄數(shù)據(jù)庫(kù)DBCat生物學(xué)、醫(yī)學(xué)文獻(xiàn)引用數(shù)據(jù)庫(kù)PubMed11:4150核酸序列變化單堿基多態(tài)性SNPs(Singlenucleotidepolymorphisms)SNPs對(duì)人類遺傳學(xué)研究和醫(yī)學(xué)應(yīng)用具有重要的意義無(wú)論對(duì)于人類種群遺傳學(xué)的研究,還是對(duì)疾病性狀分析或個(gè)體化醫(yī)療,都需要深入地研究SNPs。1、單堿基多態(tài)性數(shù)據(jù)庫(kù)dbSNP(/SNP/),11:4151單倍型數(shù)據(jù)11:41522、蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫(kù)SCOPSCOP數(shù)據(jù)庫(kù)(http://scop.mrc-lmb.cam.ac.uk/scop/)的目標(biāo)是提供關(guān)于已知結(jié)構(gòu)的蛋白質(zhì)之間結(jié)構(gòu)和進(jìn)化關(guān)系的詳細(xì)描述,包括蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(kù)PDB中的所有條目。SCOP數(shù)據(jù)庫(kù)除了提供蛋白質(zhì)結(jié)構(gòu)和進(jìn)化關(guān)系信息外,對(duì)于每一個(gè)蛋白質(zhì)還包括下述信息:到PDB的連接,序列,參考文獻(xiàn),結(jié)構(gòu)的圖像等??梢园唇Y(jié)構(gòu)和進(jìn)化關(guān)系對(duì)蛋白質(zhì)分類,分類結(jié)果是一個(gè)具有層次結(jié)構(gòu)的樹,其主要的層次是家族、超家族和折疊:(1)家族:具有明顯的進(jìn)化關(guān)系

(2)超家族:具有遠(yuǎn)源進(jìn)化關(guān)系,具有共同的進(jìn)化源

(3)折疊類:主要結(jié)構(gòu)相似11:415311:41543、蛋白質(zhì)二級(jí)結(jié)構(gòu)數(shù)據(jù)庫(kù)DSSPDSSP(http://www.sander.embl-heidelberg.de/dssp/)是一個(gè)二級(jí)結(jié)構(gòu)推導(dǎo)數(shù)據(jù)庫(kù)。對(duì)生物大分子數(shù)據(jù)庫(kù)PDB中的任何一個(gè)蛋白質(zhì),根據(jù)其三維結(jié)構(gòu)推導(dǎo)出對(duì)應(yīng)的二級(jí)結(jié)構(gòu)。研究蛋白質(zhì)序列與蛋白質(zhì)二級(jí)結(jié)構(gòu)及空間結(jié)構(gòu)的關(guān)系除了二級(jí)結(jié)構(gòu)以外,DSSP還包括蛋白質(zhì)的幾何特征及溶劑可及表面。11:4155TheDSSPcodeH=alphahelixB=residueinisolatedbeta-bridgeE=extendedstrand,participatesinbetaladderG=3-helix(3/10helix)I=5helix(pihelix)T=hydrogenbondedturnS=bend例:11:41564、蛋白質(zhì)同源序列比對(duì)數(shù)據(jù)庫(kù)HSSPHSSP(http://www.sander.embl-heidelberg.de/hssp/)二級(jí)數(shù)據(jù)庫(kù)。數(shù)據(jù)來源于PDB,或來源于SWISS-PROT對(duì)于PDB中的每一個(gè)蛋白質(zhì),HSSP將與其同源的所有蛋白質(zhì)序列對(duì)比排列起來,從而將相似序列的蛋白質(zhì)聚集成結(jié)構(gòu)同源的家族。HSSP有助于分析蛋白質(zhì)的保守區(qū)域,研究蛋白質(zhì)的進(jìn)化關(guān)系,有助于蛋白質(zhì)的分子設(shè)計(jì)。11:4157FromPDBFromSwiss-prot多重序列比對(duì)已知結(jié)構(gòu)→未知結(jié)構(gòu)11:41585、OMIMOMIM(OnlineMendelianInheritanceinMan),是關(guān)于人類基因和遺傳疾病的分類數(shù)據(jù)庫(kù)。該數(shù)據(jù)庫(kù)收集了已知的人類基因及由于這些基因突變或者缺失而導(dǎo)致的遺傳疾病。OMIM的使用非常方便查詢程序根據(jù)輸入到檢索窗口的一個(gè)或幾個(gè)詞執(zhí)行簡(jiǎn)單的查詢,返回含有該詞的文檔的列表,用戶可以在列表中選擇一個(gè)或更多的異常查看其OMIM記錄的全文:80/entrez/query.fcgi?db=OMIM

11:4159瀏覽染色體11:41606、EPDEPD(http://www.epd.isb-sib.ch/)是真核基因啟動(dòng)子數(shù)據(jù)庫(kù) 提供從EMBL中得到的真核基因的啟動(dòng)子序列,目標(biāo)是幫助實(shí)驗(yàn)研究人員、生物信息學(xué)研究人員分析真核基因的轉(zhuǎn)錄信號(hào)。11:41617、TRRDTRRD是一個(gè)關(guān)于基因調(diào)控信息的集成數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)搜集真核生物基因轉(zhuǎn)錄調(diào)控區(qū)域結(jié)構(gòu)和功能的信息。每一個(gè)TRRD的條目對(duì)應(yīng)于一個(gè)基因,包含特定基因各種結(jié)構(gòu)-功能特性TRRD6.0包括七個(gè)相關(guān)的數(shù)據(jù)表:(1)基因描述表TRRDGENES(2)控制區(qū)域表TRRDLCR(3)調(diào)控區(qū)域表TRRDUNITS(4)轉(zhuǎn)錄因子結(jié)合位點(diǎn)表TRRDSITES(5)轉(zhuǎn)錄因子表TRRDFACTORS(6)表達(dá)模式表TRRDEXP(7)實(shí)驗(yàn)來源表TRRDBIB11:41628、TRANSFACTRANSFAC(http://transfac.gbf.de/)是真核基因順式調(diào)控元件和反式作用因子數(shù)據(jù)庫(kù),數(shù)據(jù)搜集的對(duì)象從酵母到人類TRANSFAC包括6類

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論