版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第三章
生物信息數(shù)據(jù)庫及其信息檢索生物科學(xué)與技術(shù)學(xué)院本章主要內(nèi)容生物信息學(xué)數(shù)據(jù)庫類型序列數(shù)據(jù)庫結(jié)構(gòu)數(shù)據(jù)庫
功能數(shù)據(jù)庫其它專業(yè)數(shù)據(jù)庫生物信息學(xué)數(shù)據(jù)庫的檢索檢索方法概述檢索實(shí)踐和案例生物信息學(xué)數(shù)據(jù)庫的地位和作用經(jīng)典生物醫(yī)學(xué)實(shí)驗(yàn)大量零碎數(shù)據(jù)數(shù)據(jù)收集整理大規(guī)模組學(xué)實(shí)驗(yàn)海量組學(xué)數(shù)據(jù)數(shù)據(jù)存儲(chǔ)、注釋數(shù)據(jù)庫生物醫(yī)學(xué)應(yīng)用理論分析檢索查詢生物學(xué)研究生物信息學(xué)數(shù)據(jù)庫類型核酸研究(NucleicAcidsResearch)雜志的每年第一期為生物信息學(xué)數(shù)據(jù)庫??珍涀钪饕纳飳W(xué)相關(guān)數(shù)據(jù)庫,歸類并展示在/nar/database/c/。核酸序列數(shù)據(jù)庫RNA序列數(shù)據(jù)庫蛋白質(zhì)序列數(shù)據(jù)庫結(jié)構(gòu)數(shù)據(jù)庫基因組數(shù)據(jù)庫(非脊椎動(dòng)物)代謝與信號(hào)通路數(shù)據(jù)庫人類與其他脊椎動(dòng)物基因組人類基因與疾病微陣列數(shù)據(jù)庫與其他基因表達(dá)數(shù)據(jù)庫蛋白質(zhì)組資源其他分子生物學(xué)數(shù)據(jù)庫細(xì)胞器數(shù)據(jù)庫植物數(shù)據(jù)庫免疫學(xué)數(shù)據(jù)庫細(xì)胞生物學(xué)數(shù)據(jù)庫生物信息學(xué)數(shù)據(jù)庫類型序列數(shù)據(jù)庫結(jié)構(gòu)數(shù)據(jù)庫功能數(shù)據(jù)庫其它專業(yè)數(shù)據(jù)庫GooglevsBaidu膚淺的百姓工具他可以更厲害!甚至超過windows、Linux或Mac等操作系統(tǒng)一、序列數(shù)據(jù)庫主要收錄核酸和蛋白質(zhì)序列的數(shù)據(jù)庫,包括由基因組計(jì)劃產(chǎn)生的基因組及其表達(dá)序列,由基因組序列所推測(cè)的編碼和非編碼核酸和蛋白質(zhì)序列,以及個(gè)別生物學(xué)實(shí)驗(yàn)中測(cè)序獲得的核酸和蛋白質(zhì)序列。基因組序列數(shù)據(jù)庫:GenomeDatabase(GDB)數(shù)據(jù)庫(
/)包括人、鼠、斑馬魚和果蠅4種真核生物基因組的注釋分析。由EMBL-EBI和Sanger研究所聯(lián)合開發(fā)。UCSCGenomeBrowser(/)加州大學(xué)圣克魯茲分校建立,包括各種脊椎和無脊椎動(dòng)物,以及主要模式生物的基因組數(shù)據(jù)。核酸序列數(shù)據(jù)庫GenBank(
/Genbank)EMBL(
http://www.ebi.ac.uk/embl/)DDBJ(
http://www.ddbj.nig.ac.jp/)三個(gè)數(shù)據(jù)庫每天互相交換數(shù)據(jù)GenBank可通過NCBI的檢索系統(tǒng)Entrez獲取,Entrez集成來自主要DNA和蛋白序列數(shù)據(jù)庫的數(shù)據(jù),包括物種、基因組、定位、蛋白結(jié)構(gòu)和結(jié)構(gòu)域等信息其他各種專業(yè)核酸數(shù)據(jù)庫非冗余參考序列數(shù)據(jù)庫RefSeq密碼子使用數(shù)據(jù)庫CodonUsageDatabaseCUTG基因可變剪接數(shù)據(jù)庫ASDB轉(zhuǎn)錄因子數(shù)據(jù)庫TRANSFACNCBI(NationalCenterofBiotechnologyInformation)美國(guó)國(guó)立生物技術(shù)信息中心三大數(shù)據(jù)庫之間的聯(lián)系A(chǔ)TTGACTAPrimaryvs.DerivativeDatabasesACGTGCTTGACACGTGAATTGACTATATAGCCGACGTGCACGTGCACGTGCTTGACATTGACATTGACACGTGACGTGACGTGAATTGACTAATTGACTAATTGACTAATTGACTATATAGCCGTATAGCCGTATAGCCGTATAGCCGGenBankTATAGCCGTATAGCCGTATAGCCGTATAGCCGATGACATTGAGAATTATTCCGAGAATTCCGAGAATTATTCCGAGAATTCCSequencingCentersGAGAATTCCGAGAATTCCUniGeneRefSeqGenomeAssemblyLabsCuratorsAlgorithmsTATAGCCGAGCTCCGATACCGATGACAAGenBank中測(cè)序最多的20個(gè)物種humanArabidopsisThermotogamaritimaEscherichiacoliBuchnerasp.APSRickettsiaprowazekiiUreaplasmaurealyticumBacillussubtilisDrosophilamelanogasterThermoplasmaacidophilumPlasmodiumfalciparumHelicobacterpylorimouseCaenorhabitiselegansratBorreliaburgorferiBorreliaburgorferiAquifexaeolicusNeisseriameningitidisZ2491Mycobacteriumtuberculosis模式生物與基因測(cè)序virusesplasmidsbacteriafungiplantsalgaeinsectsmollusksreptilesbirdsmammalsGenomesizesinnucleotidepairs(base-pairs)10410810510610710111010109bonyfishamphibians蛋白質(zhì)序列數(shù)據(jù)庫UniProt()
由Swiss-Prot、TrEMBL和PIR蛋白質(zhì)數(shù)據(jù)庫聯(lián)合構(gòu)建,提供蛋白質(zhì)序列和功能注釋的核心資源。由三個(gè)子庫組成:(1)UniProtKB,知識(shí)庫(2)UniRef:參考簇(3)UniParc,所有公開的蛋白質(zhì)序列,包括每個(gè)序列源數(shù)據(jù)庫的追溯信息。IPI(http://www.ebi.ac.uk/IPI/)國(guó)際蛋白質(zhì)索引數(shù)據(jù)庫,針對(duì)蛋白質(zhì)組研究中利用數(shù)據(jù)庫搜索鑒定蛋白的策略而構(gòu)建的參考數(shù)據(jù)庫,月更新,整合國(guó)際上主要的蛋白質(zhì)數(shù)據(jù)庫(SwissProt,Refseq,PIR,TrEMBL,RefSeq,Ensembl,H-InvDB翻譯的蛋白數(shù)據(jù)),整合過程中,直接接受手工注釋結(jié)果。Nr(
/refseq/)NCBI構(gòu)建,非冗余蛋白質(zhì)數(shù)據(jù)庫,為每個(gè)蛋白質(zhì)序列記錄賦予一個(gè)唯一的gi號(hào),并將序列完全一致的非冗余蛋白質(zhì)合并成簇。二、結(jié)構(gòu)數(shù)據(jù)庫核酸和蛋白質(zhì)的空間結(jié)構(gòu)數(shù)據(jù)庫,一般通過X射線衍射和核磁共振獲得數(shù)據(jù),也有同源建模等計(jì)算方法獲得。結(jié)構(gòu)數(shù)據(jù)庫(核酸)NDB核酸結(jié)構(gòu)數(shù)據(jù)庫(/)收錄核酸的晶體結(jié)構(gòu)數(shù)據(jù),包含X射線衍射和核磁共振的結(jié)果,可通過ADIT(theAutoDepInputTool)同時(shí)將結(jié)構(gòu)存儲(chǔ)到NDB和PDB中,提供序列號(hào)檢索功能,可以用NDB或PDB的ID號(hào)檢索,結(jié)果包含核酸結(jié)構(gòu)的簡(jiǎn)要信息和圖片Rfam數(shù)據(jù)庫(http://rfam.sanger.ac.uk/)RNA家族多重序列比對(duì),一致性二級(jí)結(jié)構(gòu)和協(xié)方差模型,基于多重序列比對(duì)的非編碼RNA家族的變異模式結(jié)構(gòu)數(shù)據(jù)庫(蛋白質(zhì))PDB(/pdb/)RCSB(ResearchCollaboratoryforStructuralBioinformatics)專門用于處理和發(fā)布生物大分子三維結(jié)構(gòu)的知識(shí)庫,提供數(shù)據(jù)庫的檢索和下載服務(wù),以及PDB數(shù)據(jù)文件格式和其它文檔的說明,使用軟件可對(duì)PDB數(shù)據(jù)庫記錄用多種模式顯示生物大分子三維結(jié)構(gòu)。蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫SCOP(
http://scop.mrc-lmb.cam.ac.uk/scop/)包含從PDB數(shù)據(jù)庫中提取的所有結(jié)構(gòu)域,并詳細(xì)描述已知蛋白質(zhì)結(jié)構(gòu)之間的關(guān)系MMDBNCBI的分子模型數(shù)據(jù)庫。NCBI蛋白結(jié)構(gòu)數(shù)據(jù)庫(/sites/entrez?db=structure/)包括由x射線衍射和核磁共振實(shí)驗(yàn)得到的所有PDB生物分子三維結(jié)構(gòu),與原始的PDB結(jié)構(gòu)相比,增加一些附加信息:經(jīng)程序驗(yàn)證的顯性化學(xué)圖像信息、一致的二級(jí)結(jié)構(gòu)衍生定義、與MEDLINE相匹配的引用、基于源自生物實(shí)體的蛋白質(zhì)或核酸鏈進(jìn)行分類的分子匹配。三、功能數(shù)據(jù)庫收錄生物分子的功能數(shù)據(jù),由ID號(hào)與序列和結(jié)構(gòu)數(shù)據(jù)鏈接組織表達(dá)譜和亞細(xì)胞定位根據(jù)不同組織中的EST、SAGE或芯片雜交信號(hào),繪制出不同組織中表達(dá)基因的圖譜:BodyMap(http://bodymap.ims.u-tokyo.ac.jp/)Unigene(/sites/entrez?db=unigene
)SAGEmap(/projects/SAGE/)GEO(/projects/geo/)StanfordMicroarrayDatabase(/microarray)亞細(xì)胞定位數(shù)據(jù)庫PSORTdb(/)DBSubLoc(/dbsubloc.html)膜蛋白質(zhì)數(shù)據(jù)庫TMPDB(http://bioinfo.si.hirosaki-u.ac.jp/~TMPDB/)
線粒體蛋白質(zhì)數(shù)據(jù)庫MitoP2(http://www.mitop.de:8080/mitop2/)蛋白翻譯后修飾dbPTM(.tw/)磷酸化、糖基化和硫修飾,也收錄和蛋白質(zhì)翻譯后修飾相關(guān)的生物信息。O-GlycBase(http://www.cbs.dtu.dk/databases/OGLYCBASE/)只收錄O糖基化數(shù)據(jù)PhosphoBase(/)只收錄磷酸化位點(diǎn)的數(shù)據(jù)RESID(http://www.ebi.ac.uk/RESID/)收錄蛋白質(zhì)修飾的注釋和結(jié)構(gòu)的數(shù)據(jù)蛋白質(zhì)-蛋白質(zhì)相互作用數(shù)據(jù)庫DIP(/)由實(shí)驗(yàn)驗(yàn)證的蛋白質(zhì)-蛋白質(zhì)相互作用數(shù)據(jù),包括蛋白質(zhì)的信息、相互作用的信息和檢測(cè)相互作用的實(shí)驗(yàn)技術(shù)IntAct(http://www.ebi.ac.uk/intact)提供用于蛋白質(zhì)相互作用數(shù)據(jù)存儲(chǔ)、展示和分析的開源數(shù)據(jù)庫和工具包,可對(duì)相互作用數(shù)據(jù)在網(wǎng)頁上進(jìn)行文本和圖像的展示,允許用戶通過GO注釋或InterPro結(jié)構(gòu)域注釋進(jìn)行網(wǎng)絡(luò)的擴(kuò)充代謝網(wǎng)絡(luò)和信號(hào)途徑KEGG大百科(http://www.genome.ad.jp/kegg/)系統(tǒng)分析基因功能、聯(lián)系基因組信息和功能信息的知識(shí)庫,GENES收錄完整和部分測(cè)序的基因組序列;PATHWAY數(shù)據(jù)庫存儲(chǔ)更高級(jí)的功能信息,包括圖解的細(xì)胞生化過程和同系保守的子通路等信息;LIGAND數(shù)據(jù)庫收錄關(guān)于化學(xué)物質(zhì)、酶分子和酶反應(yīng)等信息。反應(yīng)通路(KEGG)glycolysispathway(糖酵解)京都基因與基因組百科全書(KyotoEncyclopediaofGenesandGenomes)全細(xì)胞通路四、其它專業(yè)數(shù)據(jù)庫人類基因和疾病數(shù)據(jù)庫OMIM(/sites/entrez?db=omim)收錄所有已知的遺傳病、遺傳性狀和基因,除簡(jiǎn)略描述各種疾病的臨床特征、診斷、治療和預(yù)防外,還提供致病基因的連鎖關(guān)系、染色體定位、組織結(jié)構(gòu)、動(dòng)物模型及其參考文獻(xiàn)等信息dbSNP(/sites/entrez?db=SNP)收錄已經(jīng)識(shí)別的SNPs的數(shù)據(jù)庫HapMapProject()收錄了三大人群(非洲人,高加索人和亞洲人群)主要的變異模式,所選擇的SNPs具有相對(duì)代表性CGED(http://lifesciencedb.jp/cged/)收錄多種癌癥的臨床和基因表達(dá)數(shù)據(jù),更新到2007年基于電泳和生物質(zhì)譜的蛋白質(zhì)組數(shù)據(jù)庫SWISS-2DPAGE(/ch2d/)收錄各種雙向電泳或SDS的電泳圖,并提供蛋白在電泳圖中的位置及其信息PRIDE(http://www.ebi.ac.uk/pride/)數(shù)據(jù)庫收集國(guó)際蛋白質(zhì)組計(jì)劃所產(chǎn)出的鑒定結(jié)果數(shù)據(jù)PeptideAtlas(/)收錄大規(guī)模LC-MS/MS實(shí)驗(yàn)鑒定的蛋白信息,并將信息匹配到Ensembl數(shù)據(jù)庫dbLEP()為肝臟蛋白質(zhì)組計(jì)劃設(shè)計(jì),提供鑒定結(jié)果及可追溯的信息,包括可供評(píng)估結(jié)果質(zhì)量的鑒定肽段數(shù)和質(zhì)譜圖譜等,同時(shí)還提供大量的注釋信息,更新到2007年免疫學(xué)數(shù)據(jù)庫IMGT(http://imgt.cines.fr)關(guān)于免疫球蛋白、T細(xì)胞受體、主要組織相容性復(fù)合體以及人類和哺乳動(dòng)物免疫系統(tǒng)相關(guān)蛋白的綜合數(shù)據(jù)庫,由序列數(shù)據(jù)庫、基因組和結(jié)構(gòu)數(shù)據(jù)庫、網(wǎng)站資源數(shù)據(jù)庫和各種研究工具數(shù)據(jù)庫組成dbMHC(/mhc/)提供人類組織相容性抗原(HLA)的序列數(shù)據(jù)和臨床上干細(xì)胞移植及風(fēng)濕性關(guān)節(jié)炎等數(shù)據(jù),也提供全世界90多個(gè)人群的HLA位點(diǎn)、等位基因和單倍型頻率的遺傳檢測(cè)工具Taxonomy分類學(xué)數(shù)據(jù)庫北京華大基因研究中心(中科院基因組研究所)楊煥明/國(guó)家人類基因組南方研究中心(上海)陳竺、趙國(guó)屏/國(guó)家人類基因組北方研究中心(北京)強(qiáng)伯勤/清華大學(xué)生物系生物信息研究室孫之榮/北京大學(xué)生物信息學(xué)中心羅靜初/chinese/復(fù)旦大學(xué)理論生物中心鐘揚(yáng)/我國(guó)的一些主要研究中心和數(shù)據(jù)庫生物信息學(xué)數(shù)據(jù)庫的檢索檢索方法概述檢索實(shí)踐和案例生物信息學(xué)數(shù)據(jù)庫的檢索主要檢索系統(tǒng)和工具Entrez(NationalCenterforBiotechnologyInformation,NCBI)SRS(EuropeanBioinformaticsInstitute,EBI)ExPasyExpertProteinAnalysisSystem(SwissInstituteofBioinformatics,SIB)日本、歐洲、美國(guó)其他研究機(jī)構(gòu)的工具平臺(tái)……復(fù)雜檢索1、限制字段類別常用的有:Author:BaoYM[au]Title:stress[ti]Tilte/Abstract:stress[title/abstract]Date:1999:2009[dp]2、布爾邏輯運(yùn)算:AND、OR、NOT必須大寫。邏輯符的運(yùn)算次序是從左至右,括號(hào)內(nèi)的檢索式可作為一個(gè)單元,優(yōu)先運(yùn)行。布爾邏輯檢索允許在檢索詞后面附加字段標(biāo)識(shí)例如:rice[ti]ANDBaoYM[au]AND2008:2009[dp]同樣存在限制字段:常用的有:Author:BaoYM[au]title:SNARE[ti]organism:rice[organism]或者直接輸入:Accession:AY077725[Accession]GeneName:ZFP15[GeneName]ProteinName:ZFP15[ProteinName]如:BaoYM[au]ANDSNARE[ti]ANDrice[organism]如果沒有限定,就是任意字段。如何獲取GenBank中的序列?Entrez(NationalCenterforBiotechnologyInformation,NCBI)選擇數(shù)據(jù)庫當(dāng)沒有進(jìn)入號(hào)時(shí)輸入關(guān)鍵詞(英文和
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 五校聯(lián)考九年級(jí)上學(xué)期語文開學(xué)考試卷
- 菠蘿幼兒課件教學(xué)課件
- 過渡合同范本(2篇)
- 股份協(xié)議書(2篇)
- 學(xué)生會(huì)培訓(xùn)演講外聯(lián)部
- 四川機(jī)電高級(jí)技工學(xué)校災(zāi)后恢復(fù)重建項(xiàng)目施工組織設(shè)計(jì)
- 南京工業(yè)大學(xué)浦江學(xué)院《路由交換技術(shù)》2023-2024學(xué)年期末試卷
- 簡(jiǎn)單專業(yè)分包合同(2篇)
- 南京工業(yè)大學(xué)《影視與影像(視聽語言與創(chuàng)意表達(dá))》2021-2022學(xué)年第一學(xué)期期末試卷
- 南京工業(yè)大學(xué)《土質(zhì)學(xué)與土力學(xué)》2023-2024學(xué)年第一學(xué)期期末試卷
- 輸煤系統(tǒng)危險(xiǎn)源辨識(shí)及控制措施
- 35kV線路工程檢測(cè)試驗(yàn)項(xiàng)目計(jì)劃
- 建設(shè)工程安全文明綜合評(píng)價(jià)書
- 旅游廁所等級(jí)申請(qǐng)?jiān)u報(bào)告書
- YUASA電池車型對(duì)照表
- 水泥土(噴漿)攪拌樁施工工藝規(guī)程與施工方案
- 混凝土用水檢測(cè)
- 平鍵鍵槽的尺寸與公差
- 土地報(bào)批流程
- 小學(xué)低段學(xué)生數(shù)學(xué)審題能力培養(yǎng)的實(shí)踐與研究實(shí)驗(yàn)方案
- 混凝土早強(qiáng)劑檢測(cè)報(bào)告
評(píng)論
0/150
提交評(píng)論