第二章 生物分子數(shù)據(jù)庫課件_第1頁
第二章 生物分子數(shù)據(jù)庫課件_第2頁
第二章 生物分子數(shù)據(jù)庫課件_第3頁
第二章 生物分子數(shù)據(jù)庫課件_第4頁
第二章 生物分子數(shù)據(jù)庫課件_第5頁
已閱讀5頁,還剩76頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

生物信息學第二章

分子生物信息數(shù)據(jù)庫

1第二章、生物分子數(shù)據(jù)庫生物信息學

第一節(jié)分子生物信息數(shù)據(jù)庫

第二節(jié)核酸與蛋白質序列格式轉換簡介2第二章、生物分子數(shù)據(jù)庫生物信息學第一節(jié)、分子生物信息數(shù)據(jù)庫一、分子生物信息數(shù)據(jù)庫簡介二、各大類主要數(shù)據(jù)庫介紹3第二章、生物分子數(shù)據(jù)庫生物信息學一、分子生物信息數(shù)據(jù)庫簡介生物分子數(shù)據(jù)高速增長分子生物學及相關領域研究人員迅速獲得最新實驗數(shù)據(jù)

建立生物分子數(shù)據(jù)庫

4第二章、生物分子數(shù)據(jù)庫生物信息學一、分子生物信息數(shù)據(jù)庫簡介

生物分子數(shù)據(jù)庫應滿足5個方面的主要需求(1)時間性(2)注釋(3)支撐數(shù)據(jù)(4)數(shù)據(jù)質量(5)集成性5第二章、生物分子數(shù)據(jù)庫生物信息學一、分子生物信息數(shù)據(jù)庫簡介生物分子數(shù)據(jù)庫幾個明顯的特征:(1)數(shù)據(jù)庫的更新速度不斷加快,數(shù)據(jù)量呈指數(shù)增長趨勢;(2)數(shù)據(jù)庫使用頻率增長更快,接近500%;(3)數(shù)據(jù)庫的復雜程度不斷增加;(4)數(shù)據(jù)庫網(wǎng)絡化;(5)面向應用;(6)先進的軟硬件配置。6第二章、生物分子數(shù)據(jù)庫生物信息學一、分子生物信息數(shù)據(jù)庫簡介7第二章、生物分子數(shù)據(jù)庫生物信息學二、各大類主要數(shù)據(jù)庫介紹基因組數(shù)據(jù)庫核酸序列數(shù)據(jù)庫蛋白質序列數(shù)據(jù)庫蛋白質結構數(shù)據(jù)庫蛋白質結構分類數(shù)據(jù)庫功能數(shù)據(jù)庫生物信息學數(shù)據(jù)庫導航系統(tǒng)8第二章、生物分子數(shù)據(jù)庫生物信息學二、各大類主要數(shù)據(jù)庫介紹基因組數(shù)據(jù)庫

基因組數(shù)據(jù)庫的主體是模式生物基因組數(shù)據(jù)庫,其中主要有世界各國人類基因組研究中心,測序中心構建的各種人類的基因組數(shù)據(jù)庫。還有模式生物基因組數(shù)據(jù)庫,如小鼠、線蟲、果蠅、酵母等。一些動物與植物基因組數(shù)據(jù)庫也紛紛上網(wǎng)。基因組信息資源除了基因組本身信息外,還包括染色體、基因突變、遺傳疾病、分類學、比較基因組、基因的調控與表達、放射雜交、基因圖譜等各種數(shù)據(jù)庫9第二章、生物分子數(shù)據(jù)庫生物信息學二、各大類主要數(shù)據(jù)庫介紹基因組數(shù)據(jù)庫(一)GDBTheGDBHumanGenomeDatabase

于1990年由美國JOHNSHOPKINS大學建立,現(xiàn)在由加拿大兒童醫(yī)院生物信息學中心負責管理。

基因組數(shù)據(jù)庫(GDB)為人類基因組計劃(HGP)保存和處理基因組圖譜數(shù)據(jù)。

GDB的目標是構建關于人類基因組的百科全書,除了構建基因組圖譜之外,還開發(fā)了描述序列水平的基因組內容的方法,包括序列變異和其它對功能和表型的描述10第二章、生物分子數(shù)據(jù)庫生物信息學二、各大類主要數(shù)據(jù)庫介紹基因組數(shù)據(jù)庫(一)GDBTheGDBHumanGenomeDatabase

目前GDB中有:人類基因組區(qū)域(包括基因、克隆、amplimersPCR標記、斷點breakpoints、細胞遺傳標記cytogeneticmarkers、易碎位點fragilesites、EST序列、綜合區(qū)域syndromicregions、contigs和重復序列);人類基因組圖譜(包括細胞遺傳圖譜、連接圖譜、放射性雜交圖譜、contentcontig圖譜和綜合圖譜等);人類基因組內的變異(包括突變和多態(tài)性,加上等位基因頻率數(shù)據(jù))。11第二章、生物分子數(shù)據(jù)庫生物信息學二、各大類主要數(shù)據(jù)庫介紹基因組數(shù)據(jù)庫12第二章、生物分子數(shù)據(jù)庫生物信息學二、各大類主要數(shù)據(jù)庫介紹基因組數(shù)據(jù)庫13第二章、生物分子數(shù)據(jù)庫生物信息學二、各大類主要數(shù)據(jù)庫介紹基因組數(shù)據(jù)庫14第二章、生物分子數(shù)據(jù)庫生物信息學二、各大類主要數(shù)據(jù)庫介紹基因組數(shù)據(jù)庫(二)人類基因組數(shù)據(jù)庫Ensembl

Ensembl試圖跟蹤所有人類基因組的序列片段,并將序列片段組裝成單個長序列,進而分析這些經(jīng)過組裝的DNA序列,搜索其中的基因,發(fā)現(xiàn)生物學家或醫(yī)學工作者感興趣的特征。

Ensembl包括所有公開的基因組DNA序列,如人類基因組、小鼠和大鼠基因組等。通過注釋形成的關于序列的特征?;蚓褪且环N特征,基因或者是通過實驗發(fā)現(xiàn)的,或者是通過Ensembl的程序預測的。

Ensembl所用的基因預測程序為GenScan。其他的特征包括單核苷酸多態(tài)性(SNP)、重復序列與其它序列高度相似(或同源)的序列。15第二章、生物分子數(shù)據(jù)庫生物信息學二、各大類主要數(shù)據(jù)庫介紹基因組數(shù)據(jù)庫(二)人類基因組數(shù)據(jù)庫Ensembl16第二章、生物分子數(shù)據(jù)庫第二章、生物分子數(shù)據(jù)庫生物信息學二、各大類主要數(shù)據(jù)庫介紹基因組數(shù)據(jù)庫(二)人類基因組數(shù)據(jù)庫Ensembl18第二章、生物分子數(shù)據(jù)庫生物信息學二、各大類主要數(shù)據(jù)庫介紹基因組數(shù)據(jù)庫(三)其他基因組數(shù)據(jù)庫1、EcoGene大腸桿菌(E.coli)K-12的序列

2、MITOMAP人類線粒體基因組

3、SGD酵母基因組數(shù)據(jù)庫

19第二章、生物分子數(shù)據(jù)庫生物信息學二、各大類主要數(shù)據(jù)庫介紹核酸序列數(shù)據(jù)

核酸序列是了解生物體結構、功能、發(fā)育和進化的出發(fā)點。國際上權威的核酸序列數(shù)據(jù)庫有三個,分別是美國生物技術信息中心(NCBI)的GenBank歐洲分子生物學實驗室的EMBL-Bank日本遺傳研究所的DDBJ

三個組織相互合作,各數(shù)據(jù)庫中的數(shù)據(jù)基本一致,僅在數(shù)據(jù)格式上有所差別,對于特定的查詢,三個數(shù)據(jù)庫的響應結果一樣。這三個數(shù)據(jù)庫是綜合性的DNA和RNA序列數(shù)據(jù)庫,其數(shù)據(jù)來源于眾多的研究機構和核酸測序小組,來源于科學文獻。用戶可以通過各種方式將核酸序列數(shù)據(jù)提交給這三個數(shù)據(jù)庫系統(tǒng)。20第二章、生物分子數(shù)據(jù)庫生物信息學(一)GenbankGenbank庫包含了所有已知的核酸序列和蛋白質序列,以及與它們相關的文獻著作和生物學注釋。它是由美國國立生物技術信息中心(NCBI)建立和維護的。它的數(shù)據(jù)直接來源于測序工作者提交的序列;由測序中心提交的大量EST序列和其它測序數(shù)據(jù);以及與其它數(shù)據(jù)機構協(xié)作交換數(shù)據(jù)而來。Genbank每天都會與歐洲分子生物學實驗室(EMBL)的數(shù)據(jù)庫,和日本的DNA數(shù)據(jù)庫(DDBJ)交換數(shù)據(jù),使這三個數(shù)據(jù)庫的數(shù)據(jù)同步。Genbank的數(shù)據(jù)可以從NCBI的FTP服務器上免費下載完整的庫,或下載積累的新數(shù)據(jù)。NCBI還提供廣泛的數(shù)據(jù)查詢、序列相似性搜索以及其它分析服務,用戶可以從NCBI的主頁上找到這些服務。21第二章、生物分子數(shù)據(jù)庫生物信息學

Genbank庫里的數(shù)據(jù)按來源于約55,000個物種,其中56%是人類的基因組序列(所有序列中的34%是人類的EST序列)。每條Genbank數(shù)據(jù)記錄包含了對序列的簡要描述,它的科學命名,物種分類名稱,參考文獻,序列特征表,以及序列本身。序列特征表里包含對序列生物學特征注釋如:編碼區(qū)、轉錄單元、重復區(qū)域、突變位點或修飾位點等。所有數(shù)據(jù)記錄被劃分在若干個文件里,如細菌類、病毒類、靈長類、嚙齒類,以及EST數(shù)據(jù)、基因組測序數(shù)據(jù)、大規(guī)模基因組序列數(shù)據(jù)等16類,其中EST數(shù)據(jù)等又被各自分成若干個文件。(一)Genbank22第二章、生物分子數(shù)據(jù)庫生物信息學(一)Genbank23第二章、生物分子數(shù)據(jù)庫生物信息學(一)Genbank24第二章、生物分子數(shù)據(jù)庫生物信息學(二)EMBL

EMBL核酸序列數(shù)據(jù)庫由歐洲生物信息學研究所(EBI)維護的核酸序列數(shù)據(jù)構成,由于與Genbank和DDBJ的數(shù)據(jù)合作交換,它也是一個全面的核酸序列數(shù)據(jù)庫。該數(shù)據(jù)庫由Oracal數(shù)據(jù)庫系統(tǒng)管理維護,查詢檢索可以通過因特網(wǎng)上的序列提取系統(tǒng)(SRS)服務完成。25第二章、生物分子數(shù)據(jù)庫生物信息學/(二)EMBL26第二章、生物分子數(shù)據(jù)庫生物信息學(三)DDBJ數(shù)據(jù)庫

日本DNA數(shù)據(jù)倉庫(DDBJ)也是一個全面的核酸序列數(shù)據(jù)庫,與Genbank和EMBL核酸庫合作交換數(shù)據(jù)??梢允褂闷渲黜撋咸峁┑腟RS工具進行數(shù)據(jù)檢索和序列分析。DDBJ的網(wǎng)址是:27第二章、生物分子數(shù)據(jù)庫生物信息學(三)DDBJ數(shù)據(jù)庫28第二章、生物分子數(shù)據(jù)庫生物信息學二、各大類主要數(shù)據(jù)庫介紹蛋白質序列數(shù)據(jù)庫1、PIR(ProteinInformationResource)由美國生物醫(yī)學基金會NBRF(NationalBiomedicalResearchFoundation)于1984年建立的。目的是幫助研究者鑒別和解釋蛋白質序列信息,研究分子進化、功能基因組,進行生物信息學分析。它是一個全面的、經(jīng)過注釋的、非冗余的蛋白質序列數(shù)據(jù)庫。所有序列數(shù)據(jù)都經(jīng)過整理,超過99%的序列已按蛋白質家族分類,一半以上還按蛋白質超家族進行了分類。29第二章、生物分子數(shù)據(jù)庫生物信息學二、各大類主要數(shù)據(jù)庫介紹蛋白質序列數(shù)據(jù)庫1、PIR(ProteinInformationResource)除了蛋白質序列數(shù)據(jù)之外,PIR還包含以下信息:

(1)蛋白質名稱、蛋白質的分類、蛋白質的來源;

(2)關于原始數(shù)據(jù)的參考文獻;

(3)蛋白質功能和蛋白質的一般特征,包括基因表達、翻譯后處理、活化等;

(4)序列中相關的位點、功能區(qū)域。30第二章、生物分子數(shù)據(jù)庫生物信息學二、各大類主要數(shù)據(jù)庫介紹蛋白質序列數(shù)據(jù)庫1、PIR(ProteinInformationResource)PIR提供三種類型的檢索服務:一是基于文本的交互式查詢,用戶通過關鍵字進行數(shù)據(jù)查詢。二是標準的序列相似性搜索,包括BLAST、FASTA等。三是結合序列相似性、注釋信息和蛋白質家族信息的高級搜索,包括按注釋分類的相似性搜索、結構域搜索等。目前,PIR包括三個子數(shù)據(jù)庫,分別是:蛋白質序列數(shù)據(jù)庫PIR-PSD蛋白質分類數(shù)據(jù)庫iProClass以及非冗余的蛋白質參考資料數(shù)據(jù)庫PIR-NREF。31第二章、生物分子數(shù)據(jù)庫生物信息學二、各大類主要數(shù)據(jù)庫介紹蛋白質序列數(shù)據(jù)庫1、PIR(ProteinInformationResource)32第二章、生物分子數(shù)據(jù)庫生物信息學二、各大類主要數(shù)據(jù)庫介紹蛋白質序列數(shù)據(jù)庫2、SWISS-PROT(曾經(jīng)的網(wǎng)址)

是由Geneva大學和歐洲生物信息學研究所(EBI)于1986年聯(lián)合建立的,它是目前國際上權威的蛋白質序列數(shù)據(jù)庫。SWISS-PROT中的蛋白質序列是經(jīng)過注釋的。SWISS-PROT中的數(shù)據(jù)來源于不同源地:(1)從核酸數(shù)據(jù)庫經(jīng)過翻譯推導而來;(2)從蛋白質數(shù)據(jù)庫PIR挑選出合適的數(shù)據(jù);(3)從科學文獻中摘錄;(4)研究人員直接提交的蛋白質序列數(shù)據(jù)與其它蛋白質序列數(shù)據(jù)庫相比較,SWISS-PROT有三個明顯的特點:(1)注釋(2)最小冗余(3)與其它數(shù)據(jù)庫的連接33第二章、生物分子數(shù)據(jù)庫生物信息學二、各大類主要數(shù)據(jù)庫介紹2、SWISS-PROT()

34第二章、生物分子數(shù)據(jù)庫生物信息學二、各大類主要數(shù)據(jù)庫介紹蛋白質序列數(shù)據(jù)庫3、TrEMBL(曾經(jīng)的網(wǎng)址)

TrEMBL是一個計算機注釋的蛋白質數(shù)據(jù)庫,作為SWISS-PROT數(shù)據(jù)庫的補充。該數(shù)據(jù)庫主要包含從EMBL/Genbank/DDBJ核酸數(shù)據(jù)庫中根據(jù)編碼序列(CDS)翻譯而得到的蛋白質序列,并且這些序列尚未集成到SWISS-PROT數(shù)據(jù)庫中。

TrEMBL有兩個部分SP-TrEMBL(SWISS-PROTTrEMBL)包含最終將要集成到SWISS-PROT的數(shù)據(jù),所有的SP-TrEMBL序列都已被賦予SWISS-PROT的登錄號。REM-TrEMBL(REMainingTrEMBL)包括所有不準備放入SWISS-PROT的數(shù)據(jù),因此這部分數(shù)據(jù)都沒有登錄號。35第二章、生物分子數(shù)據(jù)庫生物信息學二、各大類主要數(shù)據(jù)庫介紹蛋白質序列數(shù)據(jù)庫3、TrEMBL(曾經(jīng)的網(wǎng)址和界面)

36第二章、生物分子數(shù)據(jù)庫生物信息學二、各大類主要數(shù)據(jù)庫介紹蛋白質序列數(shù)據(jù)庫4、UniProt蛋白質數(shù)據(jù)倉庫

將Swiss-Prot、TrEMBL、PIR3個蛋白質數(shù)據(jù)庫統(tǒng)一起來,建立了一個蛋白質數(shù)據(jù)倉庫UniProt。UniProt包含4個部分:(1)UniProtKnowledgebase(UniProtKB),這是蛋白質序列、功能、分類、交叉引用等信息存取中心;(2)UniProtNon-redundantReference(UniRef)數(shù)據(jù)庫,該數(shù)據(jù)庫將密切相關的蛋白質序列組合到一條記錄中,以便提高搜索速度;(3)UniProtArchive(UniParc),是一個資源庫,記錄所有蛋白質序列的歷史。(4)UniProtMetagenomicandEnvironmentalSequence(UniMES),記錄metagenomic和環(huán)境微生物序列數(shù)據(jù)。用戶可以通過文本查詢數(shù)據(jù)庫,可以利用BLAST程序搜索數(shù)據(jù)庫,也可以直接通過FTP下載數(shù)據(jù)。

37第二章、生物分子數(shù)據(jù)庫第二章、生物分子數(shù)據(jù)庫生物信息學二、各大類主要數(shù)據(jù)庫介紹蛋白質結構數(shù)據(jù)庫1、PDB

ProteinDataBank

蛋白質數(shù)據(jù)倉庫(PDB)是國際上唯一的生物大分子結構數(shù)據(jù)檔案庫,由美國Brookhaven國家實驗室建立。

PDB收集的數(shù)據(jù)來源于X光晶體衍射和核磁共振(NMR)的數(shù)據(jù),經(jīng)過整理和確認后存檔而成。目前PDB數(shù)據(jù)庫的維護由結構生物信息學研究合作組織(RCSB)負責。

RCSB的主服務器和世界各地的鏡像服務器提供數(shù)據(jù)庫的檢索和下載服務,以及關于PDB數(shù)據(jù)文件格式和其它文檔的說明,PDB數(shù)據(jù)還可以從發(fā)行的光盤獲得。使用Rasmol等軟件可以在計算機上按PDB文件顯示生物大分子的三維結構。39第二章、生物分子數(shù)據(jù)庫生物信息學二、各大類主要數(shù)據(jù)庫介紹蛋白質結構數(shù)據(jù)庫1、PDB

ProteinDataBankPDB中的每條記錄有兩種序列信息一種是顯式序列信息(explicitsequence)在PDB文件中,以關鍵字SEQRES作為顯式序列標記,以該關鍵字打頭的每一行都是關于序列的信息。一種是隱式序列信息(implicitsequence) PDB的隱式序列即為立體化學數(shù)據(jù),包括每個原子的名稱和原子的三維坐標。40第二章、生物分子數(shù)據(jù)庫生物信息學二、各大類主要數(shù)據(jù)庫介紹蛋白質結構數(shù)據(jù)庫41第二章、生物分子數(shù)據(jù)庫生物信息學二、各大類主要數(shù)據(jù)庫介紹蛋白質結構數(shù)據(jù)庫PDB顯示分子結構(RasMol,ChemView)42第二章、生物分子數(shù)據(jù)庫生物信息學二、各大類主要數(shù)據(jù)庫介紹蛋白質結構數(shù)據(jù)庫2、MMDB(MolecularModelingDatabase)

分子模型MMDB是(NCBI)所開發(fā)的生物信息數(shù)據(jù)庫集成系統(tǒng)Entrez的一個部分,數(shù)據(jù)庫的內容包括來自于實驗的生物大分子結構數(shù)據(jù)。與PDB相比,對于數(shù)據(jù)庫中的每一個生物大分子結構,MMDB具有許多附加的信息,如分子的生物學功能、產(chǎn)生功能的機制、分子的進化歷史等。還提供生物大分子三維結構模型顯示、結構分析和結構比較工具。43第二章、生物分子數(shù)據(jù)庫第二章、生物分子數(shù)據(jù)庫第二章、生物分子數(shù)據(jù)庫生物信息學二、各大類主要數(shù)據(jù)庫介紹蛋白質結構數(shù)據(jù)庫2、MMDB(MolecularModelingDatabase)

46第二章、生物分子數(shù)據(jù)庫生物信息學二、各大類主要數(shù)據(jù)庫介紹蛋白質結構分類數(shù)據(jù)庫1、SCOP蛋白質結構分類數(shù)據(jù)庫(STRUCTURALCLASSIFICATIONOFPROTEINS)

詳細描述了已知的蛋白質結構之間的關系。分類基于若干層次:家族,描述相近的進化關系;超家族,描述遠源的進化關系;折疊子(fold),描述空間幾何結構的關系;折疊類,所有折疊子被歸于全α、全β、α/β、α+β、多結構域蛋白、膜蛋白和細胞表面蛋白、小蛋白分類等。在此基礎上按折疊類型、超家族、家族三個參次主級分類。47第二章、生物分子數(shù)據(jù)庫生物信息學二、各大類主要數(shù)據(jù)庫介紹蛋白質結構分類數(shù)據(jù)庫1、SCOP蛋白質結構分類數(shù)據(jù)庫48第二章、生物分子數(shù)據(jù)庫生物信息學二、各大類主要數(shù)據(jù)庫介紹蛋白質結構分類數(shù)據(jù)庫1、SCOP蛋白質結構分類數(shù)據(jù)庫49第二章、生物分子數(shù)據(jù)庫生物信息學二、各大類主要數(shù)據(jù)庫介紹蛋白質結構分類數(shù)據(jù)庫1、SCOP蛋白質結構分類數(shù)據(jù)庫50第二章、生物分子數(shù)據(jù)庫生物信息學二、各大類主要數(shù)據(jù)庫介紹蛋白質結構分類數(shù)據(jù)庫2、CATH蛋白質結構分類數(shù)據(jù)庫Class(C),Architecture(A),Topology(T)andHomologoussuperfamily(H).

CATH數(shù)據(jù)庫的分類基礎是蛋白質結構域。與SCOP不同的是,CATH把蛋白質分為4類,即α主類、β主類,α

-β類(α

/β型和α

+β型)和低二級結構類。低二級結構類是指二級結構成分含量很低的蛋白質分子。

CATH數(shù)據(jù)庫的第二個分類依據(jù)為由α螺旋和β折疊形成的超二級結構排列方式,而不考慮它們之間的連接關系。形象地說來,就是蛋白質分子的構架,如同建筑物的立柱、橫梁等主要部件,這一層次的分類主要依靠人工方法。51第二章、生物分子數(shù)據(jù)庫生物信息學二、各大類主要數(shù)據(jù)庫介紹蛋白質結構分類數(shù)據(jù)庫2、CATH蛋白質結構分類數(shù)據(jù)庫Class(C),Architecture(A),Topology(T)andHomologoussuperfamily(H).

第三個層次為拓撲結構,即二級結構的形狀和二級結構間的聯(lián)系。第四個層次為結構的同源性,它是先通過序列比較然后再用結構比較來確定的。

CATH數(shù)據(jù)庫的最后一個層次為序列(Sequence)層次,在這一層次上,只要結構域中的序列相似性大于35%,就被認為具有高度的結構和功能的相似性。對于較大的結構域,則至少要有60%與小的結構域相同。

52第二章、生物分子數(shù)據(jù)庫生物信息學二、各大類主要數(shù)據(jù)庫介紹蛋白質結構分類數(shù)據(jù)庫2、CATH蛋白質結構分類數(shù)據(jù)庫Class(C),Architecture(A),Topology(T)andHomologoussuperfamily(H).

53第二章、生物分子數(shù)據(jù)庫生物信息學二、各大類主要數(shù)據(jù)庫介紹蛋白質結構分類數(shù)據(jù)庫2、CATH蛋白質結構分類數(shù)據(jù)庫Class(C),Architecture(A),Topology(T)andHomologoussuperfamily(H).

54第二章、生物分子數(shù)據(jù)庫生物信息學二、各大類主要數(shù)據(jù)庫介紹功能數(shù)據(jù)庫KEGGDIPASDBTRRDTRANSFACEPDPROSITE55第二章、生物分子數(shù)據(jù)庫生物信息學KEGG

京都基因和基因組百科全書(KEGG)是系統(tǒng)分析基因功能,聯(lián)系基因組信息和功能信息的知識庫?;蚪M信息存儲在GENES數(shù)據(jù)庫里,包括完整和部分測序的基因組序列;更高級的功能信息存儲在PATHWAY數(shù)據(jù)庫里,包括圖解的細胞生化過程如代謝、膜轉運、信號傳遞、細胞周期,還包括同系保守的子通路等信息;KEGG的另一個數(shù)據(jù)庫是LIGAND,包含關于化學物質、酶分子、酶反應等信息。

KEGG提供了Java的圖形工具來訪問基因組圖譜,比較基因組圖譜和操作表達圖譜,以及其它序列比較、圖形比較和通路計算的工具,可以免費獲取。56第二章、生物分子數(shù)據(jù)庫生物信息學KEGG.kegg.jp/57第二章、生物分子數(shù)據(jù)庫生物信息學DIP

相互作用的蛋白質數(shù)據(jù)庫(DIP)收集了由實驗驗證的蛋白質-蛋白質相互作用。數(shù)據(jù)庫包括蛋白質的信息、相互作用的信息和檢測相互作用的實驗技術三個部分。用戶可以根據(jù)蛋白質、生物物種、蛋白質超家族、關鍵詞、實驗技術或引用文獻來查詢DIP數(shù)據(jù)庫。

DIP的網(wǎng)址是:58第二章、生物分子數(shù)據(jù)庫生物信息學DIP59第二章、生物分子數(shù)據(jù)庫生物信息學ASDB(舊)

可變剪接數(shù)據(jù)庫(ASDB)包括蛋白質庫和核酸庫兩部分。ASDB(蛋白質)部分來源于SWISS-PROT蛋白質序列庫,通過選取有可變剪接注釋的序列,搜索相關可變剪接的序列,經(jīng)過序列比對、篩選和分類構建而成。ASDB(核酸)部分來自Genbank中提及和注釋的可變剪接的完整基因構成。數(shù)據(jù)庫提供了方便的搜索服務。ASDB的網(wǎng)址是:60第二章、生物分子數(shù)據(jù)庫生物信息學ASDB--ASTD61第二章、生物分子數(shù)據(jù)庫生物信息學TRRD

轉錄調控區(qū)數(shù)據(jù)庫(TRRD)是在不斷積累的真核生物基因調控區(qū)結構-功能特性信息基礎上構建的。每一個TRRD的條目里包含特定基因各種結構-功能特性:轉錄因子結合位點、啟動子、增強子、靜默子、以及基因表達調控模式等。

TRRD包括五個相關的數(shù)據(jù)表:TRRDGENES(包含所有TRRD庫基因的基本信息和調控單元信息);TRRDSITES(包括調控因子結合位點的具體信息);TRRDFACTORS(包括TRRD中與各個位點結合的調控因子的具體信息);TRRDEXP(包括對基因表達模式的具體描述);TRRDBIB(包括所有注釋涉及的參考文獻)。TRRD主頁提供了對這幾個數(shù)據(jù)表的檢索服務。TRRD的網(wǎng)址是:62第二章、生物分子數(shù)據(jù)庫生物信息學TRRD

63第二章、生物分子數(shù)據(jù)庫生物信息學EPDEPD()

是真核基因啟動子數(shù)據(jù)庫提供從EMBL中得到的真核基因的啟動子序列,目標是幫助實驗研究人員、生物信息學研究人員分析真核基因的轉錄信號。64第二章、生物分子數(shù)據(jù)庫生物信息學EPD65第二章、生物分子數(shù)據(jù)庫生物信息學PROSITE

PROSITE數(shù)據(jù)庫收集了生物學有顯著意義的蛋白質位點和序列模式,并能根據(jù)這些位點和模式快速和可靠地鑒別一個未知功能的蛋白質序列應該屬于哪一個蛋白質家族。有的情況下,某個蛋白質與已知功能蛋白質的整體序列相似性很低,但由于功能的需要保留了與功能密切相關的序列模式,這樣就可能通過PROSITE的搜索找到隱含的功能motif,因此是序列分析的有效工具。

PROSITE中涉及的序列模式包括酶的催化位點、配體結合位點、與金屬離子結合的殘基、二硫鍵的半胱氨酸、與小分子或其它蛋白質結合的區(qū)域等;除了序列模式之外,PROSITE還包括由多序列比對構建的profile,能更敏感地發(fā)現(xiàn)序列與profile的相似性。PROSITE的主頁上提供各種相關檢索服務。66第二章、生物分子數(shù)據(jù)庫生物信息學PROSITE67第二章、生物分子數(shù)據(jù)庫

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論