




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
生物信息學(xué)第二章
分子生物信息數(shù)據(jù)庫
1/4/20231生物信息學(xué)
第一節(jié)分子生物信息數(shù)據(jù)庫
第二節(jié)核酸與蛋白質(zhì)序列格式轉(zhuǎn)換簡介1/4/20232生物信息學(xué)第一節(jié)、分子生物信息數(shù)據(jù)庫一、分子生物信息數(shù)據(jù)庫簡介二、各大類主要數(shù)據(jù)庫介紹1/4/20233生物信息學(xué)一、分子生物信息數(shù)據(jù)庫簡介生物分子數(shù)據(jù)高速增長分子生物學(xué)及相關(guān)領(lǐng)域研究人員迅速獲得最新實驗數(shù)據(jù)
建立生物分子數(shù)據(jù)庫
1/4/20234生物信息學(xué)一、分子生物信息數(shù)據(jù)庫簡介生物分子數(shù)據(jù)庫應(yīng)滿足5個方面的主要需求(1)時間性(2)注釋(3)支撐數(shù)據(jù)(4)數(shù)據(jù)質(zhì)量(5)集成性1/4/20235生物信息學(xué)一、分子生物信息數(shù)據(jù)庫簡介生物分子數(shù)據(jù)庫幾個明顯的特征:(1)數(shù)據(jù)庫的更新速度不斷加快,數(shù)據(jù)量呈指數(shù)增長趨勢;(2)數(shù)據(jù)庫使用頻率增長更快,接近500%;(3)數(shù)據(jù)庫的復(fù)雜程度不斷增加;(4)數(shù)據(jù)庫網(wǎng)絡(luò)化;(5)面向應(yīng)用;(6)先進的軟硬件配置。1/4/20236生物信息學(xué)一、分子生物信息數(shù)據(jù)庫簡介1/4/20237生物信息學(xué)二、各大類主要數(shù)據(jù)庫介紹基因組數(shù)據(jù)庫核酸序列數(shù)據(jù)庫蛋白質(zhì)序列數(shù)據(jù)庫蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫功能數(shù)據(jù)庫生物信息學(xué)數(shù)據(jù)庫導(dǎo)航系統(tǒng)1/4/20238生物信息學(xué)二、各大類主要數(shù)據(jù)庫介紹基因組數(shù)據(jù)庫
基因組數(shù)據(jù)庫的主體是模式生物基因組數(shù)據(jù)庫,其中主要有世界各國人類基因組研究中心,測序中心構(gòu)建的各種人類的基因組數(shù)據(jù)庫。還有模式生物基因組數(shù)據(jù)庫,如小鼠、線蟲、果蠅、酵母等。一些動物與植物基因組數(shù)據(jù)庫也紛紛上網(wǎng)?;蚪M信息資源除了基因組本身信息外,還包括染色體、基因突變、遺傳疾病、分類學(xué)、比較基因組、基因的調(diào)控與表達、放射雜交、基因圖譜等各種數(shù)據(jù)庫1/4/20239生物信息學(xué)二、各大類主要數(shù)據(jù)庫介紹基因組數(shù)據(jù)庫(一)GDBTheGDBHumanGenomeDatabase/
于1990年由美國JOHNSHOPKINS大學(xué)建立,現(xiàn)在由加拿大兒童醫(yī)院生物信息學(xué)中心負責(zé)管理。
基因組數(shù)據(jù)庫(GDB)為人類基因組計劃(HGP)保存和處理基因組圖譜數(shù)據(jù)。GDB的目標是構(gòu)建關(guān)于人類基因組的百科全書,除了構(gòu)建基因組圖譜之外,還開發(fā)了描述序列水平的基因組內(nèi)容的方法,包括序列變異和其它對功能和表型的描述1/4/202310生物信息學(xué)二、各大類主要數(shù)據(jù)庫介紹基因組數(shù)據(jù)庫(一)GDBTheGDBHumanGenomeDatabase
/
目前GDB中有:人類基因組區(qū)域(包括基因、克隆、amplimersPCR標記、斷點breakpoints、細胞遺傳標記cytogeneticmarkers、易碎位點fragilesites、EST序列、綜合區(qū)域syndromicregions、contigs和重復(fù)序列);人類基因組圖譜(包括細胞遺傳圖譜、連接圖譜、放射性雜交圖譜、contentcontig圖譜和綜合圖譜等);人類基因組內(nèi)的變異(包括突變和多態(tài)性,加上等位基因頻率數(shù)據(jù))。1/4/202311生物信息學(xué)二、各大類主要數(shù)據(jù)庫介紹基因組數(shù)據(jù)庫1/4/202312生物信息學(xué)二、各大類主要數(shù)據(jù)庫介紹基因組數(shù)據(jù)庫1/4/202313生物信息學(xué)二、各大類主要數(shù)據(jù)庫介紹基因組數(shù)據(jù)庫1/4/202314生物信息學(xué)二、各大類主要數(shù)據(jù)庫介紹基因組數(shù)據(jù)庫(二)人類基因組數(shù)據(jù)庫Ensembl/
Ensembl試圖跟蹤所有人類基因組的序列片段,并將序列片段組裝成單個長序列,進而分析這些經(jīng)過組裝的DNA序列,搜索其中的基因,發(fā)現(xiàn)生物學(xué)家或醫(yī)學(xué)工作者感興趣的特征。Ensembl包括所有公開的基因組DNA序列,如人類基因組、小鼠和大鼠基因組等。通過注釋形成的關(guān)于序列的特征?;蚓褪且环N特征,基因或者是通過實驗發(fā)現(xiàn)的,或者是通過Ensembl的程序預(yù)測的。Ensembl所用的基因預(yù)測程序為GenScan。其他的特征包括單核苷酸多態(tài)性(SNP)、重復(fù)序列與其它序列高度相似(或同源)的序列。1/4/202315生物信息學(xué)二、各大類主要數(shù)據(jù)庫介紹基因組數(shù)據(jù)庫(二)人類基因組數(shù)據(jù)庫Ensembl1/4/202316生物信息學(xué)二、各大類主要數(shù)據(jù)庫介紹基因組數(shù)據(jù)庫(二)人類基因組數(shù)據(jù)庫Ensembl1/4/202318生物信息學(xué)二、各大類主要數(shù)據(jù)庫介紹基因組數(shù)據(jù)庫(三)其他基因組數(shù)據(jù)庫1、EcoGene大腸桿菌(E.coli)K-12的序列/2、MITOMAP人類線粒體基因組/3、SGD酵母基因組數(shù)據(jù)庫
/Saccharomyces
1/4/202319生物信息學(xué)二、各大類主要數(shù)據(jù)庫介紹核酸序列數(shù)據(jù)
核酸序列是了解生物體結(jié)構(gòu)、功能、發(fā)育和進化的出發(fā)點。國際上權(quán)威的核酸序列數(shù)據(jù)庫有三個,分別是美國生物技術(shù)信息中心(NCBI)的GenBank歐洲分子生物學(xué)實驗室的EMBL-Bank日本遺傳研究所的DDBJ
三個組織相互合作,各數(shù)據(jù)庫中的數(shù)據(jù)基本一致,僅在數(shù)據(jù)格式上有所差別,對于特定的查詢,三個數(shù)據(jù)庫的響應(yīng)結(jié)果一樣。這三個數(shù)據(jù)庫是綜合性的DNA和RNA序列數(shù)據(jù)庫,其數(shù)據(jù)來源于眾多的研究機構(gòu)和核酸測序小組,來源于科學(xué)文獻。用戶可以通過各種方式將核酸序列數(shù)據(jù)提交給這三個數(shù)據(jù)庫系統(tǒng)。1/4/202320生物信息學(xué)(一)GenbankGenbank庫包含了所有已知的核酸序列和蛋白質(zhì)序列,以及與它們相關(guān)的文獻著作和生物學(xué)注釋。它是由美國國立生物技術(shù)信息中心(NCBI)建立和維護的。它的數(shù)據(jù)直接來源于測序工作者提交的序列;由測序中心提交的大量EST序列和其它測序數(shù)據(jù);以及與其它數(shù)據(jù)機構(gòu)協(xié)作交換數(shù)據(jù)而來。Genbank每天都會與歐洲分子生物學(xué)實驗室(EMBL)的數(shù)據(jù)庫,和日本的DNA數(shù)據(jù)庫(DDBJ)交換數(shù)據(jù),使這三個數(shù)據(jù)庫的數(shù)據(jù)同步。Genbank的數(shù)據(jù)可以從NCBI的FTP服務(wù)器上免費下載完整的庫,或下載積累的新數(shù)據(jù)。NCBI還提供廣泛的數(shù)據(jù)查詢、序列相似性搜索以及其它分析服務(wù),用戶可以從NCBI的主頁上找到這些服務(wù)。1/4/202321生物信息學(xué)
Genbank庫里的數(shù)據(jù)按來源于約55,000個物種,其中56%是人類的基因組序列(所有序列中的34%是人類的EST序列)。每條Genbank數(shù)據(jù)記錄包含了對序列的簡要描述,它的科學(xué)命名,物種分類名稱,參考文獻,序列特征表,以及序列本身。序列特征表里包含對序列生物學(xué)特征注釋如:編碼區(qū)、轉(zhuǎn)錄單元、重復(fù)區(qū)域、突變位點或修飾位點等。所有數(shù)據(jù)記錄被劃分在若干個文件里,如細菌類、病毒類、靈長類、嚙齒類,以及EST數(shù)據(jù)、基因組測序數(shù)據(jù)、大規(guī)?;蚪M序列數(shù)據(jù)等16類,其中EST數(shù)據(jù)等又被各自分成若干個文件。(一)Genbank1/4/202322生物信息學(xué)(一)Genbank1/4/202323生物信息學(xué)(一)Genbank1/4/202324生物信息學(xué)(二)EMBL
EMBL核酸序列數(shù)據(jù)庫由歐洲生物信息學(xué)研究所(EBI)維護的核酸序列數(shù)據(jù)構(gòu)成,由于與Genbank和DDBJ的數(shù)據(jù)合作交換,它也是一個全面的核酸序列數(shù)據(jù)庫。該數(shù)據(jù)庫由Oracal數(shù)據(jù)庫系統(tǒng)管理維護,查詢檢索可以通過因特網(wǎng)上的序列提取系統(tǒng)(SRS)服務(wù)完成。1/4/202325生物信息學(xué)http://www.ebi.ac.uk/embl/(二)EMBL1/4/202326生物信息學(xué)(三)DDBJ數(shù)據(jù)庫日本DNA數(shù)據(jù)倉庫(DDBJ)也是一個全面的核酸序列數(shù)據(jù)庫,與Genbank和EMBL核酸庫合作交換數(shù)據(jù)??梢允褂闷渲黜撋咸峁┑腟RS工具進行數(shù)據(jù)檢索和序列分析。DDBJ的網(wǎng)址是:http://www.ddbj.nig.ac.jp/index-e.html1/4/202327生物信息學(xué)(三)DDBJ數(shù)據(jù)庫1/4/202328生物信息學(xué)二、各大類主要數(shù)據(jù)庫介紹蛋白質(zhì)序列數(shù)據(jù)庫1、PIR(ProteinInformationResource)/由美國生物醫(yī)學(xué)基金會NBRF(NationalBiomedicalResearchFoundation)于1984年建立的。目的是幫助研究者鑒別和解釋蛋白質(zhì)序列信息,研究分子進化、功能基因組,進行生物信息學(xué)分析。它是一個全面的、經(jīng)過注釋的、非冗余的蛋白質(zhì)序列數(shù)據(jù)庫。所有序列數(shù)據(jù)都經(jīng)過整理,超過99%的序列已按蛋白質(zhì)家族分類,一半以上還按蛋白質(zhì)超家族進行了分類。1/4/202329生物信息學(xué)二、各大類主要數(shù)據(jù)庫介紹蛋白質(zhì)序列數(shù)據(jù)庫1、PIR(ProteinInformationResource)/除了蛋白質(zhì)序列數(shù)據(jù)之外,PIR還包含以下信息:(1)蛋白質(zhì)名稱、蛋白質(zhì)的分類、蛋白質(zhì)的來源;(2)關(guān)于原始數(shù)據(jù)的參考文獻;(3)蛋白質(zhì)功能和蛋白質(zhì)的一般特征,包括基因表達、翻譯后處理、活化等;(4)序列中相關(guān)的位點、功能區(qū)域。1/4/202330生物信息學(xué)二、各大類主要數(shù)據(jù)庫介紹蛋白質(zhì)序列數(shù)據(jù)庫1、PIR(ProteinInformationResource)PIR提供三種類型的檢索服務(wù):一是基于文本的交互式查詢,用戶通過關(guān)鍵字進行數(shù)據(jù)查詢。二是標準的序列相似性搜索,包括BLAST、FASTA等。三是結(jié)合序列相似性、注釋信息和蛋白質(zhì)家族信息的高級搜索,包括按注釋分類的相似性搜索、結(jié)構(gòu)域搜索等。目前,PIR包括三個子數(shù)據(jù)庫,分別是:蛋白質(zhì)序列數(shù)據(jù)庫PIR-PSD蛋白質(zhì)分類數(shù)據(jù)庫iProClass以及非冗余的蛋白質(zhì)參考資料數(shù)據(jù)庫PIR-NREF。1/4/202331生物信息學(xué)二、各大類主要數(shù)據(jù)庫介紹蛋白質(zhì)序列數(shù)據(jù)庫1、PIR(ProteinInformationResource)1/4/202332生物信息學(xué)二、各大類主要數(shù)據(jù)庫介紹蛋白質(zhì)序列數(shù)據(jù)庫2、SWISS-PROT(http://www.ebi.ac.uk/swissprot/曾經(jīng)的網(wǎng)址)/
是由Geneva大學(xué)和歐洲生物信息學(xué)研究所(EBI)于1986年聯(lián)合建立的,它是目前國際上權(quán)威的蛋白質(zhì)序列數(shù)據(jù)庫。SWISS-PROT中的蛋白質(zhì)序列是經(jīng)過注釋的。SWISS-PROT中的數(shù)據(jù)來源于不同源地:(1)從核酸數(shù)據(jù)庫經(jīng)過翻譯推導(dǎo)而來;(2)從蛋白質(zhì)數(shù)據(jù)庫PIR挑選出合適的數(shù)據(jù);(3)從科學(xué)文獻中摘錄;(4)研究人員直接提交的蛋白質(zhì)序列數(shù)據(jù)與其它蛋白質(zhì)序列數(shù)據(jù)庫相比較,SWISS-PROT有三個明顯的特點:(1)注釋(2)最小冗余(3)與其它數(shù)據(jù)庫的連接1/4/202333生物信息學(xué)二、各大類主要數(shù)據(jù)庫介紹2、SWISS-PROT(http://www.ebi.ac.uk/swissprot/)
1/4/202334生物信息學(xué)二、各大類主要數(shù)據(jù)庫介紹蛋白質(zhì)序列數(shù)據(jù)庫3、TrEMBL(http://www.ebi.ac.uk/trembl/index.html曾經(jīng)的網(wǎng)址)/
TrEMBL是一個計算機注釋的蛋白質(zhì)數(shù)據(jù)庫,作為SWISS-PROT數(shù)據(jù)庫的補充。該數(shù)據(jù)庫主要包含從EMBL/Genbank/DDBJ核酸數(shù)據(jù)庫中根據(jù)編碼序列(CDS)翻譯而得到的蛋白質(zhì)序列,并且這些序列尚未集成到SWISS-PROT數(shù)據(jù)庫中。TrEMBL有兩個部分SP-TrEMBL(SWISS-PROTTrEMBL)包含最終將要集成到SWISS-PROT的數(shù)據(jù),所有的SP-TrEMBL
序列都已被賦予SWISS-PROT的登錄號。REM-TrEMBL(REMaining
TrEMBL)包括所有不準備放入SWISS-PROT的數(shù)據(jù),因此這部分數(shù)據(jù)都沒有登錄號。1/4/202335生物信息學(xué)二、各大類主要數(shù)據(jù)庫介紹蛋白質(zhì)序列數(shù)據(jù)庫3、TrEMBL(曾經(jīng)的網(wǎng)址和界面)
1/4/202336生物信息學(xué)二、各大類主要數(shù)據(jù)庫介紹蛋白質(zhì)序列數(shù)據(jù)庫4、UniProt蛋白質(zhì)數(shù)據(jù)倉庫
將Swiss-Prot、TrEMBL、PIR3個蛋白質(zhì)數(shù)據(jù)庫統(tǒng)一起來,建立了一個蛋白質(zhì)數(shù)據(jù)倉庫UniProt。UniProt包含4個部分:(1)UniProtKnowledgebase(UniProtKB),這是蛋白質(zhì)序列、功能、分類、交叉引用等信息存取中心;(2)UniProtNon-redundantReference(UniRef)數(shù)據(jù)庫,該數(shù)據(jù)庫將密切相關(guān)的蛋白質(zhì)序列組合到一條記錄中,以便提高搜索速度;(3)UniProtArchive(UniParc),是一個資源庫,記錄所有蛋白質(zhì)序列的歷史。(4)UniProtMetagenomicandEnvironmentalSequence(UniMES),記錄metagenomic和環(huán)境微生物序列數(shù)據(jù)。用戶可以通過文本查詢數(shù)據(jù)庫,可以利用BLAST程序搜索數(shù)據(jù)庫,也可以直接通過FTP下載數(shù)據(jù)。
1/4/202337生物信息學(xué)二、各大類主要數(shù)據(jù)庫介紹蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫1、PDB
ProteinDataBank/pdb
蛋白質(zhì)數(shù)據(jù)倉庫(PDB)是國際上唯一的生物大分子結(jié)構(gòu)數(shù)據(jù)檔案庫,由美國Brookhaven國家實驗室建立。PDB收集的數(shù)據(jù)來源于X光晶體衍射和核磁共振(NMR)的數(shù)據(jù),經(jīng)過整理和確認后存檔而成。目前PDB數(shù)據(jù)庫的維護由結(jié)構(gòu)生物信息學(xué)研究合作組織(RCSB)負責(zé)。RCSB的主服務(wù)器和世界各地的鏡像服務(wù)器提供數(shù)據(jù)庫的檢索和下載服務(wù),以及關(guān)于PDB數(shù)據(jù)文件格式和其它文檔的說明,PDB數(shù)據(jù)還可以從發(fā)行的光盤獲得。使用Rasmol等軟件可以在計算機上按PDB文件顯示生物大分子的三維結(jié)構(gòu)。1/4/202339生物信息學(xué)二、各大類主要數(shù)據(jù)庫介紹蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫1、PDB
ProteinDataBank/pdbPDB中的每條記錄有兩種序列信息一種是顯式序列信息(explicitsequence)在PDB文件中,以關(guān)鍵字SEQRES作為顯式序列標記,以該關(guān)鍵字打頭的每一行都是關(guān)于序列的信息。一種是隱式序列信息(implicitsequence) PDB的隱式序列即為立體化學(xué)數(shù)據(jù),包括每個原子的名稱和原子的三維坐標。1/4/202340生物信息學(xué)二、各大類主要數(shù)據(jù)庫介紹蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫1/4/202341生物信息學(xué)二、各大類主要數(shù)據(jù)庫介紹蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫PDB顯示分子結(jié)構(gòu)(RasMol,ChemView)1/4/202342生物信息學(xué)二、各大類主要數(shù)據(jù)庫介紹蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫2、MMDB(MolecularModelingDatabase)
分子模型MMDB是(NCBI)所開發(fā)的生物信息數(shù)據(jù)庫集成系統(tǒng)Entrez的一個部分,數(shù)據(jù)庫的內(nèi)容包括來自于實驗的生物大分子結(jié)構(gòu)數(shù)據(jù)。與PDB相比,對于數(shù)據(jù)庫中的每一個生物大分子結(jié)構(gòu),MMDB具有許多附加的信息,如分子的生物學(xué)功能、產(chǎn)生功能的機制、分子的進化歷史等。還提供生物大分子三維結(jié)構(gòu)模型顯示、結(jié)構(gòu)分析和結(jié)構(gòu)比較工具。1/4/202343生物信息學(xué)二、各大類主要數(shù)據(jù)庫介紹蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫2、MMDB(MolecularModelingDatabase)
1/4/202346生物信息學(xué)二、各大類主要數(shù)據(jù)庫介紹蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫1、SCOP蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫(STRUCTURALCLASSIFICATIONOFPROTEINS)http://scop.mrc-lmb.cam.ac.uk/scop/
詳細描述了已知的蛋白質(zhì)結(jié)構(gòu)之間的關(guān)系。分類基于若干層次:家族,描述相近的進化關(guān)系;超家族,描述遠源的進化關(guān)系;折疊子(fold),描述空間幾何結(jié)構(gòu)的關(guān)系;折疊類,所有折疊子被歸于全α、全β、α/β、α+β、多結(jié)構(gòu)域蛋白、膜蛋白和細胞表面蛋白、小蛋白分類等。在此基礎(chǔ)上按折疊類型、超家族、家族三個參次主級分類。1/4/202347生物信息學(xué)二、各大類主要數(shù)據(jù)庫介紹蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫1、SCOP蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫1/4/202348生物信息學(xué)二、各大類主要數(shù)據(jù)庫介紹蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫1、SCOP蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫1/4/202349生物信息學(xué)二、各大類主要數(shù)據(jù)庫介紹蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫1、SCOP蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫1/4/202350生物信息學(xué)二、各大類主要數(shù)據(jù)庫介紹蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫2、CATH蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫Class(C),Architecture(A),Topology(T)andHomologoussuperfamily(H).
/
CATH數(shù)據(jù)庫的分類基礎(chǔ)是蛋白質(zhì)結(jié)構(gòu)域。與SCOP不同的是,CATH把蛋白質(zhì)分為4類,即α主類、β主類,α
-β類(α
/β型和α
+β型)和低二級結(jié)構(gòu)類。低二級結(jié)構(gòu)類是指二級結(jié)構(gòu)成分含量很低的蛋白質(zhì)分子。CATH數(shù)據(jù)庫的第二個分類依據(jù)為由α螺旋和β折疊形成的超二級結(jié)構(gòu)排列方式,而不考慮它們之間的連接關(guān)系。形象地說來,就是蛋白質(zhì)分子的構(gòu)架,如同建筑物的立柱、橫梁等主要部件,這一層次的分類主要依靠人工方法。1/4/202351生物信息學(xué)二、各大類主要數(shù)據(jù)庫介紹蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫2、CATH蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫Class(C),Architecture(A),Topology(T)andHomologoussuperfamily(H).
第三個層次為拓撲結(jié)構(gòu),即二級結(jié)構(gòu)的形狀和二級結(jié)構(gòu)間的聯(lián)系。第四個層次為結(jié)構(gòu)的同源性,它是先通過序列比較然后再用結(jié)構(gòu)比較來確定的。CATH數(shù)據(jù)庫的最后一個層次為序列(Sequence)層次,在這一層次上,只要結(jié)構(gòu)域中的序列相似性大于35%,就被認為具有高度的結(jié)構(gòu)和功能的相似性。對于較大的結(jié)構(gòu)域,則至少要有60%與小的結(jié)構(gòu)域相同。
1/4/202352生物信息學(xué)二、各大類主要數(shù)據(jù)庫介紹蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫2、CATH蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫Class(C),Architecture(A),Topology(T)andHomologoussuperfamily(H).
1/4/202353生物信息學(xué)二、各大類主要數(shù)據(jù)庫介紹蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫2、CATH蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫Class(C),Architecture(A),Topology(T)andHomologoussuperfamily(H).
1/4/202354生物信息學(xué)二、各大類主要數(shù)據(jù)庫介紹功能數(shù)據(jù)庫KEGGDIPASDBTRRDTRANSFACEPDPROSITE1/4/202355生物信息學(xué)KEGG
京都基因和基因組百科全書(KEGG)是系統(tǒng)分析基因功能,聯(lián)系基因組信息和功能信息的知識庫。基因組信息存儲在GENES數(shù)據(jù)庫里,包括完整和部分測序的基因組序列;更高級的功能信息存儲在PATHWAY數(shù)據(jù)庫里,包括圖解的細胞生化過程如代謝、膜轉(zhuǎn)運、信號傳遞、細胞周期,還包括同系保守的子通路等信息;KEGG的另一個數(shù)據(jù)庫是LIGAND,包含關(guān)于化學(xué)物質(zhì)、酶分子、酶反應(yīng)等信息。KEGG提供了Java的圖形工具來訪問基因組圖譜,比較基因組圖譜和操作表達圖譜,以及其它序列比較、圖形比較和通路計算的工具,可以免費獲取。1/4/202356生物信息學(xué)KEGGhttp://www.kegg.jp/1/4/202357生物信息學(xué)DIP
相互作用的蛋白質(zhì)數(shù)據(jù)庫(DIP)收集了由實驗驗證的蛋白質(zhì)-蛋白質(zhì)相互作用。數(shù)據(jù)庫包括蛋白質(zhì)的信息、相互作用的信息和檢測相互作用的實驗技術(shù)三個部分。用戶可以根據(jù)蛋白質(zhì)、生物物種、蛋白質(zhì)超家族、關(guān)鍵詞、實驗技術(shù)或引用文獻來查詢DIP數(shù)據(jù)庫。DIP的網(wǎng)址是:/1/4/202358生物信息學(xué)DIP/dip/main.cgi1/4/202359生物信息學(xué)ASDB(舊)
可變剪接數(shù)據(jù)庫(ASDB)包括蛋白質(zhì)庫和核酸庫兩部分。ASDB(蛋白質(zhì))部分來源于SWISS-PROT蛋白質(zhì)序列庫,通過選取有可變剪接注釋的序列,搜索相關(guān)可變剪接的序列,經(jīng)過序列比對、篩選和分類構(gòu)建而成。ASDB(核酸)部分來自Genbank中提及和注釋的可變剪接的完整基因構(gòu)成。數(shù)據(jù)庫提供了方便的搜索服務(wù)。ASDB的網(wǎng)址是:/asdb1/4/202360生物信息學(xué)ASDB--ASTD1/4/202361生物信息學(xué)TRRD
轉(zhuǎn)錄調(diào)控區(qū)數(shù)據(jù)庫(TRRD)是在不斷積累的真核生物基因調(diào)控區(qū)結(jié)構(gòu)-功能特性信息基礎(chǔ)上構(gòu)建的。每一個TRRD的條目里包含特定基因各種結(jié)構(gòu)-功能特性:轉(zhuǎn)錄因子結(jié)合位點、啟動子、增強子、靜默子、以及基因表達調(diào)控模式等。TRRD包括五個相關(guān)的數(shù)據(jù)表:TRRDGENES(包含所有TRRD庫基因的基本信息和調(diào)控單元信息);TRRDSITES(包括調(diào)控因子結(jié)合位點的具體信息);TRRDFACTORS(包括TRRD中與各個位點結(jié)合的調(diào)控因子的具體信息);TRRDEXP(包括對基因表達模式的具體描述);TRRDBIB(包括所有注釋涉及的參考文獻)。TRRD主頁提供了對這幾個數(shù)據(jù)表的檢索服務(wù)。TRRD的網(wǎng)址是:http://wwwmgs.bionet.nsc.ru/mgs/dbases/trrd4/1/4/202362生物信息學(xué)TRRD
1/4/202363生物信息學(xué)EPDEPD(http://www.epd.isb-sib.ch/)
是真核基因啟動子數(shù)據(jù)庫提供從EMBL中得到的真核基因的啟動子序列,目標是幫助實驗研究人員、生物信息學(xué)研究人員分析真核基因的轉(zhuǎn)錄信號。1/4/202364生物信息學(xué)EPD1/4/202365生物信息學(xué)PROSITE
PROSITE數(shù)據(jù)庫收集了生物學(xué)有顯著意義的蛋白質(zhì)位點和序列模式,并能根據(jù)這些位點和模式快速和可靠地鑒別一個未知功能的蛋白質(zhì)序列應(yīng)該屬于哪一個蛋白質(zhì)家族。有的情況下,某個蛋白質(zhì)與已知功能蛋白質(zhì)的整體序列相似性很低,但由于功能的需要保留了與功能密切相關(guān)的序列模式,這樣就可能通過PROSITE的搜索找到隱含的功能motif,因此是序列分析的有效工具。PROSITE中涉及的序列模式包括酶的催化位點、配體結(jié)合位點、與金屬離子結(jié)合的殘基、二硫鍵的半胱氨酸、與小分子或其它蛋白質(zhì)結(jié)合的區(qū)域等;除了序列模式之外,PROSITE還包括由多序列比對構(gòu)建的profile,能更敏感地發(fā)現(xiàn)序列與profile的相似性。PROSITE的主頁上提供各種相關(guān)檢索服務(wù)。1/4/202366生物信息學(xué)http://www.expasy.ch/prosite/PROSITE1/4/
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 綜采工作面回撤方案中的安全評估措施
- 海洋工程防感應(yīng)電安全措施
- 鐵路建設(shè)中的安全與風(fēng)險管理措施
- 制造業(yè)保密協(xié)議與管理措施
- 環(huán)保工程實施階段監(jiān)理服務(wù)措施
- 金融機構(gòu)內(nèi)部作風(fēng)紀律問題及改進措施探討
- 科教版小學(xué)科學(xué)家訪談活動計劃
- 環(huán)保組織活動效果評估措施
- 市政工程施工進度及協(xié)調(diào)措施
- 產(chǎn)科醫(yī)生對剖宮產(chǎn)率的管理措施建議
- 《口腔內(nèi)科護理》教學(xué)課件
- 幼兒園教師如何寫論文教學(xué)課件
- 動物性食品的食品安全課件
- 頸動脈狹窄的護理查房
- 中國后循環(huán)缺血的專家共識48506課件
- 信用管理概論課件整書電子教案完整版教學(xué)課件全套ppt教學(xué)教程最全課件最新
- 思想道德與法治全冊教案
- (高職)旅游景區(qū)服務(wù)與管理電子課件完整版PPT全書電子教案
- 唯美動畫生日快樂電子相冊視頻動態(tài)PPT模板
- 設(shè)計文件簽收表(一)
- 試運行方案計劃-
評論
0/150
提交評論