第二章生物信息學(xué)數(shù)據(jù)庫資源_第1頁
第二章生物信息學(xué)數(shù)據(jù)庫資源_第2頁
第二章生物信息學(xué)數(shù)據(jù)庫資源_第3頁
第二章生物信息學(xué)數(shù)據(jù)庫資源_第4頁
第二章生物信息學(xué)數(shù)據(jù)庫資源_第5頁
已閱讀5頁,還剩97頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第二章生物信息學(xué)數(shù)據(jù)庫資源本文檔共102頁;當前第1頁;編輯于星期三\11點44分1提綱:模式生物測序3大核酸數(shù)據(jù)庫蛋白質(zhì)數(shù)據(jù)庫本文檔共102頁;當前第2頁;編輯于星期三\11點44分2提綱:模式生物測序3大核酸數(shù)據(jù)庫蛋白質(zhì)數(shù)據(jù)庫本文檔共102頁;當前第3頁;編輯于星期三\11點44分3humanArabidopsisThermotogamaritimaEscherichiacoliBuchnerasp.APSRickettsiaprowazekiiUreaplasmaurealyticumBacillussubtilisDrosophilamelanogasterThermoplasmaacidophilumPlasmodiumfalciparumHelicobacterpylorimouseCaenorhabitiselegansratBorreliaburgorferiBorreliaburgorferiAquifexaeolicusNeisseriameningitidisZ2491Mycobacteriumtuberculosis一、模式生物本文檔共102頁;當前第4頁;編輯于星期三\11點44分4模式生物基因組計劃模式生物基因組計劃酵母、線蟲、果蠅、細菌、擬南芥等共約50多種已完成,70余種正在進行。目前總量已達60億堿基對!本文檔共102頁;當前第5頁;編輯于星期三\11點44分5virusesplasmidsbacteriafungiplantsalgaeinsectsmollusksreptilesbirdsmammalsGenomesizesinnucleotidepairs(base-pairs)10410810510610710111010109bonyfishamphibians本文檔共102頁;當前第6頁;編輯于星期三\11點44分6模式生物(ModelOrganism)病毒(Virus)不具有細胞形態(tài)結(jié)構(gòu),僅由核酸和蛋白質(zhì)構(gòu)成;如:人艾滋病毒HIV、SARS冠狀病毒體積小,10~300nm;嚴格的專性細胞內(nèi)寄生;對抗生素不敏感。電子顯微鏡下的SARS冠狀病毒100nm本文檔共102頁;當前第7頁;編輯于星期三\11點44分7Escherichiacoli

大腸桿菌大腸桿菌是研究得最為詳盡的一個模式生物。這種只有1.6微米長的、可以迅速繁殖的單細胞原核生物,已經(jīng)成為實驗室和基因工程的重要工具。EscherichiacoliO157:H7EscherichiacoliK12模式生物(ModelOrganism)本文檔共102頁;當前第8頁;編輯于星期三\11點44分8Saccharomycescerevisiae

釀酒酵母真菌界的單細胞真核生物,它的全基因組已在1996年測定。模式生物(ModelOrganism)本文檔共102頁;當前第9頁;編輯于星期三\11點44分9秀麗線蟲Caenorhabditiselegans

一種透明的、生活在海灘泥沙中的小蟲。細胞數(shù)目一定:成蟲細胞數(shù)目只有959個,其中包括302個神經(jīng)元;

有6條染色體,全基因組于1998年測定,長9.7Mb

模式生物(ModelOrganism)本文檔共102頁;當前第10頁;編輯于星期三\11點44分10Drosophilamelanogaster

果蠅繁殖很快、容易誘發(fā)變異的小昆蟲??傞L達1.8億核苷酸。

模式生物(ModelOrganism)本文檔共102頁;當前第11頁;編輯于星期三\11點44分11Arabidopsisthaliana

擬南芥?zhèn)€體生活周期只有6周的十字花科小草,是一種理想的模式植物。模式生物(ModelOrganism)本文檔共102頁;當前第12頁;編輯于星期三\11點44分12Oryzasativa

水稻單子葉植物模式植物,390-430MB模式生物(ModelOrganism)本文檔共102頁;當前第13頁;編輯于星期三\11點44分13模式生物(ModelOrganism)非洲瓜蟾(Xenopuslavias)1個受精卵在24小時內(nèi)分裂到各種器官初具雛形的程度;本文檔共102頁;當前第14頁;編輯于星期三\11點44分14模式生物(ModelOrganism)斑馬魚(Daniorerio)身體透明的小魚,生活周期約3個月,是研究脊椎動物發(fā)育過程的良好對象。本文檔共102頁;當前第15頁;編輯于星期三\11點44分15模式生物(ModelOrganism)小鼠(Musmusculus)基因組大小與人類相近,約30億個核苷酸對;本文檔共102頁;當前第16頁;編輯于星期三\11點44分16本文檔共102頁;當前第17頁;編輯于星期三\11點44分17本文檔共102頁;當前第18頁;編輯于星期三\11點44分18提綱:模式生物測序3大核酸數(shù)據(jù)庫蛋白質(zhì)數(shù)據(jù)庫本文檔共102頁;當前第19頁;編輯于星期三\11點44分19主要的數(shù)據(jù)庫資源核酸序列數(shù)據(jù)庫主要有GenBank,EMBL,DDBJ等.蛋白質(zhì)序列數(shù)據(jù)庫主要有SWISS-PROT,PIR,TrEMBL等,蛋白結(jié)構(gòu)數(shù)據(jù)庫有PDB,MMDB等,與基因組有關(guān)的數(shù)據(jù)庫還有dbEST,OMIM等,本文檔共102頁;當前第20頁;編輯于星期三\11點44分203大核酸數(shù)據(jù)庫基因組數(shù)據(jù)庫的相關(guān)背景主要的基因組數(shù)據(jù)庫資源重點介紹GenBank本文檔共102頁;當前第21頁;編輯于星期三\11點44分21ATTGACTAPrimaryvs.DerivativeDatabasesACGTGCTTGACACGTGAATTGACTATATAGCCGACGTGCACGTGCACGTGCTTGACATTGACATTGACACGTGACGTGACGTGAATTGACTAATTGACTAATTGACTAATTGACTATATAGCCGTATAGCCGTATAGCCGTATAGCCGGenBankTATAGCCGTATAGCCGTATAGCCGTATAGCCGATGACATTGAGAATTATTCCGAGAATTCCGAGAATTATTCCGAGAATTCCSequencingCentersGAGAATTCCGAGAATTCCUniGeneRefSeqGenomeAssemblyLabsCuratorsAlgorithmsTATAGCCGAGCTCCGATACCGATGACAA本文檔共102頁;當前第22頁;編輯于星期三\11點44分22DNA序列數(shù)據(jù)庫最早于1982年在歐洲分子生物學(xué)實驗室誕生,隨即就開始了一個數(shù)據(jù)庫爆炸的時代。此后不久因一項美國國家健康研究中心與洛斯阿拉莫斯國家實驗室的合同而誕生了GenBank。日本的DNA數(shù)據(jù)庫(DDBJ),在幾年后加入了數(shù)據(jù)收集的合作?;蚪M數(shù)據(jù)庫的發(fā)展歷史本文檔共102頁;當前第23頁;編輯于星期三\11點44分23基因組數(shù)據(jù)庫的發(fā)展歷史1988年一次三方會議之后(現(xiàn)在稱之為“國際DNA序列數(shù)據(jù)庫合作計劃”)達成協(xié)議,對數(shù)據(jù)庫的記錄采用共同的格式現(xiàn)在三個中心都收集直接提交的數(shù)據(jù),并在三者之間發(fā)布。

本文檔共102頁;當前第24頁;編輯于星期三\11點44分24三大基因數(shù)據(jù)庫Genbank

Genbank庫包含了所有已知的核酸序列和蛋白質(zhì)序列,以及與它們相關(guān)的文獻著作和生物學(xué)注釋。它是由美國國立生物技術(shù)信息中心(TheNationalCenterforBiotechnologyInformation,

NCBI)建立和維護的。

NCBI的網(wǎng)址是:。EMBL(TheEuropeanMolecularBiologyLaboratory

)核酸序列數(shù)據(jù)庫

由歐洲生物信息學(xué)研究所(EBI)維護的核酸序列數(shù)據(jù)構(gòu)成,查詢檢索可以通過通過因特網(wǎng)上的序列提取系統(tǒng)(SRS)服務(wù)完成。

數(shù)據(jù)庫網(wǎng)址是:。

DDBJ(DNADataBankofJapan)數(shù)據(jù)庫

日本DNA數(shù)據(jù)倉庫(DDBJ)也是一個全面的核酸序列數(shù)據(jù)庫,與Genbank和EMBL核酸庫合作交換數(shù)據(jù)。使用其主頁上提供的SRS工具進行數(shù)據(jù)檢索和序列分析。

DDBJ的網(wǎng)址是:。本文檔共102頁;當前第25頁;編輯于星期三\11點44分25GenBankPublicfreeAvailableviaInternetEMBLDataLibraryDDBJ(DNADataBankofJapan)三大基因數(shù)據(jù)庫之間的關(guān)系本文檔共102頁;當前第26頁;編輯于星期三\11點44分26本文檔共102頁;當前第27頁;編輯于星期三\11點44分27美國的核酸數(shù)據(jù)庫GenBank〖Banson,D.A.etal.(1998)NucleicAcidsRes.26,1-7〗從1979年開始建設(shè),1982年正式運行。本文檔共102頁;當前第28頁;編輯于星期三\11點44分28本文檔共102頁;當前第29頁;編輯于星期三\11點44分29歐洲分子生物學(xué)實驗室的EMBL數(shù)據(jù)庫也于1982年開始服務(wù)。本文檔共102頁;當前第30頁;編輯于星期三\11點44分30本文檔共102頁;當前第31頁;編輯于星期三\11點44分31日本于1984年開始建立國家級的核酸數(shù)據(jù)庫DDBJ,并于1987年正式服務(wù)。本文檔共102頁;當前第32頁;編輯于星期三\11點44分32本文檔共102頁;當前第33頁;編輯于星期三\11點44分33本文檔共102頁;當前第34頁;編輯于星期三\11點44分34本文檔共102頁;當前第35頁;編輯于星期三\11點44分35本文檔共102頁;當前第36頁;編輯于星期三\11點44分36本文檔共102頁;當前第37頁;編輯于星期三\11點44分37本文檔共102頁;當前第38頁;編輯于星期三\11點44分38提綱:模式生物測序3大核酸數(shù)據(jù)庫蛋白質(zhì)數(shù)據(jù)庫本文檔共102頁;當前第39頁;編輯于星期三\11點44分39蛋白質(zhì)數(shù)據(jù)庫本文檔共102頁;當前第40頁;編輯于星期三\11點44分40主要的數(shù)據(jù)庫資源核酸序列數(shù)據(jù)庫主要有GenBank,EMBL,DDBJ等.蛋白質(zhì)序列數(shù)據(jù)庫主要有SWISS-PROT,PIR,TrEMBL等,蛋白結(jié)構(gòu)數(shù)據(jù)庫有PDB,MMDB等,與基因組有關(guān)的數(shù)據(jù)庫還有dbEST,OMIM等,本文檔共102頁;當前第41頁;編輯于星期三\11點44分4160年代“蛋白質(zhì)信息資源”(ProteinInformationResource,簡稱PIR)雛形產(chǎn)生1984年,“蛋白質(zhì)信息資源”計劃正式啟動,蛋白質(zhì)序列數(shù)據(jù)庫PIR也因此而誕生。1988年,美國的NBRF、日本的國際蛋白質(zhì)信息數(shù)據(jù)庫JIPID和德國的慕尼黑蛋白質(zhì)序列信息中心MIPS合作成立了國際蛋白質(zhì)信息中心(PIR-International),共同收集和維護蛋白質(zhì)序列數(shù)據(jù)庫PIR。本文檔共102頁;當前第42頁;編輯于星期三\11點44分42

PIR(proteininformationresource)1.由美國NCBI翻譯自GenBank的DNA序列(1984年);2.在EMBL和GenBank數(shù)據(jù)庫上均建立了鏡像站點;3.數(shù)據(jù)依據(jù)注釋的質(zhì)量分為4類。

網(wǎng)址:http://www-/分類名稱(Name)說明(Comment)記錄數(shù)(Numberofentries)PIR1已分類、已注釋(Classifiedandannotated)13572PIR2已注釋(Annotated)69368PIR3未核實(Unverified)7508PIR4未翻譯(Unencodedoruntranslated)196PIR數(shù)據(jù)庫的分類情況(Release51.03)本文檔共102頁;當前第43頁;編輯于星期三\11點44分43本文檔共102頁;當前第44頁;編輯于星期三\11點44分44除了PIR外,另一個重要的蛋白質(zhì)序列數(shù)據(jù)庫則是SwissProt。該數(shù)據(jù)庫由瑞士日內(nèi)瓦大學(xué)于1986年創(chuàng)建,目前由瑞士生物信息學(xué)研究所和歐洲生物信息學(xué)研究所EBI共同維護和管理。

本文檔共102頁;當前第45頁;編輯于星期三\11點44分45

SWISS-PROT

1.瑞士日內(nèi)瓦大學(xué)醫(yī)學(xué)生物化學(xué)系和歐洲生物信息學(xué)研究所(EBI)合作維護(1986年);2.在EMBL和GenBank數(shù)據(jù)庫上均建立了鏡像站點;3.數(shù)據(jù)庫包括了從EMBL翻譯而來的蛋白質(zhì)序列,這些序列經(jīng)過檢驗和注釋;

SWISS-PROT的網(wǎng)址:本文檔共102頁;當前第46頁;編輯于星期三\11點44分46本文檔共102頁;當前第47頁;編輯于星期三\11點44分47

PIR和SwissProt是創(chuàng)建最早、使用最為廣泛的兩個蛋白質(zhì)數(shù)據(jù)庫。蛋白質(zhì)序列數(shù)據(jù)庫TrEMBL是從EMBL中的cDNA序列翻譯得到的。該數(shù)據(jù)庫采用SwissProt數(shù)據(jù)庫格式,包含EMBL數(shù)據(jù)庫中所有編碼序列的翻譯。TrEMBL:本文檔共102頁;當前第48頁;編輯于星期三\11點44分48蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫本文檔共102頁;當前第49頁;編輯于星期三\11點44分49主要的數(shù)據(jù)庫資源核酸序列數(shù)據(jù)庫主要有GenBank,EMBL,DDBJ等.蛋白質(zhì)序列數(shù)據(jù)庫主要有SWISS-PROT,PIR,TrEMBL等,蛋白結(jié)構(gòu)數(shù)據(jù)庫有PDB,MMDB等,與基因組有關(guān)的數(shù)據(jù)庫還有dbEST,OMIM等,本文檔共102頁;當前第50頁;編輯于星期三\11點44分50

PDB(proteindatabank)1.目前最主要的蛋白質(zhì)分子結(jié)構(gòu)數(shù)據(jù)庫;2.1970年代建立,美國Brookhaven國家實驗室維護管理;3.1988年,由美國RCSB(researchcollaboratoryforstructuralbiology)管理;4.以文本格式存放數(shù)據(jù),包括原子坐標、物種來源、測定方法、提交者信息、一級結(jié)構(gòu)、二級結(jié)構(gòu)等;

PDB的網(wǎng)址:http://(美國)本文檔共102頁;當前第51頁;編輯于星期三\11點44分51本文檔共102頁;當前第52頁;編輯于星期三\11點44分52本文檔共102頁;當前第53頁;編輯于星期三\11點44分53如何AccessPDB記錄?本文檔共102頁;當前第54頁;編輯于星期三\11點44分54如何AccessPDB記錄?本文檔共102頁;當前第55頁;編輯于星期三\11點44分55如何AccessPDB記錄?本文檔共102頁;當前第56頁;編輯于星期三\11點44分56如何AccessPDB記錄?DownloadPDBfileViewPDBfileStructureviewoptions本文檔共102頁;當前第57頁;編輯于星期三\11點44分57如何AccessPDB記錄?本文檔共102頁;當前第58頁;編輯于星期三\11點44分58如何AccessPDB記錄?本文檔共102頁;當前第59頁;編輯于星期三\11點44分59Questions:下列數(shù)據(jù)庫分別是什么類型的數(shù)據(jù)庫?GenBank,PIR,DDBJ,SWISS-PROT,PDB,EMBL,TrEMBL,本文檔共102頁;當前第60頁;編輯于星期三\11點44分60第三章生物信息學(xué)數(shù)據(jù)庫資源--數(shù)據(jù)庫查詢本文檔共102頁;當前第61頁;編輯于星期三\11點44分61本文檔共102頁;當前第62頁;編輯于星期三\11點44分62本文檔共102頁;當前第63頁;編輯于星期三\11點44分63本文檔共102頁;當前第64頁;編輯于星期三\11點44分64PubMed的特點收錄的文獻多!!大部分與生命科學(xué)相關(guān)自動詞語匹配鏈接點多,部分在網(wǎng)上免費獲得全文也可以直接定購原文本文檔共102頁;當前第65頁;編輯于星期三\11點44分65二、檢索規(guī)則本文檔共102頁;當前第66頁;編輯于星期三\11點44分66二、檢索規(guī)則本文檔共102頁;當前第67頁;編輯于星期三\11點44分67本文檔共102頁;當前第68頁;編輯于星期三\11點44分68本文檔共102頁;當前第69頁;編輯于星期三\11點44分69本文檔共102頁;當前第70頁;編輯于星期三\11點44分70復(fù)雜檢索限制字段類別常用的有:Author:BaoYM[au]Title:stress[ti]Tilte/Abstract:stress[title/abstract]Date:1999:2009[dp]

本文檔共102頁;當前第71頁;編輯于星期三\11點44分71復(fù)雜檢索布爾邏輯運算:AND、OR、NOT必須大寫。邏輯符的運算次序是從左至右,括號內(nèi)的檢索式可作為一個單元,優(yōu)先運行。布爾邏輯檢索允許在檢索詞后面附加字段標識例如:rice[ti]ANDBaoYM[au]AND2008:2009[dp]本文檔共102頁;當前第72頁;編輯于星期三\11點44分72本文檔共102頁;當前第73頁;編輯于星期三\11點44分73Question1:如何查找由ZhuJ實驗室于2005以后發(fā)表的,題目中顯示關(guān)于水稻的文獻?本文檔共102頁;當前第74頁;編輯于星期三\11點44分74Question2:如:我要查找BaoYM在Nature或Science上發(fā)表的論文1BaoYM[au]AND(Nature[Journal]ORScience[Journal])

2BaoYM[au]ANDNatureORScience[Journal]

3BaoYM[au]ANDNature[Journal]ORScience[Journal]4BaoYM[au]AND(NatureORScience)[Journal]哪一個檢索語言是正確的?本文檔共102頁;當前第75頁;編輯于星期三\11點44分75在PubMed頁面上選擇AdvancedSearch:本文檔共102頁;當前第76頁;編輯于星期三\11點44分76在PubMed頁面上選擇AdvancedSearch:本文檔共102頁;當前第77頁;編輯于星期三\11點44分77在PubMed頁面上選擇Limits:本文檔共102頁;當前第78頁;編輯于星期三\11點44分78在PubMed頁面上選擇Limits:本文檔共102頁;當前第79頁;編輯于星期三\11點44分79如何獲取GenBank中的序列?本文檔共102頁;當前第80頁;編輯于星期三\11點44分80同樣存在限制字段:常用的有:Author:XingJY[au]

title:BMAL1[ti]organism:pig[organism]或者直接輸入:Accession:

HQ657211[Accession]GeneName:BMAL1[GeneName]ProteinName:BMAL1

[ProteinName]如:XingJY[au]ANDBMAL1[ti]ANDpig[organism]如果沒有限定,就是任意字段。如何獲取GenBank中的序列?本文檔共102頁;當前第81頁;編輯于星期三\11點44分81本文檔共102頁;當前第82頁;編輯于星期三\11點44分82Question:查找XingJY發(fā)布的DNA序列.本文檔共102頁;當前第83頁;編輯于星期三\11點44分83本文檔共102頁;當前第84頁;編輯于星期三\11點44分84直接錄入注冊號查詢:本文檔共102頁;當前第85頁;編輯于星期三\11點44分85本文檔共102頁;當前第86頁;編輯于星期三

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論