生物信息學(xué)資源1_第1頁
生物信息學(xué)資源1_第2頁
生物信息學(xué)資源1_第3頁
生物信息學(xué)資源1_第4頁
生物信息學(xué)資源1_第5頁
已閱讀5頁,還剩65頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

生物信息學(xué)資源1第1頁/共70頁2復(fù)習(xí):細(xì)胞蛋白質(zhì)核酸第二章生物信息學(xué)的生物學(xué)基礎(chǔ)第2頁/共70頁3Questions:1.蛋白質(zhì)二級(jí)結(jié)構(gòu)有哪些?2.真核生物的啟動(dòng)子有什么作用?3.TSS,外顯子和內(nèi)含子的概念。4.如何判斷起始密碼子和終止密碼子??jī)?nèi)含子?5.基因表達(dá)調(diào)節(jié)有哪些?第3頁/共70頁4請(qǐng)畫出示意圖:1.中心法則2.真核生物基因的一般結(jié)構(gòu)第4頁/共70頁5核酸中心法則

復(fù)制

DNA

轉(zhuǎn)錄

逆轉(zhuǎn)錄

復(fù)制

RNA

蛋白質(zhì)

翻譯

調(diào)控第5頁/共70頁6TATA盒

翻譯起始植物C/GAANNATGG動(dòng)物A/GNNATGG

各內(nèi)含子加poly(A)信號(hào)植物G/AATAA1-3動(dòng)物AATAAA

終止密碼子

各個(gè)外顯子

AGGA或

CAAT盒

加帽位點(diǎn)5'm7GpppNp

5'端真核基因的一般結(jié)構(gòu)

TSS

第6頁/共70頁7編號(hào)名稱第一章生物信息學(xué)引論第二章生物信息學(xué)的生物學(xué)基礎(chǔ)第三章生物信息學(xué)數(shù)據(jù)庫資源第四章DNA和蛋白質(zhì)序列分析第五章系統(tǒng)發(fā)生分析第六章基因表達(dá)數(shù)據(jù)分析第七章其他常用生物信息學(xué)工具第八章電子克隆的原理和應(yīng)用第九章基本生物信息學(xué)工具的開發(fā)與應(yīng)用第7頁/共70頁8第三章生物信息學(xué)數(shù)據(jù)庫資源第8頁/共70頁9提綱:模式生物測(cè)序3大核酸數(shù)據(jù)庫蛋白質(zhì)數(shù)據(jù)庫第9頁/共70頁10提綱:模式生物測(cè)序3大核酸數(shù)據(jù)庫蛋白質(zhì)數(shù)據(jù)庫第10頁/共70頁11humanArabidopsisThermotogamaritimaEscherichiacoliBuchnerasp.APSRickettsiaprowazekiiUreaplasmaurealyticumBacillussubtilisDrosophilamelanogasterThermoplasmaacidophilumPlasmodiumfalciparumHelicobacterpylorimouseCaenorhabitiselegansratBorreliaburgorferiBorreliaburgorferiAquifexaeolicusNeisseriameningitidisZ2491Mycobacteriumtuberculosis一、模式生物第11頁/共70頁12模式生物基因組計(jì)劃模式生物基因組計(jì)劃酵母、線蟲、果蠅、細(xì)菌、擬南芥等共約50多種已完成,70余種正在進(jìn)行。目前總量已達(dá)60億堿基對(duì)!第12頁/共70頁virusesplasmidsbacteriafungiplantsalgaeinsectsmollusksreptilesbirdsmammalsGenomesizesinnucleotidepairs(base-pairs)10410810510610710111010109bonyfishamphibians第13頁/共70頁14模式生物(ModelOrganism)病毒(Virus)不具有細(xì)胞形態(tài)結(jié)構(gòu),僅由核酸和蛋白質(zhì)構(gòu)成;如:人艾滋病毒HIV、SARS冠狀病毒體積小,10~300nm;嚴(yán)格的專性細(xì)胞內(nèi)寄生;對(duì)抗生素不敏感。電子顯微鏡下的SARS冠狀病毒100nm第14頁/共70頁15Escherichiacoli

大腸桿菌大腸桿菌是研究得最為詳盡的一個(gè)模式生物。這種只有1.6微米長(zhǎng)的、可以迅速繁殖的單細(xì)胞原核生物,已經(jīng)成為實(shí)驗(yàn)室和基因工程的重要工具。EscherichiacoliO157:H7EscherichiacoliK12模式生物(ModelOrganism)第15頁/共70頁16Saccharomycescerevisiae

釀酒酵母真菌界的單細(xì)胞真核生物,它的全基因組已在1996年測(cè)定。模式生物(ModelOrganism)第16頁/共70頁17秀麗線蟲Caenorhabditiselegans

一種透明的、生活在海灘泥沙中的小蟲。

細(xì)胞數(shù)目一定:成蟲細(xì)胞數(shù)目只有959個(gè),其中包括302個(gè)神經(jīng)元;

有6條染色體,全基因組于1998年測(cè)定,長(zhǎng)9.7Mb

模式生物(ModelOrganism)第17頁/共70頁18Drosophilamelanogaster

果蠅繁殖很快、容易誘發(fā)變異的小昆蟲??傞L(zhǎng)達(dá)1.8億核苷酸。

模式生物(ModelOrganism)第18頁/共70頁19Arabidopsisthaliana

擬南芥?zhèn)€體生活周期只有6周的十字花科小草,是一種理想的模式植物。模式生物(ModelOrganism)第19頁/共70頁20Oryzasativa

水稻單子葉植物模式植物,390-430MB模式生物(ModelOrganism)第20頁/共70頁21模式生物(ModelOrganism)非洲瓜蟾(Xenopuslavias)

1個(gè)受精卵在24小時(shí)內(nèi)分裂到各種器官初具雛形的程度;第21頁/共70頁22模式生物(ModelOrganism)斑馬魚(Daniorerio)身體透明的小魚,生活周期約3個(gè)月,是研究脊椎動(dòng)物發(fā)育過程的良好對(duì)象。第22頁/共70頁23模式生物(ModelOrganism)小鼠(Musmusculus)基因組大小與人類相近,約30億個(gè)核苷酸對(duì);第23頁/共70頁24第24頁/共70頁25第25頁/共70頁26提綱:模式生物測(cè)序3大核酸數(shù)據(jù)庫蛋白質(zhì)數(shù)據(jù)庫第26頁/共70頁27主要的數(shù)據(jù)庫資源核酸序列數(shù)據(jù)庫主要有GenBank,EMBL,DDBJ等.蛋白質(zhì)序列數(shù)據(jù)庫主要有SWISS-PROT,PIR,TrEMBL等,蛋白結(jié)構(gòu)數(shù)據(jù)庫有PDB,MMDB等,與基因組有關(guān)的數(shù)據(jù)庫還有dbEST,OMIM等,第27頁/共70頁283大核酸數(shù)據(jù)庫基因組數(shù)據(jù)庫的相關(guān)背景。主要的基因組數(shù)據(jù)庫資源。重點(diǎn)介紹GenBank第28頁/共70頁29ATTGACTAPrimaryvs.DerivativeDatabasesACGTGCTTGACACGTGAATTGACTATATAGCCGACGTGCACGTGCACGTGCTTGACATTGACATTGACACGTGACGTGACGTGAATTGACTAATTGACTAATTGACTAATTGACTATATAGCCGTATAGCCGTATAGCCGTATAGCCGGenBankTATAGCCGTATAGCCGTATAGCCGTATAGCCGATGACATTGAGAATTATTCCGAGAATTCCGAGAATTATTCCGAGAATTCCSequencingCentersGAGAATTCCGAGAATTCCUniGeneRefSeqGenomeAssemblyLabsCuratorsAlgorithmsTATAGCCGAGCTCCGATACCGATGACAA第29頁/共70頁30DNA序列數(shù)據(jù)庫最早于1982年在歐洲分子生物學(xué)實(shí)驗(yàn)室誕生,隨即就開始了一個(gè)數(shù)據(jù)庫爆炸的時(shí)代。此后不久因一項(xiàng)美國國家健康研究中心與洛斯阿拉莫斯國家實(shí)驗(yàn)室的合同而誕生了GenBank。日本的DNA數(shù)據(jù)庫(DDBJ),在幾年后加入了數(shù)據(jù)收集的合作?;蚪M數(shù)據(jù)庫的發(fā)展歷史第30頁/共70頁31基因組數(shù)據(jù)庫的發(fā)展歷史1988年一次三方會(huì)議之后(現(xiàn)在稱之為“國際DNA序列數(shù)據(jù)庫合作計(jì)劃”)達(dá)成協(xié)議,對(duì)數(shù)據(jù)庫的記錄采用共同的格式現(xiàn)在三個(gè)中心都收集直接提交的數(shù)據(jù),并在三者之間發(fā)布。

第31頁/共70頁32三大基因數(shù)據(jù)庫Genbank

Genbank庫包含了所有已知的核酸序列和蛋白質(zhì)序列,以及與它們相關(guān)的文獻(xiàn)著作和生物學(xué)注釋。它是由美國國立生物技術(shù)信息中心(NCBI)建立和維護(hù)的。

NCBI的網(wǎng)址是:。EMBL核酸序列數(shù)據(jù)庫

由歐洲生物信息學(xué)研究所(EBI)維護(hù)的核酸序列數(shù)據(jù)構(gòu)成,查詢檢索可以通過通過因特網(wǎng)上的序列提取系統(tǒng)(SRS)服務(wù)完成。

數(shù)據(jù)庫網(wǎng)址是:http://www.ebi.ac.uk/embl/。

DDBJ數(shù)據(jù)庫

日本DNA數(shù)據(jù)倉庫(DDBJ)也是一個(gè)全面的核酸序列數(shù)據(jù)庫,與Genbank和EMBL核酸庫合作交換數(shù)據(jù)。使用其主頁上提供的SRS工具進(jìn)行數(shù)據(jù)檢索和序列分析。

DDBJ的網(wǎng)址是:http://www.ddbj.nig.ac.jp/。第32頁/共70頁33GenBankPublicfreeAvailableviaInternetEMBLDataLibraryDDBJ(DNADataBankofJapan)三大基因數(shù)據(jù)庫之間的關(guān)系第33頁/共70頁34/http://www.ddbj.nig.ac.jp/searches-e.htmlhttp://www.ebi.ac.uk/embl/第34頁/共70頁35美國的核酸數(shù)據(jù)庫GenBank〖Banson,D.A.etal.(1998)NucleicAcidsRes.26,1-7〗從1979年開始建設(shè),1982年正式運(yùn)行;第35頁/共70頁36第36頁/共70頁37

歐洲分子生物學(xué)實(shí)驗(yàn)室的EMBL數(shù)據(jù)庫也于1982年開始服務(wù)第37頁/共70頁38第38頁/共70頁39日本于1984年開始建立國家級(jí)的核酸數(shù)據(jù)庫DDBJ,并于1987年正式服務(wù)。第39頁/共70頁40第40頁/共70頁41/http://www.ddbj.nig.ac.jp/searches-e.htmlhttp://www.ebi.ac.uk/embl/第41頁/共70頁42GenBank

/第42頁/共70頁43第43頁/共70頁44第44頁/共70頁45第45頁/共70頁46第46頁/共70頁47提綱:模式生物測(cè)序3大核酸數(shù)據(jù)庫蛋白質(zhì)數(shù)據(jù)庫第47頁/共70頁48蛋白質(zhì)數(shù)據(jù)庫第48頁/共70頁49主要的數(shù)據(jù)庫資源核酸序列數(shù)據(jù)庫主要有GenBank,EMBL,DDBJ等.蛋白質(zhì)序列數(shù)據(jù)庫主要有SWISS-PROT,PIR,TrEMBL等,蛋白結(jié)構(gòu)數(shù)據(jù)庫有PDB,MMDB等,與基因組有關(guān)的數(shù)據(jù)庫還有dbEST,OMIM等,第49頁/共70頁5060年代“蛋白質(zhì)信息資源”(ProteinInformationResource,簡(jiǎn)稱PIR)雛形產(chǎn)生1984年,“蛋白質(zhì)信息資源”(ProteinInformationResource,簡(jiǎn)稱PIR)計(jì)劃正式啟動(dòng),蛋白質(zhì)序列數(shù)據(jù)庫PIR也因此而誕生。1988年,美國的NBRF、日本的國際蛋白質(zhì)信息數(shù)據(jù)庫JIPID和德國的慕尼黑蛋白質(zhì)序列信息中心MIPS合作成立了國際蛋白質(zhì)信息中心(PIR-International),共同收集和維護(hù)蛋白質(zhì)序列數(shù)據(jù)庫PIR。第50頁/共70頁51

除了PIR外,另一個(gè)重要的蛋白質(zhì)序列數(shù)據(jù)庫則是SwissProt。該數(shù)據(jù)庫由瑞士日內(nèi)瓦大學(xué)于1986年創(chuàng)建,目前由瑞士生物信息學(xué)研究所和歐洲生物信息學(xué)研究所EBI共同維護(hù)和管理。

第51頁/共70頁52

PIR和SwissProt是創(chuàng)建最早、使用最為廣泛的兩個(gè)蛋白質(zhì)數(shù)據(jù)庫。蛋白質(zhì)序列數(shù)據(jù)庫TrEMBL是從EMBL中的cDNA序列翻譯得到的。該數(shù)據(jù)庫采用SwissProt數(shù)據(jù)庫格式,包含EMBL數(shù)據(jù)庫中所有編碼序列的翻譯。第52頁/共70頁53

SWISS-PROT

1.瑞士日內(nèi)瓦大學(xué)醫(yī)學(xué)生物化學(xué)系和歐洲生物信息學(xué)研究所(EBI)合作維護(hù)(1986年);

2.在EMBL和GenBank數(shù)據(jù)庫上均建立了鏡像站點(diǎn);3.數(shù)據(jù)庫包括了從EMBL翻譯而來的蛋白質(zhì)序列,這些序列經(jīng)過檢驗(yàn)和注釋;

SWISS-PROT的網(wǎng)址:/sprot第53頁/共70頁54第54頁/共70頁55

PIR(proteininformationresource)1.由美國NCBI翻譯自GenBank的DNA序列(1984年);

2.在EMBL和GenBank數(shù)據(jù)庫上均建立了鏡像站點(diǎn);

3.數(shù)據(jù)依據(jù)注釋的質(zhì)量分為4類。

網(wǎng)址:/分類名稱(Name)說明(Comment)記錄數(shù)(Numberofentries)PIR1已分類、已注釋(Classifiedandannotated)13572PIR2已注釋(Annotated)69368PIR3未核實(shí)(Unverified)7508PIR4未翻譯(Unencodedoruntranslated)196PIR數(shù)據(jù)庫的分類情況(Release51.03)第55頁/共70頁56第56頁/共70頁57蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫第57頁/共70頁58主要的數(shù)據(jù)庫資源核酸序列數(shù)據(jù)庫主要有GenBank,EMBL,DDBJ等.蛋白質(zhì)序列數(shù)據(jù)庫主要有SWISS-PROT,PIR,TrEMBL等,蛋白結(jié)構(gòu)數(shù)據(jù)庫有PDB,MMDB等,與基因組有關(guān)的數(shù)據(jù)庫還有dbEST,OMIM等,第58頁/共70頁59

PDB(proteindatabank)

1.目前最主要的蛋

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論