華中農(nóng)業(yè)大學(xué)生物信息學(xué)Bioinf02-2_第1頁
華中農(nóng)業(yè)大學(xué)生物信息學(xué)Bioinf02-2_第2頁
華中農(nóng)業(yè)大學(xué)生物信息學(xué)Bioinf02-2_第3頁
華中農(nóng)業(yè)大學(xué)生物信息學(xué)Bioinf02-2_第4頁
華中農(nóng)業(yè)大學(xué)生物信息學(xué)Bioinf02-2_第5頁
已閱讀5頁,還剩40頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

章數(shù)據(jù)庫(III)生物信息學(xué)EBI(EuropeanBioinformaticsInstitute)管理與GenBank收集的數(shù)據(jù)相同序列數(shù)據(jù)展示方式與GenBank不同(網(wǎng)頁,純文本)數(shù)據(jù)庫主頁“Textsearch”輸入關(guān)鍵詞檢索到的條目每一條目詳細(xì)內(nèi)容(10)ENA(EuropeanNucleotideArchive)(11)DDBJ(DNADataBankofJapan)與GenBank收集的序列數(shù)據(jù)相同數(shù)據(jù)庫主頁

提供基于關(guān)鍵詞及序列的搜索服務(wù)

打開“ARSA”輸入關(guān)鍵詞檢索到的條目每一條目詳細(xì)內(nèi)容與GenBank一致發(fā)表文章要提供Accessionnumber(在三大核苷酸數(shù)據(jù)庫中通用)EPD(EukaryoticPromoterDatabase)

由WeizmannInstituteofScienceinRehovot(Israel)開創(chuàng)收集數(shù)據(jù)的轉(zhuǎn)錄起始位點(TSS)通過實驗確定包括部分cis-element信息同一個基因可以具有多個啟動子原版(EPD)包含4809條真核生物聚合酶II(eukaryoticPOLII)啟動子序列新版(EPDnew)主要包含人類、小鼠和果蠅的大量啟動子信息,總數(shù)超過20萬(12)啟動子數(shù)據(jù)庫PlantProm(plantpromoterdatabase)植物啟動子數(shù)據(jù)庫(水稻、擬南芥)部分收集數(shù)據(jù)的轉(zhuǎn)錄起始位點(TSS)通過實驗確定,其他的有全長cDNA序列支持包括部分cis-element信息最近更新是2009.02,總共8301條植物啟動子序列可以完整下載(12)啟動子數(shù)據(jù)庫(13)miRNA數(shù)據(jù)庫Science309:1522(2005)轉(zhuǎn)錄RNA折疊形成pri-miRNApre-miRNAmiRNARISC攜帶有活性的miRNAmiRNAgenemicroRNA(miRNA)的形成miRBase

收集了28645條hairpinprecursormiRNA序列(第21版,2014.6)來源于>100個物種可以通過miRNA名稱、關(guān)鍵詞、染色體位置等信息檢索數(shù)據(jù)庫分析一條DNA序列中是否可能包含miRNA(第四章介紹)(13)miRNA數(shù)據(jù)庫利用miRNA編號或關(guān)鍵詞檢索(1)在數(shù)據(jù)庫主頁點擊“searching”在“SearchmiRBase”網(wǎng)頁的“BymiRNAidentifierorkeyword”欄目輸入miRNA編號,點擊“提交查詢內(nèi)容”檢索結(jié)果目錄查看詳細(xì)信息利用染色體位置檢索miRNA(2)在數(shù)據(jù)庫主頁點擊“searching”在“SearchmiRBase”網(wǎng)頁的“Bygenomiclocation”欄目選擇物種和染色體,輸入染色體上的核苷酸位置范圍(如1000至1000000),點擊“Getsequences”檢索結(jié)果目錄查看詳細(xì)信息檢索miRNA群(cluster)(3)在數(shù)據(jù)庫主頁點擊“searching”在“SearchmiRBase”網(wǎng)頁的“Forclusters”欄目選擇物種,輸入希望查詢的miRNA之間的距離(核苷酸數(shù)目),點擊“Getclusters”檢索結(jié)果目錄批量獲取maturemiRNA序列:在結(jié)果目錄網(wǎng)頁的“Fetch”列選擇miRNA,在該網(wǎng)頁的底部選擇“Maturesequence”,點擊“FetchSequences”第二章數(shù)據(jù)庫(IV)生物信息學(xué)2、蛋白質(zhì)數(shù)據(jù)庫由PIR、EBI和SIB于2002年創(chuàng)辦,統(tǒng)一了PIR、TrEMBL和Swiss-Prot三個蛋白質(zhì)數(shù)據(jù)庫分為兩個部分:來源于實驗的有詳細(xì)注釋的序列(SwissProt)和自動注釋序列(TrEMBL)與100多個數(shù)據(jù)庫相互參照(cross-reference)可用關(guān)鍵詞(Textsearch)和序列比對(BLASTsimilaritysearch)進行檢索(1)UniProt

/UniRef100:非冗余的UniProt蛋白質(zhì)序列UniRef90:聚類UniRef100中一致性超過90%且80%重疊的蛋白質(zhì),取最長的一條(序列數(shù)壓縮58%)UniRef50:聚類UniRef90中一致性超過50%且80%重疊的蛋白質(zhì),取最長的一條(序列數(shù)壓縮79%)UniProt蛋白質(zhì)數(shù)據(jù)庫的結(jié)構(gòu)在數(shù)據(jù)庫主頁搜索框選擇“ProteinKnowledgebase”庫,使用關(guān)鍵詞檢索結(jié)果頁面,reviewed(Swiss-Prot),unreviewed(TrEMBL)Browsebytaxonomy,keyword,geneontology,enzymeclassorpathway條目詳細(xì)內(nèi)容(1)UniPROT(2)PIR(ProteinInformationResource)

由NationalBiomedicalResearchFoundation創(chuàng)辦信息整合的蛋白質(zhì)序列數(shù)據(jù)庫(iProClass),內(nèi)容/編號與UniProtKB相同,但額外提供到超過160個數(shù)據(jù)庫的鏈接蛋白質(zhì)序列分類數(shù)據(jù)庫(PIRSF),提供不同層級的蛋白質(zhì)家族分類(Superfamily、HomeomorphicFamily和HomeomorphicSubfamily)(2)PIR(ProteinInformationResource)檢索某一蛋白質(zhì)的注釋信息數(shù)據(jù)庫主頁“Search/Analysis”菜單“TextSearch”選擇數(shù)據(jù)庫“iProClass”后輸入關(guān)鍵詞或注冊號檢索結(jié)果列表查看詳細(xì)內(nèi)容檢索某一蛋白質(zhì)分類的信息數(shù)據(jù)庫主頁“Search/Analysis”菜單“TextSearch”選擇數(shù)據(jù)庫“PIRSF”后輸入關(guān)鍵詞或注冊號檢索結(jié)果列表查看詳細(xì)內(nèi)容(3)PRF(ProteinResearchFoundation)

由日本的ProteinResearchFoundation創(chuàng)辦已發(fā)表在雜志上的蛋白質(zhì)序列修飾位點、S-S鍵等兩月更新一次(4)PDBSTR(Re-OrganizedProteinDataBank)

蛋白質(zhì)序列和二級結(jié)構(gòu)碳結(jié)構(gòu)(5)Prosite

蛋白質(zhì)家族結(jié)構(gòu)域3、結(jié)構(gòu)數(shù)據(jù)庫(1)PDB(ProteinDataBank)

由BrookhavenNationalLaboratories創(chuàng)辦蛋白質(zhì)核酸其它117651個結(jié)構(gòu)圖(2016.4.11)可通過關(guān)鍵詞或BLAST系統(tǒng)檢索(第四章介紹)TotalYearlyPDBContentGrowth(1)PDB(ProteinDataBank)使用關(guān)鍵詞或注冊號檢索PDB數(shù)據(jù)庫主頁“Search”框輸入關(guān)鍵詞或注冊號檢索結(jié)果列表查看詳細(xì)內(nèi)容(2)NDB(NucleicAcidDatabase)

包含8,089個核酸分子的結(jié)構(gòu)(2016.3)(3)PDIdb(Protein-DNAInterfaceDatabase)

DNA-蛋白質(zhì)復(fù)合體的X射線衍射結(jié)構(gòu)及分類4、酶和代謝數(shù)據(jù)庫KEGG(KyotoEncyclopediaofGenesandGenomes)各種代謝、遺傳等路徑圖可檢索參于各種路徑的基因檢索Metabolism(1)KEGG主頁點擊“KEGGPATHWAY”“PATHWAY”網(wǎng)頁點擊任一代謝路徑(Metabolism),如糖酵解/糖原異生途徑(Glycolysis/Gluconeogenesis)檢索GeneticInformationProcessing(2)KEGG主頁點擊“KEGGPATHWAY”“PATHWAY”網(wǎng)頁點擊任何遺傳信息(GeneticInformationProcessing)路徑,如Proteinexport路徑可以查看參加這一路徑蛋白質(zhì)的信息KEGG數(shù)據(jù)庫檢索EnvironmentalInformationProcessing(3)KEGG主頁點擊“KEGGPATHWAY”“PATHWAY”網(wǎng)頁點擊任何EnvironmentalInformationProcessing路徑,如MAPKsignalingpathway路徑可以查看與這一路徑相連的其它信號路徑或參加這一路徑的蛋白質(zhì)信息KEGG數(shù)據(jù)庫檢索CellularProcesses(4)KEGG主頁點擊“KEGGPATHWAY”“PATHWAY”網(wǎng)頁點擊任何CellularProcesses路徑,如Cellcycle路徑可以查看與這一路徑相連的其它信號路徑或參加這一路徑的蛋白質(zhì)信息KEGG數(shù)據(jù)庫(2)PKR(ProteinKinaseResource)多種檢索內(nèi)容已知蛋白激酶的序列比較蛋白激酶分類蛋白激酶的三維結(jié)構(gòu)與疾病相關(guān)的蛋白激酶其它內(nèi)容5、物種分類數(shù)據(jù)庫物種分類界(Kingdom)門(Phylum)綱(Class)目(Order)科(Family)屬(Genus)種(Species)每一分類等級下可加設(shè)亞級(Sub-),如亞門、亞綱、亞科等。每一分類等級上可加設(shè)總級(Super-),如總綱、總目、總科等。動物界(Animal)脊索動物門(Chordata)脊椎動物亞門(Vertebrata)哺乳綱(Mammalia)嚙齒目(Rodentia)鼠科(Muridae)小家鼠屬(Mus)小家鼠種(musculus)Mouse:Musmusculus在Taxonomy主頁輸入物種俗名檢索“pig”Taxonomy數(shù)據(jù)庫lineage在Taxonomy主頁輸入物種學(xué)名檢索“Homosapiens”lineage擬南芥(Arabidopsisthaliana)系譜檢索某一物種的系譜(lineage):6、文獻數(shù)據(jù)庫(1)

/PubMed/美國國家醫(yī)學(xué)圖書館的數(shù)據(jù)庫醫(yī)學(xué)、分子生物學(xué)、基礎(chǔ)生物學(xué)5400多種刊物,來源于80多個國家文獻年限:1947年至今提供摘要,全文鏈接免費全文收集在PubMedCentralEuropePubMedCentral(內(nèi)容相同):(2)其它類型的文獻數(shù)據(jù)庫Agricola

/

美國農(nóng)業(yè)部農(nóng)業(yè)圖書館的數(shù)據(jù)庫農(nóng)業(yè)類刊物OMIM(OnlineMendelianInheritanceinMan)/omimNCBI的數(shù)據(jù)庫,每天更新數(shù)據(jù)人類基因、遺傳疾病在NCBI主頁選擇OMIM后輸入關(guān)鍵詞(疾病、基因名稱等)進行檢索條目(2)其它類型的文獻數(shù)據(jù)庫GOPubMed/web/gopubmed/基于PubMed,利用GO和MESH詞表對文獻全面分析快速了解相關(guān)領(lǐng)域文獻的年度分布、期刊分布、地域分布、合作者可視化網(wǎng)絡(luò)等信息可以根據(jù)背景知識、雜志、作者、地域和發(fā)表時間等選項對于查詢結(jié)果進行篩選查詢雜志“NatGenet”有關(guān)人類的研究結(jié)果(2)其它類型的文獻數(shù)據(jù)庫GOPubMed檢索使用關(guān)鍵詞檢索“ricesnpdatabase”查看統(tǒng)計結(jié)果,選擇雜志“NucleicAcidsRes”查看在該雜志中的相關(guān)文獻7、更多的數(shù)據(jù)庫第二章數(shù)據(jù)庫(V)生物信息學(xué)8、向數(shù)據(jù)庫提交和修改核苷酸和蛋白質(zhì)序列提交:Submission修改:Update數(shù)據(jù)庫中的數(shù)據(jù)由大家無償提供,共同享用Accuracy??(1)向GenBank提交或修改核苷酸序列GenBank主頁菜單“Submit”BankIt功能提交序列網(wǎng)上直接提交,簡單方便提交后立刻得到臨時編號二天內(nèi)得到Accessionnumber用Update功能修改GenBank中的序列和相關(guān)信息Accessionnumber不變,修改一次,version的編號就進一位用Sequin方法提交序列可下載的電子表格自動確定CDS、ORF和查找重復(fù)序列BankIt發(fā)表文章需要提交序列(2)向UniProtKB提交或修改蛋白質(zhì)序列使用SPIN網(wǎng)上直接操作,網(wǎng)頁先注冊(Register),然后登陸(Login)填寫電子表格只接收用蛋白質(zhì)直接測序的序列質(zhì)譜數(shù)據(jù)通過email提交到PRIDE由核苷酸序列翻譯得到的蛋白質(zhì)序列將進入TrEMBLMore…

遞交數(shù)據(jù)到NCBI/guide/howto/submit-sequence-data/

遞交數(shù)據(jù)到ENAhttp://www.ebi.ac.uk/ena/about/submit_and_update大規(guī)模數(shù)據(jù)往往需要郵件聯(lián)系9、常用序列格式FAS

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論