版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
生物信息學(xué)(bioinformatics)
在生命科學(xué)研究中發(fā)展起來的一門由分子生物學(xué)與計(jì)算機(jī)信息處理技術(shù)相結(jié)合,以計(jì)算機(jī)為研究工具對生物信息進(jìn)行獲取、處理、儲(chǔ)存、傳播、分析、模擬和解釋的交叉學(xué)科。本文檔共65頁;當(dāng)前第1頁;編輯于星期二\3點(diǎn)6分生物信息學(xué)研究內(nèi)容它利用數(shù)據(jù)庫技術(shù)和軟件技術(shù)對大量積累的生物大分子序列數(shù)據(jù)進(jìn)行比較和分析,揭示出生物大分子的分子結(jié)構(gòu)、功能和進(jìn)化關(guān)系以及基因組構(gòu)成與基因表達(dá)等生物學(xué)事件對生命活動(dòng)的影響。
本文檔共65頁;當(dāng)前第2頁;編輯于星期二\3點(diǎn)6分生物信息學(xué)研究重點(diǎn)主要體現(xiàn)在基因組學(xué)(genomics)和蛋白質(zhì)組學(xué)(proteomics)兩方面。它從核酸和蛋白質(zhì)序列出發(fā),分析序列中與結(jié)構(gòu)、功能相關(guān)的生物信息的表達(dá)。本文檔共65頁;當(dāng)前第3頁;編輯于星期二\3點(diǎn)6分生物信息學(xué)數(shù)據(jù)庫生物信息學(xué)中的各類數(shù)據(jù)庫幾乎覆蓋了生命科學(xué)的各個(gè)領(lǐng)域,如核酸序列數(shù)據(jù)庫,蛋白質(zhì)序列數(shù)據(jù)庫,蛋白質(zhì)、核酸、多糖的三維結(jié)構(gòu)數(shù)據(jù)庫,基因組數(shù)據(jù)庫,文獻(xiàn)數(shù)據(jù)庫和其他種類數(shù)據(jù)庫。本文檔共65頁;當(dāng)前第4頁;編輯于星期二\3點(diǎn)6分生物信息學(xué)數(shù)據(jù)庫分類
生物信息數(shù)據(jù)庫種類繁多,就目前來看,大體可以分為四個(gè)大類:
1.基因組數(shù)據(jù)庫;
2.核酸和蛋白質(zhì)一級結(jié)構(gòu)序列數(shù)據(jù)庫;
3.生物大分子(主要是蛋白質(zhì))三維空間結(jié)構(gòu)數(shù)據(jù)庫;
4.根據(jù)以上三類數(shù)據(jù)庫和文獻(xiàn)資料為基礎(chǔ)構(gòu)建的二次數(shù)據(jù)庫。也稱專門數(shù)據(jù)庫、專業(yè)數(shù)據(jù)庫或?qū)S脭?shù)據(jù)庫。一次數(shù)據(jù)庫本文檔共65頁;當(dāng)前第5頁;編輯于星期二\3點(diǎn)6分第二節(jié)核酸序列數(shù)據(jù)庫
Section2NucleicAcidsequenceDatabases自20世紀(jì)80年代第一個(gè)核酸數(shù)據(jù)庫建立以來,核酸數(shù)據(jù)庫迅速發(fā)展。在互聯(lián)網(wǎng)上不僅有核酸序列數(shù)據(jù)庫,還出現(xiàn)了基因組相關(guān)數(shù)據(jù)庫、核酸三維結(jié)構(gòu)數(shù)據(jù)庫、基因表達(dá)數(shù)據(jù)庫、人類基因突變及疾病相關(guān)數(shù)據(jù)庫、進(jìn)化相關(guān)數(shù)據(jù)庫及其他與核酸有關(guān)的數(shù)據(jù)庫。本文檔共65頁;當(dāng)前第6頁;編輯于星期二\3點(diǎn)6分三大核酸序列數(shù)據(jù)庫GenBankEMBLDDBJ
本文檔共65頁;當(dāng)前第7頁;編輯于星期二\3點(diǎn)6分特殊類型核酸序列數(shù)據(jù)庫:非編碼RNA數(shù)據(jù)庫(ncRNA);表達(dá)序列標(biāo)簽數(shù)據(jù)庫(dbEST);序列標(biāo)簽位點(diǎn)數(shù)據(jù)庫(dbSTS);miRBase;tRNAdb等。本文檔共65頁;當(dāng)前第8頁;編輯于星期二\3點(diǎn)6分基因組相關(guān)數(shù)據(jù)庫:人類基因組數(shù)據(jù)庫(HGD);基因組序列數(shù)據(jù)庫(GSDB);基因組在線數(shù)據(jù)庫(GOLD)等。本文檔共65頁;當(dāng)前第9頁;編輯于星期二\3點(diǎn)6分核酸三維結(jié)構(gòu)數(shù)據(jù)庫:核苷酸三維結(jié)構(gòu)數(shù)據(jù)庫(NDB);普納大學(xué)核酸結(jié)構(gòu)數(shù)據(jù)庫(BNASDB)等。本文檔共65頁;當(dāng)前第10頁;編輯于星期二\3點(diǎn)6分基因表達(dá)數(shù)據(jù)庫:基因表達(dá)庫(GEO);斯坦福微陣列數(shù)據(jù)庫(SMD);ArrayExpress;CGED;GXD;BodyMap等。本文檔共65頁;當(dāng)前第11頁;編輯于星期二\3點(diǎn)6分人類基因突變及疾病相關(guān)數(shù)據(jù)庫:人類基因變異數(shù)據(jù)庫(HMGD)、人類遺傳雙等位基因序列數(shù)據(jù)庫(HGBASE)、人類孟德爾遺傳在線(OMIM)、國際單體型計(jì)劃(HapMap)、人類單核苷酸多態(tài)性數(shù)據(jù)庫(dbSNP)、腫瘤基因數(shù)據(jù)庫(TGDB)、疾病關(guān)聯(lián)數(shù)據(jù)庫(GAD)、癌癥基因數(shù)據(jù)庫(CGAP)、人類表觀遺傳數(shù)據(jù)庫(HEP)、人類DNA甲基化與癌癥數(shù)據(jù)庫(MethylCancer)等。本文檔共65頁;當(dāng)前第12頁;編輯于星期二\3點(diǎn)6分一、GenBank數(shù)據(jù)庫GenBank()是一個(gè)綜合數(shù)據(jù)庫,該數(shù)據(jù)庫中包含了已經(jīng)公開的30萬余種不同物種生物的核酸序列,這些數(shù)據(jù)主要來源于全世界不同實(shí)驗(yàn)室和大規(guī)模測序計(jì)劃項(xiàng)目。
本文檔共65頁;當(dāng)前第13頁;編輯于星期二\3點(diǎn)6分GenBank是具有目錄和生物學(xué)注釋的核酸序列綜合數(shù)據(jù)庫,由美國國家醫(yī)學(xué)圖書館的國家生物技術(shù)信息中心構(gòu)建、維護(hù)和管理。該中心位于美國馬里蘭國家健康研究所(NIH)。GenBank數(shù)據(jù)庫的序列數(shù)據(jù)來源于序列發(fā)現(xiàn)者提交的序列、批量提交的表達(dá)序列標(biāo)簽(expressedsequencetag,EST)、基因組測序序列(genomesurveysequence,GSS)和其他測序中心提供的高通量數(shù)據(jù),還包括美國專利商標(biāo)局提供的已發(fā)表專利的序列數(shù)據(jù)。本文檔共65頁;當(dāng)前第14頁;編輯于星期二\3點(diǎn)6分GenBank數(shù)據(jù)庫每天與歐洲分子生物學(xué)實(shí)驗(yàn)室的核酸序列數(shù)據(jù)庫(EuropeanMolecularBiologyLaboratoryNucleotideSequenceDatabase,EMBL)和日本的DNA數(shù)據(jù)庫(DNADataBankofJapanDDBJ)進(jìn)行數(shù)據(jù)交換,以保證數(shù)據(jù)庫內(nèi)容在全世界范圍的同步性。本文檔共65頁;當(dāng)前第15頁;編輯于星期二\3點(diǎn)6分在NCBI()的主頁上提供了進(jìn)入GenBank的路徑、相關(guān)檢索和分析服務(wù)。通過NCBI的檢索系統(tǒng)(Entrez)可以進(jìn)入GenBank。Entrez檢索程序整合了主要的DNA和蛋白序列數(shù)據(jù)的分類學(xué)、基因組、圖譜、蛋白結(jié)構(gòu)和結(jié)構(gòu)(功能)域信息,還包括相關(guān)的PubMed的生物醫(yī)學(xué)文獻(xiàn)信息。BLAST程序提供GenBank和其他序列數(shù)據(jù)庫中序列相似性搜索服務(wù)。
本文檔共65頁;當(dāng)前第16頁;編輯于星期二\3點(diǎn)6分(一)GenBank數(shù)據(jù)庫結(jié)構(gòu)1.依據(jù)序列的物種來源分類2.Genbank記錄和分類2.1表達(dá)序列標(biāo)簽(EST)2.2序列標(biāo)簽位點(diǎn)(STS)、基因組勘測序列(GSS)和環(huán)境樣品序列(ENV)2.3高通量基因組(HTG)和高通量cDNA(HTC)序列2.4全基因組鳥槍測序序列(WGS)2.5轉(zhuǎn)錄組鳥槍組合序列本文檔共65頁;當(dāng)前第17頁;編輯于星期二\3點(diǎn)6分(一)GenBank數(shù)據(jù)庫結(jié)構(gòu)3.特殊記錄類型3.1第三方注釋(TPA)3.2GenBankCON記錄較小記錄組合記錄本文檔共65頁;當(dāng)前第18頁;編輯于星期二\3點(diǎn)6分(二)構(gòu)建數(shù)據(jù)庫1.直接電子提交1.1使用BankIt提交1.2使用Sequin和tbl2asn提交1.3條形碼序列提交2.序列標(biāo)識(shí)符和記錄號本文檔共65頁;當(dāng)前第19頁;編輯于星期二\3點(diǎn)6分(三)檢索GenBank數(shù)據(jù)1.Entrez系統(tǒng)()2.與測序計(jì)劃檢索相關(guān)的序列記錄()3.BLAST序列相似性搜索()4.用FTP獲取GenBank()本文檔共65頁;當(dāng)前第20頁;編輯于星期二\3點(diǎn)6分二、EMBL數(shù)據(jù)庫EMBL建立于1980年,EMBL核苷序列數(shù)據(jù)庫()是歐洲主要的核苷序列收集單位,歐洲生物信息中心EBI(即EMBL在德國海德堡的站點(diǎn))維護(hù)這個(gè)數(shù)據(jù)庫。核苷數(shù)據(jù)來自基因組測序中心、世界各地的科學(xué)家、歐洲專利局、以及與合作伙伴DDBJ(Japan)和GenBank(USA)交換的數(shù)據(jù)。本文檔共65頁;當(dāng)前第21頁;編輯于星期二\3點(diǎn)6分三、DDBJ數(shù)據(jù)庫日本DNA數(shù)據(jù)庫(DDBJ)是在亞洲唯一的核酸序列數(shù)據(jù)庫,是搜集研究者公認(rèn)的測定核酸序列的數(shù)據(jù)庫,并且發(fā)放給數(shù)據(jù)提交者國際認(rèn)證的核酸序列編號。由于DDBJ每天將搜集的數(shù)據(jù)與EMBL-Bank/EBI和GenBank/NCBI進(jìn)行交換,使得三個(gè)核酸數(shù)據(jù)庫幾乎在任何時(shí)候都享有相同數(shù)據(jù)。DDBJ主要收集來自日本研究者獲得的序列數(shù)據(jù),但也收集數(shù)據(jù)和發(fā)放編號給任何其他國家的研究者。本文檔共65頁;當(dāng)前第22頁;編輯于星期二\3點(diǎn)6分四、其他重要的核酸序列數(shù)據(jù)庫dbEST:dbEST是GenBank中的一個(gè)子數(shù)據(jù)庫,包含來源于不同物種的表達(dá)序列數(shù)據(jù)和表達(dá)序列標(biāo)簽序列的其他信息。ncRNAdb:非編碼RNA(non-codingRNAncRNA)數(shù)據(jù)庫旨在提供非編碼RNA的序列和功能信息。miRBase:miRBase序列數(shù)據(jù)庫主要存放已發(fā)表的微小RNA(microRNAmiRNA)序列和注釋的數(shù)據(jù)庫。本文檔共65頁;當(dāng)前第23頁;編輯于星期二\3點(diǎn)6分第三節(jié)蛋白質(zhì)序列數(shù)據(jù)庫
Section3ProteinSequenceDatabase
隨著分子生物學(xué)的發(fā)展,人們獲得了越來越多關(guān)于蛋白質(zhì)序列、結(jié)構(gòu)和功能的信息。世界各國的生物學(xué)家和計(jì)算機(jī)科學(xué)家合作利用這些信息構(gòu)建了蛋白質(zhì)序列數(shù)據(jù)庫、蛋白質(zhì)三維結(jié)構(gòu)數(shù)據(jù)庫、蛋白質(zhì)組數(shù)據(jù)庫(二維凝膠電泳數(shù)據(jù)庫)、信號傳導(dǎo)及蛋白質(zhì)-蛋白質(zhì)相互作用相關(guān)數(shù)據(jù)庫、DNA和蛋白質(zhì)相互作用數(shù)據(jù)庫等蛋白質(zhì)相關(guān)數(shù)據(jù)庫。
本文檔共65頁;當(dāng)前第24頁;編輯于星期二\3點(diǎn)6分常用的蛋白質(zhì)序列數(shù)據(jù)庫:PIRMIPSSwiss-Prot本文檔共65頁;當(dāng)前第25頁;編輯于星期二\3點(diǎn)6分蛋白質(zhì)功能、結(jié)構(gòu)域和蛋白質(zhì)家族有關(guān)的數(shù)據(jù)庫:PROSITEInterProPfamProDomSMART等本文檔共65頁;當(dāng)前第26頁;編輯于星期二\3點(diǎn)6分蛋白質(zhì)三維結(jié)構(gòu)相關(guān)數(shù)據(jù)庫:PDBBioMagResBankSWISS-MODELRepositoryModBaseCATHSCOPReLiBaseTOPSSWISS-3DIMAGEBioImage等本文檔共65頁;當(dāng)前第27頁;編輯于星期二\3點(diǎn)6分蛋白質(zhì)二維凝膠電泳數(shù)據(jù)庫:WORLD-2DPAGEPhoretixlinks本文檔共65頁;當(dāng)前第28頁;編輯于星期二\3點(diǎn)6分信號傳導(dǎo)及蛋白質(zhì)-蛋白質(zhì)相互作用相關(guān)數(shù)據(jù)庫:DIPINTERACTProNetKEGGCANSITESPADCSNDB等本文檔共65頁;當(dāng)前第29頁;編輯于星期二\3點(diǎn)6分DNA和蛋白質(zhì)相互作用數(shù)據(jù)庫:DPInteract蛋白質(zhì)翻譯后修飾相關(guān)數(shù)據(jù)庫:O-GlycBase、PhosphoBase、RES蛋白質(zhì)等蛋白質(zhì)本文檔共65頁;當(dāng)前第30頁;編輯于星期二\3點(diǎn)6分一、PIR數(shù)據(jù)庫蛋白質(zhì)信息庫(PIR)()是一個(gè)支持基因組學(xué)、蛋白質(zhì)組學(xué)和系統(tǒng)生物學(xué)檢索和科學(xué)研究的綜合公共生物信息學(xué)資源。PIR是由美國國家生物醫(yī)學(xué)基金會(huì)(NBRF)于1984年建立,幫助研究者確認(rèn)和解釋蛋白序列信息的數(shù)據(jù)庫。PIR免費(fèi)為科學(xué)界提供包括蛋白序列數(shù)據(jù)庫(PSD)在內(nèi)的蛋白數(shù)據(jù)庫和分析工具。本文檔共65頁;當(dāng)前第31頁;編輯于星期二\3點(diǎn)6分PIR信息庫資源本文檔共65頁;當(dāng)前第32頁;編輯于星期二\3點(diǎn)6分PIR主要數(shù)據(jù)庫:1.UniProt-通用蛋白質(zhì)資源庫2.iProClass-蛋白質(zhì)知識(shí)整合數(shù)據(jù)庫3.PIRSF-蛋白質(zhì)家族分類系統(tǒng)4.iProLINK-蛋白質(zhì)文獻(xiàn)、信息和知識(shí)整合數(shù)據(jù)庫本文檔共65頁;當(dāng)前第33頁;編輯于星期二\3點(diǎn)6分1.UniProt-通用蛋白質(zhì)資源庫UniProt()是存儲(chǔ)和鏈接其他蛋白質(zhì)數(shù)據(jù)庫的資源庫,并且是蛋白質(zhì)序列和具有綜合功能注釋目錄的中心資源庫。使用UniprotKB可以檢索準(zhǔn)確、可靠的蛋白綜合信息。使用UniRef可以減少冗余,加速序列相似性搜索。使用UniParc可以檢索存檔序列和它們來源的數(shù)據(jù)庫。本文檔共65頁;當(dāng)前第34頁;編輯于星期二\3點(diǎn)6分2.iProClass-蛋白質(zhì)知識(shí)整合數(shù)據(jù)庫iProClass()提供來自90多個(gè)生物學(xué)數(shù)據(jù)庫的大量整合數(shù)據(jù),包括蛋白ID圖譜服務(wù)、UniProtKB編注蛋白質(zhì)摘要描述和篩選UnParc數(shù)據(jù)庫的蛋白質(zhì)序列。使用iProClass可以檢索最新的蛋白質(zhì)綜合信息,包括:功能、轉(zhuǎn)導(dǎo)通路、相互作用、家族分類、基因和基因組、功能注釋標(biāo)準(zhǔn)體系(ontology)、文獻(xiàn)和分類學(xué)信息。使用iProClass還可以檢索ID圖譜、蛋白質(zhì)詞典和相關(guān)序列。本文檔共65頁;當(dāng)前第35頁;編輯于星期二\3點(diǎn)6分3.PIRSF-蛋白質(zhì)家族分類系統(tǒng)PIRSF()分類系統(tǒng)概要論述家族的特征,如家族名稱、分類分布、分級和功能域結(jié)構(gòu),以及家族成員,包括功能、結(jié)構(gòu)、傳導(dǎo)通路、功能注釋標(biāo)準(zhǔn)體系(ontology)和家族分類。利用這些信息可以獲得蛋白質(zhì)的準(zhǔn)確功能或預(yù)測的功能和該蛋白質(zhì)所屬家族成員共有的其他特征。本文檔共65頁;當(dāng)前第36頁;編輯于星期二\3點(diǎn)6分4.iProLINK-蛋白質(zhì)文獻(xiàn)、信息和知識(shí)整合數(shù)據(jù)庫iProLINK()提供有關(guān)注釋內(nèi)容的文獻(xiàn)、蛋白質(zhì)名稱詞典和其他有助于文獻(xiàn)挖掘的人文語言處理技術(shù)開發(fā)的信息、數(shù)據(jù)庫校正、蛋白質(zhì)名稱標(biāo)記和功能注釋標(biāo)準(zhǔn)體系(ontology)。使用iProLINK可以獲得描述蛋白質(zhì)記錄的文本文獻(xiàn)資源,在UniProtKB記錄(生物詞典)中加入蛋白質(zhì)或基因命名的圖譜,獲得用于開發(fā)文本挖掘算法的注釋數(shù)據(jù)集、挖掘蛋白質(zhì)磷酸化(RLIMS-P)文獻(xiàn)和獲得蛋白質(zhì)功能注釋標(biāo)準(zhǔn)體系(ontology)(PRO)信息。本文檔共65頁;當(dāng)前第37頁;編輯于星期二\3點(diǎn)6分二、MIPS數(shù)據(jù)庫慕尼黑蛋白質(zhì)序列信息中心(MIPS)(),它的重點(diǎn)工作是基因組生物信息學(xué),特別注重基因組信息系統(tǒng)分析,包括應(yīng)用生物信息學(xué)方法注釋基因組、表達(dá)分析和蛋白質(zhì)組學(xué)方面研究。MIPS支持和維護(hù)一系列基因組數(shù)據(jù)庫以及系統(tǒng),可以提供細(xì)菌、真菌和植物基因組比較分析服務(wù)。在該站點(diǎn)提供基因組分析工具、數(shù)據(jù)庫檢索系統(tǒng)、表達(dá)分析、蛋白相互作用等網(wǎng)絡(luò)服務(wù)。
本文檔共65頁;當(dāng)前第38頁;編輯于星期二\3點(diǎn)6分三、其他重要的蛋白質(zhì)序列數(shù)據(jù)庫:PRINTSPfam本文檔共65頁;當(dāng)前第39頁;編輯于星期二\3點(diǎn)6分(一)PRINTSPRINTS()是蛋白基序指紋圖綜合數(shù)據(jù)庫,每個(gè)指紋圖都是使用數(shù)據(jù)掃描程序ADSP或VISTAS序列分析軟件包反復(fù)優(yōu)化后定義的。數(shù)據(jù)庫中有兩種類型指紋圖,根據(jù)指紋圖的復(fù)雜性分為簡單和復(fù)合指紋圖:簡單指紋圖基本上是單一的基序,而復(fù)合指紋圖包含多個(gè)基序。
本文檔共65頁;當(dāng)前第40頁;編輯于星期二\3點(diǎn)6分(二)Pfam蛋白質(zhì)一般是由一個(gè)或多個(gè)功能區(qū)域組成,這些功能區(qū)域通常稱作域(domain)。在不同的蛋白質(zhì)中不同的域以不同的組合出現(xiàn),導(dǎo)致在自然界發(fā)現(xiàn)多種多樣組成成分的蛋白質(zhì)。識(shí)別出現(xiàn)在蛋白質(zhì)中的域可以了解蛋白質(zhì)的功能。Pfam數(shù)據(jù)庫()是一個(gè)大的蛋白質(zhì)域家族集合,每個(gè)家族是用多序列比對和隱馬模型(HMMs)分析結(jié)果的代表。本文檔共65頁;當(dāng)前第41頁;編輯于星期二\3點(diǎn)6分第四節(jié)NCBI與EBI
Section4NCBIandEBI一、NCBI的簡介二、EBI簡介本文檔共65頁;當(dāng)前第42頁;編輯于星期二\3點(diǎn)6分一、NCBI的簡介作為一個(gè)國家分子生物學(xué)信息資源,NCBI的使命是開發(fā)新的信息技術(shù),幫助理解控制健康和疾病的基本分子和遺傳過程。特別是,NCBI肩負(fù)建立存儲(chǔ)和分析分子生物學(xué)、生物化學(xué)和遺傳學(xué)知識(shí)的自動(dòng)系統(tǒng);提供研究和醫(yī)學(xué)界使用方便的數(shù)據(jù)庫和軟件;努力協(xié)調(diào)搜集國內(nèi)外生物技術(shù)信息;執(zhí)行分析生物學(xué)重要分子結(jié)構(gòu)和功能的先進(jìn)研究方法。本文檔共65頁;當(dāng)前第43頁;編輯于星期二\3點(diǎn)6分二、EBI簡介歐洲生物信息學(xué)研究所(EMBL-EBI),是歐洲分子生物學(xué)實(shí)驗(yàn)室(EMBL)的一部分,EMBL-EBI維護(hù)世界上最廣泛的分子數(shù)據(jù)庫。EMBL-EBI是在全球范圍內(nèi),努力協(xié)調(diào)搜集和傳播生物學(xué)數(shù)據(jù)的歐洲節(jié)點(diǎn),EMBL-EBI的許多數(shù)據(jù)庫是生物學(xué)家們熟知的,包括:EMBL-Bank(DNA和RNA序列)、Ensemble(基因組)、ArrayExpress(基于微陣列的基因表達(dá)數(shù)據(jù))、UniProt(蛋白質(zhì)序列)、InterPro(蛋白家族、域和基序)、Reactome(傳導(dǎo)通路)和ChEBI(小分子),新的資源幫助研究者不僅了解構(gòu)成生物體的分子部件,還了解這些部件是如何組合構(gòu)成系統(tǒng)的。
本文檔共65頁;當(dāng)前第44頁;編輯于星期二\3點(diǎn)6分三、通過EntrezGene從NCBI獲取序列信息Entrez主要是用于NCBI數(shù)據(jù)庫綜合的、基于文本的搜索和檢索系統(tǒng)。Entrez綜合了科學(xué)文獻(xiàn)、DNA和蛋白序列數(shù)據(jù)、3D蛋白質(zhì)結(jié)構(gòu)和蛋白質(zhì)域數(shù)據(jù)、種群研究數(shù)據(jù)集、表達(dá)數(shù)據(jù)、完整基因組組裝和分類學(xué)信息,形成一個(gè)緊密鏈接的系統(tǒng)。它用于搜索NCBI鏈接數(shù)據(jù)庫的檢索系統(tǒng)。本文檔共65頁;當(dāng)前第45頁;編輯于星期二\3點(diǎn)6分Entrez檢索系統(tǒng)子數(shù)據(jù)庫本文檔共65頁;當(dāng)前第46頁;編輯于星期二\3點(diǎn)6分(一)EntrezGene檢索EntrezGene檢索到的記錄提供關(guān)鍵鏈接,將圖譜、序列、表達(dá)、結(jié)構(gòu)、功能、索引文獻(xiàn)和同源數(shù)據(jù)鏈接在一起構(gòu)成關(guān)鍵鏈接。用定義序列、已知的圖譜定位和從表型信息推測的基因,為基因分配特有標(biāo)識(shí)符。這些標(biāo)識(shí)符在NCBI的數(shù)據(jù)庫中通用,可以用于注釋更新跟蹤和相關(guān)信息跟蹤。EntrezGene用NCBI參考序列(RefSeqs)覆蓋了基因組,還被整合到NCBI的Entrez和E-Utilities系統(tǒng)的索引、查詢和檢索中。
本文檔共65頁;當(dāng)前第47頁;編輯于星期二\3點(diǎn)6分NCBI檢索首頁檢索窗口的數(shù)據(jù)庫
選項(xiàng)下拉菜單本文檔共65頁;當(dāng)前第48頁;編輯于星期二\3點(diǎn)6分檢索欄(for)輸入“IL-2human”
本文檔共65頁;當(dāng)前第49頁;編輯于星期二\3點(diǎn)6分(二)EntrezGene記錄顯示格式當(dāng)進(jìn)行檢索時(shí),檢索結(jié)果以摘要(summary)格式顯示,每頁可顯示多條記錄,摘要顯示的每條記錄前有一個(gè)選擇框,可以選擇哪些記錄需要顯示。顯示內(nèi)容還包括首選名稱標(biāo)志、完整全名、雙單詞的物種名稱(在方括號中)、基因組定位和基因編號。如果基因在已命名的質(zhì)粒上,那么作為基因定位將給出質(zhì)粒名稱。右側(cè)的Links可以關(guān)聯(lián)到顯示相關(guān)的Entrez記錄,核對希望顯示的記錄,選擇灰色查詢條目中的顯示選項(xiàng),可以顯示希望顯示的相關(guān)記錄。本文檔共65頁;當(dāng)前第50頁;編輯于星期二\3點(diǎn)6分EntrezGene檢索結(jié)果摘要格式顯示頁面
本文檔共65頁;當(dāng)前第51頁;編輯于星期二\3點(diǎn)6分EntrezGene全文報(bào)告頁面(前部分)本文檔共65頁;當(dāng)前第52頁;編輯于星期二\3點(diǎn)6分EntrezGene全文報(bào)告頁面(后部分)本文檔共65頁;當(dāng)前第53頁;編輯于星期二\3點(diǎn)6分
IL2mRNA的Nucleotide數(shù)據(jù)庫記錄檢索結(jié)果顯示界面
本文檔共65頁;當(dāng)前第54頁;編輯于星期二\3點(diǎn)6分(三)Nucleotide數(shù)據(jù)庫記錄顯示格式
Nucleotide數(shù)據(jù)庫記錄的顯示結(jié)果,可以GenBank、FASTA、Graphics和ASN.1格式顯示,序列信息通常用FASTA和GenBank兩種格式顯示,F(xiàn)ASTA格式僅包括該序列的簡要特征,并以G、A、T、C四種堿基列出核苷酸序列,簡單明了。而GenBank格式可顯示較完整的基因序列記錄,反映核苷酸序列的詳細(xì)信息。本
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 廣東省電場遠(yuǎn)紅外針灸儀項(xiàng)目可行性研究報(bào)告
- 2025年度板材行業(yè)人才培養(yǎng)與引進(jìn)合同
- 2025年度新型建筑涂料采購與施工一體化合同
- 2025年度新能源項(xiàng)目融資借款分期還款合同
- 2025年度購房合同稅收籌劃范本模板
- 2025年度綠色環(huán)保技術(shù)研發(fā)投資合同范本
- 2025年度汽車維修廠二手車評估與修復(fù)合同
- 2025年度移動(dòng)廣告平臺(tái)合作合同范例
- 2025年度國際工程項(xiàng)目設(shè)備采購合同范本
- 2025年度公眾號運(yùn)營策略及內(nèi)容創(chuàng)作服務(wù)合同
- 2025年個(gè)人土地承包合同樣本(2篇)
- (完整版)高考英語詞匯3500詞(精校版)
- 2024年聯(lián)勤保障部隊(duì)第九四〇醫(yī)院社會(huì)招聘筆試真題
- 網(wǎng)絡(luò)貨運(yùn)行業(yè)研究報(bào)告
- 人教版七年級英語上冊單元重難點(diǎn)易錯(cuò)題Unit 2 單元話題完形填空練習(xí)(含答案)
- 00015-英語二自學(xué)教程-unit1
- 新版建設(shè)工程工程量清單計(jì)價(jià)標(biāo)準(zhǔn)解讀
- 運(yùn)動(dòng)技能學(xué)習(xí)PPT
- 嶺南版三年級美術(shù)下冊教學(xué)工作計(jì)劃
- 應(yīng)急裝備、應(yīng)急物資臺(tái)賬(較詳細(xì))
- 運(yùn)動(dòng)技能學(xué)習(xí)與控制
評論
0/150
提交評論