版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
NCBI站點(diǎn)的一般介紹及其它資源庫的介紹GenBankOverview生物信息學(xué)站點(diǎn)地圖其它資源庫的介紹什么是GenBank?GenBank是一個有13億堿基,來自于100,000多種生物的核苷酸序列的數(shù)據(jù)庫。每條紀(jì)錄都有編碼區(qū)(CDS)特征的注釋,還包括氨基酸的翻譯。GenBank屬于一個序列數(shù)據(jù)庫的國際合作組織,包括EMBL和DDBJ。紀(jì)錄樣本關(guān)于GenBank的各個字段的詳細(xì)描述,以及同Entrez搜索字段的交叉索引。訪問GenBank通過EntrezNucleotides來查詢。用accessionnumber,作者姓名,物種,基因/蛋白名字,還有許多其他的文本術(shù)語來查詢。關(guān)于Entrez更多的信息請看下文。用BLAST來在GenBank和其他數(shù)據(jù)庫中進(jìn)行序列相似搜索。用E-mail來訪問Entrez和BLAST可以通過Query和BLAST服務(wù)器。另外一種選擇是可以用FTP下載整個的GenBank和更新數(shù)據(jù)。增長統(tǒng)計(jì)
參見公布通知的2.2.6(每個分類的統(tǒng)計(jì)),2.2.7(每個物種的統(tǒng)計(jì)),2.2.8(GenBank增長)小節(jié)。
公布通知最新-最近和即將有的變化,GenBank的分類,數(shù)據(jù)增長統(tǒng)計(jì),GenBank的引用。
舊-同上相同,是過去公布的統(tǒng)計(jì)。
遺傳密碼-15個遺傳密碼的概要。用來確保GenBank中紀(jì)錄的編碼序列被正確的翻譯。
向GenBank提交數(shù)據(jù)
Sequin提交軟件程序,用于一條或者很多條的提交,長序列,完整基因組,alignments,人群/種系/突變研究的提交。可以獨(dú)立使用,或者用基于TCP/IP的“networkaware”模式,可以鏈接到其他NCBI的資源和軟件比如Entrez和PowerBLAST。(請?jiān)谔峤磺坝肰ecScreen去除載體)
ESTs-表達(dá)序列標(biāo)簽,短的、單次(測序)閱讀的cDNA序列。也包括來自于差異顯示和RACE實(shí)驗(yàn)的cDNA序列。GSSs基因組調(diào)查序列,短的、單次(測序)閱讀的cDNA序列,exontrap獲得的序列,cosmid/BAC/YAC末端,及其他。
HTGs-來自于大規(guī)模測序中心的高通量基因組序列,未完成的(階段0,1,2)和完成的(階段3)序列。注意:完成的人類的HTG序列可以同時(shí)在GenBank和HumanGenomeSequencing頁面上訪問。
STSs序列標(biāo)簽位點(diǎn)短的在基因組上可以被唯一操作的序列,用于產(chǎn)生作圖位點(diǎn)。
注:SNPs-人類的和其他物種的遺傳變異數(shù)據(jù)可以提交到NCBI數(shù)據(jù)庫的單核苷酸多態(tài)性庫中(dbSNP)。國際核苷酸序序列數(shù)據(jù)庫合合作組織GenBank,DDBJ,EMBL-合合作計(jì)劃的概概述,并鏈接接到相應(yīng)的主主頁。GenBank,DDBJ(DNADataBankofJapan)),andEMBL((EuropeanMolecularBiologyLaboratory)數(shù)數(shù)據(jù)庫共享的的數(shù)據(jù)是每天天都交換的,,因此他們是是相等的。數(shù)據(jù)紀(jì)錄的格格式和搜索方方式可能會不不一樣,但是是accessionnumber,序列數(shù)數(shù)據(jù)和注解都都是一模一樣樣的。即,你你可以用accessionnumberU12345在GenBank,,DDBJ或或EMBL中中查找相應(yīng)紀(jì)紀(jì)錄,得到的的結(jié)果是完全全一樣的序列列數(shù)據(jù),參考考內(nèi)容等等。。DDBJ/EMBJ/GenBank特性表((見講義))特性表格式和和標(biāo)準(zhǔn)被合作作數(shù)據(jù)庫用在在序列記錄的的注釋上,使使得數(shù)據(jù)共享享成為可能,,包括詳細(xì)的的描述生物特特性和特性限限定語的附錄錄,以及IUPAC規(guī)定定的核苷酸和和氨基酸的代代號。FTPGenBankandDailyUpdatesGenBank普通文件件格式參見GenBank記錄錄樣本和在GenBank公布通知知中的詳細(xì)描描述,下載大大多數(shù)最近的的完全公告和和日常積累或或非積累更新新數(shù)據(jù)。ASN.1格格式—摘摘要句法記號號1,國際標(biāo)標(biāo)準(zhǔn)組織(ISO)數(shù)據(jù)據(jù)表示格式,,下載大多數(shù)數(shù)最近的完全全公告和日常常積累或非積積累更新數(shù)據(jù)據(jù)。FASTA格格式定義行號后只只跟隨序列數(shù)數(shù)據(jù)(示例)),參見描述述數(shù)據(jù)庫的readme文件,包括nt.Z(每天更新新的非冗余BLAST核核酸數(shù)據(jù)庫,,包括GenBank+EMBL+DDBJ+PDB序列,,不包括EST,STS,GSS,orHTGS序序列),nr.Z(每日日更新的非冗冗余蛋白質(zhì))),est.Z,gss.Z,htg.Z,sts.Z,和其其它文件。分子數(shù)據(jù)庫概概覽核酸序序列Entrez核核酸——用用accessionnumber,作者者姓名名,物物種,,基因因/蛋蛋白名名字,,以及及很多多其它它的文文本術(shù)術(shù)語來來搜索索核酸酸序列列記錄錄(在在GenBank+PDB中)。。更多多的關(guān)關(guān)于Entrez的的信息息見下下。如如果要要檢索索大量量數(shù)據(jù)據(jù),也也可使使用BatchEntrez((批量量Entrez)。。RefSeqNCBI數(shù)數(shù)據(jù)庫庫的參參考序序列。。校正正的,,非冗冗余集集合,,包括括基因因組DNAcontigs,已已知基基因的的mRNAs和和蛋白白,在在將來來,整整個的的染色色體。。Accessionnumbers用NT_xxxxxx,NM_xxxxxx,NP_xxxxxx,和和NC_xxxxxx的形形式來來表示示。dbEST——表表達(dá)序序列標(biāo)標(biāo)簽數(shù)數(shù)據(jù)庫庫,短短的、、單次次(測測序))閱讀讀的cDNA序序列。。也包包括來來自于于差異異顯示示和RACE實(shí)實(shí)驗(yàn)的的cDNA序列列。dbGSS——基因因組調(diào)調(diào)查序序列的的數(shù)據(jù)據(jù)庫,,短的的、單單次((測序序)閱閱讀的的cDNA序列列,exontrap獲得得的序序列,,cosmid/BAC/YAC末端端,及及其他他。dbSTS序列標(biāo)標(biāo)簽位位點(diǎn)的的數(shù)據(jù)據(jù)庫,,短的的在基基因組組上可可以被被唯一一操作作的序序列,,用于于產(chǎn)生生作圖圖位點(diǎn)點(diǎn)。dbSNP——單單核苷苷酸多多態(tài)性性數(shù)據(jù)據(jù)庫,,包括括SNPs,小小范圍圍的插插入/缺失失,多多態(tài)重重復(fù)單單元,,和微微衛(wèi)星星變異異。完整的的基因因組參見下下面Genome和和Maps部分分,包包括各各種物物種資資源,,人,,小鼠鼠,大大鼠,,酵母母,線線蟲,,瘧原原蟲,,細(xì)菌菌,病病毒,,viroids,,質(zhì)粒粒。瘧原蟲蟲UniGene被整理理成簇簇的EST和全全長mRNA序序列,,每一一個代代表一一種特特定已已知的的或假假設(shè)的的人類類基因因,有有定位位圖和和表達(dá)達(dá)信息息以及及同其其它資資源的的交叉叉參考考。序序列數(shù)數(shù)據(jù)可可以以以cluster形形式在在Unigene網(wǎng)網(wǎng)頁下下載,,完整整的數(shù)數(shù)據(jù)可可以從從FTP站站點(diǎn)repository/UniGene目目錄下下下載載。人類UniGene小鼠UniGene大鼠UniGene斑馬魚魚UniGeneBLAST將你的的序列列同核核酸庫庫中的的的序序列比比較,,檢索索相似似的序序列。。(更更詳細(xì)細(xì)的信信息見見下面面Tools/Sequence相似似搜索索部分分)BLAST查找BLAST指南蛋白序序列Entrez蛋蛋白——用用accessionnumber,作作者姓姓名,,物種種,基基因/蛋白白名字字,以以及很很多其其它的的文本本術(shù)語語來搜搜索蛋蛋白序序列記記錄((在GenPept+Swiss-Prot+PIR+RPF+PDB中中)。。更多多的關(guān)關(guān)于Entrez的的信息息見下下。如如果要要檢索索大量量數(shù)據(jù)據(jù),也也可使使用BatchEntrez((批量量Entrez)。。RefSeqNCBI數(shù)數(shù)據(jù)庫庫的參參考序序列。。Curated,非非冗余余集合合包括括基因因組DNAcontigs,已已知基基因的的mRNAs和和蛋白白,在在將來來,整整個的的染色色體。。Accessionnumbers用用NT_xxxxxx,NM_xxxxxx,NP_xxxxxx,和和NC_xxxxxx的的形式式來表表示。。FTPGenPept下載載““genpept.fsa.Z””文文件件,,這這個個文文件件包包含含了了從從GenBank/EMBL/DDBJ記記錄錄中中翻翻譯譯過過來來的的FASTA格格式式的的氨氨基基酸酸序序列列,,這這些些記記錄錄都都有有一一到到兩兩個個CDS特特性性的的描描述述。。完整整基基因因組組參見見下下面面Genome和和Maps部部分分,,包包括括各各種種物物種種資資源源,,人人,,小小鼠鼠,,大大鼠鼠,,酵酵母母,,線線蟲蟲,,瘧瘧原原蟲蟲,,細(xì)細(xì)菌菌,,病病毒毒,,viroids,,質(zhì)質(zhì)粒粒。。Entrez基基因因組組提供供了了一一個個編編碼碼區(qū)區(qū)的的概概要要和和各各種種物物種種的的分分類類表表((TaxTable))。。編編碼碼區(qū)區(qū)概概要要列列出出了了在在基基因因組組中中所所有有的的的的蛋蛋白白,,并并提提供供鏈鏈接接到到FASTA文文件件和和BLAST。。分分類類表表總總結(jié)結(jié)了了蛋蛋白白BLAST分分析析的的結(jié)結(jié)果果,,建建議議他他們們的的可可能能功功能能,,并并用用顏顏色色編編碼碼的的圖圖來來顯顯示示物物種種同同其其它它物物種種之之間間的的關(guān)關(guān)系系((參參見見下下面面'Genomes和和Maps,'部部分分Entrez基基因因組組的的一一般般描描述述))FTP基基因因組組蛋蛋白白從ftp站站點(diǎn)點(diǎn)的的genbank/genomes目目錄錄下下下下載載各各種種物物種種的的FASTA格格式式的的氨氨基基酸酸序序列列*.faa和和蛋蛋白白表表文文件件*.ptt。。參參見見readme文文件件。。蛋蛋白白表表也也可可以以在在Entrez基基因因組組中中看看到到。。PROWWeb上上的蛋白白資源,,關(guān)于大大約200種人人類的CD細(xì)胞胞表面分分子的簡簡短官方方向?qū)?。?;ハ鄼z檢索,為為每個CD抗原原提供大大約20中標(biāo)準(zhǔn)準(zhǔn)信息的的分類((生化功功能,配配體,等等等)BLAST將你的序序列同蛋蛋白庫中中的的序序列比較較,檢索索相似的的序列。。(更詳詳細(xì)的信信息見下下面Tools/Sequence相似搜搜索部分分)BLASTp查找PSI-BLAST結(jié)構(gòu)結(jié)構(gòu)主頁——關(guān)于于NCBI結(jié)構(gòu)小組組的一般信信息和他們們的研究計(jì)計(jì)劃,另外外也可以訪訪問分子模模型數(shù)據(jù)庫庫(MMDB)和用用來搜索和和顯示結(jié)構(gòu)構(gòu)的相關(guān)工工具。MMDB::分子模型型數(shù)據(jù)庫一個關(guān)于三三維生物分分子結(jié)構(gòu)的的數(shù)據(jù)庫,,結(jié)構(gòu)來自自于X-ray晶體體衍射和NMR色譜譜分析。MMDB是是來源于Brookhaven蛋白數(shù)數(shù)據(jù)庫(PDB)三三維結(jié)構(gòu)的的一部分,,排除了那那些理論模模型。MMDB重新新組織和驗(yàn)驗(yàn)證了這些些信息,從從而保證在在化學(xué)和大大分子三維維結(jié)構(gòu)之間間的交叉參參考。數(shù)據(jù)據(jù)的說明書書包括生物物多聚體的的空間結(jié)構(gòu)構(gòu),這個分分子在化學(xué)學(xué)上是如何何組織的,,以及聯(lián)系系兩者的一一套指針。。利用將化化學(xué),序列列,和結(jié)構(gòu)構(gòu)信息整合合在一起,,MMDB計(jì)劃成為為基于結(jié)構(gòu)構(gòu)的同源模模型化和蛋蛋白結(jié)構(gòu)預(yù)預(yù)測的資源源服務(wù)。MMDBMMDB的的記錄以ASN.1格式存儲儲,可以用用Cn3D,Rasmol,或Kinemage來顯示。。另外,數(shù)數(shù)據(jù)庫中類類似的結(jié)構(gòu)構(gòu)已經(jīng)被用用VAST確認(rèn),新新的結(jié)構(gòu)可可以用VASTsearch來同數(shù)據(jù)據(jù)庫進(jìn)行比比較。Cn3D“Seein3-D”,,一個用用于NCBI數(shù)據(jù)庫庫的結(jié)構(gòu)和和序列相似似顯示工具具,它允許許觀察3-D結(jié)構(gòu)和和序列—結(jié)結(jié)構(gòu)或結(jié)構(gòu)構(gòu)—結(jié)構(gòu)同同源比較。。Cn3D用起來就就象你瀏覽覽器上的一一個幫助工工具。VAST矢量同源比較較搜索工具一個在NCBI開發(fā)的計(jì)計(jì)算算法,用用于確定相似似的蛋白三維維結(jié)構(gòu)。每一一個結(jié)構(gòu)的““結(jié)構(gòu)鄰居””都是預(yù)先計(jì)計(jì)算好的,而而且可以通過過MMDB的的結(jié)構(gòu)概要頁頁面的鏈接訪訪問。這些鄰鄰居可以用來來確認(rèn)那些不不能被序列比比較識別的遠(yuǎn)遠(yuǎn)的同源性。。VAST搜搜索—結(jié)結(jié)構(gòu)—結(jié)構(gòu)相相似搜索服務(wù)務(wù)。比較一個個新解出的蛋蛋白結(jié)構(gòu)和在在MMDB/PDB數(shù)據(jù)據(jù)庫中的結(jié)構(gòu)構(gòu)的三維坐標(biāo)標(biāo)。VAST搜索計(jì)算一一系列可能會會被交互瀏覽覽的結(jié)構(gòu)鄰居居,用分子圖圖形來觀察重重疊和同源相相似。分類類學(xué)學(xué)NCBI的的分分類類數(shù)數(shù)據(jù)據(jù)庫庫主主頁頁——關(guān)關(guān)于于分分類類計(jì)計(jì)劃劃的的一一般般信信息息,,包包括括分分類類資資源源和和同同NCBI分分類類學(xué)學(xué)家家合合作作的的外外部部管管理理者者的的列列表表。。分類類瀏瀏覽覽器器——搜搜索索NCBI的的分分類類數(shù)數(shù)據(jù)據(jù)庫庫,,包包括括大大于于70000個個物物種種的的名名字字和和種種系系,,這這些些物物種種都都至至少少在在遺遺傳傳數(shù)數(shù)據(jù)據(jù)庫庫中中有有一一條條核核酸酸或或蛋蛋白白序序列列。。可可以以檢檢索索一一個個特特定定種種或或者者更更高高分分類類((如如屬屬,,科科))的的核核酸酸,,蛋蛋白白,,和和結(jié)結(jié)構(gòu)構(gòu)記記錄錄。。如如果果有有新新物物種種的的序序列列數(shù)數(shù)據(jù)據(jù)被被放放到到數(shù)數(shù)據(jù)據(jù)庫庫中中,,這這個個物物種種就就被被加加到到((分分類類))數(shù)數(shù)據(jù)據(jù)庫庫中中。。NCBI的的分分類類數(shù)數(shù)據(jù)據(jù)庫庫的的目目的的是是為為序序列列數(shù)數(shù)據(jù)據(jù)庫庫建建立立一一個個一一致致的的種種系系發(fā)發(fā)生生分分類類學(xué)學(xué)。。分類學(xué)學(xué)文獻(xiàn)數(shù)數(shù)據(jù)庫庫概要要PubMed—一一個關(guān)關(guān)于生生物醫(yī)醫(yī)藥科科學(xué)的的檢索索系統(tǒng)統(tǒng),包包括引引用,,摘要要,和和雜志志的索索引術(shù)術(shù)語。。它包包括直直接由由出版版商提提供給給NCBI的文文獻(xiàn)引引用以以及鏈鏈接到到在出出版商商網(wǎng)址址上的的全文文的URLs。。PubMed包包括MEDLINE和PREMEDLINE的的完整整內(nèi)容容。它它還包包括一一些被被MEDLINE認(rèn)認(rèn)為超超出范范圍的的文章章和雜雜志,,(這這些文文章或或雜志志)由由于內(nèi)內(nèi)容或或在某某一時(shí)時(shí)期不不在索索引范范圍內(nèi)內(nèi)。因因此PubMed是是比MEDLINE的更更大的的集合合。雜志瀏瀏覽器器允許你你去查查找收收錄到到PubMed系統(tǒng)統(tǒng)的雜雜志的的名字字,MEDLINE的縮縮寫,,或ISSN號號碼。。PubRef((開發(fā)發(fā)中))—一一個個關(guān)于于來自自于廣廣大范范圍的的科學(xué)學(xué)雜志志的數(shù)數(shù)目記記錄,,和鏈鏈接到到出版版商網(wǎng)網(wǎng)址的的全文文。PubRef包包含了了PubMEd,加加上了了來自自其它它學(xué)科科的雜雜志出出版商商提供供的引引用和和摘要要。因因此它它是比比PubMed更大大的集集合。。這個個計(jì)劃劃的啟啟動是是因?yàn)闉镹AS要要求為為科學(xué)學(xué)領(lǐng)域域的電電子雜雜志提提供一一個““白皮皮書””服務(wù)務(wù)。PubMed中中心((開發(fā)發(fā)中))PubMed中中心是是一個個無障障礙的的NIH資資源,,用于于在生生命科科學(xué)領(lǐng)領(lǐng)域中中同業(yè)業(yè)互查查的基基礎(chǔ)研研究報(bào)報(bào)告。。從2000年年一月月開始始接受受雜志志文章章。所所有在在PubMed中心心的材材料將將由目目前任任一主主要的的摘要要和索索引服服務(wù)中中列出出的雜雜志提提供,,或者者在編編輯委委員會會中擁擁有3個以以上有有主要要資金金機(jī)構(gòu)構(gòu)的研研究經(jīng)經(jīng)費(fèi)的的擁有有人的的雜志志提供供。PubMedOMIM:在線線人類類孟德德爾遺遺傳——經(jīng)常更更新的的人類類基因因和遺遺傳失失調(diào)的的目錄錄,有有鏈接接到其其它相相關(guān)的的文獻(xiàn)獻(xiàn)參考考,序序列記記錄,,和相相關(guān)數(shù)數(shù)據(jù)庫庫。書籍同書籍籍出版版商合合作NCBI為為網(wǎng)絡(luò)絡(luò)改編編了教教科書書,并并把他他們鏈鏈接到到PubMed—生生物醫(yī)醫(yī)藥書書目數(shù)數(shù)據(jù)庫庫。這這是為為了給給PubMed提供供背景景信息息,這這樣使使用者者可以以探究究在PubMed搜搜索結(jié)結(jié)果中中不熟熟悉的的概念念。目目前收收錄的的書有有:MolecularBiologyoftheCell,3rded.AlbertsB.,BrayD.,LewisJ.,RaffM.,RobertsK.,WatsonJ.D.,1994,GarlandPublishing.外部鏈接接一個登記記服務(wù),,用于建建立從在在Entrez中的特特定的文文章,雜雜志,或或生物數(shù)數(shù)據(jù)到外外部網(wǎng)址址的鏈接接。第三三方可以以提供
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年股份代持協(xié)議
- 顴部褐青色痣病因介紹
- 阿洪病病因介紹
- 全國賽課一等獎初中統(tǒng)編版七年級道德與法治上冊《正確對待順境和逆境》獲獎?wù)n件
- 《電機(jī)技術(shù)應(yīng)用》課件 2.1.1 異步電動機(jī)結(jié)構(gòu)
- 幼兒園2024-2025學(xué)年度園務(wù)工作計(jì)劃
- (范文)花瓶項(xiàng)目立項(xiàng)報(bào)告
- (2024)茶業(yè)初精制加工生產(chǎn)線技術(shù)改造項(xiàng)目可行性研究報(bào)告寫作模板
- 2023年氫氧化鍶項(xiàng)目融資計(jì)劃書
- 【CSA GCR】大語言模型威脅分類
- 心理健康與大學(xué)生活學(xué)習(xí)通超星期末考試答案章節(jié)答案2024年
- 借款協(xié)議(父母借款給子女買房協(xié)議)(二篇)
- 外研版英語2024七年級上冊全冊單元知識清單(記憶版)
- 國家開放大學(xué)電大本科《工程經(jīng)濟(jì)與管理》2023-2024期末試題及答案(試卷代號:1141)
- 歌唱語音智慧樹知到期末考試答案章節(jié)答案2024年齊魯師范學(xué)院
- 國開(甘肅)2024年春《地域文化(專)》形考任務(wù)1-4終考答案
- MOOC 美在民間-南京農(nóng)業(yè)大學(xué) 中國大學(xué)慕課答案
- 國家開放大學(xué)《Python語言基礎(chǔ)》實(shí)驗(yàn)1:Python 基礎(chǔ)環(huán)境熟悉參考答案
- 《中國心力衰竭診斷和治療指南2024》解讀
- 中國馬克思主義與當(dāng)代課后習(xí)題答案
- 【拓展閱讀】類文閱讀《王羲之吃墨》
評論
0/150
提交評論