GenBank數(shù)據(jù)庫檢索及其應(yīng)用_第1頁
GenBank數(shù)據(jù)庫檢索及其應(yīng)用_第2頁
GenBank數(shù)據(jù)庫檢索及其應(yīng)用_第3頁
GenBank數(shù)據(jù)庫檢索及其應(yīng)用_第4頁
GenBank數(shù)據(jù)庫檢索及其應(yīng)用_第5頁
已閱讀5頁,還剩114頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

GenBank數(shù)據(jù)庫檢索及其應(yīng)用

——Entrez檢索功能重慶醫(yī)科大學(xué)圖書館李軼簡介

GenBank數(shù)據(jù)庫是由美國國立生物技術(shù)信息中心(NCBI)維護的一級核酸序列數(shù)據(jù)庫。GenBank數(shù)據(jù)庫的數(shù)據(jù)來源有三種:1、直接來源于測序工作者提交的序列;2、與其它數(shù)據(jù)機構(gòu)協(xié)作交換的數(shù)據(jù);3、美國專利局提供的專利數(shù)據(jù)。NCBI網(wǎng)站網(wǎng)址:GenBank和PubMed(序列數(shù)據(jù))檢索的比較:1、GenBank的檢索結(jié)果是序列及其注釋信息;

PubMed的檢索結(jié)果是與序列數(shù)據(jù)相關(guān)的文獻信息。2、GenBank數(shù)據(jù)更新早于PubMed,GenBank數(shù)據(jù)庫的檢全率高于PubMed。3、GenBank可對序列數(shù)據(jù)進行限制檢索,而PubMed只能對文獻、雜志、作者等進行限制檢索,因而GenBank數(shù)據(jù)庫的檢準率也高于PubMed。檢索界面簡介基本檢索輸入框基本檢索界面:執(zhí)行檢索按鈕基本檢索輸入框基本檢索界面:ras[GENE]點擊進入跨庫檢索跨庫檢索界面:ras[GENE]執(zhí)行檢索按鈕跨庫檢索界面:點擊進入GenBank數(shù)據(jù)庫GenBank數(shù)據(jù)庫界面:GenBank數(shù)據(jù)庫界面:點擊進入核苷酸序列數(shù)據(jù)庫檢索界面GenBank數(shù)據(jù)庫界面:特征欄提供輔助檢索功能核苷酸序列數(shù)據(jù)庫檢索界面:核苷酸序列數(shù)據(jù)庫檢索界面:簡介檢索界面基本檢索功能(一)名稱、作者姓名、截詞檢索、布爾邏輯運算(二)特殊標志符檢索(五)范圍檢索(三)序列長度檢索(四)分子重量檢索簡介檢索界面基本檢索功能(一)名稱、作者姓名、截詞檢索、布爾邏輯運算檢索限定詞:1、基因名稱的檢索限定詞:[GENE]2、生物體名稱的檢索限定詞:[ORGN]3、作者姓名的檢索限定詞:[AUTH]簡介檢索界面基本檢索功能(一)名稱、作者姓名、截詞檢索、布爾邏輯運算(二)特殊標志符檢索特殊標志符的格式(核酸序列)

:2、GenBank/EMBL/DDBJ序列接受號:

(1)1個字母+5個阿拉伯數(shù)字

e.g.:U12345

(2)2個字母+6個阿拉伯數(shù)字

e.g.:AY123456,Af1234561、序列辨認號(GI):一串阿拉伯數(shù)字

e.g.:6995995(1)mRNA記錄(NM_*):

e.g.:NM_000492(2)基因組DNA重疊群(NT_*):

e.g.:NT_000347(3)完整的基因組或染色體(NC_*):

e.g.:NC_000907(4)基因組的局部區(qū)域(NG_*):

e.g.:NG_000019(5)從人類基因組序列注釋、加工得到的序列模型記錄(XM,XP,orXR_*):

e.g.:XM_000483特殊標志符的格式(核酸序列):3、RefSeq(ReferenceSequence)序列接受號:特殊標志符的格式(核酸序列):4、

PDB序列接受號:1個阿拉伯數(shù)字+3個字母

e.g.:1TUP序列接受號的檢索限定詞為[ACCN]or[ACCESSION]AF123456[ACCN]簡介檢索界面基本檢索功能(一)名稱、作者姓名、截詞檢索、布爾邏輯運算(二)特殊標志符檢索(三)序列長度檢索1510[SLEN]序列長度的檢索限定詞:[SLEN]簡介檢索界面基本檢索功能(一)名稱、作者姓名、截詞檢索、布爾邏輯運算(二)特殊標志符檢索(三)序列長度檢索(四)分子重量檢索2009[MOLWT]分子重量的檢索限定詞:[MOLWT]簡介檢索界面基本檢索功能(一)名稱、作者姓名、截詞檢索、布爾邏輯運算(二)特殊標志符檢索(五)范圍檢索(三)序列長度檢索(四)分子重量檢索范圍檢索:中間用冒號連接1、序列接受號范圍檢索:

AF114696:AF114714[ACCN]2、序列長度范圍檢索:

3000:4000[SLEN]3、分子重量范圍檢索:

2002:2009[MOLWT]4、日期范圍檢索:

2005/01:2006/09/26[MDAT]or[PDAT]簡介檢索界面基本檢索功能特征欄輔助檢索限制檢索(Limits)預(yù)檢索/索引檢索(Preview/Index)檢索史管理(History)剪貼板管理(Clipboard)詳細匹配過程(Details)限制檢索預(yù)檢索/索引檢索檢索史管理剪貼板管理詳細匹配過程簡介檢索界面基本檢索功能特征欄輔助檢索限制檢索(Limits)限制檢索界面:限制檢索界面:核苷酸序列數(shù)據(jù)庫分為三個子數(shù)據(jù)庫:EST:表達序列標記數(shù)據(jù)庫GSS:基因組測序序列數(shù)據(jù)庫CoreNucleotide:包含所有未被以上兩個子數(shù)據(jù)庫收錄的核苷酸序列核苷酸序列數(shù)據(jù)庫檢索界面:核苷酸序列數(shù)據(jù)庫檢索界面:限制檢索界面:限制檢索界面:檢索結(jié)果顯示界面:限制檢索范圍限制檢索(Limits):限制檢索范圍ras排除某種類型的序列限制分子類型限制分子類型限制基因位點限制基因位點限制序列片段的顯示限制序列片段的顯示限制數(shù)據(jù)來源限制數(shù)據(jù)來源限制數(shù)據(jù)修訂日期限制數(shù)據(jù)修訂日期簡介檢索入口基本檢索功能特征欄輔助檢索限制檢索(Limits)預(yù)檢索/索引檢索(Preview/Index)預(yù)檢索/索引檢索界面:hepatitisb索引檢索輸入框索引檢索按鈕索引檢索按鈕序列特性關(guān)鍵詞索引ras[GENE]序列特性關(guān)鍵詞索引簡介檢索界面基本檢索功能特征欄輔助檢索限制檢索(Limits)預(yù)檢索/索引檢索(Preview/Index)檢索史管理(History)剪貼板管理(Clipboard)詳細匹配過程(Details)penicillin-bindingmycobacteriumtuberculosis#8AND#4penicillin-bindingANDmycobacteriumtuberculosis[ORGN]簡介檢索入口基本檢索功能特征欄輔助檢索檢索結(jié)果的顯示檢索結(jié)果顯示界面:選擇檢索結(jié)果的顯示格式選擇檢索結(jié)果的顯示格式選擇檢索結(jié)果的顯示格式摘要格式:聯(lián)接Genbank

格式:Genbank

格式:Genbank

格式:Genbank

格式:Genbank

格式:Genbank

格式:Genbank

格式:Genbank

格式:GenBank記錄中特性表中的主要關(guān)鍵詞:關(guān)鍵詞解釋關(guān)鍵詞解釋misc_feature生物學(xué)特性無法用特性表關(guān)鍵詞描述的序列promoter轉(zhuǎn)錄起始區(qū)misc_difference序列特性無法用特性表關(guān)鍵詞描述的序列CAAT_signal真核啟動子上游的CAAT盒,與RNA結(jié)合相關(guān)conflict同一序列在不同的研究中在位點或區(qū)域上有差異TATA_signal真核啟動子的TATA盒unsure序列不能確定的區(qū)域-35_signal原核啟動子中的-35框old_sequence該序列對以前的版本做過修訂-10_signal原核啟動子的Pribow盒variation包含穩(wěn)定突變的序列GC_signal真核啟動子的GC盒modified_base修飾過的核苷酸RBS核糖體結(jié)合位點gene已識別為基因或已命名的序列區(qū)域polyA_signalRNA轉(zhuǎn)錄本的剪切識別位點misc_signal無法用信號特性關(guān)鍵詞描述的信號序列enhancer增強子關(guān)鍵詞解釋關(guān)鍵詞解釋attenuator與轉(zhuǎn)錄終止有關(guān)的序列CDS蛋白質(zhì)編碼序列terminator轉(zhuǎn)錄終止序列sig_peptide編碼信號肽的序列rep_origin雙鏈DNA復(fù)制起始區(qū)transit_peptide轉(zhuǎn)運蛋白編碼序列misc_RNA無法用RNA關(guān)鍵詞描述的轉(zhuǎn)錄物或RNA產(chǎn)物mat_peptide編碼成熟肽的序列prim_transcript初始轉(zhuǎn)錄本intron內(nèi)含子precursor_RNA前體RNApolyA_siteRNA轉(zhuǎn)錄本的多聚腺苷酸化位點mRNA信使RNArRNA核糖體RNA5’clip前體轉(zhuǎn)錄本中被剪切掉的5’端序列tRNA轉(zhuǎn)運RNA3’clip前體轉(zhuǎn)錄本中被剪切掉的3’端序列scRNA小細胞質(zhì)RNA5’UTR5’非翻譯區(qū)snRNA小核RNA3’UTRexon3’非翻譯區(qū)外顯子snoRNA加工和修飾rRNA的小核RNA關(guān)鍵詞解釋關(guān)鍵詞解釋immunoglobulin_relatedrepeat_unit單個的重復(fù)元件C_region免疫相關(guān)蛋白上的不變區(qū)LTR長末端重復(fù)序列D_segment免疫球蛋白重鏈的可變區(qū),T細胞受體β鏈Satellite衛(wèi)星重復(fù)序列J_segment免疫球蛋白重鏈、輕鏈以及T細胞α、β、γ的結(jié)合鏈misc_binding無法描述的核酸序列結(jié)合位點N_region插入重排免疫球蛋白片段間的核苷酸primer_bind復(fù)制、轉(zhuǎn)錄的引物結(jié)合位點S_region免疫球蛋白重鏈的開關(guān)區(qū)protein_bind蛋白質(zhì)結(jié)合區(qū)V_region編碼免疫球蛋白的可變區(qū)N末端的序列STS測序標簽位點V_segment編碼免疫球蛋白的可變區(qū)的序列misc_recomb無法用重組特性關(guān)鍵詞描述的重組事件repeat_region基因組中所包含的重復(fù)序列iDNA通過重組所消除的DNA關(guān)鍵詞解釋關(guān)鍵詞解釋misc_structure無法用結(jié)構(gòu)關(guān)鍵詞描述的核酸序列高級結(jié)構(gòu)或構(gòu)型stem_loop發(fā)夾結(jié)構(gòu)D_loop線粒體中DNA中的取代環(huán)GenBank記錄中特性表中的限定詞:限定詞含義限定詞含義/allele=給定基因的等位基因/codon_start=相對于序列第一個堿基,編碼序列密碼子的偏移量/bound_moiety=嵌合范圍/country=DNA樣本的來源國/cell_type=獲得序列的細胞類型/db_xref=其他數(shù)據(jù)庫信息的交叉索引號/citation=已被引用的參考文獻數(shù)/direction=DNA復(fù)制方向/clone_lib=獲得序列的克隆文庫/environmental_sample=序列直接從環(huán)境材料中獲得而沒有指明來源物種限定詞含義限定詞含義/exception=指明DNA序列未按通常的生物學(xué)規(guī)律翻譯,如RNA編輯/PCR_conditi-ons=描述PCR的反應(yīng)條件/frequency=在種群中發(fā)生變異的頻率/pop_variant=獲得序列的群體變異種名稱/germline如果序列是DNA并來源于免疫球蛋白家族,則表示該序列來源于未重排DNA/product=序列編碼產(chǎn)物的名稱/insertion_seq=序列來源于某種插入元件/anticodon=tRNA反義密碼子的位置及它所編碼的氨基酸/isolate=序列來源的生物個體/cell_line=獲得序列的細胞系/lab_host=為擴增序列來源物種所用的實驗室宿主/chromosome=獲得序列的染色體/macronuclear指明DNA來源于染色體分化的大核期/clone=獲得序列的克隆子/note=評論及附加信息/codon=指出與參考密碼子不同的密碼子/organelle=獲得序列的細胞器/EC_number=序列產(chǎn)物的酶學(xué)編號限定詞含義限定詞含義/cons_splice=區(qū)分內(nèi)含子剪切位點和“5‘-GT.AG-3'”剪切位點/map=相關(guān)特性在基因圖譜上的位置/cultivar=所獲序列植物的栽培變種/mod_base=被修飾堿基的簡寫/dev_stage=序列來源于某種生物的特定發(fā)育階段/number=從5’→3’注明遺傳元件的順序/evidence=序列特性來源于實驗還是推理/organism=提供測序用遺傳物質(zhì)的物種的科學(xué)名稱/focus指出在記錄中的來源特性在其他物種中還有不同的來源特性/phenotype=序列特性所導(dǎo)致的表型/function=序列所代表的功能/plasmid=獲得序列的質(zhì)粒名稱/haplotype=序列來源于某種物種的單倍體/protein_id=蛋白質(zhì)的檢索號/isolation_sou-rce=描述序列來源物種的生理、環(huán)境和地理信息/proviral整合在基因組中的前病毒/label=序列特性的俗名/rearranged如果序列是DNA并來源于免疫球蛋白家族,則表示該序列來源于重排DNA限定詞含義限定詞含義/rpt_family=重復(fù)序列/transposon=轉(zhuǎn)座子/rpt_unit=指明重復(fù)區(qū)域的重復(fù)元件構(gòu)成/variety=獲得序列的生物變種/serotype=同一物種的不同血清學(xué)特征/pseudo假基因/sex=獲得序列的物種性別

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論