文獻(xiàn)檢索與數(shù)據(jù)收集_第1頁
文獻(xiàn)檢索與數(shù)據(jù)收集_第2頁
文獻(xiàn)檢索與數(shù)據(jù)收集_第3頁
文獻(xiàn)檢索與數(shù)據(jù)收集_第4頁
文獻(xiàn)檢索與數(shù)據(jù)收集_第5頁
已閱讀5頁,還剩93頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

EST信息檢索及常用數(shù)據(jù)庫石河子大學(xué)動物科技學(xué)院賈斌功能分類及代謝途徑分析目標(biāo)基因的分析及應(yīng)用cDNA文庫的構(gòu)建隨機(jī)挑取克隆進(jìn)行5’或3’端測序序列前處理聚類和拼接EST數(shù)據(jù)注釋分析平臺的構(gòu)建文獻(xiàn)檢索與數(shù)據(jù)收集數(shù)據(jù)公布,形成文章主要內(nèi)容文獻(xiàn)檢索常用的文獻(xiàn)檢索數(shù)據(jù)庫文獻(xiàn)管理常用的EST數(shù)據(jù)庫實踐EST信息檢索與常用數(shù)據(jù)庫一、文獻(xiàn)檢索EST信息檢索與常用數(shù)據(jù)庫1.1文獻(xiàn)檢索方法檢索工具法追溯法分段法文獻(xiàn)檢索1.2檢索途徑文獻(xiàn)檢索途徑是指通過何種特征來進(jìn)行檢索。如著者、出版年份、關(guān)鍵詞等。檢索工具中對文獻(xiàn)不同特征進(jìn)行標(biāo)識而編制的各種索引,給檢索者提供了各種檢索途徑。例如,在PubMed中,就有著者途徑,文獻(xiàn)名稱途徑、主題途徑等等;文獻(xiàn)檢索1.3文獻(xiàn)檢索步驟(參考)分析課題,明確檢索目標(biāo)和范圍;選擇檢索工具;選擇檢索手段和檢索方法;選擇檢索途徑,確定檢索標(biāo)識;查找文獻(xiàn),獲取原始文獻(xiàn)。文獻(xiàn)檢索二、一些常用的文獻(xiàn)檢索數(shù)據(jù)庫EST信息檢索與常用數(shù)據(jù)庫2.1中文文獻(xiàn)全文數(shù)據(jù)庫數(shù)據(jù)庫文獻(xiàn)年限網(wǎng)址瀏覽器中國期刊網(wǎng)全文數(shù)據(jù)庫(CJFD)1994http:///index.htmCajViewer,AcrobatReader維普全文期刊數(shù)據(jù)庫1989/index.asp維普瀏覽器AcrobatReader萬方數(shù)據(jù)資源系統(tǒng)依各期刊而定http://AcrobatReader常用文獻(xiàn)數(shù)據(jù)庫2.2外文文獻(xiàn)檢索PubMed(http:///entrez/query.fcgi?db=PubMed

)MEDLINE(/

)ScholarGoogle(/

)ISIwebofknowledge()常用文獻(xiàn)數(shù)據(jù)庫PubMedPubMed是美國國家醫(yī)學(xué)圖書館(NLM)開發(fā)的基于網(wǎng)絡(luò)服務(wù)的查詢系統(tǒng),可以免費查詢MEDLINE、OLDMEDLINE、PREMEDLINE以及其他相關(guān)的數(shù)據(jù)庫,截至到2013年11月,PubMed中共收錄了23,772本期刊雜志,包括了二千七百多萬的生物學(xué)和醫(yī)學(xué)文獻(xiàn),最早的文獻(xiàn)可以追溯到上世紀(jì)50年代。PubMed中包括了這些文獻(xiàn)的一些全文鏈接或者其他的一些信息。

主頁外文文獻(xiàn)檢索PubMedservicesJournalsDatabase

MeshDatabaseSingleCitationMatcher

BatchCitationMacherClinicalQueries

LinkOutMyNCBI(Cubby)外文文獻(xiàn)檢索PubMed附加菜單欄LimitsPreview/IndexHistoryClipboardDetails外文文獻(xiàn)檢索【實例1】

檢索最新的關(guān)于人類EST應(yīng)用的綜述性文獻(xiàn)。外文文獻(xiàn)檢索PubMed顯示方式(Display)Summary(go)BriefAbstractCitationMEDLINE外文文獻(xiàn)檢索三、文獻(xiàn)管理EST信息檢索與常用數(shù)據(jù)庫ReferenceManager

(以此軟件為例簡單講解實際使用方法,它將使論文寫作中參考文獻(xiàn)的使用和插入十分方便。)

EndNote/EndNoteWeb

(也將以此軟件為例講解實際使用方法,它將使論文寫作中參考文獻(xiàn)的使用和插入十分方便。)ProCite

http://www.adeptscience.co.uk/index.html文獻(xiàn)管理四、常用的EST數(shù)據(jù)庫EST信息檢索與常用數(shù)據(jù)庫DatabaseURL備注dbESThttp:///dbEST/index.html綜合UniGenehttp:///entrez/query.fcgi?db=unigene綜合TigrGeneIndiceshttp:///tdb/tgi/綜合AllGeneshttp://人和老鼠dbCFC

http://cytokine.medic.kumamoto-u.ac.jp/脊椎動物信號轉(zhuǎn)導(dǎo)相關(guān)KazusaDNAresearchinstitutehttp://www.kazusa.or.jp/ja2003/english/index.html藻類及擬南芥

MAGEST

http://www.genome.jp/magest/海鞘類NEMBASE

http://nema.cap.ed.ac.uk/nematodeESTs/nembase.html寄生蟲Mendel-ESTs

http://www.mendel.ac.uk/植物ApiDots

http:///apidots/頂復(fù)門(Apicomplexan

)EASED

http://eased.bioinf.mdc-berlin.de/選擇性剪切相關(guān)PEDEhttp://pede.dna.affrc.go.jp/豬常用的EST數(shù)據(jù)庫其他相關(guān)數(shù)據(jù)庫DatabaseURL備注核酸數(shù)據(jù)庫NCBI(nt,nr)ftp:///blast/db/FASTA/綜合性數(shù)據(jù)庫EMBL-EBIhttp://www.ebi.ac.uk/databases/index.html綜合性數(shù)據(jù)庫DDBJhttp://www.ddbj.nig.ac.jp/綜合性數(shù)據(jù)庫TIGRhttp:///綜合性數(shù)據(jù)庫基因組GDBhttp://人類基因組相關(guān)蛋白質(zhì)InterPro

http://www.ebi.ac.uk/interpro/蛋白質(zhì)家族、結(jié)構(gòu)域和功能位點KEGGhttp://www.genome.jp/kegg/代謝途徑GOhttp://分子功能、生物過程、細(xì)胞組分常用的EST數(shù)據(jù)庫4.1dbESTdbEST是目前最大的一個公共功能性序列數(shù)據(jù)庫,是由NCBI于1992年開發(fā)的專門用于收集各個研究組織遞交的EST數(shù)據(jù)。直到2010年11月,該數(shù)據(jù)庫中已有1976個物種的EST數(shù)據(jù)231,275,705條,其中人的EST約有1700萬條,小鼠的EST1200多萬條。下面我們以一個具體的例子來說明如何從dbEST數(shù)據(jù)庫中收集我們想要的數(shù)據(jù)。常用的EST數(shù)據(jù)庫【實例2】在dbEST數(shù)據(jù)庫中搜索并保存有關(guān)人的EST序列步驟如下:

1、搜索人類的EST序列(圖示):

2、保存我們所需要的信息(圖片)常用的EST數(shù)據(jù)庫4.2EST序列的遞交向dbEST中遞交EST數(shù)據(jù)

E-mail遞交(需要一定的格式)實驗證實具有生物學(xué)功能的EST序列

BankIt、Sequin更多介紹參考網(wǎng)頁:/Genbank/submit.html

常用的EST數(shù)據(jù)庫4.2.1EST序列的E-mail遞交序列數(shù)據(jù)的遞交必須包括4個文件:Publication、Library、Contact以及EST。圖譜數(shù)據(jù)的遞交也包括4個文件:Publication、Contact、Method和MapData。文件組織好以后,發(fā)送郵件到batch-sub@就可以完成遞交。

常用的EST數(shù)據(jù)庫EST數(shù)據(jù)的更新EST數(shù)據(jù)的更新與數(shù)據(jù)的遞交類似,只要修改數(shù)據(jù)文件中的信息(除了EST#和CONT_NAME),然后把STATUS內(nèi)容改為“Update”而不是“New”。對Publication、Contact、源數(shù)據(jù)、EST#或者CONT_NAME所做的修改必須發(fā)送郵件到batch-sub@并闡明原因。最后把修改后的文件發(fā)送到batch-sub@就可以完成更新。

常用的EST數(shù)據(jù)庫4.2.2具有生物學(xué)功能的EST序列的遞交BankIt http:///BankIt/Sequin

/sequin/ http:///Sequin/download/seq_download.html

常用的EST數(shù)據(jù)庫4.3UniGene為了解決冗余和重疊的問題,NCBI的科學(xué)家們開發(fā)了UniGene數(shù)據(jù)庫。UniGene自動地把GenBank中的序列分類,變成一個非冗余的序列集,而這樣的一個序列集就代表了一個基因。已有66個物種的927,817條記錄存在于UniGene中,其中最多的三個物種是人、水稻和小鼠,分別為:54,576,44,394和43,104。常用的EST數(shù)據(jù)庫UniGene的查詢UniGene的查詢方式與PubMed類似可以采用關(guān)鍵詞、基因名稱、物種名稱、核酸及蛋白的accession號、組織等進(jìn)行查詢;可以在查詢框中直接輸入這些檢索式,也可以采用“Preview/Index”進(jìn)行高級檢索。

常用的EST數(shù)據(jù)庫【實例3】查詢在人的腦組織中表達(dá)的UniGene

步驟如下:(圖示)點擊附加菜單欄中的“Preview/Index”按鈕,在下拉框中選擇“Tissue”,在隨后的文本框中輸入“brain”,點擊“AND”;繼續(xù)在下拉框中選擇“Organism”,在隨后的文本框中輸入“human”,點擊“AND”;點擊查詢框后面的“Go”遞交查詢條件就得到我們所需要的UniGene的多條記錄。常用的EST數(shù)據(jù)庫一條完整的UniGene記錄包括:URL

類似的序列(與UniGene中的其他具有表達(dá)產(chǎn)物的序列進(jìn)行比較得出);

基因表達(dá)情況(包括組織表達(dá)情況、表達(dá)水平(Profile)、GEO水平、NLAIII標(biāo)簽、SAU3A標(biāo)簽等);

圖譜信息(即該基因在染色體上的定位信息以及STS的信息等);

序列(包括mRNA序列和EST序列)。

您可以把這些序列下載到本地,但是需要選擇您的操作環(huán)境:Unix、PC或者M(jìn)ac,然后點擊“Downloadsequences”按鈕,就可以得到全部的序列。常用的EST數(shù)據(jù)庫 在UniGene的一條記錄中還有一些特殊的標(biāo)識,其代表的意義如下:

P

經(jīng)過翻譯后,與已知蛋白有相似性

A

具有PolyA信號

S

該序列在這個基因簇中的匹配不是很理想

M

該克隆是一個推測的全長CDS常用的EST數(shù)據(jù)庫【實例1】檢索最新的關(guān)于人類EST應(yīng)用的綜述性文獻(xiàn)。

/entrez/query.fcgi?db=PubMed【實例2】在dbEST數(shù)據(jù)庫中搜索并保存有關(guān)雞(gallus

gallus)的EST序列。

【實例3】查詢在人的腦組織中表達(dá)的UniGene http:///entrez/query.fcgi?db=unigene

EST信息檢索與常用數(shù)據(jù)庫實踐回顧Theend!Publication文件

【實例】:

TYPE:Pub MEDUID:92347897 TITLE: ExpressedsequencetagsandchromosomallocalizationofcDNAclonesfromasubtractedretinalpigmentepitheliumlibrary AUTHORS:

Gieser,L.;Swaroop,A. JOURNAL:Genomics VOLUME:13 ISSUE:2 PAGES:873-6 YEAR:1992 STATUS:4 ||Publication文件項目名稱大寫,后面跟上“:”1表示文章沒有發(fā)表;2表示文章已被接收;3表示文章正在印刷中;4表示文章已經(jīng)發(fā)表

Library文件

【實例】:

TYPE:Lib NAME:RatLambdaZapExpressLibrary ORGANISM:Rattus

norvegicus STRAIN:Sprague-Dawley SEX:male STAGE:embryonicday17post-fertilization TISSUE:aorta CELL_TYPE:vascularsmoothmuscle DESCR: ||不能多于48個字符

Contact文件

【實例】:

TYPE:Cont NAME:SikelaJM FAX:3032707097 TEL:303270 EMAIL:tjs@ LAB:DepartmentofPharmacology INST:UniversityofColoradoHealthSciencesCenter ADDR:BoxC236,4200E.9thAve.,Denver,CO80262- 0236,USA ||EST文件【實例】:TYPE:ESTSTATUS:NewCONT_NAME:KerlavageAREST#:EST00001CLONE:HHC189SOURCE:ATCCSOURCE_INHOST:65128OTHER_EST:EST00093,EST000101CITATION:ComplementaryDNAsequencing:expressedsequencetagsandhumangenomeprojectSEQ_PRIMER:M13ForwardP_END:5'HIQUAL_START:1HIQUAL_STOP:285DNA_TYPE:cDNALIBRARY:Hippocampus,Stratagene(cat.#936205)PUBLIC:PUT_ID:Actin,gamma,skeletalCOMMENT:Thisisacommentaboutthesequence.Itmayspanseverallines.SEQUENCE:AATCAGCCTGCAAGCAAAAGATAGGAATATTCACCTACAGTGGGCACCTCCTTAAGAAGCTGATAGCTTGTTACACAGTAATTAGATTGAAGATAATGGACACGAAACATATTCCGGGATTAAACATTCTTGTCAAGAAAGGGGGAGAGAAGTCTGTTGTGCAAGTTTCAAAGAAAAAGGGTACCAGCAAAAGTGATAATGATTTGAGGATTTCTGTCTCTAATTGGAGGATGATTCTCATGTAAGGTTGTTAGGAAATGGCAAAGTATTGATGATTGTGTGCTATGTGATTGGTGCTAGATACTTTAACTGAGTATACGAGTGAAATACTTGAGACTCGTGTCACTT||EST序列的遞交“new”(表示是新的序列)或者“update”(表示對原有序列記錄的修改)

默認(rèn)為cDNA,可省略序列每行不能多于60個字符在更新EST記錄的時候,只有EST文件可以修改。與Publication文件中的TITLE內(nèi)容一致與Library文件中的NAME內(nèi)容一致與Contact文件中的NAME內(nèi)容一致Method文件【實例】 TYPE:Meth NAME:YAC/CEPHJMS ORGANISM:Homosapiens ABSOLUTE:n L1:plate L2:row L3:column L4:comment L5:comment L6:comment L7:comment DESCR: PCR-basedmappingof3'UT

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論