信息生物學(xué)課件_第1頁
信息生物學(xué)課件_第2頁
信息生物學(xué)課件_第3頁
信息生物學(xué)課件_第4頁
信息生物學(xué)課件_第5頁
已閱讀5頁,還剩40頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

現(xiàn)代生物學(xué)實(shí)驗(yàn)技術(shù)

生物信息與數(shù)據(jù)處理本課件在安裝微軟雅黑字體后有最好效果【詳細(xì)說明見jiaoan.htm】機(jī)房注意事項(xiàng)不得做課堂以外的事情,一經(jīng)發(fā)現(xiàn),立刻驅(qū)逐并記錄通報(bào)。嚴(yán)禁隨意設(shè)置、升級系統(tǒng)。將自己產(chǎn)生的垃圾帶走;愛護(hù)機(jī)房設(shè)備。有問題通報(bào)老師。部分鼠標(biāo)不好使,下面墊張白紙就可以了。注意腳不要踢到下面的線。仔細(xì)閱讀教案,提問前先在本教案上找答案。2電腦操作相關(guān)事項(xiàng)登錄開機(jī)自動(dòng)進(jìn)入U(xiǎn)buntu系統(tǒng)(Linux的一個(gè)版本)后,輸入用戶名"owner"和密碼"buxudong!"登錄。復(fù)制教案(可選)點(diǎn)擊菜單欄上的“Places/HomeFolder”打開文件查看器(;相當(dāng)于Windows的資源管理器),如果沒有看到j(luò)iaoan.ppt(或jiaoan.htm)文件,按照下列步驟復(fù)制。3本課目錄生物數(shù)據(jù)查詢分子進(jìn)化與系統(tǒng)分析5一、生物數(shù)據(jù)查詢6網(wǎng)上查資料Google(“谷歌”)

7查中文生物文獻(xiàn)9查英文生物文獻(xiàn)PubMed()可編程10關(guān)鍵詞的選擇不是特殊情況,盡量使用名詞原形,不使用復(fù)數(shù)、所有格等盡量使用專業(yè)用語,不使用the,of,and,research等常用詞作為關(guān)鍵詞為了減少遺漏,使用盡可能少而精的關(guān)鍵詞11PubMed查詢結(jié)果(2)–綜述文章保存搜索結(jié)果查看該文摘要13增加搜索選項(xiàng)14精確使用PubMed查找(高級搜索)標(biāo)簽(tag)字段(field)關(guān)鍵詞(keyword)操作符(operator)檢索條件(searchterms)15查找?guī)椭?2)17NCBI美國國家生物技術(shù)信息中心(NationalCenterforBiotechnologyInformation)前身是NIH所屬的一個(gè)研究所的計(jì)算生物學(xué)研究室,1988年獨(dú)立為NCBI,形式上屬于國家醫(yī)學(xué)圖書館(NationalLibraryofMedicine/NLM)管理著許多著名數(shù)據(jù)庫,如GenBank、Medline、dbSNP、COG、OMIM等提供Entrez、BLAST等服務(wù)

18國際核苷酸序列數(shù)據(jù)庫聯(lián)盟InternationalNucleotideSequenceDatabaseCollaboration(INSDC)包括GenBank [美]EMBL [歐]DDBJ [日]每天這三個(gè)數(shù)據(jù)庫作數(shù)據(jù)同步操作在任何一個(gè)數(shù)據(jù)庫操作(查找、投遞數(shù)據(jù)等)是等效的19GenBank結(jié)構(gòu)GenBank包括三個(gè)子數(shù)據(jù)庫CoreNucleotidedbESTdbGSS其中CoreNucleotide還分為更小的BLAST數(shù)據(jù)庫nrhtgswgsenv_nt21GenBank查詢(1)已知收錄號(accessionnumber)的情況選數(shù)據(jù)庫輸入收錄號查詢結(jié)果摘要點(diǎn)擊查看詳細(xì)結(jié)果不知收錄號時(shí),如要搜索人體中的解旋酶,可以在下拉框中選擇“Nucleotide”后,輸入“helicaseANDhuman[orgn]”(不要輸入引號)22作業(yè)【作業(yè)一般性的要求參見附錄一,本作業(yè)具體的要求見下?!款}目用PubMed搜索你感興趣的課題相關(guān)的序列或

綜述文獻(xiàn)(review)。要求將搜到的文獻(xiàn)/序列的基本信息(文獻(xiàn)包括標(biāo)題、雜志名、卷、期、頁碼、時(shí)間、作者,注意不要摘要;序列只要簡單注釋)上交。文獻(xiàn)總篇數(shù)/序列總條數(shù)限制在20以內(nèi)。如果超過20不列出超出的部分,只列出實(shí)際的總數(shù)。在步驟中說明你選擇關(guān)鍵詞和限制條件的理由。23FASTA序列格式也叫Pearson格式簡單使用最多例子(單序列)>NameofthesequencectgcgagNcgcgcgatgatagMMM-NNNnnnnatgancgcggcgagcatgtagcatgctagctgtcgcgagcactUUUURRRrrrrrrrcggccgagatcaggcgatgcatgcgcagggagcagcgagcgacgagcacagcatgctagctagatgcatgctaVvvvcgtaggcagccgcc“-”表示間隔25多序列FASTA>sequence1,E.colictgcgagNcgcgcgatgatagMMM-NNNngnnatgancgcggcgagcatgtagcatgctagctgtcgcgagcactUgaURRRrrrtrrrcggccgagatcaggcgatgcatgcgcagggagcagcgagcgacgagcacagcatgctagctagatgcatgctaVagvcgtaggcagccgcc>sequence2,B.subtilisctgcgagNcgcgcgatgatagctgactNntnatganncgcggcgagcatgtagcatgctagctgtcgcgagcactUctURRRrrrcrrrcggccgagatcaggcgatgcatgcgcagggagcagcgagcgacgagcacagcatgctagctagatgcatgctaVcgvcgtaggcagccgcc>sequence3,B.nattoctgcgagNcgcgcgatgatagMcgatcccnatgannncgcggcgagcatgtagcatgctagctgtcgcgagcactUggURRRrrrggrrcggccgagatcaggcgatgcatgcgcagggagcagcgagcgacgagcacagcatgctagctagatgcatgctaVaavcgtaggcagccgcc26如何用PubMed找蛋白(BLAST第一步)選Protein輸入關(guān)鍵詞選一個(gè)蛋白29blastp(1)–BLAST主頁點(diǎn)此進(jìn)入blastp起始頁30blastp(2)–blastp起始頁在這里輸入要搜索的蛋白質(zhì)的收錄號(accessionnumber)或序列點(diǎn)此開始搜索如果要限制搜索的物種(如水稻),可在"Organism"處輸入"Oryzasativa"(水稻的拉丁名)31點(diǎn)此看結(jié)果blastp(3)–提交后頁面32blastp(4)–結(jié)果頁(1.基本信息)33blastp(5)–結(jié)果頁(2.比對圖)34blastp(6)–結(jié)果頁(3.高分序列)35blastp

(7)–結(jié)果頁(4.高分序列詳細(xì)結(jié)果)consensus36比對(MEGA)37比對38比對39建樹(MEGA)關(guān)閉比對窗口后自動(dòng)彈出對話框40建樹41作業(yè)【作業(yè)一般性的要求參見附錄一,本作業(yè)具體的要求見下。】搜索你所感興趣的蛋白及其同源物的序列(序列不超過20條),分析這些序列之間的進(jìn)化關(guān)系,建立系統(tǒng)樹。將樹輸出為(;相當(dāng)于另存為)Newick格式,將輸出的nwk文件的內(nèi)容(例子見下)復(fù)制在作業(yè)正文內(nèi)(不要貼圖)。并對結(jié)果進(jìn)行解釋。

【Newick樹例子】((gi|42673|emb|CAA23618.1|_recA_gene_pr...,gi|86449963|gb|ABC96175.1|_RecA_prote...)0.18,(gi|37362719|gb|AAQ91336.1|_RecA_Esche...,gi|86449965|gb|ABC96176.1|_RecA_prote...)0.21,gi|86449967|gb|ABC96177.1|_RecA_prote...);42附錄一作業(yè)一般性的要求請嚴(yán)格按照要求(包括一般性和具體要求)做作業(yè),這些要求將作為打分的重要依據(jù)。任選以上作業(yè)之一上交。作業(yè)要包括詳細(xì)完成步驟,其中的所有引用或用到的網(wǎng)頁/文獻(xiàn)請注明網(wǎng)址或出處。作業(yè)請?jiān)诘?周(4月19日)之前在上交。43附錄二常見問題集什么是文件的擴(kuò)展名?怎樣才能看到擴(kuò)展名?擴(kuò)展名是文件名末尾點(diǎn)號(.)后面的部分,如文件"實(shí)驗(yàn)報(bào)告.doc"的擴(kuò)展名是doc。缺省情況下,WindowsXP會(huì)(Linux一般不會(huì))隱藏已知的文件擴(kuò)展名。要想看到擴(kuò)展名,打開資源管理器,點(diǎn)擊菜單項(xiàng)"工具/文件夾選項(xiàng)",選擇"查看"標(biāo)簽,去掉"隱藏已知文件類型的擴(kuò)展名"復(fù)選框即可。什么是純文本文件?什么是二進(jìn)制文件?純文本文件一般也叫文本文件。一個(gè)簡單的判斷文本文件的方法:用記事本(Windows下)或gedit(Linux下)打開這個(gè)文件,能夠閱讀的為純文本文件,不能閱讀的為二進(jìn)制文件。另一個(gè)方法,由擴(kuò)展名判斷。常見的純文本文件有:文本文件(txt)、網(wǎng)頁文件(htm,html)等;常見的二

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論