培訓(xùn)基因功能注釋_第1頁
培訓(xùn)基因功能注釋_第2頁
培訓(xùn)基因功能注釋_第3頁
培訓(xùn)基因功能注釋_第4頁
培訓(xùn)基因功能注釋_第5頁
已閱讀5頁,還剩57頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

主要內(nèi)什么是功能注釋?主要內(nèi)什么是功能注釋?組/轉(zhuǎn)錄組拼功能注nat·u·ral·ist[nach-er-uh-list,nach- whostudiesorisan

zoologistoranadherent tureor

Origin:1580–90;natural+-

naturalist,IwasmuchstruckwithcertainfactsintheSouthAmerica,andinthetothepastinhabitantsofthat

OriginOriginofSpecies,(OntheOriginofSpeciesbyMeansofNaturalSelection,orthePreservationofFavouredRacesintheStruggleforLife)atreatise(1859)byCharlesDarwinsettingforthhistheoryofevolution.功能注釋的SequencebasedA具有某種功能 B A的同 ,所以 B也具這種功Structurebased蛋白A具有結(jié)構(gòu)X,X的結(jié)構(gòu)特征已知,因此我們可以知道A的功能Motifbasedapproaches(sequencemotifs,3D一類 具有功能X都具結(jié)構(gòu)Y;白具結(jié)構(gòu)Y,因的功能與X“Guilt-by-有功能X, B跟相關(guān)(結(jié)構(gòu)域和、化、蛋互),此B的功能跟X主要內(nèi)什么是功能注釋?生物序Sequencesimilarityisapowerfultoolfordiscoveringbiologicalfunction.JustastheancientGreeksusedcomparativeanatomytounderstandthehumanbodyandlinguistsusedtheRosettastonetodecipherEgyptianhieroglyphs,todaywecanusecomparativesequenceysistounderstandgenomes,RNAs,andproteins.Butwhyarebiologicalsequencessimilartooneanotherinthefirst ce?Theanswertothisquestionisn'tsimpleandrequiresanunderstandingofmolecularandevolutionarybiology.Biologicalsequenceslikeproteinsmayhaveimportantfunctionsnecessaryforthesurvivalofanorganism.ButDNAsequencecanmutaterandomly,andthismaychangehowasequencefunctions.Overtime,bothfunctionalconstraintsandrandomprocessesimpactthecourseofsequenceevolution.Thedegreetowhichasequencefollowsafunctionalorrandompathdependsonnaturalselectionandneutralevolution.Sothereasonwhysequencesaresimilartooneanotherisbecausetheystartoutsimilartooneanotherandfollowdifferentpaths.BasicLocalAlignmentSearch將query序列分成短的尋找完全匹配的結(jié)果,打向側(cè)翼延BLAST結(jié)果Score(分值根據(jù)打分矩陣,對(duì)排列結(jié)果打分;分值越大越Similarity(相似度Query與hit的相同序列的Coverage(覆蓋度排列長(zhǎng)度占hit序列長(zhǎng)度的百分??=????=??×??×??=Totalnumberofresiduesinthe =Numberofresiduesinthequery =ProbabilitythatanHSPalignmentisaresultofFore.g.,??=1×1020,??=100,??=1×???=1×BLAST核酸序列搜索核酸數(shù)據(jù)蛋白序列搜索蛋白數(shù)據(jù)核酸序列搜索蛋白數(shù)據(jù)庫,將query序列翻譯成蛋蛋白序列搜索核酸數(shù)據(jù)庫,將database序列翻譯成蛋核酸序列搜索核酸數(shù)據(jù)庫,將query和database都翻譯成蛋SearchUsingProfileHiddenMarkov跟BST、等相比,HMMEBSTHMMER將蛋白序列跟HMM數(shù)據(jù)庫進(jìn)行比對(duì),HMM數(shù)據(jù)庫有Pfam、Rfam將HMMprofile跟蛋白數(shù)據(jù)庫比對(duì),尋找符合這個(gè)HMM統(tǒng)計(jì)模型將蛋白序列、HMMprofile或多序列排列跟蛋白數(shù)據(jù)庫比對(duì)搜將多條蛋白序列跟蛋白數(shù)據(jù)庫搜其他引Blast2GOGO注釋工具KAAS–KO及KEGG代謝通路注釋工具(blast、hmmsearch)dbCAN–糖類代謝酶注釋工具(hmmer)orthoMCL–ortholog分類工具Cpc 編碼能力預(yù)測(cè)工具主要內(nèi)什么是功能注釋?蛋白和核酸數(shù)常用的序列數(shù)Nt-nucleotideThenucleotidecollectionconsistsofGenBank+EMBL+PDB+RefSeqNr-non-redundantproteinAllnon-redundantGenBankCDStranslations+PDB+SwissProtUniProtKB/Swiss-ProtisthemanuallyannotatedandsectionoftheUniProtKnowledgebaseRefSeq-NCBIReferenceSequenceAcomprehensive,integrated,non-redundant,well-annotatedsetofsequences,includinggenomicDNA,transcripts,andproteins.常用的序列數(shù)據(jù)庫(續(xù)PDB-ProteinDataAnInformationPortaltoBiologicalMacromolecularPIR-ProteinInformationPIRisanintegratedpublicbioinformaticsresourcetosupportgenomic,proteomicandsystemsbiologyresearchandscientificstudies.UniProt-UniProtKB,UniRef,UniParcTheUniversalProteinResource(UniProt)providesthescientificcommunitywithasingle,centralized,authoritativeresourceforproteinsequencesandfunctionalinformation.Sequenceclusters,usedtospeedupsequencesimilarityUniRef100,UniRef90,一些模式物種的數(shù)主要內(nèi)什么是功能注釋?從生物學(xué)角度解釋的作用Geneontology:本位Pathway:KEGGpathway、Reactome、BiocartaOrtholog: PFAM包括兩 手工注釋的可靠性高的Pfam-程序自動(dòng)產(chǎn)生Pfam- GeneGeneOntology,簡(jiǎn)稱GO,是一套國際標(biāo)準(zhǔn)化 功能描述的分類系統(tǒng)它的應(yīng)用范圍已從剛開始的3種模式生物(果蠅、酵母及小鼠)的分類注,擴(kuò)展到幾乎所有物 組的功能注釋。GO的三大類1)生物過程,biologicalprocess2)分子功能,molecularfunction從面描述的功能。舉例:線粒體細(xì)胞色素P450的功electronGObiologicalprocesssubstrate+O2=CO2+H2O+monooxygenaseGOmolecularfunctionmitochondrialGOcellularcomponent有向無環(huán)結(jié)GO功能根據(jù)其他注釋引申得到GO注GO注釋工ClustersofOrthologousGroupsof euKaryoticOrthologOrtholog組的Bet,Best 為頂點(diǎn)、bet為邊,構(gòu)建graph,至少含有3個(gè)種的graph模塊為一個(gè)ortholog組,人工注?KyotoEncyclopediaofGenesand 物的功能的數(shù)據(jù)庫。它整合 組、化學(xué)分子和生化系統(tǒng)等方面的數(shù)據(jù)KEGG每個(gè)KO代表了一組功能蛋白或RNA,可以定位到KEGGKEGG

Glycolysis/<operation>=info|list|find|get|conv|<argument>=<database>|<database>:pathforkeggpathway,koforkeggorthology<dbentries>:<dbentry>+<dbentry>+一個(gè)KEGG代謝通路圖參與一個(gè)KEGG代謝通路 一個(gè)KEGG代謝通路Glycolysis/參與一個(gè)KEGG代謝通路 InterproandInterPro,protein ysis&Currentrelease:42.04thAprilQueryingwith“Sequence-basedqueriesareperformedusingInterProScan,atoolthatcombinesthedifferentproteinsignaturerecognitionmethodsnativetotheInterPromemberdatabasesintooneresource.”QueryQuery主要內(nèi)什么是功能注釋?上機(jī)練服務(wù)功能注釋的NCBIPFAMsequenceKEGG本地化的功能注釋NCBIBLAST+的安裝和使HMMER3的安裝和使服務(wù)練習(xí)從NCBIgenbank .1的蛋白序列,做同源搜索、結(jié)構(gòu)域注釋、KEGG代謝通路分析及InterproScan蛋白功能分通過bioMart從 人的所 的GO注釋通過KEGG 代謝通路圖和參與該pathway NCBI從NCBI蛋白數(shù)據(jù)庫 序列為 的序列 NCBI通過BLAST比對(duì)尋找 的同 ,選擇BLAST程序?yàn)閎lastpPfam預(yù)測(cè) 的結(jié)構(gòu)域 通過InterProScan預(yù)測(cè) .1的功能 通過KAAS(KEGG注釋工具)預(yù)測(cè) .1的代謝通路 通過 所有人 的GO注釋Ensembl KEGGAPI ①.查看KEGGpathway數(shù)據(jù)庫的基本信②獲取KEGGpathway數(shù)據(jù)庫中所有代謝通路的描③.獲取KEGGpathway數(shù)據(jù)庫中人的代謝通路的描④.獲取hsa00010代謝通路的代謝⑤.獲取hsa00010代謝通路中本地化練習(xí)NCBIBLAST+的安裝和使HMMER3的安裝和使BLAST程序 /blast/executables/release/LATESTNR/NT數(shù)據(jù)

相應(yīng)的版本->->配置環(huán)境變運(yùn)行cmd輸入命令(1makeblastdb2makeblastdb-inmmu_pep.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論