![醫(yī)學(xué)數(shù)據(jù)挖掘功能分析專家講座_第1頁](http://file4.renrendoc.com/view/d80eabc801e27840c13bc2e291b57106/d80eabc801e27840c13bc2e291b571061.gif)
![醫(yī)學(xué)數(shù)據(jù)挖掘功能分析專家講座_第2頁](http://file4.renrendoc.com/view/d80eabc801e27840c13bc2e291b57106/d80eabc801e27840c13bc2e291b571062.gif)
![醫(yī)學(xué)數(shù)據(jù)挖掘功能分析專家講座_第3頁](http://file4.renrendoc.com/view/d80eabc801e27840c13bc2e291b57106/d80eabc801e27840c13bc2e291b571063.gif)
![醫(yī)學(xué)數(shù)據(jù)挖掘功能分析專家講座_第4頁](http://file4.renrendoc.com/view/d80eabc801e27840c13bc2e291b57106/d80eabc801e27840c13bc2e291b571064.gif)
![醫(yī)學(xué)數(shù)據(jù)挖掘功能分析專家講座_第5頁](http://file4.renrendoc.com/view/d80eabc801e27840c13bc2e291b57106/d80eabc801e27840c13bc2e291b571065.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
基因表示數(shù)據(jù)取得與分析徐娟Email:xujuan8475@163.com生物信息教研室分子學(xué)館106辦公室醫(yī)學(xué)數(shù)據(jù)挖掘功能分析第1頁基因芯片數(shù)據(jù)基礎(chǔ)分析思緒預(yù)處理差異表示基因篩選聚類與分類功效注釋和富集分析醫(yī)學(xué)數(shù)據(jù)挖掘功能分析第2頁依據(jù)疾病風(fēng)險基因識別疾病風(fēng)險通路利用各種技術(shù)(基因表示譜、RNAseq、質(zhì)譜、大規(guī)模突變、全基因組關(guān)聯(lián)分析等)識別疾病風(fēng)險基因注釋這些基因到通路中識別疾病風(fēng)險通路分析這些通路與疾病相關(guān)性醫(yī)學(xué)數(shù)據(jù)挖掘功能分析第3頁丙酮酸丙酮酸激酶2-磷酸甘油酸磷酸烯醇式丙酮酸烯醇化酶葡萄糖6-磷酸葡萄糖6-磷酸果糖1,6-雙磷酸果糖3-磷酸甘油醛1,3-二磷酸甘油酸3-二磷酸甘油酸http://www.genome.jp/kegg-bin/show_pathway?org_name=rn&mapno=00010&mapscale=1.0&show_description=show葡萄糖代謝通路醫(yī)學(xué)數(shù)據(jù)挖掘功能分析第4頁MAPK信號通路醫(yī)學(xué)數(shù)據(jù)挖掘功能分析第5頁節(jié)點間各種關(guān)系經(jīng)過這些詳細(xì)互作關(guān)系,我們能夠更清楚了解通路!http://www.genome.jp/kegg/document/help_pathway.htmlhttp://www.genome.jp/kegg/xml/docs/Detail:醫(yī)學(xué)數(shù)據(jù)挖掘功能分析第6頁泛素化去磷酸化抑制激活磷酸化綁定/相關(guān)http://www.genome.jp/kegg/pathway/hsa/hsa04630.html醫(yī)學(xué)數(shù)據(jù)挖掘功能分析第7頁/ERGOBioCyc/GeneDB/通路數(shù)據(jù)庫KEGG
其它通路數(shù)據(jù)庫:/ReactomeGWT/entrypoint.htmlReactomewikipathways/index.php/WikiPathwaysbiocarta/http://www.genome.jp/kegg/醫(yī)學(xué)數(shù)據(jù)挖掘功能分析第8頁KEGG數(shù)據(jù)庫介紹KyotoEncyclopediaofGenesandGenomes1995年5月,日本教育、科學(xué)、體育和文化部攜手建立了KEGG數(shù)據(jù)庫。由日本京都大學(xué)生物信息學(xué)中心Kanehisa試驗室開發(fā)KEGG是系統(tǒng)地分析基因功效、鏈接基因組信息和功效信息數(shù)據(jù)庫,意在揭示生命現(xiàn)象遺傳與化學(xué)藍(lán)圖。數(shù)據(jù)庫維護(hù)人員不定時依據(jù)最近出版一些學(xué)術(shù)論文和生物學(xué)試驗得到數(shù)據(jù)對該數(shù)據(jù)庫進(jìn)行更新,經(jīng)過了17年發(fā)展,數(shù)據(jù)庫規(guī)模不停擴大,其應(yīng)用價值也得到了世界范圍內(nèi)認(rèn)可。與其它數(shù)據(jù)庫相比,KEGG一個顯著特點就是含有強大圖形功效,它利用圖形而不是繁縟文字來介紹眾多代謝路徑以及各路徑之間關(guān)系。醫(yī)學(xué)數(shù)據(jù)挖掘功能分析第9頁KEGG主頁KEGG分析工具醫(yī)學(xué)數(shù)據(jù)挖掘功能分析第10頁KEGGPATHWAYhttp://www.genome.jp/kegg/pathway.html能夠看到KEGG收錄全部代謝路徑信息通路類別
醫(yī)學(xué)數(shù)據(jù)挖掘功能分析第11頁KEGGpathway分類
1.Metabolism
2.GeneticInformationProcessing
3.EnvironmentalInformationProcessing
4.CellularProcesses
5.OrganismalSystems
6.HumanDiseases
6.1Cancers
6.2ImmuneSystemDiseases
6.3NeurodegenerativeDiseases
6.4CardiovascularDiseases
6.5MetabolicDiseases
6.6InfectiousDiseases
醫(yī)學(xué)數(shù)據(jù)挖掘功能分析第12頁心血管疾病(CardiovascularDiseases)肥厚性心肌病(HCM)
hypertrophiccardiomyopathy致心律失常性右心室心肌癥(ARVC)
Arrhythmogenicrightventricularcardiomyopathy擴張性心肌癥(DCM)Dilatedcardiomyopathy
病毒性心肌炎Viralmyocarditis醫(yī)學(xué)數(shù)據(jù)挖掘功能分析第13頁糖尿?。═ypeIIdiabetesmellitus)結(jié)腸直腸癌(Colorectalcancer)醫(yī)學(xué)數(shù)據(jù)挖掘功能分析第14頁KEGG通路中疾病基因信息?1.Metabolism
2.GeneticInformationProcessing
3.EnvironmentalInformationProcessing
4.CellularProcesses
5.OrganismalSystems
6.HumanDiseases
KEGG通路中疾病信息?醫(yī)學(xué)數(shù)據(jù)挖掘功能分析第15頁查詢通路中疾病信息進(jìn)入KEGG網(wǎng)站http://www.genome.jp/kegg/pathway.html選擇一個通路(如:MAPK)進(jìn)入該通路,改變通路顯示方式為Homosapiens(human)+Disease/drug。點擊GoMAPK通路結(jié)果:http://www.genome.jp/kegg-bin/show_pathway?org_name=hsadd&mapno=04010&mapscale=1.0&show_description=show醫(yī)學(xué)數(shù)據(jù)挖掘功能分析第16頁瀏覽通路中與疾病相關(guān)基因疾病基因藥靶基因http://www.genome.jp/kegg-bin/show_pathway?org_name=hsadd&mapno=04010&mapscale=1.0&show_description=show人類基因培利替尼醫(yī)學(xué)數(shù)據(jù)挖掘功能分析第17頁案例:
查看單個疾病風(fēng)險基因注釋到哪些通路神經(jīng)膠質(zhì)瘤(Glioma)風(fēng)險基因(NCBI-GeneID:1956),該基因編碼表皮生長因子受體(EGFR)進(jìn)入KEGG搜索界面http://www.genome.jp/kegg/tool/map_pathway2.html選擇Searchagainst為:hsa選擇PrimaryID類型為:NCBI-GeneID輸入EGFR基因(如格式:1956red)點擊Exec醫(yī)學(xué)數(shù)據(jù)挖掘功能分析第18頁醫(yī)學(xué)數(shù)據(jù)挖掘功能分析第19頁醫(yī)學(xué)數(shù)據(jù)挖掘功能分析第20頁案例:
查看多個疾病風(fēng)險基因注釋到哪些通路(適合用于復(fù)雜疾?。慕?jīng)過差異表示分析取得動脈硬化(artherosclerosis)風(fēng)險基因集合:共234個基因進(jìn)入KEGG搜索界面http://www.genome.jp/kegg/tool/map_pathway2.html選擇Searchagainst為:hsa選擇PrimaryID類型為:NCBI-GeneID輸入差異表示基因,格式:19red368red點擊Exec醫(yī)學(xué)數(shù)據(jù)挖掘功能分析第21頁234個動脈硬化相關(guān)基因醫(yī)學(xué)數(shù)據(jù)挖掘功能分析第22頁凝血相關(guān)醫(yī)學(xué)數(shù)據(jù)挖掘功能分析第23頁功效數(shù)據(jù)庫:GeneOntology(GO)/醫(yī)學(xué)數(shù)據(jù)挖掘功能分析第24頁Year1982#ofrecords60244,202,133Sequencedatabases:GenBank、EMBL、DDBJ背景(1)傳統(tǒng)認(rèn)識功效方法遠(yuǎn)遠(yuǎn)跟不上基因發(fā)覺速度(2)大規(guī)?;蚬πьA(yù)測必要性;需系統(tǒng)水平上認(rèn)識基因功效(3)功效規(guī)范化和大規(guī)模處理需要(4)基因功效多效性?困難和挑戰(zhàn)醫(yī)學(xué)數(shù)據(jù)挖掘功能分析第25頁問題一、一個基因各種功效TP53inductionofapoptosisnegativeregulationofapoptosiscellularresponsetoUVchromosomeorganizationmitoticcellcycleG1/StransitionDNAdamagecheckpointnegativeregulationofDNAreplication…………醫(yī)學(xué)數(shù)據(jù)挖掘功能分析第26頁GlucosebiosynthesisGlucosesynthesisGlucoseformationGlucoseanabolismGluconeogenesisAllrefertotheprocessofmakingglucosefromsimplercomponents問題二、生物學(xué)功效各種描述醫(yī)學(xué)數(shù)據(jù)挖掘功能分析第27頁GO(geneontology)是:
基因本體聯(lián)合會(GeneOnotologyConsortium)所建立數(shù)據(jù)庫,意在建立一套適合用于各種物種,對基因和蛋白質(zhì)功效從多個方面進(jìn)行限定和描述,并能伴隨研究不停深入而更新語義(terms)詞匯標(biāo)準(zhǔn),即基因產(chǎn)物分類標(biāo)準(zhǔn)。GO數(shù)據(jù)庫不是以其本身為中心而是依靠外部數(shù)據(jù)庫,這些外部數(shù)據(jù)庫中收錄基因及其產(chǎn)物都將用GO定義詞匯進(jìn)行注釋。所以GO是與時俱進(jìn)與相互合作代表,它致力于統(tǒng)一基因及其產(chǎn)物注釋方式。
YoucanvisitGOat.醫(yī)學(xué)數(shù)據(jù)挖掘功能分析第28頁GO語義分類分子功效(MolecularFunction)描述在個體分子生物學(xué)上活性,如催化活性或結(jié)合活性。生物學(xué)過程(BiologicalProcess)由分子功效有序地組成,含有多個步驟一個過程,如細(xì)胞周期。細(xì)胞組件(CellularComponent)指基因產(chǎn)物位于何種細(xì)胞器或基因產(chǎn)物組中(如糙面內(nèi)質(zhì)網(wǎng),核糖體,蛋白酶體等),即基因產(chǎn)物在什么地方起作用醫(yī)學(xué)數(shù)據(jù)挖掘功能分析第29頁醫(yī)學(xué)數(shù)據(jù)挖掘功能分析第30頁Cellaging醫(yī)學(xué)數(shù)據(jù)挖掘功能分析第31頁term:gluconeogenesisid:GO:0006094definition:
Theformationofglucosefromnoncarbohydrateprecursors,suchaspyruvate,aminoacidsandglycerol.
Source:
MetaCyc:GLUCONEO-PWY
Ontology:BiologicalProcessSynonyms
exact:glucosebiosynthesisexact:glucosebiosyntheticprocessWhat’sinaGOterm?醫(yī)學(xué)數(shù)據(jù)挖掘功能分析第32頁OntologyStructureTheGOisstructuredasahierarchicaldirectedacyclicgraph(DAG)GOisn’tjustaflatlistofbiologicalterms,termsarerelatedwithinahierarchy醫(yī)學(xué)數(shù)據(jù)挖掘功能分析第33頁DirectedAcyclicGraphs語義之間關(guān)系isa:上一個概念包含下一個概念,下一個概念是上一個概念實例。partof:下一個概念是上一個概念一部分
樹松樹葉子PartofIsa(細(xì)胞質(zhì))(細(xì)胞器)(線粒體)(細(xì)胞器膜)Cell(細(xì)胞)partofpartof醫(yī)學(xué)數(shù)據(jù)挖掘功能分析第34頁案例:
查看單個疾病風(fēng)險基因注釋到哪些通路神經(jīng)膠質(zhì)瘤(Glioma)風(fēng)險基因(NCBI-GeneID:1956),該基因編碼表皮生長因子受體(EGFR)進(jìn)入GO界面/輸入EGFR基因(格式:EGFR)選擇geneorproteinname點擊Go!醫(yī)學(xué)數(shù)據(jù)挖掘功能分析第35頁醫(yī)學(xué)數(shù)據(jù)挖掘功能分析第36頁醫(yī)學(xué)數(shù)據(jù)挖掘功能分析第37頁案例:
查看多個疾病風(fēng)險基因注釋到哪些功效從經(jīng)過差異表示分析取得動脈硬化(artherosclerosis)風(fēng)險基因集合:共234個基因進(jìn)入GO搜索界面/cgi-bin/amigo/search.cgi?action=advanced_query&session_id=3352amigo1381455489在Enteryourquery文本框中輸入查詢基因輸入差異表示基因,格式:ABCA1ABCC6Searchtype選擇GenesorproteinsSearchfields選擇:symbol點擊Exec醫(yī)學(xué)數(shù)據(jù)挖掘功能分析第38頁醫(yī)學(xué)數(shù)據(jù)挖掘功能分析第39頁最多查詢50個基因醫(yī)學(xué)數(shù)據(jù)挖掘功能分析第40頁醫(yī)學(xué)數(shù)據(jù)挖掘功能分析第41頁GuidetoGOEvidenceCodesExperimentalEvidenceCodes
EXP:InferredfromExperimentIDA:InferredfromDirectAssayIPI:InferredfromPhysicalInteractionIMP:InferredfromMutantPhenotypeIGI:InferredfromGeneticInteractionIEP:InferredfromExpressionPattern
/GO.evidence.shtml#ieaComputationalAnalysisEvidenceCodesISS:InferredfromSequenceorStructuralSimilarityISO:InferredfromSequenceOrthologyISA:InferredfromSequenceAlignmentISM:InferredfromSequenceModelIGC:InferredfromGenomicContextIBA:InferredfromBiologicalaspectofAncestorIBD:InferredfromBiologicalaspectofDescendantIKR:InferredfromKeyResiduesIRD:InferredfromRapidDivergenceRCA:inferredfromReviewedComputationalAnalysis
醫(yī)學(xué)數(shù)據(jù)挖掘功能分析第42頁基因芯片數(shù)據(jù)基礎(chǔ)分析思緒預(yù)處理差異表示基因篩選聚類與分類功效注釋和富集分析醫(yī)學(xué)數(shù)據(jù)挖掘功能分析第43頁基因集功效富集分析原因一組基因直接注釋結(jié)果是得到大量功效結(jié)點。這些功效含有概念上交疊現(xiàn)象,不利于深入精細(xì)分析,所以研究人員希望對得到功效結(jié)點加以過濾和篩選,方便取得更有意義功效信息。富集分析方法通常是分析一組基因在某個功效結(jié)點上是否過出現(xiàn)(over-presentation)。由單個基因注釋分析發(fā)展到大基因集合成組分析。因為分析結(jié)論是基于一組相關(guān)基因,而不是依據(jù)單個基因,所以富集分析方法增加了研究可靠性,同時也能夠識別出與生物現(xiàn)象最相關(guān)生物過程。醫(yī)學(xué)數(shù)據(jù)挖掘功能分析第44頁案例:利用DAV
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 3萬噸年水處理劑技改項目安全條件論證報告 2
- 項目申請書模板
- 2025年歧化松香酸鈉項目投資可行性研究分析報告
- 物流系統(tǒng)規(guī)劃與設(shè)計的現(xiàn)代化技術(shù)應(yīng)用
- 電商與網(wǎng)絡(luò)直播的融合創(chuàng)新商業(yè)模式探索
- 汽車交通信號燈架項目可行性研究報告申請報告
- 貧困申請書怎么
- 2024其他農(nóng)畜產(chǎn)品批發(fā)行業(yè)影響因素分析
- 漢語兒童語音象征感知特征及其對詞匯習(xí)得的作用研究
- 《經(jīng)緯家教家風(fēng)館展陳大綱》漢英翻譯實踐報告
- 運動會活動流程中的醫(yī)療安全保障措施
- 2025年冷鏈物流產(chǎn)品配送及倉儲管理承包合同3篇
- 電鍍產(chǎn)業(yè)園項目可行性研究報告(專業(yè)經(jīng)典案例)
- 2025年魯泰集團招聘170人高頻重點提升(共500題)附帶答案詳解
- 2024-2025學(xué)年成都高新區(qū)七上數(shù)學(xué)期末考試試卷【含答案】
- 企業(yè)員工食堂管理制度框架
- 【開題報告】中小學(xué)校鑄牢中華民族共同體意識教育研究
- 2024-2025學(xué)年云南省大理州七年級(上)期末英語試卷(含答案)
- 中國遠(yuǎn)洋海運集團招聘筆試沖刺題2025
- 2025中國水利水電第十二工程局限公司招聘400人高頻重點提升(共500題)附帶答案詳解
- 《辣椒主要病蟲害》課件
評論
0/150
提交評論