




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、基因表達(dá)數(shù)據(jù)的獲得與分析基因芯片數(shù)據(jù)的基礎(chǔ)分析思路預(yù)處理差異表達(dá)基因篩選聚類與分類功能注釋和富集分析根據(jù)疾病風(fēng)險基因識別疾病風(fēng)險通路利用各種技術(shù)(基因表達(dá)譜、RNAseq、質(zhì)譜、大規(guī)模突變、全基因組關(guān)聯(lián)分析等)識別疾病風(fēng)險基因注釋這些基因到通路中識別疾病風(fēng)險通路分析這些通路與疾病的相關(guān)性丙酮酸丙酮酸激酶2-磷酸甘油酸磷酸烯醇式丙酮酸烯醇化酶葡萄糖6-磷酸葡萄糖6-磷酸果糖1,6-雙磷酸果糖3-磷酸甘油醛1,3-二磷酸甘油酸3-二磷酸甘油酸http:/www.genome.jp/kegg-bin/show_pathway?org_name=rn&mapno=00010&mapscale=1.0&
2、show_description=show葡萄糖代謝通路MAPK信號通路節(jié)點間的各種關(guān)系通過這些詳細(xì)的互作關(guān)系,我們能夠更清晰的了解通路!http:/www.genome.jp/kegg/document/help_pathway.htmlhttp:/www.genome.jp/kegg/xml/docs/Detail:泛素化去磷酸化抑制激活磷酸化綁定/相關(guān)http:/www.genome.jp/kegg/pathway/hsa/hsa04630.html/ ERGOBioCyc/ GeneDB/ 通路數(shù)據(jù)庫KEGG 其它通路數(shù)據(jù)庫:/ReactomeGWT/entrypoint.htmlRe
3、actomewikipathways/index.php/WikiPathwaysbiocarta/http:/www.genome.jp/kegg/KEGG數(shù)據(jù)庫介紹Kyoto Encyclopedia of Genes and Genomes1995年5月,日本的教育、科學(xué)、體育和文化部攜手建立了KEGG數(shù)據(jù)庫。由日本京都大學(xué)生物信息學(xué)中心的Kanehisa實驗室開發(fā) KEGG是系統(tǒng)地分析基因功能、鏈接基因組信息和功能信息的數(shù)據(jù)庫,旨在揭示生命現(xiàn)象的遺傳與化學(xué)藍(lán)圖。數(shù)據(jù)庫的維護(hù)人員不定期的根據(jù)最近出版的一些學(xué)術(shù)論文和生物學(xué)實驗得到的數(shù)據(jù)對該數(shù)據(jù)庫進(jìn)行更新,經(jīng)過了17年的發(fā)展,數(shù)據(jù)庫的規(guī)模不
4、斷的擴(kuò)大,其應(yīng)用價值也得到了世界范圍內(nèi)的認(rèn)可。與其他數(shù)據(jù)庫相比,KEGG 的一個顯著特點就是具有強(qiáng)大的圖形功能,它利用圖形而不是繁縟的文字來介紹眾多的代謝途徑以及各途徑之間的關(guān)系。KEGG主頁KEGG分析工具KEGG PATHWAYhttp:/www.genome.jp/kegg/pathway.html可以看到KEGG 收錄的所有代謝途徑信息通路類別 KEGG pathway 分類 1. Metabolism 2. Genetic Information Processing 3. Environmental Information Processing 4. Cellular Proces
5、ses 5. Organismal Systems 6. Human Diseases 6.1 Cancers 6.2 Immune System Diseases 6.3 Neurodegenerative Diseases 6.4 Cardiovascular Diseases 6.5 Metabolic Diseases 6.6 Infectious Diseases 心血管疾病(Cardiovascular Diseases )肥厚性心肌病(HCM)hypertrophic cardiomyopathy致心律失常性右心室心肌癥(ARVC)Arrhythmogenic right ven
6、tricular cardiomyopathy擴(kuò)張性心肌癥(DCM)Dilated cardiomyopathy 病毒性心肌炎Viral myocarditis 糖尿?。═ype II diabetes mellitus )結(jié)腸直腸癌(Colorectal cancer)KEGG通路中的疾病基因信息? 1. Metabolism 2. Genetic Information Processing 3. Environmental Information Processing 4. Cellular Processes 5. Organismal Systems 6. Human Disease
7、s KEGG通路中的疾病信息?查詢通路中的疾病信息進(jìn)入KEGG網(wǎng)站 http:/www.genome.jp/kegg/pathway.html選擇一個通路(如:MAPK)進(jìn)入該通路,改變通路顯示方式為Homo sapiens (human) + Disease/drug 。點擊GoMAPK通路結(jié)果:http:/www.genome.jp/kegg-bin/show_pathway?org_name=hsadd&mapno=04010&mapscale=1.0&show_description=show瀏覽通路中與疾病相關(guān)的基因疾病基因 藥靶基因 http:/www.genome.jp/kegg
8、-bin/show_pathway?org_name=hsadd&mapno=04010&mapscale=1.0&show_description=show人類基因 培利替尼 案例:查看單個疾病風(fēng)險基因注釋到哪些通路神經(jīng)膠質(zhì)瘤(Glioma)風(fēng)險基因(NCBI-GeneID :1956),該基因編碼表皮生長因子受體(EGFR) 進(jìn)入KEGG搜索界面http:/www.genome.jp/kegg/tool/map_pathway2.html選擇Search against為:hsa選擇Primary ID 類型為:NCBI-GeneID輸入EGFR基因(如格式:1956 red)點擊Exec
9、案例:查看多個疾病風(fēng)險基因注釋到哪些通路(適用于復(fù)雜疾?。耐ㄟ^差異表達(dá)分析獲得動脈硬化(artherosclerosis)風(fēng)險基因集合:共234個基因進(jìn)入KEGG搜索界面http:/www.genome.jp/kegg/tool/map_pathway2.html選擇Search against為:hsa選擇Primary ID 類型為:NCBI-GeneID輸入差異表達(dá)基因,格式:19 red 368 red點擊Exec234個動脈硬化相關(guān)基因凝血相關(guān)功能數(shù)據(jù)庫:Gene Ontology (GO)/Year19822005# of records60244, 202,133 Sequen
10、ce databases:GenBank、EMBL、DDBJ背景 (1)傳統(tǒng)認(rèn)識功能的方法遠(yuǎn)遠(yuǎn)跟不上基因發(fā)現(xiàn)的速度(2)大規(guī)模的基因功能預(yù)測的必要性;需系統(tǒng)水平上認(rèn)識基因功能(3)功能的規(guī)范化和大規(guī)模處理的需要(4)基因功能的多效性?困難和挑戰(zhàn) 問題一、一個基因多種功能TP53induction of apoptosisnegative regulation of apoptosis cellular response to UVchromosome organizationmitotic cell cycle G1/S transition DNA damage checkpoint neg
11、ative regulation of DNA replication Glucose biosynthesisGlucose synthesisGlucose formationGlucose anabolismGluconeogenesisAll refer to the process of making glucose from simpler components問題二、生物學(xué)功能的多種描述GO(gene ontology)是: 基因本體聯(lián)合會(Gene Onotology Consortium)所建立的數(shù)據(jù)庫,旨在建立一套適用于各種物種的,對基因和蛋白質(zhì)功能從多個方面進(jìn)行限定和描述
12、的,并能隨著研究不斷深入而更新的語義(terms)詞匯標(biāo)準(zhǔn),即基因產(chǎn)物分類標(biāo)準(zhǔn)。GO數(shù)據(jù)庫不是以其自身為中心而是依靠外部數(shù)據(jù)庫,這些外部數(shù)據(jù)庫中收錄的基因及其產(chǎn)物都將用GO定義的詞匯進(jìn)行注釋。因此GO是與時俱進(jìn)與相互合作的代表,它致力于統(tǒng)一基因及其產(chǎn)物注釋的方式。 You can visit GO at .GO語義的分類分子功能(Molecular Function)描述在個體分子生物學(xué)上的活性,如催化活性或結(jié)合活性。生物學(xué)過程(Biological Process)由分子功能有序地組成的,具有多個步驟的一個過程,如細(xì)胞周期。細(xì)胞組件(Cellular Component)指基因產(chǎn)物位于何種細(xì)
13、胞器或基因產(chǎn)物組中(如糙面內(nèi)質(zhì)網(wǎng),核糖體,蛋白酶體等),即基因產(chǎn)物在什么地方起作用Cell agingterm: gluconeogenesisid: GO:0006094definition: The formation of glucose from noncarbohydrate precursors, such as pyruvate, amino acids and glycerol. Source: MetaCyc:GLUCONEO-PWY Ontology:Biological Process Synonyms exact: glucose biosynthesis exact:
14、 glucose biosynthetic process Whats in a GO term?Ontology StructureThe GO is structured as a hierarchical directed acyclic graph (DAG)GO isnt just a flat list of biological terms, terms are related within a hierarchyDirected Acyclic Graphs語義之間的關(guān)系is a:上一個概念包括下一個概念 , 下一個概念是上一個概念的實例 。part of:下一個概念是上一個概
15、念的一部分 樹松樹葉子Part ofIs a(細(xì)胞質(zhì))(細(xì)胞器)(線粒體)(細(xì)胞器膜)Cell(細(xì)胞)part ofpart of案例:查看單個疾病風(fēng)險基因注釋到哪些通路神經(jīng)膠質(zhì)瘤(Glioma)風(fēng)險基因(NCBI-GeneID :1956),該基因編碼表皮生長因子受體(EGFR) 進(jìn)入GO界面/輸入EGFR基因(格式: EGFR )選擇gene or protein name 點擊Go!案例:查看多個疾病風(fēng)險基因注釋到哪些功能從通過差異表達(dá)分析獲得動脈硬化(artherosclerosis)風(fēng)險基因集合:共234個基因進(jìn)入GO搜索界面 /cgi-bin/amigo/search.cgi?ac
16、tion=advanced_query&session_id=3352amigo1381455489在Enter your query文本框中輸入查詢基因輸入差異表達(dá)基因,格式:ABCA1 ABCC6Search type 選擇Genes or proteinsSearch fields選擇:symbol點擊Exec最多查詢50個基因Guide to GO Evidence CodesExperimental Evidence Codes EXP: Inferred from Experiment IDA: Inferred from Direct Assay IPI: Inferred fr
17、om Physical Interaction IMP: Inferred from Mutant Phenotype IGI: Inferred from Genetic Interaction IEP: Inferred from Expression Pattern /GO.evidence.shtml#ieaComputational Analysis Evidence Codes ISS: Inferred from Sequence or Structural Similarity ISO: Inferred from Sequence Orthology ISA: Inferre
18、d from Sequence Alignment ISM: Inferred from Sequence Model IGC: Inferred from Genomic Context IBA: Inferred from Biological aspect of Ancestor IBD: Inferred from Biological aspect of Descendant IKR: Inferred from Key Residues IRD: Inferred from Rapid Divergence RCA: inferred from Reviewed Computational Analysis 基因芯片數(shù)據(jù)的基礎(chǔ)分析思路預(yù)處理差異表達(dá)基因篩選聚類與分類功能注釋和富集分析基因集功能富集分析的原因一組基因直接注釋的結(jié)果是得到大量的功能結(jié)點。這些功能具有概念上的交疊現(xiàn)象,不利于進(jìn)一步的精細(xì)分析,所以研究人員希望對得到的功能結(jié)點加以過濾和篩選,以便獲得更有意義的功能信息。富集分析方法通常是分析一組基因在某個功能結(jié)點上是否過出現(xiàn)(over-presentation)。由單個基因的注釋分析發(fā)展到大基因集合的成組分析。 由于分析的結(jié)論是基于
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 財務(wù)人員的責(zé)任與義務(wù)計劃
- 制定清晰的財務(wù)目標(biāo)計劃
- 幼兒藝術(shù)表現(xiàn)的多樣性研究計劃
- 萬源市竹源煤業(yè)有限公司長石二煤礦礦山地質(zhì)環(huán)境保護(hù)與土地復(fù)墾方案情況
- 2025年經(jīng)典大班蒙氏數(shù)學(xué)標(biāo)準(zhǔn)教案
- 空乘禮儀知識培訓(xùn)班課件
- 2025年四川貨運(yùn)從業(yè)資格證考試模擬考試答案
- 胃癌治療手段
- 2025年洛陽貨運(yùn)從業(yè)資格證考試技巧
- 3D打印技術(shù)知到課后答案智慧樹章節(jié)測試答案2025年春上海電子信息職業(yè)技術(shù)學(xué)院
- 辦公用品供貨服務(wù)計劃方案
- DB37∕T 5107-2018 城鎮(zhèn)排水管道檢測與評估技術(shù)規(guī)程
- 2022新冠疫苗疑似預(yù)防接種異常反應(yīng)監(jiān)測和處置方案
- 酒精溶液體積濃度、質(zhì)量濃度與密度對照表
- 主要腸內(nèi)營養(yǎng)制劑成分比較
- 老年人各系統(tǒng)的老化改變
- 小學(xué)五年級綜合實踐課教案
- 煤礦井下供電常用計算公式及系數(shù)
- ISO14001:2015中文版(20211205141421)
- 汽車總裝車間板鏈輸送線的應(yīng)用研究
- 工作日志模板
評論
0/150
提交評論