醫(yī)學(xué)數(shù)據(jù)挖掘課件:功能分析_第1頁(yè)
醫(yī)學(xué)數(shù)據(jù)挖掘課件:功能分析_第2頁(yè)
醫(yī)學(xué)數(shù)據(jù)挖掘課件:功能分析_第3頁(yè)
醫(yī)學(xué)數(shù)據(jù)挖掘課件:功能分析_第4頁(yè)
醫(yī)學(xué)數(shù)據(jù)挖掘課件:功能分析_第5頁(yè)
已閱讀5頁(yè),還剩36頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

基因表達(dá)數(shù)據(jù)的獲得與分析基因芯片數(shù)據(jù)的基礎(chǔ)分析思路預(yù)處理差異表達(dá)基因篩選聚類(lèi)與分類(lèi)功能注釋和富集分析根據(jù)疾病風(fēng)險(xiǎn)基因識(shí)別疾病風(fēng)險(xiǎn)通路利用各種技術(shù)(基因表達(dá)譜、RNAseq、質(zhì)譜、大規(guī)模突變、全基因組關(guān)聯(lián)分析等)識(shí)別疾病風(fēng)險(xiǎn)基因注釋這些基因到通路中識(shí)別疾病風(fēng)險(xiǎn)通路分析這些通路與疾病的相關(guān)性丙酮酸丙酮酸激酶2-磷酸甘油酸磷酸烯醇式丙酮酸烯醇化酶葡萄糖6-磷酸葡萄糖6-磷酸果糖1,6-雙磷酸果糖3-磷酸甘油醛1,3-二磷酸甘油酸3-二磷酸甘油酸http://www.genome.jp/kegg-bin/show_pathway?org_name=rn&mapno=00010&mapscale=1.0&show_description=show葡萄糖代謝通路泛素化去磷酸化抑制激活磷酸化綁定/相關(guān)http://www.genome.jp/kegg/pathway/hsa/hsa04630.html節(jié)點(diǎn)間的各種關(guān)系通過(guò)這些詳細(xì)的互作關(guān)系,我們能夠更清晰的了解通路!http://www.genome.jp/kegg/document/help_pathway.htmlhttp://www.genome.jp/kegg/xml/docs/Detail:/ERGOBioCyc/GeneDB/通路數(shù)據(jù)庫(kù)KEGG其它通路數(shù)據(jù)庫(kù):/ReactomeGWT/entrypoint.htmlReactomewikipathways/index.php/WikiPathwaysbiocarta/http://www.genome.jp/kegg/KEGG數(shù)據(jù)庫(kù)介紹KyotoEncyclopediaofGenesandGenomes1995年5月,日本的教育、科學(xué)、體育和文化部攜手建立了KEGG數(shù)據(jù)庫(kù)。由日本京都大學(xué)生物信息學(xué)中心的Kanehisa實(shí)驗(yàn)室開(kāi)發(fā)KEGG是系統(tǒng)地分析基因功能、鏈接基因組信息和功能信息的數(shù)據(jù)庫(kù),旨在揭示生命現(xiàn)象的遺傳與化學(xué)藍(lán)圖。數(shù)據(jù)庫(kù)的維護(hù)人員不定期的根據(jù)最近出版的一些學(xué)術(shù)論文和生物學(xué)實(shí)驗(yàn)得到的數(shù)據(jù)對(duì)該數(shù)據(jù)庫(kù)進(jìn)行更新,經(jīng)過(guò)了17年的發(fā)展,數(shù)據(jù)庫(kù)的規(guī)模不斷的擴(kuò)大,其應(yīng)用價(jià)值也得到了世界范圍內(nèi)的認(rèn)可。與其他數(shù)據(jù)庫(kù)相比,KEGG的一個(gè)顯著特點(diǎn)就是具有強(qiáng)大的圖形功能,它利用圖形而不是繁縟的文字來(lái)介紹眾多的代謝途徑以及各途徑之間的關(guān)系。KEGG主頁(yè)KEGG分析工具KEGGPATHWAYhttp://www.genome.jp/kegg/pathway.html可以看到KEGG收錄的所有代謝途徑信息通路類(lèi)別

KEGGpathway分類(lèi)

1.Metabolism

2.GeneticInformationProcessing

3.EnvironmentalInformationProcessing

4.CellularProcesses

5.OrganismalSystems

6.HumanDiseases

6.1Cancers

6.2ImmuneSystemDiseases

6.3NeurodegenerativeDiseases

6.4CardiovascularDiseases

6.5MetabolicDiseases

6.6InfectiousDiseases

心血管疾病(CardiovascularDiseases

)肥厚性心肌病(HCM)

hypertrophiccardiomyopathy致心律失常性右心室心肌癥(ARVC)

Arrhythmogenicrightventricularcardiomyopathy擴(kuò)張性心肌癥(DCM)Dilatedcardiomyopathy

病毒性心肌炎Viralmyocarditis糖尿?。═ypeIIdiabetesmellitus)結(jié)腸直腸癌(Colorectalcancer)案例1:

查看單個(gè)疾病風(fēng)險(xiǎn)基因注釋到哪些通路神經(jīng)膠質(zhì)瘤(Glioma)風(fēng)險(xiǎn)基因(NCBI-GeneID:1956),該基因編碼表皮生長(zhǎng)因子受體(EGFR)進(jìn)入KEGG搜索界面http://www.genome.jp/kegg/tool/map_pathway2.html選擇Searchagainst為:hsa選擇PrimaryID類(lèi)型為:NCBI-GeneID輸入EGFR基因(如格式:1956red)點(diǎn)擊Exec案例2:

查看多個(gè)疾病風(fēng)險(xiǎn)基因注釋到哪些通路(適用于復(fù)雜疾?。耐ㄟ^(guò)差異表達(dá)分析獲得動(dòng)脈硬化(artherosclerosis)風(fēng)險(xiǎn)基因集合:共234個(gè)基因進(jìn)入KEGG搜索界面http://www.genome.jp/kegg/tool/map_pathway2.html選擇Searchagainst為:hsa選擇PrimaryID類(lèi)型為:NCBI-GeneID輸入差異表達(dá)基因,格式:19red368red點(diǎn)擊Exec234個(gè)動(dòng)脈硬化相關(guān)基因凝血相關(guān)功能數(shù)據(jù)庫(kù):GeneOntology(GO)/GO語(yǔ)義的分類(lèi)分子功能(MolecularFunction)描述在個(gè)體分子生物學(xué)上的活性,如催化活性或結(jié)合活性。生物學(xué)過(guò)程(BiologicalProcess)由分子功能有序地組成的,具有多個(gè)步驟的一個(gè)過(guò)程,如細(xì)胞周期。細(xì)胞組件(CellularComponent)指基因產(chǎn)物位于何種細(xì)胞器或基因產(chǎn)物組中(如糙面內(nèi)質(zhì)網(wǎng),核糖體,蛋白酶體等),即基因產(chǎn)物在什么地方起作用term:gluconeogenesisid:GO:0006094definition:

Theformationofglucosefromnoncarbohydrateprecursors,suchaspyruvate,aminoacidsandglycerol.

Source:

MetaCyc:GLUCONEO-PWY

Ontology:BiologicalProcessSynonyms

exact:glucosebiosynthesisexact:glucosebiosyntheticprocessWhat’sinaGOterm?/amigo/term/GO:0006094案例3:

查看單個(gè)疾病風(fēng)險(xiǎn)基因注釋到哪些功能神經(jīng)膠質(zhì)瘤(Glioma)風(fēng)險(xiǎn)基因(NCBI-GeneID:1956),該基因編碼表皮生長(zhǎng)因子受體(EGFR)進(jìn)入GO界面/輸入EGFR基因(格式:EGFR)選擇geneorproteinname點(diǎn)擊Go!案例4:

查看多個(gè)疾病風(fēng)險(xiǎn)基因注釋到哪些功能從通過(guò)差異表達(dá)分析獲得動(dòng)脈硬化(artherosclerosis)風(fēng)險(xiǎn)基因集合:共234個(gè)基因進(jìn)入GO搜索界面

/cgi-bin/amigo/search.cgi?action=advanced_query&session_id=3352amigo1381455489在Enteryourquery文本框中輸入查詢(xún)基因輸入差異表達(dá)基因,格式:ABCA1ABCC6Searchtype選擇GenesorproteinsSearchfields選擇:symbol點(diǎn)擊Exec最多查詢(xún)50個(gè)基因基因芯片數(shù)據(jù)的基礎(chǔ)分析思路預(yù)處理差異表達(dá)基因篩選聚類(lèi)與分類(lèi)功能注釋和富集分析基因集功能富集分析的原因一組基因直接注釋的結(jié)果是得到大量的功能結(jié)點(diǎn)。這些功能具有概念上的交疊現(xiàn)象,不利于進(jìn)一步的精細(xì)分析,所以研究人員希望對(duì)得到的功能結(jié)點(diǎn)加以過(guò)濾和篩選,以便獲得更有意義的功能信息。富集分析方法通常是分析一組基因在某個(gè)功能結(jié)點(diǎn)上是否過(guò)出現(xiàn)(over-presentation)。由單個(gè)基因的注釋分析發(fā)展到大基因集合的成組分析。由于分析的結(jié)論是基于一組相關(guān)的基因,而不是根據(jù)單個(gè)基因,所以富集分析方法增加了研究的可靠性,同時(shí)也能夠識(shí)別出與生物現(xiàn)象最相關(guān)的生物過(guò)程。案例5:利用DAVID工具進(jìn)行動(dòng)脈硬化風(fēng)險(xiǎn)通路識(shí)別從GAD數(shù)據(jù)庫(kù)收集動(dòng)脈硬化(artherosclerosis)風(fēng)險(xiǎn)基因集合:共234個(gè)基因?qū)?34個(gè)基因輸入到DAVID系統(tǒng)利用EASE檢驗(yàn)計(jì)算每個(gè)通路的富集顯著性(P-value)EASEScore,amodifiedFisherExactP-Value

疾病風(fēng)險(xiǎn)基因數(shù)

人類(lèi)基因

InPathway

3

40

NotInPathway

297

29960FisherExactP-Value=

0.008EASEScore=

0.06EASE分值更加嚴(yán)格!-1DAVIDTools

步驟1:進(jìn)入DAVID網(wǎng)站,選擇

FunctionalAnnotation

DAVID地址:/步驟2:(1)輸入234個(gè)動(dòng)脈硬化基因集合(2)選擇基因ID

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論