公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件_第1頁
公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件_第2頁
公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件_第3頁
公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件_第4頁
公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件_第5頁
已閱讀5頁,還剩143頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

李曦副教授中南大學(xué)湘雅醫(yī)院臨床藥理研究所公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法李曦副教授公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法1NatureReviewsGenetics

16,

85–97

(2015)NatureReviewsGenetics

16,

852什么是數(shù)據(jù)挖掘從海量數(shù)據(jù)中揭示潛在的生物學(xué)規(guī)律。什么是數(shù)據(jù)挖掘從海量數(shù)據(jù)中揭示潛在的生物學(xué)規(guī)律。3為什么要學(xué)習(xí)數(shù)據(jù)挖掘把握自己的命運最大化利用已有數(shù)據(jù)尋找新的課題為什么要學(xué)習(xí)數(shù)據(jù)挖掘把握自己的命運4數(shù)據(jù)挖掘的步驟數(shù)據(jù)挖掘的步驟5生物醫(yī)學(xué)研究人員的優(yōu)勢數(shù)據(jù)處理步驟、統(tǒng)計分析均有工具可以完成數(shù)據(jù)挖掘表型的確定數(shù)據(jù)的選擇數(shù)據(jù)挖掘結(jié)果的解讀生物醫(yī)學(xué)研究人員的優(yōu)勢數(shù)據(jù)處理步驟、統(tǒng)計分析均有工具可以完成6生物醫(yī)學(xué)數(shù)據(jù)挖掘所需技能必備技能:基本的生物信息學(xué)知識各種數(shù)據(jù)庫的使用、數(shù)據(jù)庫信息的解讀基本的生物統(tǒng)計學(xué)知識分析方法的選擇,分析軟件的使用可選技能:R語言的基本操作R包的使用Linux系統(tǒng)的基本操作生物信息學(xué)分析軟件的使用生物醫(yī)學(xué)數(shù)據(jù)挖掘所需技能必備技能:7基因組表達譜數(shù)據(jù)挖掘流程確定研究策略獲取表達譜數(shù)據(jù)處理表達譜數(shù)據(jù)統(tǒng)計分析驗證分析基因組表達譜數(shù)據(jù)挖掘流程確定研究策略8數(shù)據(jù)挖掘案例數(shù)據(jù)挖掘案例9分析策略核心思路:影響腦膠質(zhì)瘤發(fā)生發(fā)展的基因可能影響腦膠質(zhì)瘤的預(yù)后分析流程:獲取包含腦膠質(zhì)瘤組織和正常腦組織的全基因組表達數(shù)據(jù)的多個數(shù)據(jù)集鑒定在腦膠質(zhì)瘤組織和正常腦組織中差異表達的基因在自己收集的樣本中驗證這些基因分析這些基因與腫瘤分級以及總生存期之間的關(guān)系分析策略核心思路:10公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件11公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件12公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件13公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件14公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件15策略舉例影響阿糖胞苷藥物敏感性的基因可能影響AML預(yù)后。影響鉑類藥物敏感性的基因可能影響多種腫瘤的預(yù)后。在高低腫瘤分級中存在差異的基因可能影響癌癥預(yù)后。……策略舉例影響阿糖胞苷藥物敏感性的基因可能影響AML預(yù)后。16研究策略如何確定研究策略可以千變?nèi)f化研究策略決定了論文的上限應(yīng)根據(jù)自身專業(yè)選擇有意義的研究策略研究策略如何確定研究策略可以千變?nèi)f化17包含基因組表達譜數(shù)據(jù)的數(shù)據(jù)庫包含基因組表達譜數(shù)據(jù)的數(shù)據(jù)庫18GEO數(shù)據(jù)庫關(guān)鍵名詞Profile:數(shù)據(jù)庫整理好的單個基因的概述Datasets:見GDS和GSE。GSM:單個樣本的實驗數(shù)據(jù)GDS:數(shù)據(jù)庫整理好的關(guān)于某個話題的GSM集合。一個GDS中的所有GSM為同一平臺。GSE:一個實驗項目中的多個GSM合集,可能使用多個平臺。GPL:芯片平臺,如Affymetrix,Agilent等。GEO數(shù)據(jù)庫關(guān)鍵名詞Profile:數(shù)據(jù)庫整理好的單個基因的19公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件20Profile示例實驗描述實驗結(jié)果展示Profile示例實驗描述實驗結(jié)果展示21Value:歸一化的相對表達量Rank:探針表達值在所有表達值中的排名的百分比。Rank越高,表達越高。Value:歸一化的相對表達量22Datasets示例Datasets示例23公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件24公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件25芯片介紹芯片介紹26芯片注釋文件芯片注釋文件27樣本描述樣本描述28公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件29公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件30公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件31公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件32公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件33Limma法分析的TOP250結(jié)果Limma法分析的TOP250結(jié)果34公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件35公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件36公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件37https://paolo.shinyapps.io/ShinyVolcanoPlot/https://paolo.shinyapps.io/Shi38韋恩圖http://bioinformatics.psb.ugent.be/webtools/Venn/韋恩圖http://bioinformatics.psb.u39公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件40通路分析/通路分析/41公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件42公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件43公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件44公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件45生存分析驗證Survexpresshttp://bioinformatica.mty.itesm.mx:8080/Biomatec/SurvivaX.jspKMPlotter/analysis//生存分析驗證Survexpress46輸入基因名輸入基因名47公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件48選擇分析表型選擇分析表型49公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件50公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件51公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件52公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件53公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件54GEO數(shù)據(jù)本機處理統(tǒng)計分析+作圖軟件SPSSGraphadRGEO數(shù)據(jù)本機處理統(tǒng)計分析+作圖軟件55Kaplan-Meier法單因素生存分析分類變量做生存曲線圖Cox回歸模型單因素或多因素生存分析分類或連續(xù)變量計算HR和95%CI生存分析Kaplan-Meier法生存分析56公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件57公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件58P值HRP值HR59公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件60公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件61公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件62公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件63雙擊彈出雙擊彈出64公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件65公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件66謝謝!腫瘤靶向藥物的個體化治療謝謝!腫瘤靶向藥物的個體化治療67數(shù)量性狀連續(xù)變量,如:身高、體重、藥物劑量等質(zhì)量性狀分類變量,如:性別、療效、等級等其他類型性狀時間依賴性變量,如:生存期,中位生存時間等

研究表型數(shù)量性狀研究表型68參數(shù)檢驗(符合正態(tài)分布時)T檢驗(獨立樣本或配對樣本):兩樣本均數(shù)比較方差分析:兩個以上樣本均數(shù)比較線性回歸分析:多個因素對因變量的影響

非參數(shù)檢驗(不符合正態(tài)分布時)Mann-WhitneyU檢測:兩獨立樣本Kolmogorov-Smirnov檢測:兩獨立樣本McNemar檢驗:配對樣本Kruskal-Wallis檢驗:多獨立樣本數(shù)量性狀常用統(tǒng)計分析方法參數(shù)檢驗(符合正態(tài)分布時)數(shù)量性狀常用統(tǒng)計分析方法69卡方檢驗:單因素對因變量的影響邏輯回歸:多個因素對因變量的影響質(zhì)量性狀常用統(tǒng)計分析方法A:期望值>5且樣本量>40,用Pearson卡方。

B:1<期望值<5且樣本量>40,用連續(xù)校正。(僅用于四格表資料)

C:期望值<5或樣本量≤40,用Fisher精確檢驗??ǚ綑z驗:單因素對因變量的影響質(zhì)量性狀常用統(tǒng)計分析方法A:期70還有問題解決不了怎么辦?還有問題解決不了怎么辦?71加入達人學(xué)社QQ群(加群請注明信息:單位+專業(yè)+姓名,每人限加一個群)33405037、491043563496353730、496740737496974932、273757394大神幫你解決高難文獻群內(nèi)共享資源資源獲取技術(shù)教學(xué)視頻同行分享交流(主要為生物、醫(yī)學(xué)、化學(xué)專業(yè))加入達人學(xué)社QQ群大神幫你解決高難文獻72請關(guān)注達人學(xué)社微信公眾號甲骨文技術(shù)負責人微信號請注明個人信息:單位、專業(yè)、姓名張常昕夏艷東請關(guān)注達人學(xué)社微信公眾號甲骨文技術(shù)負責人微信號請注明個人信息73講座主辦單位達人學(xué)社湖南甲骨文生物醫(yī)藥有限公司講座主辦單位74李曦副教授中南大學(xué)湘雅醫(yī)院臨床藥理研究所公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法李曦副教授公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法75NatureReviewsGenetics

16,

85–97

(2015)NatureReviewsGenetics

16,

8576什么是數(shù)據(jù)挖掘從海量數(shù)據(jù)中揭示潛在的生物學(xué)規(guī)律。什么是數(shù)據(jù)挖掘從海量數(shù)據(jù)中揭示潛在的生物學(xué)規(guī)律。77為什么要學(xué)習(xí)數(shù)據(jù)挖掘把握自己的命運最大化利用已有數(shù)據(jù)尋找新的課題為什么要學(xué)習(xí)數(shù)據(jù)挖掘把握自己的命運78數(shù)據(jù)挖掘的步驟數(shù)據(jù)挖掘的步驟79生物醫(yī)學(xué)研究人員的優(yōu)勢數(shù)據(jù)處理步驟、統(tǒng)計分析均有工具可以完成數(shù)據(jù)挖掘表型的確定數(shù)據(jù)的選擇數(shù)據(jù)挖掘結(jié)果的解讀生物醫(yī)學(xué)研究人員的優(yōu)勢數(shù)據(jù)處理步驟、統(tǒng)計分析均有工具可以完成80生物醫(yī)學(xué)數(shù)據(jù)挖掘所需技能必備技能:基本的生物信息學(xué)知識各種數(shù)據(jù)庫的使用、數(shù)據(jù)庫信息的解讀基本的生物統(tǒng)計學(xué)知識分析方法的選擇,分析軟件的使用可選技能:R語言的基本操作R包的使用Linux系統(tǒng)的基本操作生物信息學(xué)分析軟件的使用生物醫(yī)學(xué)數(shù)據(jù)挖掘所需技能必備技能:81基因組表達譜數(shù)據(jù)挖掘流程確定研究策略獲取表達譜數(shù)據(jù)處理表達譜數(shù)據(jù)統(tǒng)計分析驗證分析基因組表達譜數(shù)據(jù)挖掘流程確定研究策略82數(shù)據(jù)挖掘案例數(shù)據(jù)挖掘案例83分析策略核心思路:影響腦膠質(zhì)瘤發(fā)生發(fā)展的基因可能影響腦膠質(zhì)瘤的預(yù)后分析流程:獲取包含腦膠質(zhì)瘤組織和正常腦組織的全基因組表達數(shù)據(jù)的多個數(shù)據(jù)集鑒定在腦膠質(zhì)瘤組織和正常腦組織中差異表達的基因在自己收集的樣本中驗證這些基因分析這些基因與腫瘤分級以及總生存期之間的關(guān)系分析策略核心思路:84公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件85公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件86公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件87公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件88公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件89策略舉例影響阿糖胞苷藥物敏感性的基因可能影響AML預(yù)后。影響鉑類藥物敏感性的基因可能影響多種腫瘤的預(yù)后。在高低腫瘤分級中存在差異的基因可能影響癌癥預(yù)后。……策略舉例影響阿糖胞苷藥物敏感性的基因可能影響AML預(yù)后。90研究策略如何確定研究策略可以千變?nèi)f化研究策略決定了論文的上限應(yīng)根據(jù)自身專業(yè)選擇有意義的研究策略研究策略如何確定研究策略可以千變?nèi)f化91包含基因組表達譜數(shù)據(jù)的數(shù)據(jù)庫包含基因組表達譜數(shù)據(jù)的數(shù)據(jù)庫92GEO數(shù)據(jù)庫關(guān)鍵名詞Profile:數(shù)據(jù)庫整理好的單個基因的概述Datasets:見GDS和GSE。GSM:單個樣本的實驗數(shù)據(jù)GDS:數(shù)據(jù)庫整理好的關(guān)于某個話題的GSM集合。一個GDS中的所有GSM為同一平臺。GSE:一個實驗項目中的多個GSM合集,可能使用多個平臺。GPL:芯片平臺,如Affymetrix,Agilent等。GEO數(shù)據(jù)庫關(guān)鍵名詞Profile:數(shù)據(jù)庫整理好的單個基因的93公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件94Profile示例實驗描述實驗結(jié)果展示Profile示例實驗描述實驗結(jié)果展示95Value:歸一化的相對表達量Rank:探針表達值在所有表達值中的排名的百分比。Rank越高,表達越高。Value:歸一化的相對表達量96Datasets示例Datasets示例97公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件98公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件99芯片介紹芯片介紹100芯片注釋文件芯片注釋文件101樣本描述樣本描述102公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件103公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件104公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件105公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件106公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件107Limma法分析的TOP250結(jié)果Limma法分析的TOP250結(jié)果108公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件109公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件110公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件111https://paolo.shinyapps.io/ShinyVolcanoPlot/https://paolo.shinyapps.io/Shi112韋恩圖http://bioinformatics.psb.ugent.be/webtools/Venn/韋恩圖http://bioinformatics.psb.u113公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件114通路分析/通路分析/115公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件116公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件117公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件118公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件119生存分析驗證Survexpresshttp://bioinformatica.mty.itesm.mx:8080/Biomatec/SurvivaX.jspKMPlotter/analysis//生存分析驗證Survexpress120輸入基因名輸入基因名121公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件122選擇分析表型選擇分析表型123公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件124公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件125公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件126公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件127公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件128GEO數(shù)據(jù)本機處理統(tǒng)計分析+作圖軟件SPSSGraphadRGEO數(shù)據(jù)本機處理統(tǒng)計分析+作圖軟件129Kaplan-Meier法單因素生存分析分類變量做生存曲線圖Cox回歸模型單因素或多因素生存分析分類或連續(xù)變量計算HR和95%CI生存分析Kaplan-Meier法生存分析130公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件131公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件132P值HRP值HR133公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件134公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件135公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件136公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件137雙擊彈出雙擊彈出138公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件139公用數(shù)據(jù)庫基因組表達譜數(shù)據(jù)挖掘策略及分析方法課件140謝謝!腫瘤靶向藥物的個體化治療謝謝!腫瘤靶向藥物的個體化治療141數(shù)量性狀連續(xù)變量,如:身高、體重、藥物劑量等質(zhì)量性狀分類變量,如:性別、療效、等級等其他類型性狀時間依賴性變量,如:生存期,中位生存時間等

研究表型數(shù)量性狀研究表型142參數(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論