公用數(shù)據(jù)庫基因組表達(dá)譜數(shù)據(jù)挖掘策略及方法李曦達(dá)人學(xué)社_第1頁
公用數(shù)據(jù)庫基因組表達(dá)譜數(shù)據(jù)挖掘策略及方法李曦達(dá)人學(xué)社_第2頁
公用數(shù)據(jù)庫基因組表達(dá)譜數(shù)據(jù)挖掘策略及方法李曦達(dá)人學(xué)社_第3頁
公用數(shù)據(jù)庫基因組表達(dá)譜數(shù)據(jù)挖掘策略及方法李曦達(dá)人學(xué)社_第4頁
公用數(shù)據(jù)庫基因組表達(dá)譜數(shù)據(jù)挖掘策略及方法李曦達(dá)人學(xué)社_第5頁
已閱讀5頁,還剩70頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

李曦副教授中南大學(xué)湘雅醫(yī)院臨床藥理研究所公用數(shù)據(jù)庫基因組表達(dá)譜數(shù)據(jù)挖掘策略及分析方法NatureReviewsGenetics

16,

85–97

(2015)什么是數(shù)據(jù)挖掘從海量數(shù)據(jù)中揭示潛在的生物學(xué)規(guī)律。為什么要學(xué)習(xí)數(shù)據(jù)挖掘把握自己的命運(yùn)最大化利用已有數(shù)據(jù)尋找新的課題數(shù)據(jù)挖掘的步驟生物醫(yī)學(xué)研究人員的優(yōu)勢數(shù)據(jù)處理步驟、統(tǒng)計(jì)分析均有工具可以完成數(shù)據(jù)挖掘表型的確定數(shù)據(jù)的選擇數(shù)據(jù)挖掘結(jié)果的解讀生物醫(yī)學(xué)數(shù)據(jù)挖掘所需技能必備技能:基本的生物信息學(xué)知識各種數(shù)據(jù)庫的使用、數(shù)據(jù)庫信息的解讀基本的生物統(tǒng)計(jì)學(xué)知識分析方法的選擇,分析軟件的使用可選技能:R語言的基本操作R包的使用Linux系統(tǒng)的基本操作生物信息學(xué)分析軟件的使用基因組表達(dá)譜數(shù)據(jù)挖掘流程確定研究策略獲取表達(dá)譜數(shù)據(jù)處理表達(dá)譜數(shù)據(jù)統(tǒng)計(jì)分析驗(yàn)證分析數(shù)據(jù)挖掘案例分析策略核心思路:影響腦膠質(zhì)瘤發(fā)生發(fā)展的基因可能影響腦膠質(zhì)瘤的預(yù)后分析流程:獲取包含腦膠質(zhì)瘤組織和正常腦組織的全基因組表達(dá)數(shù)據(jù)的多個數(shù)據(jù)集鑒定在腦膠質(zhì)瘤組織和正常腦組織中差異表達(dá)的基因在自己收集的樣本中驗(yàn)證這些基因分析這些基因與腫瘤分級以及總生存期之間的關(guān)系策略舉例例影響阿糖糖胞苷藥藥物敏感感性的基基因可能能影響AML預(yù)后。影響鉑類類藥物敏敏感性的的基因可可能影響響多種腫腫瘤的預(yù)預(yù)后。在高低腫腫瘤分級級中存在在差異的的基因可可能影響響癌癥預(yù)預(yù)后?!芯坎呗月匀绾未_確定研究策略略可以千千變?nèi)f化化研究策略略決定了了論文的的上限應(yīng)根據(jù)自自身專業(yè)業(yè)選擇有有意義的的研究策策略包含基因組表達(dá)譜數(shù)數(shù)據(jù)的數(shù)數(shù)據(jù)庫GEO數(shù)據(jù)庫關(guān)關(guān)鍵名詞詞Profile:數(shù)據(jù)庫庫整理好好的單個個基因的的概述Datasets:見GDS和GSE。GSM:單個樣本的實(shí)實(shí)驗(yàn)數(shù)據(jù)GDS:數(shù)據(jù)庫整理好的關(guān)于于某個話話題的GSM集合。一個GDS中的所有GSM為同一平平臺。GSE:一個實(shí)驗(yàn)項(xiàng)項(xiàng)目中的的多個GSM合集,可能使用用多個平臺。GPL:芯片平臺臺,如Affymetrix,Agilent等。Profile示例實(shí)驗(yàn)描述述實(shí)驗(yàn)結(jié)果果展示Value:歸一化化的相對對表達(dá)量量Rank:探針表表達(dá)值在在所有表表達(dá)值中中的排名名的百分分比。Rank越高,表表達(dá)越高高。Datasets示例芯片介紹紹芯片注釋釋文件樣本描述述Limma法分析的的TOP250結(jié)果https://paolo.shinyapps.io/ShinyVolcanoPlot/韋恩圖http://bioinformatics.psb.ugent.be/webtools/Venn/通路分析析/生存分析析驗(yàn)證Survexpresshttp://bioinformatica.mty.itesm.mx:8080/Biomatec/SurvivaX.jspKMPlotter/analysis//輸入基因因名選擇分析析表型GEO數(shù)據(jù)本機(jī)機(jī)處理統(tǒng)計(jì)分析析+作圖軟件件SPSSGraphadRKaplan-Meier法單因素生生存分析析分類變量量做生存曲線線圖Cox回歸模型單因素或或多因素素生存分析分類或連連續(xù)變量量計(jì)算HR和95%CI生存分析析P值HR雙擊彈出出謝謝!腫瘤靶向向藥物的的個體化化治療數(shù)量性狀狀連續(xù)變量量,如::身高、、體重、、藥物劑劑量等質(zhì)量性狀狀分類變量量,如::性別、、療效、、等級等等其他類型型性狀時間依賴賴性變量量,如::生存期期,中位位生存時時間等研究表型型參數(shù)檢驗(yàn)驗(yàn)(符合合正態(tài)分分布時))T檢驗(yàn)(獨(dú)獨(dú)立樣本本或配對對樣本)):兩樣樣本均數(shù)數(shù)比較方差分析析:兩個個以上樣樣本均數(shù)數(shù)比較線性回歸歸分析::多個因因素對因因變量的的影響非參數(shù)檢檢驗(yàn)(不不符合正正態(tài)分布布時)Mann-WhitneyU檢測:兩兩獨(dú)立樣樣本Kolmogorov-Smirnov檢測:兩獨(dú)立樣本McNemar檢驗(yàn):配配對樣本本Kruskal-Wallis檢驗(yàn)::多獨(dú)獨(dú)立樣樣本數(shù)量性性狀常常用統(tǒng)統(tǒng)計(jì)分分析方方法卡方檢檢驗(yàn)::單因因素對對因變變量的的影響響邏輯回回歸::多個因因素對對因變變量的的影響響質(zhì)量性性狀常用統(tǒng)統(tǒng)計(jì)分分析方方法A:期望望值>>5且樣本本量>>40,用Pearson卡方。。B:1<期望值值<5且樣本量量>40,用連連續(xù)校校正。。(僅用于四格表表資料))C:期望望值<<5或樣本量量≤40,用Fisher精確檢驗(yàn)。還有問問題解解決不不了怎怎么辦辦?加入達(dá)達(dá)人學(xué)學(xué)社QQ群(加群群請注注明信信息::單位位+專業(yè)+姓名,,每人人限加加一個個群))33405037、491043563496353730、496740737496974932、273757394大神幫幫你解解決高高難文文獻(xiàn)群內(nèi)共享資資源資源獲取技技術(shù)教教學(xué)視視頻同行分分享交流((主要要為生生物、、醫(yī)學(xué)學(xué)、化化學(xué)專專業(yè)))請關(guān)注注達(dá)人學(xué)社社微信信公眾眾號甲骨文文技術(shù)術(shù)負(fù)責(zé)人人微信信號請注明明個人人信息息:單位、專業(yè)、、姓名名張常昕昕夏艷東東講座主主辦單單位達(dá)人學(xué)社社湖南甲骨文文生物物醫(yī)藥藥有限限公司司9、靜夜四四無鄰,,荒居舊舊業(yè)貧。。。1月-231月-23Friday,January6,202310、雨中中黃葉葉樹,,燈下下白頭頭人。。。13:50:4813:50:4813:501/6/20231:50:48PM11、以以我我獨(dú)獨(dú)沈沈久久,,愧愧君君相相見見頻頻。。。。1月月-2313:50:4813:50Jan-2306-Jan-2312、故人人江海海別,,幾度度隔山山川。。。13:50:4813:50:4813:50Friday,January6,202313、乍見翻疑夢夢,相悲各問問年。。1月-231月-2313:50:4813:50:48January6,202314、他鄉(xiāng)生白白發(fā),舊國國見青山。。。06一月月20231:50:48下下午13:50:481月-2315、比不了了得就不不比,得得不到的的就不要要。。。。一月231:50下午午1月-2313:50January6,202316、行動動出成成果,,工作作出財(cái)財(cái)富。。。2023/1/613:50:4813:50:4806January202317、做前,能能夠環(huán)視四四周;做時時,你只能能或者最好好沿著以腳腳為起點(diǎn)的的射線向前前。。1:50:48下下午1:50下下午13:50:481月-239、沒沒有有失失敗敗,,只只有有暫暫時時停停止止成成功功??!。。1月月-231月月-23Friday,January6,202310、很多事情努努力了未必有有結(jié)果,但是是不努力卻什什么改變也沒沒有。。13:50:4813:50:4813:501/6/20231:50:48PM11、成成功功就就是是日日復(fù)復(fù)一一日日那那一一點(diǎn)點(diǎn)點(diǎn)點(diǎn)小小小小努努力力的的積積累累。。。。1月月-2313:50:4813:50Jan-2306-Jan-2312、世世間間成成事事,,不不求求其其絕絕對對圓圓滿滿,,留留一一份份不不足足,,可可得得無無限限完完美美。。。。13:50:4813:50:4813:50Friday,January6,202313、不知香積積寺,數(shù)里里入云峰。。。1月-231月-2313:50:4813:50:48January6,202314、意志志堅(jiān)強(qiáng)強(qiáng)的人人能把把世界界放在在手中中像泥泥塊一一樣任任意揉揉捏。。06一一月月20231:50:48下下午13:50:481月-2315、楚塞三三湘接,,荊門九九派通。。。。一月231:50下午午1月-2313:50January6,202316、少年年十五五二十十時,,步行行奪得得胡馬馬騎。。。2023/1/613:50:4813:50:4806January202317、空空山山新新雨雨后后,,天天氣氣晚晚來來秋秋。。。。1:50:48下下午午1:50下下午午13:50:481月月-239、楊柳散散和風(fēng),,青山澹澹吾慮。。。1月-231月-23Friday,January6,202310、閱讀一切好好書如同和過過去最杰出的的人談話。13:50:4813:50:4813:501/6/20231:50:48PM11、越越是是沒沒有有本本領(lǐng)領(lǐng)的的就就越越加加自自命命不不凡凡。。1月月-2313:50:4813:50Jan-2306-Jan-2312、越是是無能能的人人,越越喜歡歡挑剔剔別人人的錯錯兒。。13:50:4813:50:4813:50Friday,January6,202313、知人者智,,自知者明。。勝人者有力力,自勝者強(qiáng)強(qiáng)。1月-231月-2313:50:4813:50:48January6,202314、意意志志堅(jiān)堅(jiān)強(qiáng)強(qiáng)的的人人能能把把世世界界放放在在手手中中像像泥泥塊塊一一樣樣任任意意揉揉捏捏。。06一一月月20231:50:48下下午午13:50:481月月-2315、最具挑戰(zhàn)性性的挑戰(zhàn)莫過過于提升自我我。。一月231:50下下午1月-2313:50January6,202316、業(yè)余余生活活要有有意義義,不不要越越軌。。2023/1/613:50:4813:50:4806January202317、一個人人即

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論