




已閱讀5頁,還剩2頁未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
學(xué)科教育論文-將生物信息學(xué)知識(shí)帶進(jìn)醫(yī)學(xué)統(tǒng)計(jì)學(xué)課堂教學(xué)摘要:生物信息學(xué)的蓬勃發(fā)展已使醫(yī)學(xué)研究由宏觀逐步探索到微觀。醫(yī)學(xué)統(tǒng)計(jì)學(xué)作為一門醫(yī)學(xué)院校的基礎(chǔ)課程,其理論和方法在醫(yī)學(xué)研究的新要求下其理論和方法也有了新的發(fā)展與應(yīng)用。將生物信息學(xué)知識(shí)帶入醫(yī)學(xué)統(tǒng)計(jì)學(xué)課堂教學(xué),介紹醫(yī)學(xué)統(tǒng)計(jì)學(xué)的新發(fā)展,不但能使學(xué)員了解到本學(xué)科的前沿研究內(nèi)容,有效地激發(fā)學(xué)員的學(xué)習(xí)興趣,還能使他們掌握生物信息學(xué)研究的工具,提高今后從事醫(yī)學(xué)科研工作的能力。關(guān)鍵詞:生物信息學(xué)醫(yī)學(xué)統(tǒng)計(jì)學(xué)課堂教學(xué)生物信息學(xué)融合了生物技術(shù)、計(jì)算機(jī)技術(shù)、數(shù)學(xué)和統(tǒng)計(jì)學(xué)的大量方法,已逐漸成為發(fā)現(xiàn)生命過程中所蘊(yùn)涵知識(shí)的一門重要學(xué)科。其基本問題主要包括:DNA分析、蛋白質(zhì)結(jié)構(gòu)分析、分子進(jìn)化。醫(yī)學(xué)統(tǒng)計(jì)學(xué)作為醫(yī)科院校的基礎(chǔ)課程之一,長期以來其理論和方法就廣泛應(yīng)用于臨床醫(yī)學(xué)、基礎(chǔ)醫(yī)學(xué)的各類研究中。隨著生物新技術(shù)的誕生,在推動(dòng)生物信息學(xué)發(fā)展的同時(shí),醫(yī)學(xué)研究對象也由宏觀的病人、生物組織拓展到微觀的基因領(lǐng)域,所面對的實(shí)驗(yàn)數(shù)據(jù)在性質(zhì)和結(jié)構(gòu)上也都有所不同,這對醫(yī)學(xué)統(tǒng)計(jì)學(xué)的應(yīng)用提出了新的更高的要求。目前,醫(yī)學(xué)統(tǒng)計(jì)學(xué)的很多原理和方法已成功地應(yīng)用于這些新研究之中,并在此基礎(chǔ)之上有了新的發(fā)展和改進(jìn)。如概率分布的知識(shí)與序列相似性分析、蛋白質(zhì)分類等技術(shù)密切相關(guān);方差分析、非參數(shù)檢驗(yàn)方法經(jīng)改進(jìn)和結(jié)合后在基因表達(dá)數(shù)據(jù)的前期分析中發(fā)揮了較好的作用;而聚類分析、判別分析、相關(guān)分析這些大家所熟知的統(tǒng)計(jì)學(xué)方法更是在基因分類和調(diào)控網(wǎng)絡(luò)的建立中得到了廣泛的應(yīng)用。在進(jìn)行醫(yī)學(xué)統(tǒng)計(jì)學(xué)課堂教學(xué)時(shí)加入生物信息學(xué)方面的應(yīng)用實(shí)例,不僅可以使學(xué)員了解本學(xué)科研究的前沿和醫(yī)學(xué)、生物信息學(xué)研究的新發(fā)展,還可以提高學(xué)員對于醫(yī)學(xué)統(tǒng)計(jì)學(xué)理論學(xué)習(xí)的興趣,掌握先進(jìn)的生物實(shí)驗(yàn)數(shù)據(jù)分析方法,提高今后從事醫(yī)學(xué)科研的能力。下面,本文在回顧醫(yī)學(xué)統(tǒng)計(jì)學(xué)授課主要內(nèi)容的基礎(chǔ)上,就醫(yī)學(xué)和生物信息學(xué)中的可能應(yīng)用舉例如下:一、概率分布概率分布(probabilitydistribution)是醫(yī)學(xué)統(tǒng)計(jì)學(xué)中多種統(tǒng)計(jì)分析方法的理論基礎(chǔ)。授課內(nèi)容一般包括:二項(xiàng)分布、Possion分布、正態(tài)分布、t分布、F分布等。借助概率分布常??梢詭椭覀兞私馍笜?biāo)的特征、醫(yī)學(xué)現(xiàn)象的發(fā)生規(guī)律等等。例如,臨床檢驗(yàn)中計(jì)量實(shí)驗(yàn)室指標(biāo)的參考值范圍就是依據(jù)正態(tài)分布和t分布的原理計(jì)算得到;許多醫(yī)學(xué)試驗(yàn)的“陽性”結(jié)果服從二項(xiàng)分布,因此它被廣泛用于化學(xué)毒性的生物鑒定、樣本中某疾病陽性率的區(qū)間估計(jì)等;而一定人群中諸如遺傳缺陷、癌癥等發(fā)病率很低的非傳染性疾病患病數(shù)或死亡數(shù)的分布,單位面積(或容積)內(nèi)細(xì)菌數(shù)的分布等都服從Poisson分布,我們就可以借助Poisson分布的原理定量地對上述現(xiàn)象進(jìn)行研究。在生物信息學(xué)中概率分布也有一定應(yīng)用。例如,Poisson分布可以用于基因(蛋白質(zhì))序列的相似性分析。被研究者廣泛使用的分析工具BLAST(BasicLocalAlignmentSearchTool)能迅速將研究者提交的蛋白質(zhì)(或DNA)數(shù)據(jù)與公開數(shù)據(jù)庫進(jìn)行相似性序列比對。對于序列a和b,BLAST發(fā)現(xiàn)的高得分匹配區(qū)稱為HSPs。而HSP得分超過閾值t的概率P(H(a,b)t)可以依據(jù)Poisson分布的性質(zhì)計(jì)算得到。二、假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)(hypothesis)是醫(yī)學(xué)統(tǒng)計(jì)學(xué)中統(tǒng)計(jì)推斷部分的重要內(nèi)容。假設(shè)檢驗(yàn)根據(jù)反證法和小概率原理,首先依據(jù)資料性質(zhì)和所需解決的問題,建立檢驗(yàn)假設(shè);在假設(shè)該檢驗(yàn)假設(shè)成立的前提下,采用適當(dāng)?shù)臋z驗(yàn)方法,根據(jù)樣本算得相應(yīng)的檢驗(yàn)統(tǒng)計(jì)量;最后,依據(jù)概率分布的特點(diǎn)和算得的檢驗(yàn)統(tǒng)計(jì)量的大小來判斷是否支持所建立的檢驗(yàn)假設(shè),進(jìn)而推斷總體上該假設(shè)是否成立。其基本方法包括:u檢驗(yàn)、t檢驗(yàn)、方差分析(ANOVA)和非參數(shù)檢驗(yàn)方法。假設(shè)檢驗(yàn)為醫(yī)學(xué)研究提供了一種很好的由樣本推斷總體的方法。例如,隨機(jī)抽取某市一定年齡段中100名兒童,將其平均身高(樣本均數(shù))與該年齡段兒童應(yīng)有的標(biāo)準(zhǔn)平均身高(總體均數(shù))做u檢驗(yàn),其檢驗(yàn)結(jié)果可以幫助我們推斷出該市該年齡段兒童身高是否與標(biāo)準(zhǔn)身高一致,為了解該市該年齡段兒童的生長發(fā)育水平提供參考。又如,醫(yī)學(xué)中常??梢圆捎胻檢驗(yàn)、秩和檢驗(yàn)比較兩種藥物的療效有無差別;用2檢驗(yàn)比較不同治療方法的有效率是否相同等等。這些假設(shè)檢驗(yàn)的方法在生物實(shí)驗(yàn)資料的分析前期應(yīng)用較多,但由于研究目的和資料性質(zhì)不同,一般會(huì)對某些方法進(jìn)行適當(dāng)調(diào)整和結(jié)合。例如,基于基因芯片實(shí)驗(yàn)數(shù)據(jù)尋找差異表達(dá)基因的問題?;蛐酒╣enechip)是近年來實(shí)驗(yàn)分子生物學(xué)的技術(shù)突破之一,它允許研究者在一次實(shí)驗(yàn)中獲得成千上萬條基因在設(shè)定實(shí)驗(yàn)條件下的表達(dá)數(shù)據(jù)。為了從這海量的數(shù)據(jù)中尋找有意義的信息,在對基因表達(dá)數(shù)據(jù)進(jìn)行分析的過程中,找到那些在若干實(shí)驗(yàn)組中表達(dá)水平有明顯差異的基因是比較基礎(chǔ)和前期的方法。這些基因常常被稱為“差異表達(dá)基因”,或者“顯著性基因”。如果將不同實(shí)驗(yàn)條件下某條基因表達(dá)水平的重復(fù)測量數(shù)據(jù)看作一個(gè)樣本,尋找差異表達(dá)基因的問題其實(shí)就可以采用假設(shè)檢驗(yàn)方法加以解決。如果表達(dá)數(shù)據(jù)服從正態(tài)分布,可以采用t-檢驗(yàn)(或者方差分析)比較兩樣本(或多樣本)平均表達(dá)水平的差異。但是,由于表達(dá)數(shù)據(jù)很難滿足正態(tài)性假定,目前常用的方法基于非參數(shù)檢驗(yàn)的思想,并對其進(jìn)行了改進(jìn)。該方法分為兩步:首先,選擇一個(gè)統(tǒng)計(jì)量對基因排秩,用秩代替表達(dá)值本身;其次,為排秩統(tǒng)計(jì)量選擇一個(gè)判別值,在其之上的值判定為差異顯著。常用的排秩統(tǒng)計(jì)量有:任一特定基因在重復(fù)序列中表達(dá)水平M值的均值;考慮到基因在不同序列上變異程度的統(tǒng)計(jì)量,其中,s是M的標(biāo)準(zhǔn)差;以及用經(jīng)驗(yàn)Bayes方法修正后的t-統(tǒng)計(jì)量:,修正值a由M的方差s2的均數(shù)和標(biāo)準(zhǔn)差估計(jì)得到。三、一些高級(jí)統(tǒng)計(jì)方法在基因研究中的應(yīng)用(一)聚類分析聚類分析(clusteringanalysis)是按照“物以類聚”的原則,根據(jù)聚類對象的某些性質(zhì)與特征,運(yùn)用統(tǒng)計(jì)分析的方法,將聚類對象比較相似或相近的歸并為同一類。使得各類內(nèi)的差異相對較小,類與類間的差異相對較大1。聚類分析作為一種探索性的統(tǒng)計(jì)分析方法,其基本內(nèi)容包括:相似性度量方法、系統(tǒng)聚類法(HierarchicalClustering)、K-means聚類法、SOM方法等。聚類分析可以幫助我們解決醫(yī)學(xué)中諸如:人的體型分類,某種疾病從發(fā)生、發(fā)展到治愈不同階段的劃分,青少年生長發(fā)育分期的確定等問題。近年來隨著基因表達(dá)譜數(shù)據(jù)的不斷積累,聚類分析已成為發(fā)掘基因信息的有效工具。在基因表達(dá)研究中,一項(xiàng)主要的任務(wù)是從基因表達(dá)數(shù)據(jù)中識(shí)別出基因的共同表達(dá)模式,由此將基因分成不同的種類,以便更為深入地了解其生物功能及關(guān)聯(lián)性。這種探索完全未知的數(shù)據(jù)特征的方法就是聚類分析,生物信息學(xué)中又稱為無監(jiān)督的分析(UnsupervisedAnalysis)。常用方法是利用基因表達(dá)數(shù)據(jù)對基因(樣本)進(jìn)行聚類,將具有相同表達(dá)模式的基因(樣本)聚為一類,根據(jù)聚類結(jié)果通過已知基因(樣本)的功能去認(rèn)識(shí)那些未知功能的基因。對于基因表達(dá)數(shù)據(jù)而言,系統(tǒng)聚類法易于使用、應(yīng)用廣泛,其結(jié)果系統(tǒng)樹圖能提供一個(gè)可視化的數(shù)據(jù)結(jié)構(gòu),直觀具體,便于理解。而在幾種相似性的計(jì)算方法中,平均聯(lián)接法(AverageLinkageClustering)一般能給出較為合理的聚類結(jié)果2。(二)判別分析判別分析(discriminantanalysis)是根據(jù)觀測到的某些指標(biāo)的數(shù)據(jù)對所研究的對象建立判別函數(shù),并進(jìn)行分類的一種多元統(tǒng)計(jì)分析方法。它與聚類分析都是研究分類問題,所不同的是判別分析是在已知分類的前提下,判定觀察對象的歸屬3。其基本方法包括:Fisher線性判別(FLD)、最鄰近分類法(k-NearestNeighborClassifiers)、分類樹算法(ClassificationTreeAlgorithm),人工神經(jīng)網(wǎng)絡(luò)(ANNs)和支持向量機(jī)(SVMs)。判別分析常用于臨床輔助鑒別診斷,計(jì)量診斷學(xué)就是以判別分析為主要基礎(chǔ)迅速發(fā)展起來的一門科學(xué)。如臨床醫(yī)生根據(jù)患者的主訴、體征及檢查結(jié)果作出診斷;根據(jù)各種癥狀的嚴(yán)重程度預(yù)測病人的預(yù)后或進(jìn)行某些治療方法的療效評(píng)估;以及流行病學(xué)中某些疾病的早期預(yù)報(bào)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- xxx項(xiàng)目可行性研究報(bào)告
- 物聯(lián)網(wǎng)居間服務(wù)協(xié)議
- 園林苗圃建設(shè)可行性報(bào)告
- 礦山油漆施工模板
- 智能停車場 系統(tǒng)
- 片區(qū)開發(fā)項(xiàng)目可行性研究報(bào)告
- 低空經(jīng)濟(jì)的未來發(fā)展前景
- 農(nóng)業(yè)保險(xiǎn)精準(zhǔn)賠付系統(tǒng)實(shí)施方案
- 物流配送形式
- 茶藝師練習(xí)試題附答案(一)
- 石油焦生產(chǎn)工藝及設(shè)備解讀課件
- 肺炎-疑難病例討論課件
- 2023全國高中化學(xué)奧林匹克競賽預(yù)賽試題及答案
- 邊坡變形觀測報(bào)告
- 音樂劇悲慘世界歌詞
- 復(fù)合材料鋪層設(shè)計(jì)說明
- 戴德梁行物業(yè)培訓(xùn)ppt課件
- GB∕T 16422.3-2022 塑料 實(shí)驗(yàn)室光源暴露試驗(yàn)方法 第3部分:熒光紫外燈
- 煤礦防治水中長期規(guī)劃2017—2019
- 2022年鄉(xiāng)鎮(zhèn)(街道)執(zhí)法人員資格考試題庫(含答案)
- 新版廣西大學(xué)畢業(yè)設(shè)計(jì)封面
評(píng)論
0/150
提交評(píng)論