




下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、醫(yī)學(xué)論文中統(tǒng)計設(shè)計的聚類分析醫(yī)學(xué)論文中統(tǒng)計設(shè)計的聚類分析摘要:本文應(yīng)用系統(tǒng)聚類方法,對醫(yī)學(xué)中常用的統(tǒng)計設(shè)計方案按其使用情況進(jìn)展分類,通過對類間的分析與比擬,找出存在的問題,綜合評價三年醫(yī)學(xué)統(tǒng)計設(shè)計方案的缺乏與可取之處,通過對醫(yī)學(xué)常用的統(tǒng)計設(shè)計方案進(jìn)展聚類,以便引起有關(guān)人員應(yīng)該對哪些統(tǒng)計設(shè)計方案更加重視,從而為進(jìn)步中醫(yī)學(xué)論文的質(zhì)量提供一點建議,對如何改良并進(jìn)步醫(yī)學(xué)論文統(tǒng)計設(shè)計方案提供一點參考價值。關(guān)鍵詞:醫(yī)學(xué)論文;統(tǒng)計設(shè)計方案;聚類分析1前言在醫(yī)學(xué)科研中,設(shè)計主要包括專業(yè)設(shè)計和統(tǒng)計學(xué)設(shè)計兩個方面。近年來,統(tǒng)計設(shè)計方案存在著很大的問題1,如統(tǒng)計設(shè)計方案過于簡單,沒有充分表達(dá)處理因素間的效應(yīng);統(tǒng)計設(shè)
2、計方案使用不當(dāng),與目的和處理因素的程度數(shù)不符。在定量資料的假設(shè)檢驗中,誤用統(tǒng)計方法最常見的原因是無視資料所對應(yīng)的設(shè)計類型2。醫(yī)學(xué)統(tǒng)計設(shè)計是進(jìn)展臨床醫(yī)學(xué)實驗的重要前提,只有一個好的統(tǒng)計設(shè)計,才能使實驗用比擬經(jīng)濟(jì)的人力、物力和時間得到一個準(zhǔn)確、可靠、重現(xiàn)性好的結(jié)果。而要得到一個好的統(tǒng)計設(shè)計,必須嚴(yán)格遵循統(tǒng)計設(shè)計的4個原那么:對照、平衡、隨機(jī)化、重復(fù)的原那么,然后制定一個合理的統(tǒng)計設(shè)計方案3,它直接影響到醫(yī)學(xué)質(zhì)量上下,目前國內(nèi)外對醫(yī)學(xué)統(tǒng)計設(shè)計方案的研究只是針對某個設(shè)計類型應(yīng)用方法進(jìn)展分析,而對醫(yī)學(xué)中統(tǒng)計設(shè)計方案的使用質(zhì)量并未系統(tǒng)地進(jìn)展分析。為此,本文采用樣品聚類方法,對醫(yī)學(xué)中常用的9種統(tǒng)計設(shè)計方案進(jìn)
3、展分析,通過類內(nèi)與類間的比擬,找出其中存在的問題,對改良研究設(shè)計提供一點參考價值。2材料與方法從河北省圖書館和河北醫(yī)科大學(xué)圖書館藏書中,用單純隨機(jī)抽樣的方法抽取2000年、2001年和2002年登載的需要進(jìn)展統(tǒng)計設(shè)計的臨床醫(yī)學(xué)研究、根底醫(yī)學(xué)研究文章657篇,其樣本量用率的抽樣方法進(jìn)展計算,公式如下4:n-所需樣本量大校本次調(diào)查=0.05,那么0.05=1.96;為容許誤差(即所希望檢出的差值)。本次調(diào)查根據(jù)以往的經(jīng)歷取0.04;預(yù)調(diào)查了100篇文章,其中48篇文章的統(tǒng)計設(shè)計方案存在缺乏之處,故本次調(diào)查p取值為0.5;為了剔除與本研究無關(guān)的文章,本文抽取了1000篇根底研究與臨床研究中的醫(yī)學(xué)論文
4、,最后剔除了非本文研究的設(shè)計類型343篇,剩余657篇,所以有效樣本量為657篇,滿足了本文需要的601篇文章。3統(tǒng)計方法2.1指標(biāo)確實定及其賦值本次調(diào)查的樣品為醫(yī)學(xué)中常用的統(tǒng)計設(shè)計類型(成組設(shè)計、配對設(shè)計、隨機(jī)區(qū)組設(shè)計、穿插設(shè)計、拉丁方設(shè)計、析因設(shè)計、正交設(shè)計、重復(fù)測量設(shè)計和序貫設(shè)計),統(tǒng)計設(shè)計方案的指標(biāo)依次為無、不正確、不明確和正確5-7,其數(shù)據(jù)結(jié)果用百分比表示8,本次調(diào)查的統(tǒng)計設(shè)計方案主要從以下幾方面進(jìn)展判斷:與實驗?zāi)康氖欠裣喾?處理因素的程度數(shù);區(qū)組因素的個數(shù);處理因素間有無交互作用;非處理因素的平衡情況。無:指文章中沒有統(tǒng)計設(shè)計過程,沒有遵循統(tǒng)計設(shè)計的四個原那么;不正確:指論文中寫明
5、了統(tǒng)計設(shè)計方案但與上述任一方面不符者;不明確:指論文中沒有寫明詳細(xì)的統(tǒng)計設(shè)計方案名稱,僅是對受試對象進(jìn)展了隨機(jī)分配并分組,無法判斷的;正確:指論文中寫明了統(tǒng)計設(shè)計方案的詳細(xì)名稱,且全部條件都符合的。無、不正確、不明確和正確分別賦值為1、2、3和4。2.2Q型系統(tǒng)聚類本次調(diào)查采用系統(tǒng)聚類法,聚類統(tǒng)計量用歐氏間隔 ,類與類的間隔 定義為類平均法,數(shù)據(jù)處理用SAS8.0,在樣本聚類分析中,兩個樣本之間的間隔 越小,說明兩個樣本的性質(zhì)越相似。類間間隔 是用來度量一個類(一組樣本)與另一個類(另一組樣本)之間間隔 的統(tǒng)計量。令類A中有a個樣本,類B中有b個樣本,D(i,j)為A中的第i個樣本與類B中的第
6、j個樣本之間的間隔 ,那么稱D(i,j)為類A和類B中一對樣本之間的間隔 ,i=1,2,a;j=1,2,b。假設(shè)D(A,B)為類A和類B之間的間隔 ,本次調(diào)查的類平均法,其類間間隔 等于兩類中所有樣本對之間間隔 的平均值,即D(A,B)=suD(i,j)/(ab),在樣本聚類分析中兩個類的類間間隔 越大,那么兩個類的類內(nèi)所有樣本的性質(zhì)越不相似;反之,兩個類的類間間隔 越小,那么兩個類的類內(nèi)所有樣本的性質(zhì)越相似。系統(tǒng)聚類的根本思想是先把n個聚類樣本看成n類,然后按類間間隔 將相似程度最大的兩個類合并為一類,再將所有的類(包括新類)中相似程度最大的兩個類合并為一類,重復(fù)此過程,直至所有類間間隔 到
7、達(dá)一定的要求為止,或直至所有n個樣本被合并成一類為止,然后根據(jù)類間間隔 的要求以及實際意義選擇一個適當(dāng)?shù)姆诸?。把醫(yī)學(xué)常用的統(tǒng)計設(shè)計方案進(jìn)展聚類后,可以進(jìn)一步對類間及類內(nèi)進(jìn)展系統(tǒng)分析,以便找出問題所在,提醒有關(guān)人員應(yīng)該對哪些統(tǒng)計設(shè)計方案更加重視。2.3三年之間的比擬三年的論文使用情況在3類的構(gòu)成比的比擬用2檢驗,兩兩比擬的檢驗水準(zhǔn)用校正的,其計算公式如上,統(tǒng)計處理用S2000統(tǒng)計軟件。4一致性檢驗一致性的檢驗或盲評法復(fù)審是質(zhì)量控制的重要方法,本次調(diào)查采用一致檢驗,它可以評價本次樣品分析結(jié)果的可靠性。其評價指標(biāo)用kappa值來表示,其公式如下:所有被評閱的文章均由作者按統(tǒng)一的評價標(biāo)準(zhǔn)進(jìn)展評閱,并經(jīng)
8、另一專業(yè)人士復(fù)查,如遇意見不一致之處,由兩人共同討論分析,以求獲得一致的結(jié)論。兩人對657篇文章的設(shè)計方案的評閱一致率為95.74%(結(jié)果見Table1),Kappa值=0.9227,兩人對657篇論文的判斷存在一致性(u=35.1507,p0.05),可見本次所調(diào)查的657篇文章結(jié)果是可靠的,數(shù)據(jù)處理過程使用S2000統(tǒng)計軟件。4結(jié)果與討論4.1統(tǒng)計設(shè)計方案的聚類過程及樣品聚類結(jié)果的解釋本次研究也對各種方法進(jìn)展嘗試,其中以平均間隔 法的分類結(jié)果最為理想。統(tǒng)計設(shè)計方案的聚類過程及樣品聚類結(jié)果的解釋(見表1和表2)如下:有2個特征值大于1,因此至少應(yīng)分成2類。列出了聚類過程:第一步,將第5號樣本
9、和第6號樣本合并成一類,稱為類8,記為L8;第二步,將第1號樣本和第4號樣本合并成一類,稱為類7,記為L7;第三步,將第7號樣本和第9號樣本合并成一類,稱為類6,記為L6,可見L6含有2個樣本,它們是7、9;第四步,將第3號樣本和L8合并成一類,稱為類5,記為L5;第五步,將L5和第8號樣本合并成一類,稱為類4,記為L4,可以看出,L4含有4個樣本,它們是3、5、6、8;第六步,將L7和第2號樣本合并成一類,稱為類3,記為L3,此時L3含有個樣本,它們是1、4、2;第七步,L3和L4合并居一類,稱為類2,記為L2;第八步,L2和L6合并成一類,記為L1。這樣所有9個樣本合并為一類。其中SPRS
10、Q是半偏統(tǒng)計量,說明此次合并類對信息的損失程度,半偏值越小,說明此次合并的效果越好;RSQ是統(tǒng)計量,用來評價聚類的累計效果,值越大,聚類效果越好。在這個分類結(jié)果中,根據(jù)判別指標(biāo)值,可以清楚地看到,在倒數(shù)第3行,即聚類到第6步時,SPRSQ值急劇增加,從0.0967增加到0.3111,而RSQ值急劇減少,從0.759減少到0.447,因為此時SPRSQ和RSQ值突然波動,所以可以決定,樣本分成3類比擬適宜。聚類樹狀圖結(jié)果(見Fig.1)。從直觀上看,將這9個統(tǒng)計設(shè)計方案分為3類是比擬適宜的,這時類間平均間隔 不小于2.2164??傮w變異的75.9%被類成分所解釋。從樹狀圖中還可以直接得到分類的結(jié)
11、果,這就是:第類包含1、4、2三個樣本,即重復(fù)測量設(shè)計、拉丁方設(shè)計、序貫設(shè)計;第類包含3、5、6、8四個樣本,即穿插設(shè)計、析因設(shè)計、正交設(shè)計、配對設(shè)計;第類包含7、9兩個樣本,即成組設(shè)計、隨機(jī)區(qū)組設(shè)計。4.2三年的統(tǒng)計設(shè)計方案的使用情況及在3類中構(gòu)成比的比擬結(jié)果657篇論文中,2000年、2001年和2002年的文章各占293篇、183篇、181篇。2000年、2001年和2002年在3類中的構(gòu)成比比擬差異顯著(2=44.0895,p=0.0000),說明3年在3類中的總體分布是不同的(見Table11),進(jìn)一步兩兩比擬的校正=0.0125,經(jīng)2檢驗,2000年與2001年的構(gòu)成比比擬差異無顯
12、著性(2=3.0721,p=0.2154);2000年與2002年比擬差異有顯著性(2=41.8902,p=0.0000);2001年與2002年比擬差異有顯著性(2=18.2208,p=0.0000)。對每一類中年的兩兩比擬,其檢驗水準(zhǔn)用校正=0.0125。2000年與2002年相比,類和類的構(gòu)成比差異顯著(p0.0125),類差異不顯著(p0.0125)。2001年與2002年相比,類和類的構(gòu)成比差異顯著(p0.0125),類差異不顯著(p0.0125)。其中,2002年在第類的有46篇,占25.41%,2000年和2001年在第類中的各為7.51%、11.42%,所以2002年醫(yī)學(xué)論文的
13、使用情況要好于2000年和2001年,說明醫(yī)學(xué)論文在這三年中的使用質(zhì)量是有所進(jìn)步的。第類,即析因設(shè)計、正交設(shè)計和穿插設(shè)計存在的問題較少,但不明確的論文占的比例最高,為30.30%,所以這三種設(shè)計方案應(yīng)在以后的論文發(fā)表中將設(shè)計類型的名稱標(biāo)明。配對統(tǒng)計設(shè)計、拉丁方統(tǒng)計設(shè)計、重復(fù)測量統(tǒng)計設(shè)計存在的問題應(yīng)用正確的程度較高,但不明確的比例也相對較高,應(yīng)注意這方面的問題,論文聯(lián)盟.Ll.成組統(tǒng)計設(shè)計和隨機(jī)區(qū)組設(shè)計的應(yīng)用情況最差,出現(xiàn)的問題也最多,無的占11.55%,論文聯(lián)盟.Ll.不正確的占17.94%,不明確的占20.35%,在三類中占的比例較高,應(yīng)該引起有關(guān)人員的注意。統(tǒng)計設(shè)計方案的使用情況不同,較好的為第類和第類,最差的為第類,但三類文章中均存在一定的問題。所以重視并加強(qiáng)科研人員的統(tǒng)計
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025天津市建筑安全員A證考試題庫附答案
- 生物-四川省金太陽2025屆高三2月開學(xué)考試試題和答案
- 2025年度房產(chǎn)出售代理售后服務(wù)協(xié)議
- 2025年度化工原料運(yùn)輸事故應(yīng)急預(yù)案合同
- 2025年度文化藝術(shù)公司公司掛靠文化藝術(shù)交流活動合同
- 2025年度農(nóng)村魚塘養(yǎng)殖權(quán)轉(zhuǎn)讓與漁業(yè)資源可持續(xù)利用合同
- 2025年度圖書出版著作權(quán)許可及翻譯權(quán)合同
- 2025年度電商運(yùn)營顧問勞動合同
- 2025年度商業(yè)地產(chǎn)開發(fā)車位贈送及使用維護(hù)合同
- 2025年度個人自愿捐贈殘疾人福利基金協(xié)議書
- 冀教版五年級數(shù)學(xué)下冊全冊課件【完整版】
- 2024年連云港專業(yè)技術(shù)人員繼續(xù)教育《飲食、運(yùn)動和健康的關(guān)系》92分(試卷)
- 《短視頻拍攝與制作》課件-2短視頻前期創(chuàng)意
- 八年級上冊物理期末考試試題附答案(人教版)
- 關(guān)注聽力健康知識講座
- 家校合作共育課件
- 2023年全國報關(guān)員考試真題試卷及答案
- 中藥藥茶計劃書
- 《電子技術(shù)基礎(chǔ)(第2版)》 課件全套 第1-12章 緒論、常用半導(dǎo)體器件-數(shù)模和模數(shù)轉(zhuǎn)換電路
- 兒童康復(fù)作業(yè)治療
- 春節(jié)后復(fù)產(chǎn)復(fù)工培訓(xùn)
評論
0/150
提交評論