




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
SPSS在醫(yī)學(xué)統(tǒng)計(jì)學(xué)中的應(yīng)用流行病與衛(wèi)生統(tǒng)計(jì)教研室2021/3/29星期一1常用的統(tǒng)計(jì)軟件SAS(StatisticsAnalysisSystem),最早由北卡羅來納大學(xué)的兩位生物統(tǒng)計(jì)學(xué)研究生編制,并于1976年成立了SAS軟件研究所,正式推出了SAS軟件。R語言
主要用于統(tǒng)計(jì)分析、繪圖的語言和操作環(huán)境。R本來是由來自新西蘭奧克蘭大學(xué)的RossIhaka和RobertGentleman開發(fā)(也因此稱為R),現(xiàn)在由“R開發(fā)核心團(tuán)隊(duì)”負(fù)責(zé)開發(fā)。SPSS(StatisticalProductandServiceSolutions)2021/3/29星期一2簡(jiǎn)介SPSS(StatisticalProductandServiceSolutions),“統(tǒng)計(jì)產(chǎn)品與服務(wù)解決方案”軟件。最初軟件全稱為“社會(huì)科學(xué)統(tǒng)計(jì)軟件包”(SolutionsStatisticalPackagefortheSocialSciences),但是隨著SPSS產(chǎn)品服務(wù)領(lǐng)域的擴(kuò)大和服務(wù)深度的增加,SPSS公司已于2000年正式將英文全稱更改為“統(tǒng)計(jì)產(chǎn)品與服務(wù)解決方案”,標(biāo)志著SPSS的戰(zhàn)略方向正在做出重大調(diào)整。之后推出了一系列用于統(tǒng)計(jì)學(xué)分析運(yùn)算、數(shù)據(jù)挖掘、預(yù)測(cè)分析和決策支持任務(wù)的軟件產(chǎn)品及相關(guān)服務(wù),有Windows和MacOSX等版本。2021/3/29星期一3SPSS是世界上最早的統(tǒng)計(jì)分析軟件,由美國(guó)斯坦福大學(xué)的三位研究生NormanH.Nie、C.Hadlai(Tex)Hull和DaleH.Bent于1968年研究開發(fā)成功,同時(shí)成立了SPSS公司,并于1975年成立法人組織、在芝加哥組建了SPSS總部。1984年SPSS總部首先推出了世界上第一個(gè)統(tǒng)計(jì)分析軟件微機(jī)版本SPSS/PC+,開創(chuàng)了SPSS微機(jī)系列產(chǎn)品的開發(fā)方向,極大地?cái)U(kuò)充了它的應(yīng)用范圍,并使其能很快地應(yīng)用于自然科學(xué)、技術(shù)科學(xué)、社會(huì)科學(xué)的各個(gè)領(lǐng)域。世界上許多有影響的報(bào)刊雜志紛紛就SPSS的自動(dòng)統(tǒng)計(jì)繪圖、數(shù)據(jù)的深入分析、使用方便、功能齊全等方面給予了高度的評(píng)價(jià)。2021/3/29星期一42009年7月28日,IBM公司宣布將用12億美元現(xiàn)金收購(gòu)統(tǒng)計(jì)分析軟件提供商SPSS公司。如今SPSS已出至版本22.0,而且更名為IBMSPSS。2021/3/29星期一51.基本特點(diǎn)2.主要窗口及功能3.運(yùn)行環(huán)境一、SPSS的概述2021/3/29星期一61.操作簡(jiǎn)便SPSS軟件基本操作通過點(diǎn)擊鼠標(biāo)就可以完成,有一定的統(tǒng)計(jì)學(xué)基礎(chǔ)、熟悉Windows的基本操作就可以自學(xué)使用,除了數(shù)據(jù)錄入需要使用鍵盤,常見的統(tǒng)計(jì)分析方法完全可以通過菜單、對(duì)話框的操作來完成,不需要編程?;咎攸c(diǎn)2021/3/29星期一72.數(shù)據(jù)管理功能強(qiáng)大SPSS集成了數(shù)據(jù)錄入、轉(zhuǎn)換、檢索、統(tǒng)計(jì)分析、作圖、制表及編程功能,也可以從外部導(dǎo)入數(shù)據(jù),如通過Excel表格、txt文本讀入數(shù)據(jù)庫(kù)。2021/3/29星期一83.統(tǒng)計(jì)分析方法比較全面SPSS統(tǒng)計(jì)過程包括了常用的、較為成熟的統(tǒng)計(jì)分析方法,提供了從簡(jiǎn)單的描述統(tǒng)計(jì)到復(fù)雜的多因素統(tǒng)計(jì)分析方法,例如數(shù)據(jù)的探索性分析、一般統(tǒng)計(jì)描述、簡(jiǎn)單列聯(lián)表分析、均數(shù)比較、一般線性模型、混合模型、相關(guān)回歸、對(duì)數(shù)線性模型、聚類和判別、因子和對(duì)應(yīng)分析、非參數(shù)檢驗(yàn)以及生存分析等等等等。2021/3/29星期一9SPSS主要由三大窗口:數(shù)據(jù)編輯窗口(data
editor)
結(jié)果輸出窗口(vieweditor)
程序編輯窗口(syntax
editor)主要窗口及其功能2021/3/29星期一10數(shù)據(jù)編輯窗口:
在“數(shù)據(jù)視圖”中可以輸入變量;“變量視圖”中可以設(shè)定不同變量的屬性。2021/3/29星期一111.數(shù)值:標(biāo)準(zhǔn)數(shù)值型變量,系統(tǒng)默認(rèn)
2.逗號(hào):帶逗點(diǎn)的數(shù)值型變量,千進(jìn)位用逗號(hào)分隔
3.點(diǎn):圓點(diǎn)數(shù)值型變量,小數(shù)與整數(shù)間用圓點(diǎn)分隔
4.科學(xué)計(jì)數(shù)法
5.日期型變量
6.帶美元符號(hào)的數(shù)值型變量
7.自定義型
8.字符型變量2021/3/29星期一12變量值標(biāo)簽的添加方法2021/3/29星期一13語法編輯窗口:
編輯語法、運(yùn)行由語法組成的過程文件。2021/3/29星期一14二、數(shù)據(jù)文件的建立、導(dǎo)入與導(dǎo)出2021/3/29星期一15結(jié)果輸出窗口:
輸出程序運(yùn)算結(jié)果及各種操作的記錄2021/3/29星期一16通過數(shù)據(jù)編輯窗口輸入數(shù)據(jù)2021/3/29星期一17文件的建立、調(diào)用和保存可以在文件菜單的指引下操作。2021/3/29星期一182021/3/29星期一19.sav-數(shù)據(jù)文件-數(shù)據(jù)編輯.spo-輸出結(jié)果文件-結(jié)果編輯.sps-命令程序文件-語法編輯SPSS主要的存儲(chǔ)類型2021/3/29星期一201.數(shù)據(jù)編輯2.數(shù)據(jù)搜索3.變量的插入與刪除4.觀察單位的插入與刪除5.觀測(cè)值排序6.數(shù)據(jù)文件的拆分與合并7.變量加權(quán)三、數(shù)據(jù)文件整理
2021/3/29星期一21數(shù)據(jù)操作在數(shù)據(jù)編輯窗口中的“Data
View”視窗下進(jìn)行??梢詫?duì)選定的操作對(duì)象進(jìn)行剪切、拷貝、粘貼等操作??梢灾苯佑檬髽?biāo)右鍵進(jìn)行操作,也可以用“編輯”下拉菜單中的選項(xiàng)進(jìn)行操作,還可以用鍵盤上的快捷鍵來完成操作“control”+“X”(剪切)、“control”+“C”(拷貝)、“control”+“V”(粘貼)1.數(shù)據(jù)編輯2021/3/29星期一221.搜索指定的記錄編號(hào):從“編輯”菜單中選擇“轉(zhuǎn)至個(gè)案”,只要在彈出的“個(gè)案數(shù)”中鍵入欲搜索的記錄編號(hào),光標(biāo)就會(huì)自粽跳到該記錄上。2.搜索指定變量中的指定數(shù)據(jù)的單元格:打開數(shù)據(jù)文件,光標(biāo)移到變量所在的任意單元格,單擊,然后從“編輯”菜單中選擇“查找”,在彈出的對(duì)話框中鍵入需要查找的數(shù)據(jù),然后點(diǎn)擊“查找下一個(gè)”,光標(biāo)會(huì)自動(dòng)跳入該值所在的單元格。2.數(shù)據(jù)搜索2021/3/29星期一233.變量的插入與刪除4.觀察單位的插入與刪除5.觀測(cè)值排序以上三項(xiàng)操作均可以通過在選定變量或個(gè)案后,點(diǎn)擊鼠標(biāo)右鍵來完成操作2021/3/29星期一24在進(jìn)行數(shù)據(jù)的處理時(shí),經(jīng)常要對(duì)文件中的觀察單位進(jìn)行分組分析,例如,按男性、女性計(jì)算“年齡”的平均值,因此在進(jìn)行分析計(jì)算是要對(duì)數(shù)據(jù)文件進(jìn)行拆分。注意:此處的“拆分”并不是物理結(jié)構(gòu)上,將數(shù)據(jù)庫(kù)拆分為兩個(gè)數(shù)據(jù)文件,僅為運(yùn)算形式上的拆分。6.數(shù)據(jù)文件的拆分與合并2021/3/29星期一252021/3/29星期一262.增加變量:從外物數(shù)據(jù)文件增加變量到當(dāng)前數(shù)據(jù)文件,成為橫向合并或追加變量,合并后的數(shù)據(jù)文件包含相同的觀察量。2021/3/29星期一27數(shù)據(jù)文件的合并包括兩種方式:1.增加觀察單位:從外部數(shù)據(jù)文件中增加觀察單位到當(dāng)前數(shù)據(jù)文件中,稱為縱向合并或追加觀察單位,這種合并方式要求兩個(gè)數(shù)據(jù)文件中的變量相同。2021/3/29星期一28統(tǒng)計(jì)分析中經(jīng)常要用到變量加權(quán),如計(jì)算加權(quán)平均數(shù),在選擇加權(quán)變量時(shí),應(yīng)該注意:加權(quán)變量中含有零、負(fù)整數(shù)、或者缺失值的記錄將會(huì)被排除在外;分?jǐn)?shù)值有效;一旦對(duì)數(shù)據(jù)進(jìn)行了加權(quán)處理,那么在以后的分析中加權(quán)處理一直有效,直到關(guān)閉加權(quán)處理過程或者選擇其他的加權(quán)變量進(jìn)行加權(quán)處理。操作步驟:“數(shù)據(jù)”→“加權(quán)個(gè)案”→“頻率變量”8.變量加權(quán)2021/3/29星期一291.新變量的建立2.變量的重新賦值3.觀察單位的排秩4.缺失值的替代四、數(shù)據(jù)轉(zhuǎn)換2021/3/29星期一30在醫(yī)學(xué)科研實(shí)踐中,僅使用原始數(shù)據(jù)新型分析處理往往是不夠的,應(yīng)根據(jù)統(tǒng)計(jì)分析的需要,對(duì)原始數(shù)據(jù)進(jìn)行轉(zhuǎn)換,生成新的變量或進(jìn)行重新編碼等。SPSS的數(shù)據(jù)轉(zhuǎn)換功能主要通過“轉(zhuǎn)換”菜單來實(shí)現(xiàn)。2021/3/29星期一31SPSS提供了14類180多種函數(shù),用戶可以根據(jù)需要,利用這些函數(shù)建立一些新的變量,常用函數(shù)如下:1.算數(shù)函數(shù)2.統(tǒng)計(jì)函數(shù)3.缺失值函數(shù)4.字符型函數(shù)5.日期、時(shí)間函數(shù)6.邏輯函數(shù)7.分布函數(shù)1.新變量的建立2021/3/29星期一32操作步驟:“轉(zhuǎn)換”→“計(jì)算變量”2021/3/29星期一33以年齡分組為例:將數(shù)據(jù)文件中的年齡分成幾個(gè)年齡組,以5歲為一組,將分組后的各組相應(yīng)的賦值為1,2,3,4,5……菜單選擇:“轉(zhuǎn)換”→“重新編碼為不同變量”2.變量的重新賦值2021/3/29星期一342021/3/29星期一352021/3/29星期一362021/3/29星期一37某些統(tǒng)計(jì)分析過程需要對(duì)變量的秩進(jìn)行分析,例如秩和檢驗(yàn),需要先對(duì)變量進(jìn)行排秩。SPSS提供了該功能菜單選擇:“轉(zhuǎn)換”→“個(gè)案等級(jí)排序”3.觀察單位的排秩2021/3/29星期一382021/3/29星期一39SPSS的某些統(tǒng)計(jì)過程會(huì)因?yàn)閿?shù)據(jù)文件帶有缺失值而無法執(zhí)行,例如在進(jìn)行時(shí)間系統(tǒng)的統(tǒng)計(jì)分析時(shí),要求相鄰觀測(cè)量中的變量值是在相等的時(shí)間間隔內(nèi)測(cè)得,不能將帶有缺失值的觀測(cè)量排除掉,SPSS提供了多種方法估計(jì)并替換缺失值。菜單選擇:“轉(zhuǎn)換”→“替換缺失值”。4.缺失值的替代2021/3/29星期一402021/3/29星期一411.頻數(shù)分布分析2.描述性統(tǒng)計(jì)分析3.探索性分析五、統(tǒng)計(jì)描述2021/3/29星期一42統(tǒng)計(jì)分析包括兩個(gè)方面:統(tǒng)計(jì)描述;統(tǒng)計(jì)推斷。統(tǒng)計(jì)描述指選用恰當(dāng)?shù)慕y(tǒng)計(jì)指標(biāo),通常稱為統(tǒng)計(jì)量,選用合適的統(tǒng)計(jì)表與統(tǒng)計(jì)圖,對(duì)資料的數(shù)量特征及其分布規(guī)律進(jìn)行測(cè)定和描述。SPSS中用于統(tǒng)計(jì)描述的統(tǒng)計(jì)量主要由以下幾類:1.描述集中趨勢(shì)的指標(biāo):算數(shù)均數(shù)、幾何均數(shù)、中位數(shù)2.描述離散趨勢(shì)的指標(biāo):極差、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差3.百分位數(shù)指標(biāo)4.描述數(shù)據(jù)分布的統(tǒng)計(jì)量:偏度系數(shù)、峰度系數(shù)2021/3/29星期一43SPSS中的“描述統(tǒng)計(jì)”菜單可以完成上述各種統(tǒng)計(jì)量并可以繪制統(tǒng)計(jì)圖表,主要包含以下幾大模塊:“頻率”過程:主要用于產(chǎn)生頻數(shù)表;“描述”過程:對(duì)變量進(jìn)行描述性統(tǒng)計(jì)分析,計(jì)算統(tǒng)計(jì)指標(biāo);“探索”過程:對(duì)變量進(jìn)行更為深入的描述性統(tǒng)計(jì)分析。2021/3/29星期一44頻數(shù)分布分析可以產(chǎn)生詳細(xì)的頻數(shù)表,并可以按要求給出條圖、直方圖以及集中趨勢(shì)和離散趨勢(shì)的各種統(tǒng)計(jì)量,描述數(shù)據(jù)的分布特征。以書后練習(xí)2.1為例1.建立數(shù)據(jù)文件1.頻數(shù)分布分析2021/3/29星期一452.統(tǒng)計(jì)分析:“分析”→“描述統(tǒng)計(jì)”→“頻率”→“statistic”/“圖表”→“確定”2021/3/29星期一462021/3/29星期一472021/3/29星期一483.主要輸出結(jié)果2021/3/29星期一49描述性統(tǒng)計(jì)分析主要用以描述集中趨勢(shì)和離散趨勢(shì)的各種統(tǒng)計(jì)量,還有一個(gè)特殊功能,就是可以對(duì)變量進(jìn)行標(biāo)準(zhǔn)化處理。以書后練習(xí)2.1為例1.打開數(shù)據(jù)文件2.描述性統(tǒng)計(jì)分析2021/3/29星期一502.統(tǒng)計(jì)分析:“分析”→“描述統(tǒng)計(jì)”→“描述”→“選項(xiàng)”→“確定”2021/3/29星期一512021/3/29星期一523.主要輸出結(jié)果2021/3/29星期一53標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤的區(qū)別:標(biāo)準(zhǔn)差能反映一個(gè)數(shù)據(jù)集的離散程度。標(biāo)準(zhǔn)誤用來衡量抽樣誤差。標(biāo)準(zhǔn)誤越小,表明樣本統(tǒng)計(jì)量與總體參數(shù)的值越接近,樣本對(duì)總體越有代表性,用樣本統(tǒng)計(jì)量推斷總體參數(shù)的可靠度越大。2021/3/29星期一54探索性分析的目的是對(duì)數(shù)據(jù)進(jìn)行初步檢查,判斷有無奇異值和極端值;判斷變量是否服從正態(tài)分布;對(duì)數(shù)據(jù)進(jìn)行初步考察。以書后練習(xí)2.1為例1.打開數(shù)據(jù)文件3.探索性分析2021/3/29星期一552.統(tǒng)計(jì)分析:“分析”→“描述統(tǒng)計(jì)”→“探索”→“statistic”2021/3/29星期一563.主要輸出結(jié)果2021/3/29星期一571.單樣本均數(shù)比較2.配對(duì)設(shè)計(jì)均數(shù)比較3.完全隨機(jī)設(shè)計(jì)兩均數(shù)比較六、兩個(gè)均數(shù)比較的t檢驗(yàn)
2021/3/29星期一58SPSS在“分析”菜單中的“比較均值”選項(xiàng)提供的t檢驗(yàn)方法過程有單樣本t檢驗(yàn)、配對(duì)樣本t檢驗(yàn)、獨(dú)立樣本t檢驗(yàn)。單樣本均數(shù)比較的t檢驗(yàn)即已知樣本均數(shù)與已知總體均數(shù)的比較。本法是檢驗(yàn)單個(gè)樣本均數(shù)所代表的未知總體均數(shù)與已知總體均數(shù)是否有差別的參數(shù)檢驗(yàn)方法過程。1.單樣本均數(shù)比較2021/3/29星期一59例:某醫(yī)生測(cè)得36名男性礦工的血紅蛋白含量為:112,137,129,126,88,90,105,178,130,128,126,103,172,116,125,90,96,62,157,151,135,113,175,129,165,171,128,128,160,110,140,163,100,129,116,127(g/L),問,這36名礦工的血紅蛋白含量與正常男性(平均值為140g/L)有無不同?1.建立數(shù)據(jù)庫(kù)建立數(shù)據(jù)庫(kù)文件時(shí),產(chǎn)生一個(gè)變量“Hb”,類型為數(shù)值型,共36行1列。(ex---6.2)2021/3/29星期一60統(tǒng)計(jì)分析:“分析”→“比較均值”→“單獨(dú)樣本T檢驗(yàn)”2021/3/29星期一61不要忘記2021/3/29星期一62統(tǒng)計(jì)量t=-2.596,自由度df=35,雙側(cè)檢驗(yàn)p=0.014,差值的均數(shù)為-11.944,95%可信區(qū)間為(-21.29,-2.6),按α=0.05水準(zhǔn),可認(rèn)為礦工的血紅蛋白與正常男性有差別,結(jié)合本例,可認(rèn)為礦工的血紅蛋白比正常男性低。2021/3/29星期一63配對(duì)設(shè)計(jì)均數(shù)比較簡(jiǎn)稱配對(duì)t檢驗(yàn),使用與:1.量同質(zhì)收拾對(duì)象配成對(duì)子分別接受兩種不同的處理;2.同一受試對(duì)象分別接受兩種不同處理;3.同一受試對(duì)象接受(一種)處理前后。2.配對(duì)設(shè)計(jì)均數(shù)比較2021/3/29星期一64建立數(shù)據(jù)文件時(shí),產(chǎn)生兩個(gè)反應(yīng)變量x1正常組,x2缺乏組,均為數(shù)值型。以書后練習(xí)6.2為例,首先建立數(shù)據(jù)文件2021/3/29星期一652021/3/29星期一66兩組相關(guān)系數(shù)的假設(shè)檢驗(yàn)p=0.129,說明兩組的差別沒有統(tǒng)計(jì)學(xué)意義。2021/3/29星期一67完全隨機(jī)設(shè)計(jì)兩組均數(shù)比較的t檢驗(yàn)又稱成組t檢驗(yàn),適用于完全隨機(jī)設(shè)計(jì)兩樣本均數(shù)的比較。兩組完全隨機(jī)設(shè)計(jì)是將受試對(duì)象完全隨機(jī)分配到兩個(gè)不同處理組。3.完全隨機(jī)設(shè)計(jì)兩均數(shù)比較2021/3/29星期一68建立數(shù)據(jù)文件時(shí),取兩個(gè)變量,一個(gè)為分組變量group,字符型,1=新藥組,2=常規(guī)藥組;一個(gè)為反應(yīng)變量X,數(shù)值型,共20行2列。以書后練習(xí)6.3,首先建立數(shù)據(jù)文件2021/3/29星期一692021/3/29星期一70方差齊性檢驗(yàn)F=1.697,p=0.209,可認(rèn)為方差為齊性,選擇“采用相等變異系數(shù)”時(shí)的值,t=1.019,自由度df=18,雙側(cè)檢驗(yàn)p=0.321,按α=0.05水準(zhǔn),不能認(rèn)為新藥和常用藥有差別。2021/3/29星期一711.完全隨機(jī)設(shè)計(jì)資料的方差分析2.隨機(jī)區(qū)組設(shè)計(jì)資料的方差分析七、多個(gè)均數(shù)比較的方差分析2021/3/29星期一72方差分析多用于多個(gè)樣本均數(shù)的比較,其應(yīng)用條件為:1.各樣本均是相互獨(dú)立的隨機(jī)樣本;2.均服從正態(tài)分布;3.各樣本的總體方差相等。2021/3/29星期一73完全隨機(jī)設(shè)計(jì)是采用完全隨機(jī)化的分組方法,將全部試驗(yàn)對(duì)象分配到n個(gè)處理組,各組接受不同的處理,實(shí)驗(yàn)結(jié)束后比較各組均數(shù)的差別有無統(tǒng)計(jì)學(xué)意義,以推斷處理因素的效應(yīng)。1.完全隨機(jī)設(shè)計(jì)資料的方差分析以書后練習(xí)6.4為例,首先建立數(shù)據(jù)文件數(shù)據(jù)文件包含兩個(gè)變量,分組變量group:1=A組,2=B組,3=C組,變量類型為數(shù)值型;反應(yīng)變量zsl,變量類型為數(shù)值型。共3列21行。2021/3/29星期一742021/3/29星期一752021/3/29星期一762021/3/29星期一77本例Levene
p=0.360,認(rèn)為三組方差齊性;F=1.05,p=0.370,按照α=0.05的水準(zhǔn),接受H0,拒絕H1,認(rèn)為三組間的差異無統(tǒng)計(jì)學(xué)意義。SNK的分析結(jié)果,認(rèn)為三組間,兩兩均無差異。2021/3/29星期一78隨機(jī)區(qū)組設(shè)計(jì)又稱為配伍組設(shè)計(jì),在進(jìn)行統(tǒng)計(jì)分析時(shí),將區(qū)組變異離均差平方和從完全隨機(jī)設(shè)計(jì)的組內(nèi)離均差平方和中分離出來,從而減小組內(nèi)平方和,提高了統(tǒng)計(jì)檢驗(yàn)效率。2.隨機(jī)區(qū)組設(shè)計(jì)資料的方差分析
以書后練習(xí)6.5為例,首先建立數(shù)據(jù)文件數(shù)據(jù)文件包含3個(gè)變量,分組變量year,數(shù)值型,1=三年,2=四年,3=五年;配伍組變量block,數(shù)值型,1=大花葉,2=無光葉,3=小花葉;結(jié)果變量weight2021/3/29星期一792021/3/29星期一802021/3/29星期一812021/3/29星期一822021/3/29星期一832021/3/29星期一84本例結(jié)果顯示時(shí)間因素year對(duì)黃連的產(chǎn)量有影響,F(xiàn)=21.782,p=0.007<0.05,區(qū)組因素block對(duì)黃連的產(chǎn)量也有影響,F(xiàn)=10.138,p=0.027<0.05。2021/3/29星期一851.四格表(2×2表)的x2檢驗(yàn)2.配對(duì)四格表x2檢驗(yàn)3.行×列表x2檢驗(yàn)八、率和構(gòu)成比的比較2021/3/29星期一86x2檢驗(yàn)是一種用途廣泛的假設(shè)檢驗(yàn),本章介紹應(yīng)用x2檢驗(yàn)推斷兩個(gè)或兩個(gè)以上總體率或構(gòu)成比之間有無差別,以及兩個(gè)分類變量之間有無關(guān)聯(lián)。2021/3/29星期一87四格表資料的x2檢驗(yàn)可推斷兩個(gè)總體率之間有無差別。各實(shí)際頻數(shù)排列用符號(hào)表示如下:1.四格表(2×2表)的x2檢驗(yàn)2021/3/29星期一88以書后練習(xí)7.2為例,整理四格表:建立數(shù)據(jù)庫(kù)建立數(shù)據(jù)文件時(shí),取3個(gè)變量:處理組別“treat”變量:1=case,2=control;療效變量“effect”:1=有效,2=無效;頻率變量“freq”。2021/3/29星期一892021/3/29星期一90統(tǒng)計(jì)分析:“數(shù)據(jù)”→“加權(quán)個(gè)案”→“分析”→“描述統(tǒng)計(jì)”→“交叉表格”→“statistic”,點(diǎn)選“卡方”選項(xiàng)。2021/3/29星期一912021/3/29星期一922021/3/29星期一932021/3/29星期一94本例選擇Pearson
x2=6.930,p=0.008,按α=0.05水準(zhǔn),拒絕H0,接受H1,認(rèn)為兩組差別有統(tǒng)計(jì)學(xué)意義。2021/3/29星期一95計(jì)數(shù)資料的配對(duì)設(shè)計(jì)常用于兩種檢驗(yàn)方法、培養(yǎng)方法、診斷方法的比較。其特點(diǎn)是樣本中每個(gè)個(gè)體分別接受兩種方法的處理,觀察兩種處理方法的二分類變量的技術(shù)結(jié)果。配對(duì)四格表的樣本資料表示如下表:2.配對(duì)四格表x2檢驗(yàn)2021/3/29星期一96建立數(shù)據(jù)文件,建立數(shù)據(jù)文件時(shí),取3個(gè)變量,一個(gè)為“正常體重”,變量標(biāo)示:1=“發(fā)生”,2=“未發(fā)生”;一個(gè)為“肥胖”,變量標(biāo)示:1=“發(fā)生”,2=“未發(fā)生”;一個(gè)為“freq”,表示各指標(biāo)的發(fā)生頻率。以書后練習(xí)7.5為例,整理四格表:2021/3/29星期一972021/3/29星期一98統(tǒng)計(jì)分析:“數(shù)據(jù)”→“加權(quán)個(gè)案”→“分析”→“描述統(tǒng)計(jì)”→“交叉表格”→“statistic”,點(diǎn)選“McNemar”選項(xiàng)。2021/3/29星期一992021/3/29星期一1002021/3/29星期一1012021/3/29星期一102本例p=0.143,按α=0.05水準(zhǔn),不能拒絕H0,認(rèn)為兩組差別沒有統(tǒng)計(jì)學(xué)意義。2021/3/29星期一103行×列表資料的卡方檢驗(yàn)用于多個(gè)率或多個(gè)構(gòu)成比的比較。以書后習(xí)題7.3為例講解。首先整理表格:3.行×列表x2檢驗(yàn)2021/3/29星期一1042021/3/29星期一105建立數(shù)據(jù)文件2021/3/29星期一1062021/3/29星期一1072021/3/29星期一108本例選擇Pearson
x2=146.175,p=0.000,按α=0.05水準(zhǔn),拒絕H0,接受H1,認(rèn)為各組差別有統(tǒng)計(jì)學(xué)意義。2021/3/29星期一1091.兩獨(dú)立樣本非參數(shù)檢驗(yàn)2.多個(gè)獨(dú)立樣本非參數(shù)檢驗(yàn)3.兩相關(guān)樣本非參數(shù)檢驗(yàn)4.多個(gè)相關(guān)樣本非參數(shù)檢驗(yàn)九、非參數(shù)檢驗(yàn)2021/3/29星期一110非參數(shù)檢驗(yàn)的方法很過,常用的有秩和檢驗(yàn),非參數(shù)檢驗(yàn)方法的應(yīng)用范圍主要包括:1.不滿足正太和方差齊性條件的小樣本計(jì)量資料;2.分布不知是否正態(tài)的小樣本資料;3.一端或者兩端為不確定數(shù)值資料;4.等級(jí)資料。2021/3/29星期一111兩獨(dú)立樣本非參數(shù)檢驗(yàn)過程是檢驗(yàn)兩個(gè)獨(dú)立樣本所在總體分布是否有差別的方法。1.兩獨(dú)立樣本非參數(shù)檢驗(yàn)以書后練習(xí)8.2為例,首先建立數(shù)據(jù)文件建立數(shù)據(jù)文件時(shí),產(chǎn)生兩個(gè)變量,一個(gè)為分組變量group:1=鉛作業(yè)組,2=非鉛作業(yè)組;一個(gè)為反應(yīng)變量Pb。2021/3/29星期一1122021/3/29星期一1132021/3/29星期一114Mann-Whitney
U檢驗(yàn)的統(tǒng)計(jì)量為4.500,Wilcoxon
W檢驗(yàn)統(tǒng)計(jì)量為59.500,兩種檢驗(yàn)的Z值為-2.980,雙側(cè)檢驗(yàn)p=0.003,確切概率檢驗(yàn)p=0.001,因?yàn)閆分布為對(duì)稱分布,單側(cè)檢驗(yàn)p=0.0015<0.05,認(rèn)為兩組的血鉛值含量差異有統(tǒng)計(jì)學(xué)意義。2021/3/29星期一115練習(xí)8.3,建立數(shù)據(jù)文件,數(shù)據(jù)文件包含3個(gè)變量:(1)分組變量,賦值:1=一般組,2=重癥組。(2)反應(yīng)變量,即總膽紅素的含量,編秩。(3)頻數(shù)變量,即人數(shù)2021/3/29星期一1161.對(duì)數(shù)據(jù)進(jìn)行加權(quán):數(shù)據(jù)→加權(quán)個(gè)案2021/3/29星期一1172.對(duì)兩獨(dú)立樣本進(jìn)行秩和檢驗(yàn)2021/3/29星期一118Z=-5.576,雙側(cè)檢驗(yàn)P=0.000;按α=0.05水準(zhǔn),可認(rèn)為兩組患肝炎嬰兒的血清總膽紅素有差別,2021/3/29星期一119多個(gè)獨(dú)立樣本非參數(shù)檢驗(yàn)過程是檢驗(yàn)多個(gè)獨(dú)立樣本所在的總體分布是否有差異的方法。2.多個(gè)獨(dú)立樣本非參數(shù)檢驗(yàn)以書后練習(xí)8.5為例,首先建立數(shù)據(jù)文件數(shù)據(jù)文件包含兩個(gè)變量,分組變量group:1=正常人,2=單純性肥胖,3=皮質(zhì)醇增多型;反應(yīng)變量X,表示血漿總皮質(zhì)醇的濃度。2021/3/29星期一1202021/3/29星期一1212021/3/29星期一122本例Chi-Square統(tǒng)計(jì)量為18.130,自由度為df=2,p=0.000,按α=0.05水準(zhǔn)可認(rèn)為三組人的血漿總皮質(zhì)醇含量有差異。2021/3/29星期一123練習(xí)8.3,建立數(shù)據(jù)文件,數(shù)據(jù)文件包含3個(gè)變量:(1)分組變量,賦值:1=單純型,2=喘息型,3=單純型合并肺氣腫,4=喘息型合并肺氣腫。(2)反應(yīng)變量,即療效,編秩。(3)頻數(shù)變量,即人數(shù)2021/3/29星期一1241.對(duì)數(shù)據(jù)進(jìn)行加權(quán):數(shù)據(jù)→加權(quán)個(gè)案2021/3/29星期一1252021/3/29星期一126卡方檢驗(yàn)統(tǒng)計(jì)量為2.113,自由度df=3,概率p=0.549,按照α=0.05水準(zhǔn)尚不能認(rèn)為四種藥物的療效有差別。2021/3/29星期一1271.直線相關(guān)2.直線回歸十、雙變量相關(guān)與回歸分析2021/3/29星期一128在醫(yī)學(xué)科研的過程中,經(jīng)常會(huì)遇到分析兩個(gè)變量之間的關(guān)系,例如,體重與肺活量,年齡與血壓,身高與體表面積之間的關(guān)系,此時(shí),經(jīng)常用相關(guān)與回歸分析來解決。在進(jìn)行相關(guān)與回歸分析之前必須先做散點(diǎn)圖,判斷量變量之間是否存在線性趨勢(shì),當(dāng)兩變量間存在線性趨勢(shì)時(shí),才考慮做相關(guān)或者回歸。2021/3/29星期一129直線相關(guān)是研究?jī)蓚€(gè)變量之間線性關(guān)系的一種常用統(tǒng)計(jì)方法,分析的是兩變量之間是否存在直線相關(guān)關(guān)系,以及相關(guān)的方向和程度。作直線相關(guān)分析要求資料服從雙變量正態(tài)分布。對(duì)于不符合雙變量正態(tài)分布的資料,不能直接計(jì)算相關(guān)系數(shù),可用非參數(shù)統(tǒng)計(jì)方法。1.直線相關(guān)2021/3/29星期一130例2.某地研究了8名正常兒童的尿肌酐含量Y(mmol/24h),使計(jì)算尿肌酐的含量與其年齡的相關(guān)系數(shù)。建立數(shù)據(jù)文件,取兩個(gè)變量,X:年齡;Y:尿肌酐含量。兩變量均為數(shù)值型。2021/3/29星期一131散點(diǎn)圖的制作2021/3/29星期一1322021/3/29星期一1332021/3/29星期一134結(jié)果顯示年齡和尿肌酐含量的相關(guān)系數(shù)為0.882,p=0.004,有統(tǒng)計(jì)學(xué)意義。2021/3/29星期一135Pearson相關(guān):極距相關(guān)系數(shù),系統(tǒng)默認(rèn)項(xiàng),主要用于符合雙變量正態(tài)分布資料的相關(guān)分析。Kendall’s
tau-b:Kendall’s等級(jí)相關(guān)系數(shù),是反映兩個(gè)分類變量一致性的指標(biāo)。Spearman:spearman相關(guān)系數(shù)是非參數(shù)相關(guān)分析,即秩相關(guān)分析。補(bǔ)充:2021/3/29星期一136醫(yī)學(xué)研究中常要定量刻畫應(yīng)變量Y對(duì)自變量X在數(shù)量上的依存關(guān)系,常常將易于測(cè)量的變量作為X,另一個(gè)隨機(jī)變量作為Y。直線回歸分析的使用條件:對(duì)于每個(gè)X相應(yīng)的Y要服從正態(tài)分布,X可以是正態(tài)隨機(jī)變量也可以是能精確測(cè)量或嚴(yán)格控制的非隨機(jī)變量。2.直線回歸仍以例2的資料為例,建立數(shù)據(jù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2030年中國(guó)塑料膨脹螺絲數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 【假期提升】五升六語文暑假作業(yè)(十六)-人教部編版(含答案含解析)
- 2019-2025年消防設(shè)施操作員之消防設(shè)備高級(jí)技能題庫(kù)檢測(cè)試卷A卷附答案
- 2019-2025年消防設(shè)施操作員之消防設(shè)備高級(jí)技能每日一練試卷B卷含答案
- 2025年軍隊(duì)文職人員招聘之軍隊(duì)文職管理學(xué)題庫(kù)檢測(cè)試卷B卷附答案
- 重新簽署終止合同范本(2篇)
- 酒吧資源部合同(2篇)
- 2023年國(guó)家公務(wù)員《行政職業(yè)能力測(cè)驗(yàn)》試題(副省級(jí))
- 電氣維保知識(shí)培訓(xùn)課件
- 年度銷售目標(biāo)與策略
- 2024-2025學(xué)年第二學(xué)期天域全國(guó)名校協(xié)作體高三3月聯(lián)考 地理試卷(含答案)
- 修理木橋施工合同范本
- 新教科版一年級(jí)科學(xué)下冊(cè)第一單元第6課《哪個(gè)流動(dòng)得快》課件
- 屋面種植土垂直施工方案
- 2025年新人教PEP版英語三年級(jí)下冊(cè)全冊(cè)課時(shí)練習(xí)
- 《愛耳日課件》課件
- 2024年安徽中醫(yī)藥高等??茖W(xué)校高職單招職業(yè)適應(yīng)性測(cè)試歷年參考題庫(kù)含答案解析
- GB/T 45107-2024表土剝離及其再利用技術(shù)要求
- 2025年保密工作計(jì)劃(3篇)
- 2025年中國(guó)移動(dòng)通信集團(tuán)甘肅限公司校園招聘290人高頻重點(diǎn)提升(共500題)附帶答案詳解
- 5G優(yōu)化案例:5G波束配置優(yōu)化提升CQI優(yōu)良比案例
評(píng)論
0/150
提交評(píng)論