數(shù)據(jù)統(tǒng)計(jì)分析及方法SPSS教程完整版

上傳人：優(yōu)*** IP屬地：廣東上傳時(shí)間：2020-10-20 格式：PPT 頁(yè)數(shù)：430 大小：7.06MB 積分：20 舉報(bào) 版權(quán)申訴

數(shù)據(jù)統(tǒng)計(jì)分析及方法SPSS教程完整版_第2頁(yè)

數(shù)據(jù)統(tǒng)計(jì)分析及方法SPSS教程完整版_第3頁(yè)

數(shù)據(jù)統(tǒng)計(jì)分析及方法SPSS教程完整版_第4頁(yè)

數(shù)據(jù)統(tǒng)計(jì)分析及方法SPSS教程完整版_第5頁(yè)

已閱讀5頁(yè)，還剩425頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、數(shù)據(jù)統(tǒng)計(jì)分析及方法SPSS教程完整版,1,第1章數(shù)據(jù)分析概述與軟件入門,1.1 SPSS軟件概述 1.1.1 SPSS簡(jiǎn)介 SPSS（Statistics Package for Social Science ）for Windows是一種運(yùn)行在Windows系統(tǒng)下的社會(huì)科學(xué)統(tǒng)計(jì)軟件軟件包。 SPSS的基本功能包括數(shù)據(jù)管理、統(tǒng)計(jì)分析、圖表分析、輸出管理等，具體內(nèi)容包括描述統(tǒng)計(jì)、列聯(lián)分析，總體的均值比較、相關(guān)分析、回歸模型分析、聚類分析、主成份分析、時(shí)間序列分析、非參數(shù)檢驗(yàn)等多個(gè)大類，每個(gè)類中還有多個(gè)專項(xiàng)統(tǒng)計(jì)方法。,2,一、功能強(qiáng)大,（1）囊括了各種成熟的統(tǒng)計(jì)方法與模型，為統(tǒng)計(jì)分析用戶提供了全

2、方位的統(tǒng)計(jì)學(xué)算法，為各種研究提供了相應(yīng)的統(tǒng)計(jì)學(xué)方法。（2）提供了各種數(shù)據(jù)準(zhǔn)備與數(shù)據(jù)整理技術(shù)。（3）自由靈活的表格功能。（4）各種常用的統(tǒng)計(jì)學(xué)圖形。,3,二、SPSS的實(shí)驗(yàn)環(huán)境要求,（1）系統(tǒng)運(yùn)行環(huán)境 SPSS10.0以上版本軟件包可以工作在兩種模式下，單機(jī)模式和作為網(wǎng)絡(luò)系統(tǒng)的用戶界面模式。（2）輔助軟件環(huán)境三、SPSS的主要界面 SPSS的主要界面有數(shù)據(jù)編輯窗口和結(jié)果輸出窗口。四、SPSS的幫助系統(tǒng) SPSS對(duì)一些基本模塊中的統(tǒng)計(jì)提供了幫助，可以通過(guò)單擊Help菜單中的Statistics Coach命令，選擇所需要的統(tǒng)計(jì)指導(dǎo)。,4,5,五、SPSS的運(yùn)行方式,SPSS提供了3種基

3、本運(yùn)行方式：完全窗口菜單方式，程序運(yùn)行方式、混合運(yùn)行方式。程序運(yùn)行方式和混合運(yùn)行方式是使用者從特殊的分析需要出發(fā)，編寫自己的SPSS命令程序，通過(guò)語(yǔ)句直接運(yùn)行。 SPSS中使用的對(duì)話框主要有兩類，一類是文件操作對(duì)話框，文件操作對(duì)話窗口操作與Windows應(yīng)用軟件操作風(fēng)格一致。另一類是統(tǒng)計(jì)分析對(duì)話框，統(tǒng)計(jì)分析對(duì)話框可以分為主窗口和下級(jí)窗口，在該類對(duì)話框中，選擇參與分析的各類變量及統(tǒng)計(jì)方法是對(duì)話框的主要任務(wù)。,6,1.1.2 spss的安裝,一、啟動(dòng)Windows 后，把SPSS 系統(tǒng)安裝軟盤（或光盤）插入軟驅(qū)（或光驅(qū)），并找到SPSS的安裝程序的可執(zhí)行文件Setup.exe。二、雙擊 Setu

4、p.exe 文件，安裝程序向?qū)⒔o出每一步操作的提示。在出現(xiàn)Welcome（歡迎）窗口后，選擇Next進(jìn)入下一步。三、安裝程序顯示Software License Agreement對(duì)話框時(shí)，選擇Yes接受顯示的協(xié)議條款。,7,1.2 spss操作入門,1.2.1 spss軟件的啟動(dòng)與退出單擊Windows 的開(kāi)始按鈕，在程序菜單項(xiàng)SPSS for Windows中找到SPSS 10.0 for Windows并單擊。,8,1.2.2 SPSS的5個(gè)窗口,（1）數(shù)據(jù)編輯窗口（SPSS Data Editor）,Spss處理數(shù)據(jù)的工作全在此窗口進(jìn)行。,9,10,（2）結(jié)果管理窗口（SPSS

5、Output viewer）,此窗口用于存放分析結(jié)果。左邊是目錄區(qū)，右邊是內(nèi)容區(qū)。,11,（3）草稿結(jié)果窗口（SPSS Draft Viewer）,草稿結(jié)果是結(jié)果的一種簡(jiǎn)化文本格式。實(shí)際上就是WORD所兼容的rtf超文本格式，因此可以在沒(méi)有安裝SPSS的PC機(jī)上使用文字編輯軟件打開(kāi)。,12,（4）語(yǔ)法編輯窗口（SPSS Syntax Editor）,13,（5）腳本窗口（SPSS Script Editor）,14,1.2.3 SPSS的四種運(yùn)行方式,一、菜單對(duì)話方式首先打開(kāi)SPSS軟件，然后選擇菜單File Open file。,然后，利用菜單Analyze Descriptive Sta

6、tistics Frequencies，,15,16,二、程序方式,在Syntax編輯窗口中鍵入以下程序：,Get file=c:program filesspssemployee data.sav. Frequencies variables = jobcat/order = analysis。,只需要選擇菜單Run All，運(yùn)行該程序也一樣會(huì)出現(xiàn)相同的分析結(jié)果。,17,三、Include命令方式,當(dāng)編寫Syntax程序時(shí)，如果發(fā)現(xiàn)將要編寫的程序語(yǔ)句正好是另一個(gè)Syntax文件的內(nèi)容；或者發(fā)現(xiàn)所需要的程序語(yǔ)句其實(shí)是幾個(gè)Syntax文件的總和是，除了可以通過(guò)“Copy”、“Paste”的方法利

7、用資源，生產(chǎn)一個(gè)新的Syntax文件外，還可以利用Include命令。,Include c:sytaxsample.sps.,18,四、spss Production Faccility 方式,在Windows的程序菜單中，spss菜單組除了有“spss for windows”項(xiàng)之外，還有一個(gè)“spss production facility”。,19,（1）單擊Syntax框下的“Add”按鈕，到C盤根目錄下打開(kāi)“syntaxsample”。,（2）單擊Syntax框下的“Edit”按鈕，對(duì)程序進(jìn)行編輯。,（3）單擊右下角的“uesr prompts”按鈕，添加對(duì)程序的交互分析界面。,（4

8、）單擊“Browse”按鈕制定結(jié)果保存路徑，單擊“export options”按鈕還可以制定結(jié)果保存格式。,20,1.2.4 spss的四種輸出結(jié)果,1、表格格式 2、文本格式 3、標(biāo)準(zhǔn)圖與交互圖 4、結(jié)果的保存和導(dǎo)出,21,22,第2章數(shù)據(jù)錄入與數(shù)據(jù)獲取,本章主要解決兩個(gè)問(wèn)題：第一個(gè)問(wèn)題，根據(jù)問(wèn)題類型的不同，將會(huì)從開(kāi)放題、單選題和多選題的錄入方式為例進(jìn)行介紹。第二個(gè)問(wèn)題，重點(diǎn)介紹如何用SPSS直接讀取Excel類型和文本格式的數(shù)據(jù)，以及如何用ODBC接口讀取數(shù)據(jù)庫(kù)文件。,23,2.1.1 統(tǒng)計(jì)軟件中數(shù)據(jù)的錄入格式（1）不同觀測(cè)對(duì)象的數(shù)據(jù)不能在同一記錄中出現(xiàn)，即同一觀測(cè)數(shù)據(jù)應(yīng)當(dāng)獨(dú)占一

9、行。（2）每一個(gè)觀測(cè)量指標(biāo)或影響因素只能占據(jù)一列的位置，即同一指標(biāo)的數(shù)量觀測(cè)值都應(yīng)當(dāng)錄入到同一個(gè)變量中去。,2.1 數(shù)據(jù)格式概述,即：一個(gè)觀測(cè)占一行，一個(gè)變量占一列,24,在錄入數(shù)據(jù)時(shí)，歸納為以下三步：第一步：定義變量名；第一步：指定每個(gè)變量的各種屬性；第一步：錄入數(shù)據(jù)。變量名不能與spss保留字相同，spss的保留字有ALL、END、BY、EQ、GE、GT、LE、LT、NE、NOT、OR、TO、WITH。,2.1.2 變量屬性介紹,25,一、變量的儲(chǔ)存類型,SPSS中，變量有三種的基本類型：數(shù)值型、字符型和日期型。,標(biāo)準(zhǔn) 數(shù)值型,逗號(hào) 數(shù)值型,圓點(diǎn) 數(shù)值型,科學(xué)技術(shù)法數(shù)值型,美元

10、數(shù)值型,用戶自定義型,數(shù)值型：數(shù)值型的數(shù)據(jù)是0-9的阿拉伯?dāng)?shù)字和其他符號(hào)，如美元符號(hào)、逗號(hào)或圓點(diǎn)組成的。,26,字符型：字符型數(shù)據(jù)的默認(rèn)顯示寬度為8個(gè)字符位，系統(tǒng)不區(qū)分變量名中的大小寫字母，并且不能進(jìn)行數(shù)學(xué)運(yùn)算。注意：在輸入數(shù)據(jù)時(shí)不應(yīng)輸入引號(hào)，否則雙引號(hào)將會(huì)作為字符型數(shù)據(jù)的一部分。,日期型：日期型數(shù)據(jù)是用來(lái)表示日期或時(shí)間的。日期型數(shù)據(jù)的顯示格式有很多，SPSS以菜單方式列出日期型數(shù)據(jù)的顯示格式以供用戶選擇。事實(shí)上，SPSS存儲(chǔ)中的日期型變量是該實(shí)踐與1582年10月14日零點(diǎn)相差的秒數(shù)。,27,關(guān)于日期型格式的幾點(diǎn)說(shuō)明：,“m”在年與日（字母y與d）之間表示月份；在時(shí)與秒（字母h與s）之

11、間表示“分”鐘。 “mmm”表示要求書(shū)寫英文月份單詞的前三個(gè)字母組成的縮寫。 “ddd”三個(gè)字母d表示要求用從元月一日算起的日數(shù)表示日期。指定了日期變量的格式，不一定在輸入時(shí)就使用指定的格式?？梢暂斎胗谩?”或“”作分隔符的具體日期，回車后，系統(tǒng)將自動(dòng)將輸入的格式轉(zhuǎn)化為指定的格式，顯示在單元各種。,28,二、變量的測(cè)量尺度,在SPSS中使用Measure屬性對(duì)變量的測(cè)量尺度進(jìn)行定義。,（1）定類尺度（Nominal Measurement）：定類尺度是對(duì)事物的類別或?qū)傩缘囊环N測(cè)度，按照事物的某種屬性對(duì)其進(jìn)行分類或分組。,特點(diǎn)：其值僅代表了事物的類別和屬性，即能測(cè)度類別差異，不能比較各類之間的

12、大小，所以各類之間沒(méi)有順序和等級(jí)。對(duì)定類尺度的變量只能計(jì)算頻數(shù)和頻率。,在spss中，能適用定類尺度的數(shù)據(jù)可以是數(shù)值型，也可以是字符型變量。使用定類變量對(duì)事物進(jìn)行分類時(shí)，必須符合窮盡原則和互斥原則。,29,（2）定序尺度（Ordinal Measurement）：定序尺度是對(duì)事物之間的等級(jí)或順序差別的一種測(cè)度，可比較優(yōu)劣或排序。,特點(diǎn)：由于定序變量只能側(cè)度類別之間的順序，無(wú)法測(cè)出類別之間的準(zhǔn)確差值，即測(cè)量數(shù)值不代表絕對(duì)的數(shù)量大小，所以其測(cè)量結(jié)果只能排序，不能進(jìn)行運(yùn)算。,（3）定矩尺度（Interval Measurement）：定矩尺度是對(duì)事物類別或次序之間間距的測(cè)度。,特點(diǎn)：不僅能將事物區(qū)分

13、為不同類型并進(jìn)行排序，而且可能準(zhǔn)確指出類別之間的差距是多少；定居變量通常以自然或物理單位為計(jì)量尺度，因此測(cè)量結(jié)果往往表現(xiàn)為數(shù)值，所以計(jì)量結(jié)果可以進(jìn)行加減運(yùn)算。,30,（4）定比尺度（Scale Measurement）：定比尺度是能夠測(cè)算兩個(gè)測(cè)度值之間比值的一種計(jì)量尺度，它的測(cè)量結(jié)果同定距變量一樣表現(xiàn)為數(shù)值。,特點(diǎn)：定必變量是測(cè)量尺度的最高水平，它除了具有其他三種測(cè)量尺度的全部特點(diǎn)外，還具有可計(jì)算兩個(gè)側(cè)度至之間筆直的特點(diǎn)，因此它可以進(jìn)行加、減、乘、除運(yùn)算，而定居變量值可進(jìn)行加減運(yùn)算。,31,三、變量名與變量標(biāo)簽值,Label：定義變量名標(biāo)簽 Value：定義變量值標(biāo)簽,32,四、缺失值,Sps

14、s中缺失值有用戶自定義缺失值和系統(tǒng)缺失值兩大類。,在SPSS中，對(duì)字符型變量，默認(rèn)的缺失值為空格；對(duì)數(shù)值型變量，默認(rèn)的缺失值為零。,33,2.2 數(shù)據(jù)的直接錄入,2.1.1 操作界面說(shuō)明,Data View表可以直接輸入觀測(cè)數(shù)據(jù)值或存放數(shù)據(jù)，表的左端列邊框顯示觀測(cè)個(gè)體的序號(hào)，最上端行邊框顯示變量名。,34,Variable View表用來(lái)定義和修改變量的名稱、類型及其他屬性，如圖所示。,如果輸入變量名后回車，將給出變量的默認(rèn)屬性。如果不定義變量的屬性，直接輸入數(shù)據(jù)，系統(tǒng)將默認(rèn)變量Var00001,Var00002等。,35,在Variable View表中，每一行描述一個(gè)變量，依次是： Nam

15、e：變量名。變量名必須以字母、漢字及開(kāi)頭，總長(zhǎng)度不超過(guò)8個(gè)字符，共容納4個(gè)漢字或8個(gè)英文字母，英文字母不區(qū)別大小寫，最后一個(gè)字符不能是句號(hào)。 Type：變量類型。變量類型有8 種，最常用的是Numeric數(shù)值型變量。其它常用的類型有：String字符型，Date日期型,Comma逗號(hào)型（隔3位數(shù)加一個(gè)逗號(hào)）等。 Width：變量所占的寬度。 Decimals：小數(shù)點(diǎn)后位數(shù)。 Label：變量標(biāo)簽。關(guān)于變量涵義的詳細(xì)說(shuō)明。 Values：變量值標(biāo)簽。關(guān)于變量各個(gè)取值的涵義說(shuō)明。 Missing：缺失值的處理方式。 Columns：變量在Date View 中所顯示的列寬（默認(rèn)列寬為8）。 Ali

16、gn：數(shù)據(jù)對(duì)齊格式（默認(rèn)為右對(duì)齊）。 Measure：數(shù)據(jù)的測(cè)度方式。系統(tǒng)給出名義尺度、定序尺度和等間距尺度三種（默認(rèn)為等間距尺度）。,36,為了在統(tǒng)計(jì)分析過(guò)程中能有效的利用其它軟件產(chǎn)生的數(shù)據(jù)，SPSS軟件編輯窗口除可以使用*.sav擴(kuò)展名數(shù)據(jù)文件，還可以直接打開(kāi)和保存下述類型的文件： SPSS DOS版本產(chǎn)生的數(shù)據(jù)文件*.sys； Excel 報(bào)表程序產(chǎn)生的數(shù)據(jù)文件*.xls； DBASE 數(shù)據(jù)庫(kù)格式文件*.dbf； SAS統(tǒng)計(jì)軟件產(chǎn)生的數(shù)據(jù)文件。,37,2.2.2 開(kāi)放題和簡(jiǎn)單單選題的錄入,一、在spss中定義變量,錄入數(shù)據(jù)的第一步是定義變量屬性，隨后才能進(jìn)行數(shù)據(jù)錄入。,二、開(kāi)放題的錄入,

17、38,三、單選題的錄入單選題的錄入可以采用字符直接錄入、字符代碼+值標(biāo)簽、數(shù)值代碼+值標(biāo)簽三種方式。,39,2.2.3多選題的錄入,一、多重二分法（Multiple Dichotomy Method）所謂多重二分法，是在編碼的時(shí)候，對(duì)應(yīng)每一個(gè)選項(xiàng)都要定義一個(gè)變量，有幾個(gè)選項(xiàng)就有幾個(gè)變量，這些變量均為二分類，他們各自代表對(duì)一個(gè)選項(xiàng)的選擇結(jié)果。二、多重分類法（Multiple Category Method）多重分類法，也是利用多個(gè)變量對(duì)一個(gè)多選題的答案進(jìn)行定義，應(yīng)該用多少個(gè)變量，由被訪者實(shí)際可能給出的最多答案數(shù)而定。,40,三、多選題錄入在spss中的實(shí)現(xiàn),41,2.3 外部數(shù)據(jù)的獲取,

18、SPSS讀入非SPSS類型的文件數(shù)據(jù)，有三種主要方式：直接打開(kāi)，利用文本導(dǎo)向讀入文本數(shù)據(jù)以及利用數(shù)據(jù)庫(kù)OBDC接口讀入數(shù)據(jù)。,2.3.1 電子表格數(shù)據(jù)如何導(dǎo)入spss中,SPSS中可以直接讀入許多常用格式的數(shù)據(jù)文件，選擇菜單File Open Data或直接單擊快捷鍵工具欄上的快捷按鈕，系統(tǒng)就會(huì)彈出Open File 對(duì)話框，單擊“文件類型”列表框，在里面能夠看到可以直接打開(kāi)的數(shù)據(jù)文件格式。,42,2.3.2 文本數(shù)據(jù)如何導(dǎo)入spss中,第一步：首先，在Open File 文件框中選中文件，單擊“打開(kāi)”，系統(tǒng)會(huì)自動(dòng)啟動(dòng)文本倒入向?qū)?duì)話框。,第二步：選擇“NO”并單擊“下一步”按鈕。,43,用

19、某種字符區(qū)分,固定寬度,第三步：分別選擇“Delimited”和“yes”,然后單擊“下一步”按鈕。,44,第四步,45,第五步,46,第六步,47,第七步,48,2.4 數(shù)據(jù)的保存,2.4.1 存為spss格式 2.4.2 存為其他數(shù)據(jù)格式,49,第3章數(shù)據(jù)管理,3.1 變量級(jí)別的數(shù)據(jù)管理,對(duì)變量進(jìn)行操作的內(nèi)容主要集中于Transform菜單中，包括新變量的生成、記錄的排序、對(duì)變量進(jìn)行計(jì)數(shù)等。,計(jì)算新變量：就是用Compute過(guò)程。變量轉(zhuǎn)換：包括Recode、Visual Bander、Count、Rank Case、Automatic Recode這五個(gè)過(guò)程。專用過(guò)程：包括建立時(shí)間序

20、列、缺失值代替和設(shè)定隨機(jī)種子三個(gè)過(guò)程。 Run Pending Transforming：用于執(zhí)行編程中被掛起的數(shù)據(jù)整理操作。,50,計(jì)算產(chǎn)生新變量,變量值自動(dòng)編碼,設(shè)定隨機(jī)數(shù)種子,創(chuàng)建代替缺失值變量,創(chuàng)建時(shí)間序列變量,運(yùn)行其它轉(zhuǎn)換程序,變量值重新編碼,創(chuàng)建計(jì)數(shù)變量,觀測(cè)量排秩,連續(xù)變量進(jìn)行分段,51,3.1.1 計(jì)算新變量,計(jì)算新變量的功能就是在原有spss數(shù)據(jù)文件的基礎(chǔ)上，根據(jù)用戶的要求，使用spss算術(shù)表達(dá)式及函數(shù)，對(duì)所有記錄或滿足SPSS條件表達(dá)式的記錄，計(jì)算出一個(gè)新結(jié)果，并將結(jié)果存入一個(gè)用戶指定的變量中。一、常用基本概念（1）spss算術(shù)表達(dá)式 spss算術(shù)表達(dá)式是由常量、sps

21、s變量名、spss的算術(shù)運(yùn)算符、圓括號(hào)等組成的式子。（2）spss函數(shù) spss提供了多達(dá)70多種函數(shù)，分為八大類：算術(shù)函數(shù)、統(tǒng)計(jì)函數(shù)、分布函數(shù)、邏輯函數(shù)、字符串函數(shù)、日期時(shí)間函數(shù)、缺失值函數(shù)和其它函數(shù)。（3）spss條件表達(dá)式通過(guò)spss的算術(shù)表達(dá)式和函數(shù)可以對(duì)所有記錄計(jì)算一個(gè)結(jié)果，如果僅希望對(duì)部分記錄進(jìn)行計(jì)算，則應(yīng)當(dāng)利用spss的條件表達(dá)式指定對(duì)那些記錄進(jìn)行計(jì)算。,52,二、compute過(guò)程的分析實(shí)例,例3.1 統(tǒng)計(jì)英語(yǔ)成績(jī)?cè)?0分以上的學(xué)生的數(shù)學(xué)和語(yǔ)文的平均成績(jī)。,53,54,例3.2 計(jì)算工人工資的所得稅。,學(xué)生自己練習(xí)。,55,3.1.2 對(duì)變量值進(jìn)行分組合并,一、對(duì)連續(xù)變量

22、進(jìn)行分組,在SPSS中可以將連續(xù)變量轉(zhuǎn)換為離散（等級(jí)或定序）變量，按照某種一一對(duì)應(yīng)的關(guān)系生成新變量值，可以將新值賦給原變量。Recode過(guò)程和Visual Bander過(guò)程都可以完成這一任務(wù)，但前者給為簡(jiǎn)單和常用。,例3.3 當(dāng)學(xué)生英語(yǔ)成績(jī)小于60時(shí)取值為“不及格”，大于等于60且小于70為“及格”，大于等于70且小于80為“較好”，大于等于80為“優(yōu)秀”。,56,57,二、分類變量類別的合并,Recode過(guò)程也常用于合并某個(gè)分類變量的幾個(gè)水平為一個(gè)水平。,將上例grade中優(yōu)秀、良好和及格三個(gè)等級(jí)合并為一個(gè)等級(jí)“PASS”，將grade的等級(jí)“不及格”轉(zhuǎn)換為“NOPASS”。,58,59,3

23、.1.3 連續(xù)變量的可視化分段,VISUAL Bander 用于將連續(xù)變量進(jìn)行分段，該過(guò)程使用百分位數(shù)、標(biāo)準(zhǔn)差范圍或者等間距方式將連續(xù)變量劃分為若干組段，并采用圖形化操作的方式。,例3.4 對(duì)數(shù)學(xué)成績(jī)進(jìn)行分段，假設(shè)現(xiàn)在希望按變量math將學(xué)生分為5組，60分以下為第一組，60分以上的按照等間距的方式分為4組。,60,61,62,63,3.1.4 將字符變量轉(zhuǎn)換為數(shù)值變量,用automatic recode將字符變量轉(zhuǎn)換為數(shù)值變量。,64,3.1.5 變量的編秩,所謂編秩，就是對(duì)記錄按照某個(gè)變量值大小來(lái)排序。Rank case過(guò)程就是用來(lái)排序的一個(gè)專用過(guò)程。,例：根據(jù)性別分組計(jì)算數(shù)學(xué)成績(jī)的秩次

24、。,65,66,3.1.6 Transform菜單中的其它功能,（1）count過(guò)程如果用戶需要對(duì)滿足某項(xiàng)條件的數(shù)據(jù)進(jìn)行計(jì)數(shù)，可以使用Count命令。,先在Target Variable中指定一個(gè)變量（可以是已經(jīng)存在的變量或新變量），并定義變量標(biāo)簽，然后指定要統(tǒng)計(jì)的變量加到Numeric Variables框中，再單擊Define Values按紐，打開(kāi)Value to Count對(duì)話框。,67,Value:輸入某個(gè)值為清點(diǎn)對(duì)象； System-missing:以系統(tǒng)的缺失值為清點(diǎn)對(duì)象； System-or user missing:以系統(tǒng)或用戶指定的缺失值為清點(diǎn)對(duì)象； Range:指定數(shù)值

25、的計(jì)數(shù)區(qū)域：其中包括：（）through（）在框內(nèi)指定下限和上限 lowest through（）: 在框內(nèi)只指定上限；（）highest through: 在框內(nèi)只指定下限。,68,（2）random Number Seed過(guò)程：用于設(shè)定偽隨機(jī)函數(shù)的隨機(jī)種子。,69,3.2 文件級(jí)別的數(shù)據(jù)管理（一）,數(shù)據(jù)編輯窗口的Data菜單為用戶創(chuàng)建和定義數(shù)據(jù)提供了方便的功能。這個(gè)菜單是SPSS統(tǒng)計(jì)軟件數(shù)據(jù)整理的特有功能菜單。它的功能包括：對(duì)變量、觀測(cè)量的編輯處理；對(duì)變量數(shù)據(jù)的變換；對(duì)觀察量數(shù)據(jù)整理。（1）簡(jiǎn)單命令：包括插入變量、插入記錄和到達(dá)某條記錄，他們的功能實(shí)際上都可以用鼠標(biāo)在數(shù)據(jù)表

26、界面上直接完成，很少會(huì)使用菜單來(lái)調(diào)用。（2）常用的簡(jiǎn)單過(guò)程：包括排序、拆分文件、選擇記錄和加權(quán)記錄。（3）變量與數(shù)據(jù)文件屬性導(dǎo)向：用于定義數(shù)據(jù)字典，或者將于定義的數(shù)據(jù)字典直接引入當(dāng)前數(shù)據(jù)文件。,70,（4）數(shù)重構(gòu)過(guò)導(dǎo)向：用于進(jìn)行數(shù)據(jù)轉(zhuǎn)置，或者對(duì)重復(fù)測(cè)量數(shù)據(jù)表進(jìn)行長(zhǎng)型、寬型記錄間的轉(zhuǎn)換。（5）文件合并過(guò)程：將幾個(gè)數(shù)據(jù)文件合并為一個(gè)大的spss數(shù)據(jù)文件，含橫向合并和縱向合并兩種情況。（6）正交設(shè)計(jì)過(guò)程：實(shí)際上是聯(lián)合分析模塊的一部分，用于生成實(shí)施聯(lián)合分析所需要的設(shè)計(jì)。（7）其他過(guò)程：包括定義日期變量過(guò)程、數(shù)據(jù)匯總過(guò)程和查找重復(fù)記錄導(dǎo)向。,71,定義變量屬性,定義變量日期,插入觀測(cè)量,拷貝數(shù)

27、據(jù)屬性,插入一個(gè)變量,定位觀測(cè)量,觀測(cè)量排序,重構(gòu)數(shù)據(jù)結(jié)構(gòu),分類或不分類匯總,正交設(shè)計(jì),數(shù)據(jù)文件轉(zhuǎn)置,合并數(shù)據(jù)文件,標(biāo)識(shí)重復(fù)觀測(cè)量,拆分?jǐn)?shù)據(jù)文件,選擇觀測(cè)量,觀測(cè)量加權(quán),72,3.2.1 記錄排序,一、排序的兩種方法：（1）在數(shù)據(jù)表格的變量名處單擊右鍵，彈出的右鍵菜單最后兩項(xiàng)就是“sort Ascending”和“Sort Descending”。（2）對(duì)于多變量排序，則需要使用Sort Cases過(guò)程來(lái)進(jìn)行。二、多變量排序需要注意的三點(diǎn)：（1）在多重排序中，制定排序變量名是很關(guān)鍵的，先指定的變量在排序時(shí)必然優(yōu)先于后制訂的變量。（2）可以指定按某變量值升序排序的同時(shí)按另一變量值降序排

28、序，或相反。（3）排序以后，原來(lái)記錄數(shù)據(jù)的排列次序?qū)⒈淮騺y。,73,74,75,3.2.2 記錄拆分,Split File 分割文件的功能是把當(dāng)前工作分割成兩個(gè)或兩個(gè)以上的組，隨后的分析將對(duì)每個(gè)組進(jìn)行。,76,77,3.2.3 記錄篩選,Select Cases：當(dāng)用戶不需要分析全部的數(shù)據(jù)，而是按要求分析其中的一部分，使用該選擇。,All case：選擇所有數(shù)據(jù)； If condition is satisfied: 按指定條件選擇數(shù)據(jù)。,78,Random Sample of cases：對(duì)觀察值進(jìn)行隨機(jī)抽樣。,79,80,81,82,Use filter variable：用指定變量作過(guò)

29、濾。先選擇一個(gè)變量，系統(tǒng)自動(dòng)在數(shù)據(jù)管理器中將該變量值為0的觀測(cè)單位標(biāo)上刪除記號(hào)，系統(tǒng)對(duì)標(biāo)有刪除記號(hào)的觀測(cè)單位不作分析。,Based on time or case range：順序抽樣。單擊Range按紐，打開(kāi)Select Case: Range對(duì)話框，用戶自行定義從第幾個(gè)觀察值開(kāi)始抽到第幾個(gè)觀察值結(jié)束。,83,84,3.2.4 加權(quán)記錄,Weight Cases：設(shè)定某變量為頻數(shù)變量。,85,3.2.5 數(shù)據(jù)匯總,所謂分類匯總就是按指定的分類變量對(duì)觀測(cè)值進(jìn)行分組，對(duì)每組記錄的各變量求指定的描述統(tǒng)計(jì)量，結(jié)果可以存入新數(shù)據(jù)文件，也可以替換當(dāng)前數(shù)據(jù)文件。,一、匯總的概念,二、進(jìn)行分類匯總的方法,1

30、、打開(kāi)“data”菜單，選擇“Aggregate”，展開(kāi)aggregate data”對(duì)話框。,86,2、在左側(cè)的源變量框中選擇一個(gè)或多個(gè)變量作為分類變量進(jìn)入分類變量（Break Variables）框中。,3、在左側(cè)的源變量框中選擇一個(gè)或多個(gè)變量作為要求匯總的變量進(jìn)入?yún)R總變量（Aggregate Variables）框中，即要求這些變量的值進(jìn)行分類匯總。,4、“name 當(dāng)n為偶數(shù)時(shí)選擇Endpoints weighted by .5。 4、如果選擇左下方的Display casewise listing，可以在輸出窗口觀察計(jì)算過(guò)程，其中包括移動(dòng)平均的結(jié)果，季節(jié)指數(shù)的生成過(guò)程，序列成分分解過(guò)

31、程。否則只輸出簡(jiǎn)單的季節(jié)指數(shù)。,5、單擊Save按紐，打開(kāi)Save對(duì)話框，選擇是否創(chuàng)建新的變量。新創(chuàng)建的時(shí)間序列有：季節(jié)指數(shù)、調(diào)整后的序列值、平滑值及不規(guī)則變動(dòng)。,397,6、單擊OK得到輸出結(jié)果如表所示。簡(jiǎn)單的輸出結(jié)果只顯示季節(jié)指數(shù)。 Results of SEASON procedure for variable 零售量變量季節(jié)分析結(jié)果 Multiplicative Model. Centered MA method. Period = 12 乘法模型,Seasonal index 季節(jié)指數(shù) 時(shí)期Period (* 100) 1 16.391 2 23.999 3 71.285 4 1

32、08.195 5 258.452 6 268.829 7 226.751 8 110.477 9 59.058 10 27.338 11 16.214 12 13.011,從上面的季節(jié)指數(shù)可以看出，背心的銷售量在4月份至8月份的季節(jié)指數(shù)明顯的高于其它月份的季節(jié)指數(shù)，其中5月、6月和7月份的季節(jié)指數(shù)超過(guò)了200，說(shuō)明了這個(gè)階段的零售量非常大，已經(jīng)達(dá)到月平均值的兩倍以上。,398,9.2.2 進(jìn)行季節(jié)調(diào)整,季節(jié)分解的目的是根據(jù)季節(jié)指數(shù)進(jìn)行季節(jié)調(diào)整，消除季節(jié)因素的影響，并通過(guò)調(diào)整前后的指標(biāo)數(shù)據(jù)的比較，確定季節(jié)因素的影響程度，為預(yù)測(cè)決策提供科學(xué)依據(jù)。所以在進(jìn)行季節(jié)分解的同時(shí)，在Seasonal Dec

33、omposition對(duì)話框中選擇Display casewise listing復(fù)選項(xiàng)，可以得到詳細(xì)的分解過(guò)程和季節(jié)調(diào)整值。表中給出了季節(jié)分解和調(diào)整過(guò)程的部分?jǐn)?shù)據(jù)。,399,序號(hào) 變量移動(dòng)平均比率季節(jié)指數(shù) 季節(jié)調(diào)整值平滑值不規(guī)則變動(dòng) Seasonal Seasonally Smoothed Case Moving Ratios factors adjusted trend- Irregular number 零售量 averages (* 100) (* 100) series cycle component （1）（2） (3)=(1)/(2) （4） (5)=(1)/(4) (

34、6) (7)=(5)/(6) 1 23.000 . . 16.391 140.321 148.671 .944 2 33.000 . . 23.999 137.505 124.873 1.101 3 69.000 . . 71.285 96.794 105.357 .919 4 91.000 . . 108.195 84.107 95.716 .879 5 192.000 . . 258.452 74.289 95.421 .779 6 348.000 . . 268.829 129.450 106.167 1.219 7 254.000 109.208 232.583 226.751 112

35、.017 116.773 .959 8 122.000 109.667 111.246 110.477 110.430 125.651 .879 9 95.000 109.417 86.824 59.058 160.859 131.264 1.225 10 34.000 110.208 30.851 27.338 124.367 138.571 .897 11 19.000 116.375 16.327 16.214 117.185 151.024 .776 12 27.000 120.750 22.360 13.011 207.521 166.836 1.244 13 30.000 120.

36、833 24.828 16.391 183.027 163.602 1.119 14 37.000 121.500 30.453 23.999 154.173 145.837 1.057 15 59.000 120.458 48.980 71.285 82.766 120.203 .689 16 120.000 119.375 100.524 108.195 110.911 113.038,400,第10章非參數(shù)檢驗(yàn),前面進(jìn)行的假設(shè)檢驗(yàn)和方差分析，大都是在數(shù)據(jù)服從正態(tài)分布或近似地服從正態(tài)分布的條件下進(jìn)行的。但是如果總體的分布未知，如何進(jìn)行總體參數(shù)的檢驗(yàn)，或者如何檢驗(yàn)總體服從一個(gè)指定的分布，都

37、可以歸結(jié)為非參數(shù)檢驗(yàn)方法。非參數(shù)檢驗(yàn)包括下列內(nèi)容：本章主要內(nèi)容： 1、總體分布的假設(shè)檢驗(yàn)； 2、兩種以上的現(xiàn)象之間的關(guān)聯(lián)性檢驗(yàn)（見(jiàn)列聯(lián)分析）； 3、總體分布未知時(shí)，關(guān)于單個(gè)總體均值的檢驗(yàn)；兩個(gè)總體均值或分布的差異是否顯著的檢驗(yàn)，以及多個(gè)未知總體的單因素方差分析。 4、某種現(xiàn)象的出現(xiàn)的隨機(jī)性檢驗(yàn)；在SPSS分析軟件中，非參數(shù)檢驗(yàn)在菜單Analyze Nonparametric Test 中顯示，共有8種檢驗(yàn)方法。,401,這8種檢驗(yàn)方法依次是：,Chi-square卡方檢驗(yàn) Binomial二項(xiàng)分布檢驗(yàn) Runs游程檢驗(yàn) 1-Sample K-S 單個(gè)樣本柯?tīng)柲缏宸?斯米諾夫檢驗(yàn) 2 In

38、dependent sample 兩個(gè)獨(dú)立樣本檢驗(yàn) K Independent sample K個(gè)獨(dú)立樣本檢驗(yàn) 2 Related Independent sample兩個(gè)相關(guān)樣本檢驗(yàn) K Related Independent sample K個(gè)相關(guān)樣本檢驗(yàn),402,10.1 Chi-Square Test 卡方檢驗(yàn),卡方檢驗(yàn)是一種常用的檢驗(yàn)總體分布是否服從指定的分布的一種非參數(shù)檢驗(yàn)方法。其檢驗(yàn)思想是：將總體的取值范圍分成有限個(gè)互不相容的子集，從總體中抽取一個(gè)樣本，考察樣本觀察值落到每個(gè)子集中的實(shí)際頻數(shù)，并按假設(shè)的總體分布計(jì)算每個(gè)子集的理論頻數(shù)，最后根據(jù)實(shí)際頻數(shù)和理論頻數(shù)的差構(gòu)造卡方統(tǒng)計(jì)量，

39、當(dāng)原假設(shè)成立時(shí)，統(tǒng)計(jì)量服從卡方分布。以此來(lái)檢驗(yàn)假設(shè)總體的分布是否成立。下面通過(guò)例題來(lái)說(shuō)明具體的檢驗(yàn)方法。,例10.1 擲一個(gè)骰子300次，每個(gè)面出現(xiàn)的次數(shù)（取變量名為Shi）見(jiàn)表，用數(shù)字1，2，3，4，5，6分別表示六個(gè)面的點(diǎn)數(shù)，試在顯著性水平0.05下檢驗(yàn)顆骰子是否是均勻的？,403,解：如果這個(gè)骰子是均勻的，則每次試驗(yàn)出現(xiàn)六個(gè)點(diǎn)數(shù)的可能性是相等的。建立原假設(shè)H0：每個(gè)點(diǎn)出現(xiàn)的概率等于1/6；備擇假設(shè)H1：每個(gè)點(diǎn)出現(xiàn)的概率不等于1/6。具體操作步驟： 1、首先建立數(shù)據(jù)文件，注意變量Shi的變量值是300次試驗(yàn)的所有結(jié)果。然后單擊Analyze Nonparametric Test Ch

40、i-Square Test ，Chi-Square Test打開(kāi)對(duì)話框如圖所示。,2、指定檢驗(yàn)統(tǒng)計(jì)量，本例中選擇變量Shi進(jìn)入檢驗(yàn)框中。,3、在Expect Values欄內(nèi)指定期望分布的頻數(shù)值，有兩個(gè)選擇項(xiàng) 。,404,4、在Expect Range 欄中指定檢驗(yàn)值的范圍。系統(tǒng)默認(rèn)從數(shù)據(jù)中得到的最小值和最大值作為取值范圍，也可選擇自定義取值范圍。本例中選擇系統(tǒng)默認(rèn)項(xiàng)。 5、單擊Option按鈕，打開(kāi)對(duì)話框如下圖所示，對(duì)話框中有兩個(gè)選擇欄： Statistics欄, 選擇輸出的統(tǒng)計(jì)量：有統(tǒng)計(jì)描述和四分位數(shù)兩個(gè)選項(xiàng)，基本統(tǒng)計(jì)描述輸出變量的均值、標(biāo)準(zhǔn)差、最大值和最小值，缺失值數(shù)量等。,Miss

41、ing Value欄，選擇處理缺失值的方式。本例中選擇系統(tǒng)默認(rèn)項(xiàng)，將剔除參與對(duì)比的缺失值,405,7、單擊OK，系統(tǒng)運(yùn)行，輸出結(jié)果如表所示。,406,10.2 一個(gè)樣本的K-S檢驗(yàn),Chi-Square Test 卡方檢驗(yàn)在進(jìn)行均勻分布時(shí)的檢驗(yàn)比較方便，但在進(jìn)行其它總體分布的檢驗(yàn)時(shí)需要預(yù)先計(jì)算出理論分布期望值并輸入到計(jì)算機(jī)中。這樣操作起來(lái)比較麻煩，下面介紹一種K-S檢驗(yàn)方法，可以非常方便快捷地檢驗(yàn)常用的四種總體分布形式，使檢驗(yàn)過(guò)程更加簡(jiǎn)單。一個(gè)樣本的K-S檢驗(yàn)又稱單個(gè)樣本柯?tīng)柲缏宸?斯米諾夫檢驗(yàn)，這種檢驗(yàn)可以檢驗(yàn)樣本數(shù)據(jù)是否服從Normal正態(tài)分布、Poisson泊松分布、Uniform

42、均勻分布及Exponential指數(shù)分布等四種分布形式。但一般要求在大樣本條件下進(jìn)行檢驗(yàn)。下面通過(guò)例題介紹這種檢驗(yàn)方法。,407,例5.2：某棉織廠質(zhì)量檢驗(yàn)部門抽檢驗(yàn)了50匹布，每匹布上的疵點(diǎn)數(shù)如下： 2 1 0 1 1 2 0 5 1 1 3 0 1 1 2 0 1 1 0 0 1 3 4 0 0 1 1 4 1 2 5 2 6 2 4 1 5 1 1 2 0 1 1 0 3 2 0 2 3 3 試檢驗(yàn)布匹上的疵點(diǎn)是否服從的泊松分布。（=0.05,解：如果只檢驗(yàn)疵點(diǎn)數(shù)的分布，可以用一個(gè)樣本的K-S檢驗(yàn)。即檢驗(yàn)假設(shè)： H0：布匹上的疵點(diǎn)服從泊松分布， H1：布匹上的疵點(diǎn)不服從泊松分布。具體檢

43、驗(yàn)的操作過(guò)程如下：,1、根據(jù)原始數(shù)據(jù)建立數(shù)據(jù)文件，在其數(shù)據(jù)編輯窗口單擊Analyze Nonparametric Test 1-sample K-S，打開(kāi)對(duì)話框。,408,2、選擇檢驗(yàn)變量“疵點(diǎn)”進(jìn)入檢驗(yàn)框； 3、在Test Distribution欄中選擇檢驗(yàn)數(shù)據(jù)的分布假設(shè)，系統(tǒng)默認(rèn)正態(tài)分布，根據(jù)本例中的要求，選擇泊松分布。 4、在Options對(duì)話框中選擇輸出結(jié)果形式及缺失值處理方式。 5、單擊OK。,從上面的檢驗(yàn)結(jié)果可以看出，樣本平均值為1.68，由樣本計(jì)算的統(tǒng)計(jì)量為0.569，假設(shè)檢驗(yàn)的P值為0.902，遠(yuǎn)遠(yuǎn)大于0.05，所以可以認(rèn)定疵點(diǎn)數(shù)服從泊松分布，故接受假設(shè)H0。,409,如果將

44、要檢驗(yàn)布匹上的疵點(diǎn)是否服從=1.5.的泊松分布。則要通過(guò)Chi-square檢驗(yàn)。即檢驗(yàn)假設(shè) H0：布匹上的疵點(diǎn)服從=1.5.泊松分布， H1：布匹上的疵點(diǎn)不服從=1.5.泊松分布。設(shè)=1.5，通過(guò)泊松分布的分布計(jì)算出X取每一值概率并得出理論頻數(shù)如表。,具體檢驗(yàn)步驟如下： 1、打開(kāi)數(shù)據(jù)文件，在數(shù)據(jù)編輯窗口單擊Analyze Nonparametric Test Chi-Square Test ，打開(kāi)Chi-Square Test對(duì)話框。 2、指定檢驗(yàn)統(tǒng)計(jì)量本例中選擇變量疵點(diǎn)進(jìn)入檢驗(yàn)框中。 3、在Expect Values欄內(nèi)指定理論值，選擇Values ，依次輸入各組由給定分布所計(jì)算的理

45、論值，每輸入一個(gè)值，點(diǎn)擊Add，直到輸入全部理論值為止。,4、單擊OK，系統(tǒng)運(yùn)行。,410,從上面的結(jié)果可以看出，由樣本計(jì)算的統(tǒng)計(jì)量值為12.671，P值小于0.05，故接受H1，認(rèn)為每匹布的疵點(diǎn)數(shù)不是服從=1.5的泊松分布。但是，注意，在這次檢驗(yàn)中頻數(shù)小于5 的值太多，按照卡方檢驗(yàn)法的條件，應(yīng)當(dāng)適當(dāng)合并小于5的組，將疵點(diǎn)數(shù)大于等于4的觀察值合并成一組，再進(jìn)行檢驗(yàn)，在合并時(shí)注意定義一個(gè)新的變量，給變量值重新編碼，主要將變量值大于等于4（有4，5，6三個(gè)值）的值賦予同一個(gè)碼值，即相當(dāng)于一個(gè)組，與之相應(yīng)的觀測(cè)頻數(shù)和理論頻數(shù)合并相加后，再進(jìn)行卡方檢驗(yàn)，就可以得到最終結(jié)果。,411,10.3 兩個(gè)獨(dú)

46、立樣本的檢驗(yàn)（Test for Two Independent Sample）,如果兩個(gè)無(wú)聯(lián)系總體的分布是未知的，則檢驗(yàn)兩個(gè)總體的均值或分布是否有顯著差異的方法是一種非參數(shù)檢驗(yàn)方法，或者稱為兩個(gè)獨(dú)立樣本的檢驗(yàn)。檢驗(yàn)是通過(guò)兩個(gè)總體中分別抽取的隨機(jī)樣本數(shù)據(jù)進(jìn)行的。下面通過(guò)例題解釋具體操作過(guò)程。,例3：為了調(diào)查甲、乙兩地的土壤對(duì)種植的同一種西瓜有無(wú)影響，從這兩個(gè)產(chǎn)地分別隨機(jī)抽取同種的8只和7只西瓜，重量（市斤）如下：,試根據(jù)樣本數(shù)據(jù)檢驗(yàn)兩地的土壤對(duì)種植西瓜在重量上是否有顯著差異。解：建立假設(shè) H0：甲乙兩地的西瓜重量沒(méi)有顯著差異； H1：甲乙兩地的西瓜重量有沒(méi)有顯著差異。然后根據(jù)上面給出的數(shù)據(jù)建

47、立數(shù)據(jù)文件，注意數(shù)據(jù)文件中有一個(gè)表示重量數(shù)據(jù)的變量和一個(gè)表示地區(qū)分組的變量。,412,最后在數(shù)據(jù)編輯窗口進(jìn)行檢驗(yàn)。檢驗(yàn)的具體操作過(guò)程如下： 1、單擊Analyze Nonparametric Test 2 Independent Sample ，打開(kāi)Two-Independent-Sample對(duì)話框如圖所示。,2、選擇檢驗(yàn)的變量進(jìn)入檢驗(yàn)框中，選擇分組變量進(jìn)入Grouping Variable框中，單擊Define Group鍵，打開(kāi)Define Group對(duì)話框。,413,3、在Test Type欄中，確定檢驗(yàn)方法。 SPSS中提供了四種檢驗(yàn)方式：這四種方式分別是： Mann-Whitney

48、U 曼惠特尼檢驗(yàn)，同時(shí)適用于小樣本和大樣本的情況。 Kolmogorov-Smirnov Z K-S檢驗(yàn)，適用于大樣本的情況。 Mases Extreme Reactions 極端反應(yīng)檢驗(yàn)，適用于小樣本的情況。 Wald-Wolfowitz runs 游程檢驗(yàn)，適用于大樣本的情況。,這四種檢驗(yàn)方法的側(cè)重點(diǎn)有所不同，但都是先將兩樣本數(shù)據(jù)混合排序，再?gòu)牟煌慕嵌确治霾z驗(yàn)兩個(gè)獨(dú)立總體的分布是否有顯著的差異。有時(shí)這幾種檢驗(yàn)結(jié)果可能不一樣，所以要結(jié)合數(shù)據(jù)的探索分析考察數(shù)據(jù)的分布狀況作出結(jié)論。常用的檢驗(yàn)方法是 Mann-Whitney U方法，該方法同時(shí)適用于大樣本和小樣本的情況。本例中就選擇Mann-

49、Whitney 和Kolmogorov-Smirnov方法。,4、選擇輸出的結(jié)果形式及缺失值處理方式； 5、單擊OK，得輸出結(jié)果。,414,上表中顯示的是Mann-Whitney U 曼惠特尼檢驗(yàn)的秩和表，右表中有適用于大小兩種樣本的統(tǒng)計(jì)量，由于例題是小樣本的情況，所以選擇小樣本 U 統(tǒng)計(jì)量和精確概率的計(jì)算結(jié)果，從檢驗(yàn)結(jié)果知兩個(gè)地區(qū)的西瓜重量上無(wú)顯著差異。,415,上表顯示的是頻數(shù)表，下表中顯示檢驗(yàn)結(jié)果，從表中看到檢驗(yàn)統(tǒng)計(jì)量值Z為0.414，P值接近1，故兩地種植的西瓜的重量沒(méi)有顯著差異。因此，上面的兩種檢驗(yàn)的結(jié)論是一致的。即兩地種植的同一種西瓜地的重量沒(méi)有顯著差異。,416,10.4 兩個(gè)

50、有聯(lián)系樣本檢驗(yàn)（Test for Two related samples）,兩個(gè)有聯(lián)系的樣本檢驗(yàn)一般用于比較一個(gè)現(xiàn)象在采取了某項(xiàng)措施前后的變化是否顯著，或者說(shuō)采取的措施是否有效。也可以檢驗(yàn)同一個(gè)測(cè)試對(duì)象上的兩種測(cè)試方法是否一致。取n個(gè)測(cè)試對(duì)象作為樣本，則樣本數(shù)據(jù)是成對(duì)出現(xiàn)的。也可以檢驗(yàn)這樣兩個(gè)樣本是否服從相同的分布等。這種檢驗(yàn)在實(shí)際中應(yīng)用范圍很廣，如對(duì)于一種藥品效果比較檢驗(yàn)，農(nóng)業(yè)上對(duì)于一種新的糧食品種與原有品種的比較檢驗(yàn)，工業(yè)中新工藝方法、新材料與原方法和材料的比較檢驗(yàn)等等。下面通過(guò)一個(gè)例題說(shuō)明兩個(gè)有聯(lián)系樣本的檢驗(yàn)方法。,例5.4：一車間為了提高工作效率，對(duì)某種零件的加工過(guò)程進(jìn)行改進(jìn)，為了比較

51、加工時(shí)間是否明顯減少，抽取15名工人對(duì)比他們改革前后零件的加工時(shí)間，得到相應(yīng)的數(shù)據(jù)如下：試根據(jù)數(shù)據(jù)檢驗(yàn)改進(jìn)后零件的加工時(shí)間是否明顯減少（=0.05）？改進(jìn)前(m)：70，76，56，63，63，56，58，60，65，65，75，66，56，59，70 改進(jìn)后(m)：48，54，60，64，48，55，54，45，51，48，56，48，64，50，54,417,解：根據(jù)上面的數(shù)據(jù)建立數(shù)據(jù)文件SY-15，這顯然是兩個(gè)有聯(lián)系的樣本，故采用兩個(gè)有聯(lián)系的樣本檢驗(yàn)方法。具體操作如下：建立假設(shè)H0：改進(jìn)前后的零件加工時(shí)間沒(méi)有顯著差異； H1：改進(jìn)前后的零件加工時(shí)間明顯減少。,1、單擊Analyze

52、Nonparametric Test 2 Related Sample ，打開(kāi)Two Related Sample對(duì)話框如圖所示。,3、在Test Type欄中選擇檢驗(yàn)方式。SPSS中給出了三種檢驗(yàn)方法，分別是： Wilcoxon ：威爾克科森秩和檢驗(yàn)，只給出大樣本近似檢驗(yàn)概率。 Sign：符號(hào)檢驗(yàn)，給出精確檢驗(yàn)概率。 McNemar：適用于二值變量的檢驗(yàn) 本例中選擇Wilcoxon和Sign檢驗(yàn)。,2、選擇檢驗(yàn)的兩個(gè)變量進(jìn)入檢驗(yàn)框中。,418,4、在Options框內(nèi)選擇輸出結(jié)果形式和缺失值處理方式。 5、單擊OK，輸出結(jié)果如表。,Sign Test符號(hào)檢驗(yàn),Wilcoxon Signed

53、Ranks Test 威爾克科森秩和檢驗(yàn),威爾克科森秩和檢驗(yàn)，檢驗(yàn)統(tǒng)計(jì)量Z的值為-2.870，假設(shè)檢驗(yàn)的P值為0.004，小于0.05；而符號(hào)檢驗(yàn)的頻數(shù)表和檢驗(yàn)表，同樣，假設(shè)檢驗(yàn)的P值為0.035，也小于0.05，故拒絕原假設(shè)，認(rèn)為改進(jìn)前后的差異是顯著的。,419,10.6 多個(gè)樣本的非參數(shù)檢驗(yàn)（K Samples Test）,一、多個(gè)獨(dú)立樣本的單因素方差分析（Test for Saveral Independent Samples）在總體分布未知的情況下，多個(gè)獨(dú)立樣本的檢驗(yàn)是檢驗(yàn)多個(gè)獨(dú)立總體的平均值是否存在顯著的差異。由于總體分布未知，所以檢驗(yàn)過(guò)程是建立秩的基礎(chǔ)上。下面通過(guò)例題來(lái)說(shuō)明具體

54、的檢驗(yàn)方法。,例 5.6 仍以2002年全國(guó)職工平均工資表為例，如果定義一個(gè)分組變量，將我國(guó)東部、中部和西部各省標(biāo)上1，2，3作為分組值，下面來(lái)考察東部、中部和西部的職工平均工資是否存在顯著差異（=0.05）？,解：建立假設(shè) H0：各地區(qū)的職工平均工資沒(méi)有顯著差異； H1：各地區(qū)的職工平均工資有顯著差異；可以從分組中得到三個(gè)獨(dú)立的樣本數(shù)據(jù)，顯然可以用多個(gè)獨(dú)立樣本的檢驗(yàn)。具體操作步驟如下：,420,1打開(kāi)數(shù)據(jù)，在數(shù)據(jù)窗口單擊Analyze Nonparametric Test K Independent Sample ，打開(kāi)K-Independent-Sample對(duì)話框如圖所示。 2選擇檢驗(yàn)

55、的變量進(jìn)入檢驗(yàn)框中。本例中選擇國(guó)有單位，城鎮(zhèn)集體和港澳臺(tái)商進(jìn)入Test Variable List框內(nèi)。 3在Test Type欄中選擇檢驗(yàn)方式。SPSS軟件給出兩種檢驗(yàn)方式，Kruskal-Wallis H檢驗(yàn)，利用秩平均建立檢驗(yàn)統(tǒng)計(jì)量，檢驗(yàn)多個(gè)獨(dú)立總體的分布是否存在顯著差異。Median中位數(shù)檢驗(yàn)，利用卡方統(tǒng)計(jì)量檢驗(yàn)多組樣本的中位數(shù)差異是否顯著。本例中選擇Kruskal-Wallis 統(tǒng)計(jì)量。,4在Options對(duì)話框內(nèi)選擇輸出結(jié)果形式和缺失值處理方式。 5單擊OK，輸出結(jié)果如表。,421,Ranks 秩和表中給出每個(gè)變量各組的秩平均。 Test Statistics(a,b) 檢驗(yàn)統(tǒng)計(jì)表

56、中給出檢驗(yàn)結(jié)果，其結(jié)果顯示：卡方統(tǒng)計(jì)量結(jié)果顯示：國(guó)有企業(yè)、城鎮(zhèn)集體及港澳臺(tái)商企業(yè)這三個(gè)變量的職工平均工資在中國(guó)的東部、中部和西部地區(qū)的的差異都是顯著的。,Ranks 秩和表,Test Statistics(a,b) 檢驗(yàn)統(tǒng)計(jì)表,422,二、多個(gè)有聯(lián)系樣本的方差分析（K Related Samples Test）,多個(gè)有聯(lián)系樣本的方差分析，又稱多個(gè)配對(duì)樣本的檢驗(yàn)，是在總體分布未知的情況下，用于比較多個(gè)有聯(lián)系的總體分布的差異性?？梢詺w納為：多個(gè)有聯(lián)系的總體是否存在顯著差異；多個(gè)評(píng)判結(jié)果是否存在顯著差異（一致性檢驗(yàn)）；由于總體分布未知，所以檢驗(yàn)都是建立秩和的基礎(chǔ)上。下面通過(guò)例題來(lái)說(shuō)明具體的檢驗(yàn)方法。,例7 對(duì)于五個(gè)企業(yè)生產(chǎn)的同一類型產(chǎn)品，由四個(gè)使

人人文庫(kù)> 全部分類> 專業(yè)文獻(xiàn) > IT計(jì)算機(jī)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

數(shù)據(jù)統(tǒng)計(jì)分析及方法SPSS教程完整版

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

數(shù)據(jù)統(tǒng)計(jì)分析及方法SPSS教程完整版

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔