薛薇《統(tǒng)計(jì)分析軟件SPSS應(yīng)用》教學(xué)講義(SPSS18)p316匯編

上傳人：1*** IP屬地：浙江上傳時(shí)間：2021-10-09 格式：PPT 頁數(shù)：317 大?。?.10MB 積分：20 舉報(bào) 版權(quán)申訴

薛薇《統(tǒng)計(jì)分析軟件SPSS應(yīng)用》教學(xué)講義(SPSS18)p316匯編_第2頁

薛薇《統(tǒng)計(jì)分析軟件SPSS應(yīng)用》教學(xué)講義(SPSS18)p316匯編_第3頁

薛薇《統(tǒng)計(jì)分析軟件SPSS應(yīng)用》教學(xué)講義(SPSS18)p316匯編_第4頁

薛薇《統(tǒng)計(jì)分析軟件SPSS應(yīng)用》教學(xué)講義(SPSS18)p316匯編_第5頁

已閱讀5頁，還剩312頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第一章第一章 SPSS SPSS 概述概述 SPSS概述 SPSS: Statistical Package for Social Science Statistical Product and Service Solutions SPSS的發(fā)展： l 60年代：美國斯坦福大學(xué)三位研究生研制 l 70年代：SPSS總部成立于芝加哥，推出SPSSX中小型機(jī)版 l 80年代：SPSS公司（SPSS/PC+微機(jī)版13） l 90年代：SPSS公司（SPSS WINDOWS版514） SPSS 主要特點(diǎn) 操作簡便。絕大多數(shù)操作是通過菜單、按鈕、對話框完成的。無需計(jì)算機(jī)編程、需記憶大量命令和參數(shù)。

2、分析方法豐富、分析結(jié)果清晰、直觀。可以直接讀取其他軟件格式的數(shù)據(jù)文件，如：dbf、xls、 sas等。最新版本采用分布式分析系統(tǒng)，適應(yīng)互聯(lián)網(wǎng)，支持動態(tài)收集、分析數(shù)據(jù)和HTML報(bào)告與一般的辦公軟件直接兼容不方便 SPSS主要窗口：數(shù)據(jù)編輯窗口窗口標(biāo)題：data editor 功能：對SPSS的數(shù)據(jù)文件數(shù)據(jù)文件進(jìn)行錄入、修改、管理等基本操作的窗口。組成：窗口主菜單、工具欄、數(shù)據(jù)編輯區(qū)、狀態(tài)顯示區(qū) 特點(diǎn)： SPSS運(yùn)行過程中自動打開 SPSS中各統(tǒng)計(jì)分析功能都是針對該窗口中的數(shù)據(jù)進(jìn) 行的窗口中的數(shù)據(jù)文件以.sav存于磁盤上兩個視圖：數(shù)據(jù)視圖和變量視圖 SPSS主要窗口：數(shù)據(jù)輸

3、出窗口窗口標(biāo)題：viewer 功能：SPSS統(tǒng)計(jì)分析報(bào)表及圖形的輸出的窗口。組成：窗口主菜單、工具欄、結(jié)果顯示區(qū)、狀態(tài)顯示區(qū) 特點(diǎn)：在進(jìn)行第一次分析時(shí)自動打開，也可手工打開可以手工打開若干個可相互切換若干個可相互切換的viewer窗口；狀態(tài)欄上的！表示當(dāng)前輸出窗口輸出窗口可以關(guān)閉，窗口內(nèi)容以.SPO存于磁盤上兩個視圖：目錄視圖和內(nèi)容視圖 SPSS主要窗口：數(shù)據(jù)輸出窗口駕馭數(shù)據(jù)出輸出窗口一般操作結(jié)果文件的打開和保存加密保存窗口元素的移動和刪除標(biāo)準(zhǔn)的拖放式操作在大綱視圖中操作最方便結(jié)果的導(dǎo)出以純文本格式導(dǎo)出、以HTML格式導(dǎo)出如何在WORD中引用分析結(jié)果統(tǒng)計(jì)表

4、格：拷貝或拷貝對象統(tǒng)計(jì)圖：拷貝對象表格的編輯表格狀態(tài)的確定單元格內(nèi)容編輯行列轉(zhuǎn)置 Autofit 表格樣式的變換 SPSS基本運(yùn)行方式完全窗口菜單方式: 所有分析操作過程都是通過菜單和按鈕及對話框方式進(jìn)行的. 是經(jīng)常使用的一種運(yùn)行方式,適用于一般分析和SPSS的初學(xué)者. SPSS基本運(yùn)行方式程序運(yùn)行方式: 手工編寫SPSS命令程序一次性提交計(jì)算機(jī)運(yùn)行適用于大規(guī)模的分析工作和熟練的SPSS程序員. 實(shí)現(xiàn)方法: (1)打開SYNTAX語句窗口并編寫和修改SPSS程序 (2)點(diǎn)擊語句窗口中的RUN菜單項(xiàng)，選擇運(yùn)行方式運(yùn)行 Syntax語句窗口窗口標(biāo)題: syntax editer

5、功能：編寫和修改SPSS程序的窗口. 特點(diǎn)：打開： FILE - NEW - SYNTAX或FILE-OPEN- .SPS擴(kuò)展名窗口中的程序以.SPS存于磁盤上菜單項(xiàng)RUN中提供四種程序執(zhí)行方式：All、Selection、 Current、To end SPSS 基本運(yùn)行方式菜單程序混合運(yùn)行方式: 先通過菜單選擇分析過程和參數(shù),不立即提交（OK）執(zhí)行,而是按動PASTE按鈕. 計(jì)算機(jī)自動將用戶剛定義的分析過程和參數(shù)轉(zhuǎn)換成 SPSS的命令,并顯示到SYNTAX語句窗口中. 用戶可對其進(jìn)行必要的修改后再提交給計(jì)算機(jī)執(zhí)行. 一般適用于熟練的SPSS程序員. 利用SPSS進(jìn)行數(shù)據(jù)分析的步

6、驟建立SPSS數(shù)據(jù)文件定義數(shù)據(jù)文件結(jié)構(gòu) 錄入修改和編輯待分析數(shù)據(jù) 數(shù)據(jù)的統(tǒng)計(jì)分析統(tǒng)計(jì)分析之前的預(yù)處理統(tǒng)計(jì)分析數(shù)據(jù)和分析結(jié)果的保存結(jié)果的說明和解釋思考復(fù)習(xí) SPSS有哪兩個主要窗口？功能是什么？有哪些特點(diǎn)？ SPSS有哪些運(yùn)行方式？特點(diǎn)是什么？第二章 SPSS數(shù)據(jù)文件的建立和管理一份簡單的調(diào)查問卷單項(xiàng)選擇題提供幾個備選擇答案，從其中選擇一個答案變量類型：分類數(shù)據(jù)、定序數(shù)據(jù) 數(shù)據(jù)類型：字符型填空題變量類型：定距數(shù)據(jù) 數(shù)據(jù)類型：數(shù)值型如何利用SPSS組織數(shù)據(jù) SPSS數(shù)據(jù)文件是一種有結(jié)構(gòu)的數(shù)據(jù)文件年級性別問題1問題n 11. 4 222 . 文件結(jié)構(gòu) 數(shù)據(jù) 個案

7、 case 變量名變量用字符或數(shù)字表示字符型數(shù)據(jù) SPSS數(shù)據(jù)文件一般只能通過SPSS軟件打開一份簡單的調(diào)查問卷 l多項(xiàng)選擇題 l提供幾個備選擇答案，從其中選擇多個答案如：在下列品牌中您信任哪些品牌？被診斷為高血要后你采取了以下哪些輔助治療手段？如：高考時(shí)報(bào)考學(xué)校 (1)北京大學(xué) (2)清華大學(xué) (3)人民大學(xué) (4)北京理工大學(xué) (5)北京師范大學(xué) (6)北京外國語大學(xué) l多項(xiàng)選擇題不能在SPSS中直接存儲，因?yàn)镾PSS的一個變量只能有一個取值 l多項(xiàng)選擇題的處理方法 l思路：將一個問題定義成幾個變量，用這幾個變量來描述該問題的幾個可能被選擇的答案。 l編碼方式：多選項(xiàng)二

8、分法(multiple dichotomize method) 多選項(xiàng)分類法(multiple category method) l多選項(xiàng)二分法將每個答案作為一個變量，每個變量只有兩個取值 (0或1)。例如: 變量名變量名標(biāo) 簽編碼方案 X 1北京大學(xué)01 X 2清華大學(xué)01 X 3人民大學(xué)01 X 4北京理工大學(xué)01 X 5北京師范大學(xué)01 X 6北京外國語大學(xué)01 如何利用SPSS組織數(shù)據(jù) l多選項(xiàng)分類法: 預(yù)先估計(jì)多選項(xiàng)問題可能被選擇的最多答案數(shù).為每個答案建立一個變量,取值為多選項(xiàng)問題的可選答案. 例如: 變量名

9、變量名標(biāo) 簽編碼方案 A第一選項(xiàng) (1 ) 北京大學(xué) (2 ) 清華大學(xué) (3 ) 人民大學(xué) (4 ) 北京理工大學(xué) (5 ) 北京師范大學(xué) (6 ) 北京外國語大學(xué) B第二選項(xiàng) (1 ) 北京大學(xué) (2 ) 清華大學(xué) (3 ) 人民大學(xué) (4 ) 北京理工大學(xué) (5 ) 北京師范大學(xué) (6 ) 北京外國語大學(xué) C第三選項(xiàng) (1 ) 北京大學(xué) (2 ) 清華大學(xué) (3 ) 人民大學(xué) (4 ) 北京理工大學(xué) (5 ) 北京師范大學(xué) (6

10、 ) 北京外國語大學(xué) 如何利用SPSS組織數(shù)據(jù) 頻數(shù)數(shù)據(jù)：男女統(tǒng)計(jì)1023 精算1220 如何利用SPSS組織數(shù)據(jù) 設(shè)置三個變量：專業(yè)方向、性別、人數(shù) SPSS數(shù)據(jù)文件的結(jié)構(gòu) （一）變量名變量名(Variable name): 變量名是變量存取的唯一標(biāo)志。起名規(guī)則：不多于8個字符組成不區(qū)分大小寫允許漢字作為變量名默認(rèn)變量名為VARn，如：var00001 SPSS數(shù)據(jù)文件的結(jié)構(gòu) （二）變量的類型變量的類型(type)和顯示寬度和顯示寬度(width) 1、數(shù)值型：標(biāo)準(zhǔn)數(shù)值型(Numeric):默認(rèn)類型 8.2 如： 12345678、12345.67、-1234.

11、56 帶逗號的數(shù)值型(Comma): 從個位開始三位一個逗號8.2 如：1,234.56 科學(xué)計(jì)數(shù)法(Scientific Notation):表示很大或很小的數(shù)據(jù) 8.2 如：1.2E+05 帶美元符號(Dollar):表示貨幣格式很多，如：$12.30 SPSS數(shù)據(jù)文件的結(jié)構(gòu) 2 、字符型(String): 存儲字符數(shù)據(jù) 8位如：beijing 處理時(shí)用雙引號擴(kuò)起來 3、日期型（Date):存儲日期數(shù)據(jù) 格式很多，如：20-AUG-1999 4、其他: 如：圓點(diǎn)數(shù)值型(dot)、用戶自定義型 (customer) 注意：顯示寬度不影響數(shù)據(jù)的存儲 SPSS數(shù)據(jù)文件的結(jié)構(gòu) （三）變量名標(biāo)簽

12、變量名標(biāo)簽(Variable label) : 對變量名的一些解釋說明，增強(qiáng)分析結(jié)果的可視性。可以省略。（四）變量值標(biāo)簽變量值標(biāo)簽(Value label) 對變量所取值的一些解釋說明，增強(qiáng)分析結(jié)果的可視性。可以省略。一般用于品質(zhì)數(shù)據(jù) 如：1-男 2-女、1-高 2-中 3-低 SPSS數(shù)據(jù)文件的結(jié)構(gòu) （五）變量列格式變量列格式(Column Format) 對齊方式(Text Alignment) 左對齊(Left):字符型默認(rèn)。右對齊(Right):數(shù)值型默認(rèn)。居中對齊(Center) 列寬度(Column Width) 默認(rèn)值為變量的總長度。 SPSS數(shù)據(jù)文件的結(jié)構(gòu) （六）缺

13、失值缺失值(Missing Values) 1、什么是缺失值？漏填數(shù)據(jù) 明顯錯誤的數(shù)據(jù) 2、對缺失值的一般處理事先指定：指定某個特定值為缺失值（用戶缺失值）其他處理方法，如：以均值、眾數(shù)替代等 3、SPSS缺失值用戶缺失值系統(tǒng)缺失值：數(shù)值型：點(diǎn) () 字符型：空 SPSS數(shù)據(jù)文件的結(jié)構(gòu) （七）變量計(jì)量尺度（七）變量計(jì)量尺度(Measurement) scale: 定距數(shù)據(jù)，一般為數(shù)值型數(shù)據(jù)。如:收入、人數(shù)。 ordinal: 有固有順序的順序水準(zhǔn)的數(shù)值型或字符型數(shù) 據(jù)。如:職稱、年齡段 nominal: 無固有順序的名義水準(zhǔn)的數(shù)值型或字符型數(shù) 據(jù)。如:性別、民族定義SPSS數(shù)

14、據(jù)文件結(jié)構(gòu) 操作方法：利用變量視圖如何查看變量定義的情況菜單選項(xiàng): Utilities - Variables SPSS數(shù)據(jù)的錄入與保存錄入時(shí)應(yīng)注意：黑框確定當(dāng)前數(shù)據(jù)單元錄入帶有變量值標(biāo)簽的數(shù)據(jù)：手工輸入代碼，屏幕顯示變量值標(biāo)簽凍結(jié)第一列數(shù)據(jù)保存：操作保存格式： (1)*.sav :SPSS數(shù)據(jù)文件(默認(rèn))。（2)*.dbf : dbase數(shù)據(jù)文件。（3)*.xls : Excel工作表文件。注意：有些信息會丟失 SPSS數(shù)據(jù)的編輯 (一)打開數(shù)據(jù)文件菜單選項(xiàng):File - Open - .sav (二)數(shù)據(jù)定位按個案號碼定位菜單: Data - Go to c

15、ase - 輸入樣本號按值定位光標(biāo)定位到某列變量上光標(biāo)定位到某列變量上 - Edit - Find. SPSS數(shù)據(jù)的編輯 (三)插入和刪除一個個案插入：data-insert case 刪除：選定待刪行，鼠標(biāo)右鍵找到Cut (四)插入和刪除一個變量插入：光標(biāo)定位到某列變量上光標(biāo)定位到某列變量上 - Data - Insert Variable (插到某列前) 或鼠標(biāo)右鍵刪除：選定列，鼠標(biāo)右鍵Cut項(xiàng) SPSS數(shù)據(jù)的編輯 (五)數(shù)據(jù)移動、復(fù)制和刪除定義源數(shù)據(jù)塊鼠標(biāo)右鍵：cut copy clear 確定目標(biāo)單元鼠標(biāo)右鍵：paste 數(shù)據(jù)文件的合并目的: 將兩個SPSS數(shù)據(jù)文件合

16、并到一個數(shù)據(jù)文件中文件合并的方式: 縱向合并橫向合并 (一)縱向數(shù)據(jù)合并 (1)含義含義: 將磁盤上的一個SPSS數(shù)據(jù)文件追加追加到當(dāng)前data editor窗口中的數(shù)據(jù) 文件中。 (2)前提前提: 兩個SPSS數(shù)據(jù)文件應(yīng)可以合并的內(nèi)容可以合并的內(nèi)容，且最好有相同的相同的變量名和變量類型。 (3)菜單選項(xiàng)菜單選項(xiàng): data - merge file - add cases 數(shù)據(jù)文件的合并數(shù)據(jù)文件的合并 (二)橫向數(shù)據(jù)合并 (1)含義含義: 將磁盤上的一個SPSS數(shù)據(jù)文件中的若干個變量增加到當(dāng)前data editor窗口的數(shù)據(jù)文件中。 (2)前提前提: a.兩個數(shù)據(jù)文件必須必須有一

17、個共同的變量名為關(guān)鍵字段 -合并的依據(jù)； b. 兩個數(shù)據(jù)文件應(yīng)事先按關(guān)鍵字段升序排序。數(shù)據(jù)文件的合并 (二)橫向數(shù)據(jù)合并 (3)菜單選項(xiàng)菜單選項(xiàng): data - merge file - add variable (4)選項(xiàng)說明選項(xiàng)說明: math cases on key variables in sorted files:以關(guān)鍵字作為合并標(biāo)志。 Both files provide cases:合并后的文件的數(shù)據(jù)由兩個文件共同提供。 External file is keyed table:以data editor的數(shù)據(jù)為基礎(chǔ)。 Working data file is keyed

18、table:以磁盤文件的數(shù)據(jù)為基礎(chǔ)。與其他軟件數(shù)據(jù)共享共享dbf和xls格式文件菜單選項(xiàng): Data - Open (1)*.dbf : dbase數(shù)據(jù)文件。字段名、字段類型自動轉(zhuǎn)成 SPSS數(shù)據(jù)文件中的變量名和類型。一條記錄為一個個案。 (2)*.xls : Excel文件 (Read variable name選項(xiàng)) 共享數(shù)據(jù)庫文件建立ODBC數(shù)據(jù)源第三章 SPSS數(shù)據(jù)文件的基本加工和處理 SPSS數(shù)據(jù)文件的基本加工和處理數(shù)據(jù)文件的整理個案排序、個案選取數(shù)據(jù)加工變量計(jì)算、計(jì)數(shù) 數(shù)據(jù)分組自動分組、手工分組數(shù)據(jù)文件的其他處理功能指定加權(quán)變量目的：將所有個案按照

19、用戶指定的某一個或多個變量的變量值的升序或降序重新排列。菜單選項(xiàng): data - sort cases 注意: (1)Ascending:升序、Descending:降序。 (2)多重排序,選擇變量名的次序很關(guān)鍵。個案排序排序在數(shù)據(jù) 分析中的作用？個案選取目的：從現(xiàn)有數(shù)據(jù)中挑選出部分?jǐn)?shù)據(jù)。菜單選項(xiàng): data - select cases 選取個案的幾種不同方式 (1)選擇符合一定條件的個案(If condition is satisfied) (2)隨機(jī)選取個案(Random sample of cases) 近似選取、精確選取 (3)選取某一區(qū)域內(nèi)的個案(Based on

20、 time or case range) (4)使用過濾變量(use filter variable) 注意:以后的操作和分析都在該個案選取的基礎(chǔ)上進(jìn)行. 個案選取在數(shù) 據(jù)分析中的作用？變量計(jì)算目的：產(chǎn)生新變量或?qū)υ兞窟M(jìn)行必要的轉(zhuǎn)換處理 (如:預(yù)測問題產(chǎn)生比率數(shù)據(jù) 偏態(tài)數(shù)據(jù)的正態(tài)處理時(shí)間序列的平穩(wěn)處理等) (1)含義: 根據(jù)用戶給出的SPSS算術(shù)表達(dá)式，對所有或部分樣本數(shù)據(jù)進(jìn)行加工。 (2)菜單選項(xiàng)： transform-compute if 按鈕 (3)SPSS算術(shù)表達(dá)式(Numeric Expression): 由算術(shù)運(yùn)算符(+ 、-、 *、 /、 *)、SPSS函數(shù)以及

21、SPSS 變量名組成的式子。變量計(jì)算算術(shù)函數(shù) 統(tǒng)計(jì)函數(shù) 分布函數(shù) 邏輯函數(shù) 字符串函數(shù) 缺失值函數(shù) 日期時(shí)間函數(shù) 其他函數(shù) (4) SPSS函數(shù) l算術(shù)函數(shù) lAbs()：求絕對值 lsqrt()：求平方根 lrnd()：四舍五入后取整 ltrunc()：截取小數(shù)部分取整 lmod()：取余 lLn()：自然對數(shù) lLg10()：以10為底的對數(shù) (4) SPSS函數(shù) 變量計(jì)算 l統(tǒng)計(jì)函數(shù)： lmean()：均值 lsd()：標(biāo)準(zhǔn)差 lsum()：求總和 lcfvar()：求變異系數(shù) lmax() min()：求最大最小值 (4) SPSS函數(shù) 變量計(jì)算 l分布函數(shù)： lnormal()：

22、產(chǎn)生服從標(biāo)準(zhǔn)正態(tài)分布的隨機(jī)數(shù)序列 luniform()：產(chǎn)生均勻分布的隨機(jī)數(shù)序列 lrv.()：產(chǎn)生指定分布的隨機(jī)數(shù)序列，如：rv.t(10) lcdf.()：計(jì)算指定分布的累計(jì)概率值 lidf.()：計(jì)算指定分布的臨界值 (4) SPSS函數(shù) 變量計(jì)算 l邏輯函數(shù)： lrange()：判斷變量值是否在指定的區(qū)間內(nèi) lany()：判斷變量值是否為指定的若干值 l字符串函數(shù)： lindex(S1，S2)：判斷字符串S2在S1中首次出現(xiàn)的位置 llength()：求字符串長度 llower() upcase()：字符串的大小寫轉(zhuǎn)換 llpad()：用指定字符補(bǔ)齊字符串為指定長度 lltrim()：

23、壓縮字符串空格 lsubstr()：取子串 (4) SPSS函數(shù) 變量計(jì)算 l缺失值函數(shù) lmissing()：判斷變量是否取系統(tǒng)或用戶缺失值 lsysmis()：判斷變量是否取系統(tǒng)缺失值 l其他函數(shù)： lLag()：便于進(jìn)行差分計(jì)算 (4) SPSS函數(shù) 變量計(jì)算變量轉(zhuǎn)換 (5)SPSS條件表達(dá)式條件表達(dá)式: 條件表達(dá)式:由SPSS關(guān)系運(yùn)算符、邏輯運(yùn)算符、SPSS函數(shù)以及SPSS變量名組成的式子。關(guān)系運(yùn)算符: (大于)、 =(大于等于)、 32、sr32) and (sr=700) (nl=32) | (sr700) not xb=1 計(jì)數(shù) (1)含義: 對所有或部分個案，計(jì)算若干個變

24、量中有幾個變量的值落在指定的區(qū)域內(nèi)，并將結(jié)果存入新變量中。 (2)菜單選項(xiàng)菜單選項(xiàng): transform - count - define value 產(chǎn)生計(jì)數(shù)變量 (3)指定區(qū)域的定義 Value:指定一個值 system-missing:系統(tǒng)缺失值 system-or user missing:系統(tǒng)或用戶缺失值 range through:指定一個閉區(qū)域，給出最大和最小值 range: lowest through n:最小值到某個給定值 range: n through highest:某個給定值到最大值數(shù)據(jù)文件的分類匯總 (1)含義：按指定的分類變量的變量值對個案分組；計(jì)算

25、每組個案的匯總變量的基本統(tǒng)計(jì)量；將計(jì)算結(jié)果生成到一新文件中，即：在新文件中對應(yīng)分類變量的每一個分類值產(chǎn)生一個個案。性別年齡獎金男 401000 女 35550 男 20200性別_1年齡_1獎金_1 男30600 女35550 原始數(shù)據(jù) 按性別變量匯總數(shù)據(jù) 數(shù)據(jù)文件的分類匯總 (2)菜單選項(xiàng): data - aggregate (3)說明: 多重分組時(shí)，變量名的選擇順序。生成的新文件名默認(rèn)為:aggr.sav?？尚薷摹?生成的新變量名默認(rèn)為原變量名后加_1?？尚?改。可以在新文件中存貯個分組個案數(shù). 數(shù)據(jù)分組目的:了解數(shù)據(jù)的總體分布狀況思路：指定按哪個變量分組，即：指定分組變

26、量定義分組變量的分組區(qū)間（不重、不漏）指定一個存放分組結(jié)果的標(biāo)志變量分組方法：自動分組手工分組數(shù)據(jù)分組 (一)自動分組單變量值分組 (1)含義: 分組變量值相同的個案分在同一組，同組中的標(biāo)志變量相同。標(biāo)志變量依照分組變量值的大小次序給定。（單變量分組，通常只適合于離散變量且變量值較少的情況） (2)菜單選項(xiàng)菜單選項(xiàng): transform - automatic recode 分位值自動分組（1）含義：將定距型變量按分位數(shù)要求自動劃分成相應(yīng)類（2）菜單選項(xiàng)：transform-categorize variables 數(shù)據(jù)分組 (二)手工分組（組距分組） (1)含義：人工

27、定義分組區(qū)域，對所有個案或符合一定條件的個案進(jìn)行等距或非等距分組。 (2)方法：分組結(jié)果存入原變量、分組結(jié)果存入新變量數(shù)據(jù)分組 (3)分組結(jié)果存入原變量: 定義分組區(qū)域: 定義某一區(qū)間的原變量值分組后所對應(yīng) 的新值是什么.未定義的原變量值保持不變。菜單選項(xiàng): transform - recode - into same variables 說明：可以指定對符合一定條件的個案進(jìn)行分組。數(shù)據(jù)分組 (4)分組結(jié)果存入新變量: 定義分組區(qū)域:定義某一區(qū)間的原變量值分組后所對應(yīng) 的新值是什么.未定義的原變量值在新變量中為系統(tǒng)缺失值。菜單選項(xiàng): transform - recode - i

28、nto different variables 定義原變量分組后產(chǎn)生的相應(yīng)新變量(CHANGE鈕) 可以指定對符合一定條件的個案進(jìn)行分組。單值區(qū)間可以實(shí)現(xiàn)數(shù)據(jù)轉(zhuǎn)換（問卷分析中的反向題重新計(jì)分）問卷分析中的反向題重新計(jì)分舉例性格打分（內(nèi)向、一般、外向） 1、與生人交往會“自來熟” （1）從不（2）偶爾（3）有時(shí) （4）經(jīng)常 2、與不熟悉的異性交往，會臉紅（1）從不（2）偶爾（3）有時(shí) （4）經(jīng)常 3、在公眾場合下你會大聲發(fā)表自己的意見（1）從不（2）偶爾（3）有時(shí) （4）經(jīng)常極為內(nèi)向：3分較為內(nèi)向：6分較為外向:9分極為外向：12分指定加權(quán)變量 (1)含義:

29、指定某一變量為加權(quán)變量。如：平均蔬菜價(jià)格、男足打分 (2)菜單選項(xiàng): data - weight case (3)說明如果取消加權(quán)變量應(yīng)重新定義: data-weight case do not weight cases 作業(yè) 根據(jù)給定的兩個關(guān)于學(xué)生成績的SPSS數(shù)據(jù)文件做如下處理：合并兩個數(shù)據(jù)文件（數(shù)據(jù)不一定是一一對應(yīng)的）計(jì)算每個同學(xué)的總成績、平均成績、標(biāo)準(zhǔn)差計(jì)算每個同學(xué)的得優(yōu)率和得良率根據(jù)得優(yōu)率排名將各門課程的成績按優(yōu)、良、中、及格和不及格重新分組分別計(jì)算男生和女生的各科的平均成績、標(biāo)準(zhǔn)差，并保存計(jì)算結(jié)果到SPSS數(shù)據(jù)文件。第四章 SPSS的基本統(tǒng)計(jì)分析基本統(tǒng)計(jì)分析

30、頻數(shù)分析計(jì)算基本描述統(tǒng)計(jì)量（分布特征測度）圖形分析工具列聯(lián)分析頻數(shù)分析目的粗略把握變量值的分布狀況。例：研究被調(diào)查者的特征（如：性別、年齡、收入）研究被調(diào)查者對某個問題的總體看法（如：教學(xué)方式、選修課程）研究被調(diào)查者某方面的狀態(tài)（如：購買家電的類型、居民月支出狀況）采用的方法計(jì)算頻分布表：包括計(jì)算頻數(shù)、百分比、累計(jì)百分比繪制統(tǒng)計(jì)圖形：條形圖、餅圖頻數(shù)分析基本操作步驟 (1)菜單選項(xiàng):analyze-descriptive statistics-frequencies (2)選擇幾個待分析的變量到variables框. (3)chart選項(xiàng)，選擇所需要的圖形頻數(shù)分

31、析應(yīng)用舉例儲戶的職業(yè)分析特點(diǎn)：定類數(shù)據(jù) 頻數(shù)分布表輸出按頻數(shù)升降序輸出儲戶收入水平分析特點(diǎn)：定序數(shù)據(jù) 除使用頻數(shù)、百分比、總數(shù)外，還可以充分使用累計(jì)百分比頻數(shù)分析頻數(shù)分析中的其他分析計(jì)算分位數(shù):適用于定距數(shù)據(jù) 數(shù)據(jù)按升序排序后，找到若干個分位點(diǎn)上的變量值 quartiles:計(jì)算四分位數(shù)25%(QL)、50%(中位數(shù))、75%(QU) cut points for n equal groups:n等份 percentile:自定義百分位點(diǎn) 分位數(shù)的應(yīng)用在排除極端值影響的條件下，通過計(jì)算分位數(shù)差，比較兩組樣本數(shù)據(jù)的離散程度例: ( QL=50,QU=80) 和 (QL=7

32、0,QU=75) 的比較分位數(shù)、中位數(shù)、眾數(shù)的應(yīng)用舉例不同戶口所在地的儲戶取款金額比較利用分位數(shù)（不顯示頻數(shù)分析表）計(jì)算描述統(tǒng)計(jì)量目的精確把握變量的總體分布狀況，了解數(shù)據(jù)的集中趨勢、離散趨勢、對稱程度、陡峭程度。基本方法計(jì)算基本描述統(tǒng)計(jì)量計(jì)算描述統(tǒng)計(jì)量描述集中趨勢的統(tǒng)計(jì)量均值(mean):表示某變量所有變量值集中趨勢或平均水平的統(tǒng)計(jì)量。適用于定距數(shù)據(jù)。特點(diǎn)：利用了全部數(shù)據(jù)，易受極端值的影響。描述離散程度的統(tǒng)計(jì)量標(biāo)準(zhǔn)差(standard deviation-Std Dev):表示某變量的所有變量值離散程度的統(tǒng)計(jì)量。 SPSS中計(jì)算的是樣本標(biāo)準(zhǔn)差。方差(var

33、iance):標(biāo)準(zhǔn)差的平方。 SPSS中計(jì)算的是樣本方差。極差 (range):最大值(maximum)最小值(minimum) 計(jì)算描述統(tǒng)計(jì)量描述對稱程度的統(tǒng)計(jì)量偏度(skewness):描述某變量分布形態(tài)的偏斜程度和方向的統(tǒng)計(jì)量. 偏度為0表示對稱; 大于0表示正偏差大(右偏),頻數(shù)最大的值比均值小,極值大于均值; 小于0表示負(fù)偏差大(左偏) 計(jì)算描述統(tǒng)計(jì)量描述陡峭程度的統(tǒng)計(jì)量峰度(kurtosis):描述某變量所有變量值分布形態(tài)陡緩程度的統(tǒng)計(jì)量。峭度為0表示與標(biāo)準(zhǔn)正態(tài)分布峭度相同。大于0表示比標(biāo)準(zhǔn)正態(tài)分布陡，尖峰。小于0表示比標(biāo)準(zhǔn)正態(tài)分布緩；平峰。計(jì)算描述統(tǒng)計(jì)量

34、其他統(tǒng)計(jì)量標(biāo)準(zhǔn)誤差(standard error S.E):抽樣分布中的標(biāo)準(zhǔn)差，反映樣本誤差。均值標(biāo)準(zhǔn)誤差(means of S.E) 中心極限定理認(rèn)為：樣本均值N(u,2/n) 反映樣本均值與總體真值間的平均離散程度樣本數(shù)越大，樣本均值的離散程度越小，對真值的估計(jì)越準(zhǔn)確計(jì)算描述統(tǒng)計(jì)量基本操作步驟 (1)菜單選項(xiàng):analyze-descriptive statistics-descripive (2)選擇將參加計(jì)算的數(shù)值型數(shù)值型變量名到variables框。分析比較不同戶口所在地儲戶取款情況比較集中趨勢比較離散趨勢比較偏斜程度比較陡峭程度實(shí)現(xiàn)方式：數(shù)據(jù)拆分其他功能

35、數(shù)據(jù)標(biāo)準(zhǔn)化處理新變量的均值為0,標(biāo)準(zhǔn)差為1; 小于0表示在平均水平下,大于0反之. 正態(tài)分布的數(shù)據(jù)標(biāo)準(zhǔn)化后呈標(biāo)準(zhǔn)正態(tài)分布（68.2%， 95.4%，99.7%） save standardized values as variables選項(xiàng) 將變量作標(biāo)準(zhǔn)化后,結(jié)果存入名為“Z+原變量名”的新變量中. 數(shù)據(jù)標(biāo)準(zhǔn)化處理應(yīng)用舉例你能以較簡便的方法快速找到取款數(shù)目出眾的儲戶嗎？ SDxxz ii / )( 計(jì)算描述統(tǒng)計(jì)量基本統(tǒng)計(jì)分析的圖形工具以制作條形圖為例繪制簡單條圖（單式條圖）繪制復(fù)式條圖繪制堆積條圖（分段條圖）定義統(tǒng)計(jì)圖中數(shù)據(jù)的表達(dá)類型：同一變量若干條記錄的分組匯總條圖反

36、映了不同變量的匯總條圖反映了個體觀察值戶口所在地邊遠(yuǎn)郊區(qū)中心城市 Count 220 200 180 160 140 120 100 80 60 以制作條形圖為例第一種模式下的三種圖形第一種模式下的三種圖形：用于某變量在各分類情況的比較用于某變量在各分類情況的比較基本統(tǒng)計(jì)分析的圖形工具戶口所在地邊遠(yuǎn)郊區(qū)中心城市 Count 140 120 100 80 60 40 20 0 收入水平 1000元以下 10003000元 30005000元 1500元以上戶口所在地邊遠(yuǎn)郊區(qū)中心城市 Count 300 200 100 0 收入水平 1500元以上 30005000元 10003

37、000元 1000元以下以制作條形圖為例第二種模式下的三種圖形第二種模式下的三種圖形：用于若干變量的統(tǒng)計(jì)量的比較用于若干變量的統(tǒng)計(jì)量的比較未來收入情況收入情況 N 2 62 60 58 56 54 52 50 48 46 基本統(tǒng)計(jì)分析的圖形工具戶口所在地邊遠(yuǎn)郊區(qū)中心城市 N 2 50 40 30 20 10 0 收入情況未來收入情況戶口所在地邊遠(yuǎn)郊區(qū)中心城市 N descriptive statistics- crosstabs (2)選擇一個變量作為行變量到row框. (3)選擇一個變量作為列變量到column框. (4)可選一個或多個變量作為控制變量到layer框. 控制變

38、量的層次設(shè)置:同層為水平數(shù)加水平數(shù)加;不同層為水平數(shù)積水平數(shù)積. (5)是否顯示各分組的棒圖(display clustered bar charts ) 產(chǎn)生交叉列聯(lián)表應(yīng)用舉例戶口與收入水平有關(guān)聯(lián)嗎嗎？行變量：戶口；列變量：月收入不同戶口不同收入水平的儲戶對物價(jià)水平的看法一致嗎？行變量：收入水平；列變量：物價(jià)水平；控制變量：戶口產(chǎn)生交叉列聯(lián)表應(yīng)用舉例不同戶口不同收入水平的儲戶對物價(jià) 水平水平的看法一致嗎？產(chǎn)生交叉列聯(lián)表進(jìn)一步計(jì)算 cells選項(xiàng):選擇在頻數(shù)分析表中輸出各種百分比. row:行百分比(Row pct); column:列百分比(Col pct);

39、total:總百分比(Tot pct); 分析列聯(lián)表中變量間的關(guān)系目的：通過列聯(lián)表分析，檢驗(yàn)行列變量之間是否獨(dú)立。方法：卡方檢驗(yàn)：對品質(zhì)數(shù)據(jù)的相關(guān)性進(jìn)行度量分析列聯(lián)表中變量間的關(guān)系卡方檢驗(yàn) 年齡與工資收入交叉列聯(lián)表低中高青 400 00 中 0 5000 老 0 0600 低中高青 0 0500 中 0 6000 老 400 00 分析列聯(lián)表中變量間的關(guān)系卡方檢驗(yàn)基本步驟 (1)H0:行列變量之間無關(guān)聯(lián)或相互獨(dú)立 (2)構(gòu)造卡方統(tǒng)計(jì)量統(tǒng)計(jì)量服從(r-1)*(c-1)個自由度的卡方分布 count:觀察(實(shí)際)頻數(shù) expected count:期望頻數(shù) (期望頻數(shù)

40、反映的是H0成立情況下的數(shù)據(jù)分布特征) Residual:剩余 (觀察頻數(shù)-期望頻數(shù)) e eo f ff 2 2 )( 分析列聯(lián)表中變量間的關(guān)系卡方檢驗(yàn)基本步驟 (3)計(jì)算卡方統(tǒng)計(jì)量的值，并得到該統(tǒng)計(jì)量值的概率P 值 (4)決策。概率P與顯著性水平比較，小于等于則拒絕 H0,否則不能拒絕實(shí)現(xiàn)步驟 statistics選項(xiàng) cells選項(xiàng) 分析列聯(lián)表中變量間的關(guān)系應(yīng)用舉例戶口對平均收入水平的分布會產(chǎn)生影響嗎？獨(dú)立性檢驗(yàn)：從一個總體中隨機(jī)抽樣。按某兩個屬性變量將樣本進(jìn)行分類不同行業(yè)人對的自己職業(yè)的選擇標(biāo)準(zhǔn)是否存在差異？一致性檢驗(yàn)：從兩個總體中獨(dú)立抽樣，根據(jù)一個屬性變量將樣本進(jìn)

41、行分類。制造業(yè) 服務(wù)業(yè) 物質(zhì)報(bào)酬 105 45 穩(wěn)定性 40 35 分析列聯(lián)表中變量間的關(guān)系卡方檢驗(yàn)的要求: 一般要求列聯(lián)表中期望頻數(shù)小于5的格子數(shù)不超過 20%，否則會夸大卡方值，容易得出拒絕結(jié)論，可以合并單元格。卡方值會受樣本數(shù)的影響分析列聯(lián)表中變量間的關(guān)系行列變量相關(guān)性的其他測度指標(biāo) phi系數(shù)：適用于22列聯(lián)表當(dāng)行列變量獨(dú)立時(shí)：有：當(dāng)行列變量完全相關(guān)時(shí)：有：越接近于1，相關(guān)性越強(qiáng)。越接近0，相關(guān)性越弱 2 12 1 11 C A C A 2121 21122211 2 CCRR AAAA n 0 2211 AA 1 分析列聯(lián)表中變量間的關(guān)系行列變量相關(guān)性的其他測

42、度指標(biāo) 列聯(lián)C系數(shù)(contingency coefficient）, 通常為0,1),取值受到行列數(shù)的影響（見EXCEL） V系數(shù) 0,1 值越大表示行列變量的相關(guān)性越大 n C 2 2 )1(),1min( 2 crn V 多選項(xiàng)分析多選項(xiàng)分析的基本思路定義多選項(xiàng)變量集多選項(xiàng)頻數(shù)分析多選項(xiàng)交叉分組下的頻數(shù)分析多選項(xiàng)分析定義多選項(xiàng)變量集目的:將已分解的變量定義為一個集合,便于進(jìn)行多選項(xiàng)分析菜單選項(xiàng):analyze-multiple response-define sets 從原變量中選取被分解的變量(數(shù)值型)到variables in sets框指定被分解的變量是按多選

43、項(xiàng)二分法(dichotomize) 分解還是按多選項(xiàng)分類法(categories)分解的為變量集命名。系統(tǒng)自動在名字前加字符$. 多選項(xiàng)分析多選項(xiàng)頻數(shù)分析菜單選項(xiàng):analyze-multiple response-frequencies 多選項(xiàng)交叉分析下的頻數(shù)分析菜單選項(xiàng):analyze-multiple response-crosstabs 多選項(xiàng)分析多選項(xiàng)分析實(shí)例分析居民的儲蓄目的采用多選項(xiàng)分類法組織數(shù)據(jù) 在某次市場調(diào)查中收集了北京、上海和廣州三個城市的受訪者對幾種常見飲料的喜好情況，可選的飲料有茶、牛奶、咖啡、果汁、礦泉水。（數(shù)據(jù)是從原始數(shù)據(jù)庫中抽出的一小部分資料）

44、，作以下分析：采用二分法組織數(shù)據(jù) 受訪人群中最受歡迎的飲料是哪種？男、女喜愛的飲料有無差異？三個城市的人群對飲料的喜好有無差異？作業(yè) 根據(jù)第三章的關(guān)于學(xué)生成績的合并后的 SPSS數(shù)據(jù)文件做以下處理：對各門課程分組后，做頻數(shù)分析，繪制某兩門課程成績的直方圖繪制男女生構(gòu)成的餅圖分別計(jì)算男女生各門成績的基本描述統(tǒng)計(jì)量，并對數(shù)據(jù)的集中趨勢、離散程度和偏度加以比較（數(shù)字和圖形的對比）第五章 SPSS參數(shù)檢驗(yàn) 假設(shè)檢驗(yàn)概述假設(shè)檢驗(yàn)是一種根據(jù)樣本數(shù)據(jù)來推斷總體的分布或均值、方差等總體統(tǒng)計(jì)參數(shù)的方法。根據(jù)樣本來推斷總體的原因：總體數(shù)據(jù)不可能全部收集到。如：質(zhì)量檢測問題收集到總

45、體全部數(shù)據(jù)要耗費(fèi)大量的人力和財(cái)力假設(shè)檢驗(yàn)包括：參數(shù)檢驗(yàn) 非參數(shù)檢驗(yàn) 假設(shè)檢驗(yàn)的基本原理基本信念：利用小概率原理進(jìn)行反證明。小概率事件在一次實(shí)驗(yàn)中不可能發(fā)生。例如：對人民大學(xué)男生平均身高進(jìn)行推斷 H0：平均身高為173 樣本平均身高為178，由于存在抽樣誤差，不能直接拒絕H0。而需要考慮：在H0成立的條件下，一次抽樣得到平均身高為 178的可能性有多大。如果可能性較大，是個大概率事件（與相比較），則不能認(rèn)為H0不正確。否則，如果可能性較小，是個小概率事件，但確實(shí)發(fā)生了，則只能認(rèn)為H0不正確。概率P值即為觀測結(jié)果或更極端現(xiàn)象在零假設(shè)成立時(shí)出現(xiàn)的概率假設(shè)檢驗(yàn)的基本步驟 (1)根

46、據(jù)檢驗(yàn)的目標(biāo)，對待推斷的總體參數(shù)或分布作一個基本假設(shè)H0 (2)構(gòu)造檢驗(yàn)統(tǒng)計(jì)量,且該統(tǒng)計(jì)量服從某種已知分布. (3)利用收集到的樣本數(shù)據(jù)和基本假設(shè)計(jì)算檢驗(yàn)統(tǒng)計(jì) 量的值，并得到相應(yīng)的相伴概率P值，即：檢驗(yàn)統(tǒng)計(jì) 量在某個特定的極端區(qū)域取值在H0成立時(shí)的概率. (4)如果概率P值小于用戶給定的顯著性水平a，則拒絕H0 .否則，不拒絕H0 . SPSS中的參數(shù)檢驗(yàn)方法單樣本t檢驗(yàn) 兩獨(dú)立樣本t檢驗(yàn) 兩配對樣本t檢驗(yàn) SPSS單樣本t檢驗(yàn) (一)含義：檢驗(yàn)?zāi)匙兞康目傮w均值與指定的檢驗(yàn)值之間是否存在顯著差異。例如：周歲兒童的平均身高是否為75厘米 (二)要求：樣本來自的總體服從正態(tài)分布為什

47、么？ SPSS單樣本t檢驗(yàn) (三)基本思路： H0:u=u0,總體均值與檢驗(yàn)值之間不存在顯著差異. 構(gòu)造檢驗(yàn)統(tǒng)計(jì)量.從樣本均值的分布出發(fā),即:N(u0, 2/n).于是：總體方差未知時(shí)構(gòu)造t統(tǒng)計(jì)量 D=X- u0 t統(tǒng)計(jì)量服從n-1個自由度的t分布計(jì)算t統(tǒng)計(jì)量和對應(yīng)的相伴概率P(絕對值大于等于的雙側(cè)概率) 結(jié)論:P,則拒絕H0,認(rèn)為總體均值與檢驗(yàn)值之間有顯著差異.P ,不能拒絕H0. nS D t / SPSS單樣本t檢驗(yàn) (四)基本操作步驟 (1).菜單選項(xiàng): Analyze-compare means-one-samples T test (2).指定檢驗(yàn)值: 在test后的框

48、中輸入檢驗(yàn)值 SPSS單樣本t檢驗(yàn) (五)option選項(xiàng) confidence interval:指定輸出0的置信區(qū)間.默認(rèn)值為 95%. Missing values: 缺失值的處理(單樣本檢驗(yàn)時(shí)以下選項(xiàng)沒有差別) exclude cases analysis by analysis:當(dāng)分析時(shí)涉及到有缺失值變量時(shí)再剔除相應(yīng)的個案 exclude cases listwise:剔除所有含缺失值的個案后再分析 SPSS單樣本t檢驗(yàn) (六)應(yīng)用舉例周歲兒童的平均身高為75厘米嗎？根據(jù)以前的大量調(diào)查，已知顧客對某產(chǎn)品的滿意度評分在72分左右，現(xiàn)該產(chǎn)品進(jìn)行了重新包裝，收集了一批顧客的滿

49、意度評分，現(xiàn) 在的評價(jià)是否顯著高于以前？ SPSS兩獨(dú)立樣本t檢驗(yàn) (一)含義: 根據(jù)兩獨(dú)立樣本的數(shù)據(jù),對兩總體均值是否有顯著差異進(jìn)行推斷。例如：男生和女生的計(jì)算機(jī)平均成績有顯著差異嗎？ (二)要求: 兩樣本必須相互獨(dú)立,即:抽取其中一批樣本對抽取另一批樣本沒有任何影響.(如:北京周歲兒童與上海兒童的平均身高) 兩總體服從正態(tài)分布為什么？ SPSS兩獨(dú)立樣本t檢驗(yàn) (三)基本思路： H0:u1-u2=0,兩總體均值無顯著差異. 構(gòu)造檢驗(yàn)統(tǒng)計(jì)量.從兩樣本均值差的分布出發(fā), 即:N(u1-u2, 2x1-x2).于是兩總體均方差未知時(shí)構(gòu)造t統(tǒng) 計(jì)量：兩總體均值差的抽樣分布標(biāo)準(zhǔn)差：方差

50、相等：用合并方差方差不等：計(jì)算t統(tǒng)計(jì)量和對應(yīng)的相伴概率P (絕對值大于等于該值的雙側(cè)概率) )2( / 21 2 2 1 2 21 nnt nSpnSp xx t )( / )( 2 2 21 2 1 21 ft nSnS xx t 1 )( 1 )( )( 2 2 2 2 2 1 2 1 2 1 2 2 2 2 1 2 1 n n S n n S n S n S f SPSS兩獨(dú)立樣本t檢驗(yàn) (三)基本思路：結(jié)論：方差齊性F檢驗(yàn) 利用Levene F檢驗(yàn)確定兩總體方差是否齊性.H0:兩總體方差無顯著差異. 該檢驗(yàn)首先計(jì)算每個個案與所屬組均值之差并取絕對值.然后對其進(jìn)行單因素方差分

51、析. SPSS兩獨(dú)立樣本t檢驗(yàn) (三)基本思路：結(jié)論：首先,如果F檢驗(yàn)的P,則拒絕F檢驗(yàn)的H0,認(rèn)為方差不齊性; 其次看Unequal行的t檢驗(yàn)概率.如果,則拒絕t檢驗(yàn)的H0, 認(rèn)為兩總體均值有顯著差異;如果,則不拒絕t檢驗(yàn)的H0. 首先,如果F檢驗(yàn)的P ,則不能拒絕F檢驗(yàn)的H0,認(rèn)為方差齊性;其次看equal行的t檢驗(yàn)概率.其余同上 SPSS兩獨(dú)立樣本t檢驗(yàn) (四)基本操作步驟 (1).菜單選項(xiàng):analyze-compare means-independent- samples T (2).選擇若干變量作為檢驗(yàn)變量到test variables框 (3).選擇代表不同總體的變量作為分

52、組變量到grouping variable 框 (4).定義分組變量的分組情況Define Groups.： use specified values:定義分組變量的分組標(biāo)志值分別是什么 cut point:分組變量為連續(xù)變量.輸入一個數(shù)字,將大于等于該值的分成一組,小于該值的分成另一組. SPSS兩獨(dú)立樣本t檢驗(yàn) 應(yīng)用舉例上海周歲兒童的平均身高與北京周歲兒童的平均身高有顯著差異嗎？某商場為某種產(chǎn)品進(jìn)行了促銷活動，請比較前后數(shù)日的銷售額，以確認(rèn)促銷活動對銷量有無作用。 A、B兩種減肥產(chǎn)品的作用有明顯差異嗎？隨機(jī)選了200名肥胖者服用A種減肥產(chǎn)品，其中： 92人體重明顯減輕了；另隨

53、機(jī)選了183名肥胖者服用B減肥產(chǎn)品，其中：161人體重明顯減輕了。 SPSS兩配對樣本t檢驗(yàn) (一) 含義: 根據(jù)配對樣本對兩總體均值是否有顯著差異進(jìn) 行推斷. 例如：某種減肥茶是否有效 (二)要求: 兩樣本數(shù)據(jù)必須兩兩配對,即:樣本個數(shù)相同,個案順序相同.如:減肥茶的效果、不同廣告形式對銷售額的影響.(控制了個案自身的影響) 兩總體服從正態(tài)分布 SPSS兩配對樣本t檢驗(yàn) (三)基本思路 H0:兩總體均值無顯著差異,差值序列的均值u0 =0. 構(gòu)造統(tǒng)計(jì)量：同單樣本均值檢驗(yàn) D=X- u0 S為差值序列的標(biāo)準(zhǔn)差實(shí)質(zhì)是先求出每對測量值的差值;然后檢驗(yàn)差值序列的均值是否與0有顯著差異.

54、如果差值的均值與0有顯著差異,則認(rèn)為兩總體均值存在顯著差異;否則,與0無顯著差異,則認(rèn)為兩總體均值不存在顯著差異. nS D t / SPSS兩配對樣本t檢驗(yàn) (三)基本思路計(jì)算t統(tǒng)計(jì)量和對應(yīng)的相伴概率P(絕對值大于等于的雙側(cè)概率) 結(jié)論:P,則拒絕H0,認(rèn)為兩總體均值有顯著差異.P , 不能拒絕H0. SPSS兩配對樣本t檢驗(yàn) (四)基本操作步驟 (1).菜單選項(xiàng): analyze-compare means-paired-samples T (2).選擇一對或若干對配對變量作為檢測變量到paired variables框. (3)option選項(xiàng) 同獨(dú)立樣本的T檢驗(yàn) SPSS兩配對

55、樣本t檢驗(yàn) 應(yīng)用舉例某種減肥茶真起到減肥作用了嗎？對促銷人員培訓(xùn)前和培訓(xùn)后銷售額的比較，以確認(rèn)業(yè)務(wù)培訓(xùn)有無效果。作業(yè) 一、給幼鼠以不同的飼料，研究每天鈣的留存量是否有顯著不同。以下兩種方法涉及實(shí)驗(yàn)樣本：方式1：同一鼠喂不同的飼料鼠號 1 2 3 4 5 6 7 8 9 飼料1 33.1 33.1 26.8 36.3 39.5 30.9 33.4 31.5 28.6 飼料2 36.7 28.8 35.1 35.2 43.8 25.7 36.5 37.9 28.7 方式2：甲組12只喂飼料1，乙組9只喂飼料2 甲組：29.7 26.7 28.9 31.1 31.1 26.8 26.3

56、 39.5 30.9 33.4 33.1 28.6 乙組：28.7 28.3 29.3 32.2 31.1 30.0 36.2 36.8 30.0 二、根據(jù)學(xué)生成績數(shù)據(jù)，分析：是否有男女生平均成績存在明顯差異的課程判斷學(xué)生在哪些課程上的平均成績差別不明顯第六章方差分析方差分析概述一、問題的提出最優(yōu)方案的設(shè)計(jì) l如何獲得最佳的產(chǎn)品銷售量 l哪些因素是影響銷售量的主要因素 l哪些因素的那種情況更利于提高銷售量 l哪些因素的組合更利于提高銷售量 l可以利用方差分析的方法來實(shí)現(xiàn) 方差分析概述二、方差分析目的：方差分析從分析數(shù)據(jù)的差異入手，分析哪些因素是影響數(shù)據(jù)差異的眾多因素中的主要

57、因素. 相關(guān)概念： (1)觀測變量:作為觀測的對象(如：畝產(chǎn)量、推銷量等). (2)控制因素：人為可以控制的因素(如:施肥量、品種、推銷策略、價(jià)格、包裝方式等)，在方差分析中稱為控制因素.將控制變量的不同情況稱為控制變量的不同水平. (3)隨機(jī)因素：人為很難控制的因素(如:氣候、推銷人員的形象、抽樣誤差等)，方差分析中主要指抽樣誤差。方差分析概述三、核心問題從數(shù)據(jù)差異角度看: 觀測變量的數(shù)據(jù)差異=控制因素造成+隨機(jī)因素造成當(dāng)控制因素對實(shí)驗(yàn)結(jié)果有顯著影響時(shí),和隨機(jī)因素共同作用必然使觀測變量產(chǎn)生顯著變動;反之,觀測變量的變動較小,將歸結(jié)為隨機(jī)性造成的(這里指抽樣誤差造成的). 方

58、差分析概述四、方差分析的類型單因素方差分析: 只考慮一個控制因素的影響多因素方差分析: 考慮兩個以上的控制因素和它們的交互作用對觀測變量的影響協(xié)方差分析：在盡量排除其他因素的影響下，分析單個或多個控制因素對觀測變量的影響.(引入?yún)f(xié)變量) 單因素方差分析 (一)目的檢驗(yàn)?zāi)骋粋€一個控制因素的改變是否會給觀察變量帶來顯著影響. 例如：應(yīng)用面很廣（科學(xué)試驗(yàn)，社會經(jīng)濟(jì)問題）考察不同肥料對某農(nóng)作物畝產(chǎn)量是否有顯著差異. 考察不同溫度下某化工產(chǎn)品的獲得率考察婦女生育率在不同地區(qū)是否有顯著差異. 考察不同學(xué)歷是否對工資收入產(chǎn)生顯著影響. 單因素方差分析 (二)基本思路 (1)入手點(diǎn): 檢

59、驗(yàn)控制變量的不同水平下，各總體的分布是否存在顯著差異，進(jìn)而判斷控制變量是否對觀測變量產(chǎn) 生了顯著影響. (2)前提: 各組樣本獨(dú)立不同水平下各總體服從方差相等方差相等的正態(tài)分布正態(tài)分布. (3) H0:不同水平下,各總體均值無顯著差異.即:不同水平下控制因素的影響不顯著. 通過參數(shù)檢驗(yàn)可以解決兩兩總體均值的比較多個總體均值的檢驗(yàn)如何作？(如：北京、上海、廣州周歲兒童平均身高的比較）可以多次采用兩樣本t檢驗(yàn)方法實(shí)現(xiàn) 產(chǎn)生的問題：犯第一類錯誤的概率明顯增大例如：K個變量兩兩進(jìn)行t檢驗(yàn)，需要作N=k! (2! (k-2)!)次，如果為 0.05，那么每次不犯錯的概率為0.95。N次檢驗(yàn)

60、均不犯錯的概率為 0.95N，而犯錯的概率為1-0.95N，遠(yuǎn)遠(yuǎn)大于設(shè)定的0.05 可以利用方差分析的方法來實(shí)現(xiàn)多個總體的均值比較單因素方差分析單因素方差分析 (二)基本思路 (4) 構(gòu)造F統(tǒng)計(jì)量因?yàn)?總變差=組間差異+組內(nèi)差異可證明:SST= SSA+SSE(設(shè):k個水平，每個水平有ni 個數(shù)據(jù)) 考察平均的組間差異與平均的組內(nèi)差異的比值,于是: k i ii xxnSSA 1 2 )( k ii nj j iij xxSSE 1 2 )( MSE MSA knSSE kSSA F )/( ) 1/( k i nj j ij xxSST 11 2 )( F(k-1,n-k) 單因素方

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

薛薇《統(tǒng)計(jì)分析軟件SPSS應(yīng)用》教學(xué)講義(SPSS18)p316匯編

文檔簡介

溫馨提示

最新文檔

評論

薛薇《統(tǒng)計(jì)分析軟件SPSS應(yīng)用》教學(xué)講義(SPSS18)p316匯編

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔