




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、 第一章第一章 SPSS SPSS 概述概述 SPSS概述 SPSS: Statistical Package for Social Science Statistical Product and Service Solutions SPSS的發(fā)展: l 60年代:美國斯坦福大學(xué)三位研究生研制 l 70年代:SPSS總部成立于芝加哥,推出SPSSX中小型機(jī)版 l 80年代:SPSS公司(SPSS/PC+微機(jī)版13) l 90年代:SPSS公司(SPSS WINDOWS版514) SPSS 主要特點(diǎn) 操作簡便。絕大多數(shù)操作是通過菜單、按鈕、對話框 完成的。 無需計(jì)算機(jī)編程、需記憶大量命令和參數(shù)。
2、 分析方法豐富、分析結(jié)果清晰、直觀。 可以直接讀取其他軟件格式的數(shù)據(jù)文件,如:dbf、xls、 sas等。 最新版本采用分布式分析系統(tǒng),適應(yīng)互聯(lián)網(wǎng),支持動 態(tài)收集、分析數(shù)據(jù)和HTML報(bào)告 與一般的辦公軟件直接兼容不方便 SPSS主要窗口:數(shù)據(jù)編輯窗口 窗口標(biāo)題:data editor 功能:對SPSS的數(shù)據(jù)文件數(shù)據(jù)文件進(jìn)行錄入、 修改、 管理等基本操作的窗口。 組成:窗口主菜單、工具欄、數(shù)據(jù)編輯區(qū)、狀態(tài)顯示 區(qū) 特點(diǎn): SPSS運(yùn)行過程中自動打開 SPSS中各統(tǒng)計(jì)分析功能都是針對該窗口中的數(shù)據(jù)進(jìn) 行的 窗口中的數(shù)據(jù)文件以.sav存于磁盤上 兩個視圖:數(shù)據(jù)視圖和變量視圖 SPSS主要窗口:數(shù)據(jù)輸
3、出窗口 窗口標(biāo)題:viewer 功能:SPSS統(tǒng)計(jì)分析報(bào)表及圖形的輸出的窗口。 組成:窗口主菜單、工具欄、結(jié)果顯示區(qū)、狀態(tài)顯示 區(qū) 特點(diǎn): 在進(jìn)行第一次分析時(shí)自動打開,也可手工打開 可以手工打開若干個可相互切換若干個可相互切換的viewer窗口;狀 態(tài)欄上的!表示當(dāng)前輸出窗口 輸出窗口可以關(guān)閉,窗口內(nèi)容以.SPO存于磁盤上 兩個視圖:目錄視圖和內(nèi)容視圖 SPSS主要窗口:數(shù)據(jù)輸出窗口 駕馭數(shù)據(jù)出輸出窗口 一般操作 結(jié)果文件的打開和保存 加密保存 窗口元素的移動和刪除 標(biāo)準(zhǔn)的拖放式操作 在大綱視圖中操作最方便 結(jié)果的導(dǎo)出 以純文本格式導(dǎo)出、以HTML格式導(dǎo)出 如何在WORD中引用分析結(jié)果 統(tǒng)計(jì)表
4、格:拷貝或拷貝對象 統(tǒng)計(jì)圖:拷貝對象 表格的編輯 表格狀態(tài)的確定 單元格內(nèi)容編輯 行列轉(zhuǎn)置 Autofit 表格樣式的變換 SPSS基本運(yùn)行方式 完全窗口菜單方式: 所有分析操作過程都是通過菜單和按鈕及對話框方式進(jìn)行的. 是經(jīng)常使用的一種運(yùn)行方式,適用于一般分析和SPSS的初學(xué)者. SPSS基本運(yùn)行方式 程序運(yùn)行方式: 手工編寫SPSS命令程序 一次性提交計(jì)算機(jī)運(yùn)行 適用于大規(guī)模的分析工作和熟練的SPSS程序員. 實(shí)現(xiàn)方法: (1)打開SYNTAX語句窗口并編寫和修改SPSS程序 (2)點(diǎn)擊語句窗口中的RUN菜單項(xiàng),選擇運(yùn)行方式運(yùn)行 Syntax語句窗口 窗口標(biāo)題: syntax editer
5、 功能:編寫和修改SPSS程序的窗口. 特點(diǎn): 打開: FILE - NEW - SYNTAX或FILE-OPEN- .SPS擴(kuò)展名 窗口中的程序以.SPS存于磁盤上 菜單項(xiàng)RUN中提供四種程序執(zhí)行方式:All、Selection、 Current、To end SPSS 基本運(yùn)行方式 菜單程序混合運(yùn)行方式: 先通過菜單選擇分析過程和參數(shù),不立即提交(OK) 執(zhí)行,而是按動PASTE按鈕. 計(jì)算機(jī)自動將用戶剛定義的分析過程和參數(shù)轉(zhuǎn)換成 SPSS的命令,并顯示到SYNTAX語句窗口中. 用戶可對其進(jìn)行必要的修改后再提交給計(jì)算機(jī)執(zhí)行. 一般適用于熟練的SPSS程序員. 利用SPSS進(jìn)行數(shù)據(jù)分析的步
6、驟 建立SPSS數(shù)據(jù)文件 定義數(shù)據(jù)文件結(jié)構(gòu) 錄入修改和編輯待分析數(shù)據(jù) 數(shù)據(jù)的統(tǒng)計(jì)分析 統(tǒng)計(jì)分析之前的預(yù)處理 統(tǒng)計(jì)分析 數(shù)據(jù)和分析結(jié)果的保存 結(jié)果的說明和解釋 思考復(fù)習(xí) SPSS有哪兩個主要窗口?功能是什么? 有哪些特點(diǎn)? SPSS有哪些運(yùn)行方式?特點(diǎn)是什么? 第二章 SPSS數(shù)據(jù)文件的 建立和管理 一份簡單的調(diào)查問卷 單項(xiàng)選擇題 提供幾個備選擇答案,從其中選擇一個答案 變量類型:分類數(shù)據(jù)、定序數(shù)據(jù) 數(shù)據(jù)類型:字符型 填空題 變量類型:定距數(shù)據(jù) 數(shù)據(jù)類型:數(shù)值型 如何利用SPSS組織數(shù)據(jù) SPSS數(shù)據(jù)文件是一種有結(jié)構(gòu)的數(shù)據(jù)文件 年級 性別問題1問題n 11. 4 222 . 文件結(jié)構(gòu) 數(shù)據(jù) 個案
7、 case 變量名 變量 用字符或數(shù)字表示字符型數(shù)據(jù) SPSS數(shù)據(jù)文件一般只能通過SPSS軟件打開 一份簡單的調(diào)查問卷 l多項(xiàng)選擇題 l提供幾個備選擇答案,從其中選擇多個答案 如:在下列品牌中您信任哪些品牌? 被診斷為高血要后你采取了以下哪些輔助治療手段? 如:高考時(shí)報(bào)考學(xué)校 (1)北京大學(xué) (2)清華大學(xué) (3)人民大學(xué) (4)北京理工大學(xué) (5)北京師范大學(xué) (6)北京外國語大學(xué) l多項(xiàng)選擇題不能在SPSS中直接存儲,因?yàn)镾PSS的一個變 量只能有一個取值 l多項(xiàng)選擇題的處理方法 l思路: 將一個問題定義成幾個變量,用這幾個變量來描述 該問題的幾個可能被選擇的答案。 l編碼方式: 多選項(xiàng)二
8、分法(multiple dichotomize method) 多選項(xiàng)分類法(multiple category method) l多選項(xiàng)二分法 將每個答案作為一個變量,每個變量只有兩個取值 (0或1)。 例如: 變 量 名變 量 名 標(biāo) 簽編碼 方 案 X 1北 京 大 學(xué)01 X 2清 華 大 學(xué)01 X 3人 民 大 學(xué)01 X 4北 京 理 工 大 學(xué)01 X 5北 京 師 范 大 學(xué)01 X 6北 京 外 國 語 大 學(xué)01 如何利用SPSS組織數(shù)據(jù) l多選項(xiàng)分類法: 預(yù)先估計(jì)多選項(xiàng)問題可能被選擇的最多答案數(shù).為每個 答案建立一個變量,取值為多選項(xiàng)問題的可選答案. 例如: 變 量 名
9、 變量 名標(biāo) 簽 編 碼 方 案 A第一 選 項(xiàng) (1 ) 北 京 大 學(xué) (2 ) 清 華 大 學(xué) (3 ) 人 民 大 學(xué) (4 ) 北 京 理 工 大 學(xué) (5 ) 北 京 師 范 大 學(xué) (6 ) 北 京 外 國 語 大 學(xué) B第二 選 項(xiàng) (1 ) 北 京 大 學(xué) (2 ) 清 華 大 學(xué) (3 ) 人 民 大 學(xué) (4 ) 北 京 理 工 大 學(xué) (5 ) 北 京 師 范 大 學(xué) (6 ) 北 京 外 國 語 大 學(xué) C第三 選 項(xiàng) (1 ) 北 京 大 學(xué) (2 ) 清 華 大 學(xué) (3 ) 人 民 大 學(xué) (4 ) 北 京 理 工 大 學(xué) (5 ) 北 京 師 范 大 學(xué) (6
10、 ) 北 京 外 國 語 大 學(xué) 如何利用SPSS組織數(shù)據(jù) 頻數(shù)數(shù)據(jù): 男女 統(tǒng)計(jì)1023 精算1220 如何利用SPSS組織數(shù)據(jù) 設(shè)置三個變量: 專業(yè)方向、性別、人數(shù) SPSS數(shù)據(jù)文件的結(jié)構(gòu) (一)變量名變量名(Variable name): 變量名是變量存取的唯一標(biāo)志。 起名規(guī)則: 不多于8個字符組成 不區(qū)分大小寫 允許漢字作為變量名 默認(rèn)變量名為VARn,如:var00001 SPSS數(shù)據(jù)文件的結(jié)構(gòu) (二)變量的類型變量的類型(type)和顯示寬度和顯示寬度(width) 1、數(shù)值型: 標(biāo)準(zhǔn)數(shù)值型(Numeric):默認(rèn)類型 8.2 如: 12345678、12345.67、-1234.
11、56 帶逗號的數(shù)值型(Comma): 從個位開始三位一個逗號8.2 如:1,234.56 科學(xué)計(jì)數(shù)法(Scientific Notation):表示很大或很小的數(shù)據(jù) 8.2 如:1.2E+05 帶美元符號(Dollar):表示貨幣 格式很多,如:$12.30 SPSS數(shù)據(jù)文件的結(jié)構(gòu) 2 、字符型(String): 存儲字符數(shù)據(jù) 8位 如:beijing 處理時(shí)用雙引號擴(kuò)起來 3、日期型(Date):存儲日期數(shù)據(jù) 格式很多,如:20-AUG-1999 4、其他: 如:圓點(diǎn)數(shù)值型(dot)、用戶自定義型 (customer) 注意:顯示寬度不影響數(shù)據(jù)的存儲 SPSS數(shù)據(jù)文件的結(jié)構(gòu) (三)變量名標(biāo)簽
12、變量名標(biāo)簽(Variable label) : 對變量名的一些解釋說明,增強(qiáng)分析結(jié)果的可視性。 可以省略。 (四)變量值標(biāo)簽變量值標(biāo)簽(Value label) 對變量所取值的一些解釋說明,增強(qiáng)分析結(jié)果的可 視性。可以省略。 一般用于品質(zhì)數(shù)據(jù) 如:1-男 2-女、1-高 2-中 3-低 SPSS數(shù)據(jù)文件的結(jié)構(gòu) (五)變量列格式變量列格式(Column Format) 對齊方式(Text Alignment) 左對齊(Left):字符型默認(rèn)。 右對齊(Right):數(shù)值型默認(rèn)。 居中對齊(Center) 列寬度(Column Width) 默認(rèn)值為變量的總長度。 SPSS數(shù)據(jù)文件的結(jié)構(gòu) (六)缺
13、失值缺失值(Missing Values) 1、什么是缺失值? 漏填數(shù)據(jù) 明顯錯誤的數(shù)據(jù) 2、對缺失值的一般處理 事先指定:指定某個特定值為缺失值(用戶缺失值) 其他處理方法,如:以均值、眾數(shù)替代等 3、SPSS缺失值 用戶缺失值 系統(tǒng)缺失值:數(shù)值型:點(diǎn) () 字符型:空 SPSS數(shù)據(jù)文件的結(jié)構(gòu) (七)變量計(jì)量尺度(七)變量計(jì)量尺度(Measurement) scale: 定距數(shù)據(jù),一般為數(shù)值型數(shù)據(jù)。 如:收入、人數(shù)。 ordinal: 有固有順序的順序水準(zhǔn)的數(shù)值型或字符型數(shù) 據(jù)。 如:職稱、年齡段 nominal: 無固有順序的名義水準(zhǔn)的數(shù)值型或字符型數(shù) 據(jù)。 如:性別、民族 定義SPSS數(shù)
14、據(jù)文件結(jié)構(gòu) 操作方法:利用變量視圖 如何查看變量定義的情況 菜單選項(xiàng): Utilities - Variables SPSS數(shù)據(jù)的錄入與保存 錄入時(shí)應(yīng)注意: 黑框確定當(dāng)前數(shù)據(jù)單元 錄入帶有變量值標(biāo)簽的數(shù)據(jù):手工輸入代碼,屏幕 顯示變量值標(biāo)簽 凍結(jié)第一列 數(shù)據(jù)保存: 操作 保存格式: (1)*.sav :SPSS數(shù)據(jù)文件(默認(rèn))。 (2)*.dbf : dbase數(shù)據(jù)文件。 (3)*.xls : Excel工作表文件。 注意:有些信息會丟失 SPSS數(shù)據(jù)的編輯 (一)打開數(shù)據(jù)文件 菜單選項(xiàng):File - Open - .sav (二)數(shù)據(jù)定位 按個案號碼定位 菜單: Data - Go to c
15、ase - 輸入樣本號 按值定位 光標(biāo)定位到某列變量上光標(biāo)定位到某列變量上 - Edit - Find. SPSS數(shù)據(jù)的編輯 (三)插入和刪除一個個案 插入:data-insert case 刪除:選定待刪行,鼠標(biāo)右鍵找到Cut (四)插入和刪除一個變量 插入:光標(biāo)定位到某列變量上光標(biāo)定位到某列變量上 - Data - Insert Variable (插到某列前) 或鼠標(biāo)右鍵 刪除:選定列,鼠標(biāo)右鍵Cut項(xiàng) SPSS數(shù)據(jù)的編輯 (五)數(shù)據(jù)移動、復(fù)制和刪除 定義源數(shù)據(jù)塊 鼠標(biāo)右鍵:cut copy clear 確定目標(biāo)單元 鼠標(biāo)右鍵:paste 數(shù)據(jù)文件的合并 目的: 將兩個SPSS數(shù)據(jù)文件合
16、并到一個數(shù)據(jù)文件 中 文件合并的方式: 縱向合并 橫向合并 (一)縱向數(shù)據(jù)合并 (1)含義含義: 將磁盤上的一個SPSS數(shù)據(jù)文件追加追加到當(dāng)前data editor窗口中的數(shù)據(jù) 文件中。 (2)前提前提: 兩個SPSS數(shù)據(jù)文件應(yīng)可以合并的內(nèi)容可以合并的內(nèi)容,且最好有相同的相同的變量名和 變量類型。 (3)菜單選項(xiàng)菜單選項(xiàng): data - merge file - add cases 數(shù)據(jù)文件的合并 數(shù)據(jù)文件的合并 (二)橫向數(shù)據(jù)合并 (1)含義含義: 將磁盤上的一個SPSS數(shù)據(jù)文件中的若干個變量增加 到當(dāng)前data editor窗口的數(shù)據(jù)文件中。 (2)前提前提: a.兩個數(shù)據(jù)文件必須必須有一
17、個共同的變量名為關(guān)鍵字段 -合并的依據(jù); b. 兩個數(shù)據(jù)文件應(yīng)事先按關(guān)鍵字段升序排序。 數(shù)據(jù)文件的合并 (二)橫向數(shù)據(jù)合并 (3)菜單選項(xiàng)菜單選項(xiàng): data - merge file - add variable (4)選項(xiàng)說明選項(xiàng)說明: math cases on key variables in sorted files:以關(guān)鍵字作 為合并標(biāo)志。 Both files provide cases:合并后的文件的數(shù)據(jù)由兩個 文件共同提供。 External file is keyed table:以data editor的數(shù)據(jù)為基礎(chǔ)。 Working data file is keyed
18、table:以磁盤文件的數(shù)據(jù)為 基礎(chǔ)。 與其他軟件數(shù)據(jù)共享 共享dbf和xls格式文件 菜單選項(xiàng): Data - Open (1)*.dbf : dbase數(shù)據(jù)文件。字段名、字段類型自動轉(zhuǎn)成 SPSS數(shù)據(jù)文件中的變量名和類型。一條記錄為一個個 案。 (2)*.xls : Excel文件 (Read variable name選項(xiàng)) 共享數(shù)據(jù)庫文件 建立ODBC數(shù)據(jù)源 第三章 SPSS數(shù)據(jù)文件的基本 加工和處理 SPSS數(shù)據(jù)文件的基本加工和處理 數(shù)據(jù)文件的整理 個案排序、個案選取 數(shù)據(jù)加工 變量計(jì)算、計(jì)數(shù) 數(shù)據(jù)分組 自動分組、手工分組 數(shù)據(jù)文件的其他處理功能 指定加權(quán)變量 目的: 將所有個案按照
19、用戶指定的某一個或多個變量 的變量值的升序或降序重新排列。 菜單選項(xiàng): data - sort cases 注意: (1)Ascending:升序、Descending:降序。 (2)多重排序,選擇變量名的次序很關(guān)鍵。 個案排序 排序在數(shù)據(jù) 分析中的作 用? 個案選取 目的: 從現(xiàn)有數(shù)據(jù)中挑選出部分?jǐn)?shù)據(jù)。 菜單選項(xiàng): data - select cases 選取個案的幾種不同方式 (1)選擇符合一定條件的個案(If condition is satisfied) (2)隨機(jī)選取個案(Random sample of cases) 近似選取、精確選取 (3)選取某一區(qū)域內(nèi)的個案(Based on
20、 time or case range) (4)使用過濾變量(use filter variable) 注意:以后的操作和分析都在該個案選取的基礎(chǔ)上 進(jìn)行. 個案選取在數(shù) 據(jù)分析中的作 用? 變量計(jì)算 目的:產(chǎn)生新變量或?qū)υ兞窟M(jìn)行必要的轉(zhuǎn)換處理 (如:預(yù)測問題 產(chǎn)生比率數(shù)據(jù) 偏態(tài)數(shù)據(jù)的正態(tài)處理 時(shí)間序列的平穩(wěn)處 理等) (1)含義: 根據(jù)用戶給出的SPSS算術(shù)表達(dá)式,對所有或部分樣本 數(shù)據(jù)進(jìn)行加工。 (2)菜單選項(xiàng): transform-compute if 按鈕 (3)SPSS算術(shù)表達(dá)式(Numeric Expression): 由算術(shù)運(yùn)算符(+ 、-、 *、 /、 *)、SPSS函數(shù)以及
21、SPSS 變量名組成的式子。 變量計(jì)算 算術(shù)函數(shù) 統(tǒng)計(jì)函數(shù) 分布函數(shù) 邏輯函數(shù) 字符串函數(shù) 缺失值函數(shù) 日期時(shí)間函數(shù) 其他函數(shù) (4) SPSS函數(shù) l算術(shù)函數(shù) lAbs():求絕對值 lsqrt():求平方根 lrnd():四舍五入后取整 ltrunc():截取小數(shù)部分取整 lmod():取余 lLn():自然對數(shù) lLg10():以10為底的對數(shù) (4) SPSS函數(shù) 變量計(jì)算 l統(tǒng)計(jì)函數(shù): lmean():均值 lsd():標(biāo)準(zhǔn)差 lsum():求總和 lcfvar():求變異系數(shù) lmax() min():求最大最小值 (4) SPSS函數(shù) 變量計(jì)算 l分布函數(shù): lnormal():
22、產(chǎn)生服從標(biāo)準(zhǔn)正態(tài)分布的隨機(jī)數(shù)序列 luniform():產(chǎn)生均勻分布的隨機(jī)數(shù)序列 lrv.():產(chǎn)生指定分布的隨機(jī)數(shù)序列,如:rv.t(10) lcdf.():計(jì)算指定分布的累計(jì)概率值 lidf.():計(jì)算指定分布的臨界值 (4) SPSS函數(shù) 變量計(jì)算 l邏輯函數(shù): lrange():判斷變量值是否在指定的區(qū)間內(nèi) lany():判斷變量值是否為指定的若干值 l字符串函數(shù): lindex(S1,S2):判斷字符串S2在S1中首次出現(xiàn)的位置 llength():求字符串長度 llower() upcase():字符串的大小寫轉(zhuǎn)換 llpad():用指定字符補(bǔ)齊字符串為指定長度 lltrim():
23、壓縮字符串空格 lsubstr():取子串 (4) SPSS函數(shù) 變量計(jì)算 l缺失值函數(shù) lmissing():判斷變量是否取系統(tǒng)或用戶缺失值 lsysmis():判斷變量是否取系統(tǒng)缺失值 l其他函數(shù): lLag():便于進(jìn)行差分計(jì)算 (4) SPSS函數(shù) 變量計(jì)算 變量轉(zhuǎn)換 (5)SPSS條件表達(dá)式條件表達(dá)式: 條件表達(dá)式:由SPSS關(guān)系運(yùn)算符、邏輯運(yùn)算符、SPSS函 數(shù)以及SPSS變量名組成的式子。 關(guān)系運(yùn)算符: (大于)、 =(大于等于)、 32、sr32) and (sr=700) (nl=32) | (sr700) not xb=1 計(jì)數(shù) (1)含義: 對所有或部分個案,計(jì)算若干個變
24、量中有幾個 變量的值落在指定的區(qū)域內(nèi),并將結(jié)果存入新 變量中。 (2)菜單選項(xiàng)菜單選項(xiàng): transform - count - define value 產(chǎn)生計(jì)數(shù)變量 (3)指定區(qū)域的定義 Value:指定一個值 system-missing:系統(tǒng)缺失值 system-or user missing:系統(tǒng)或用戶缺失值 range through:指定一個閉區(qū)域,給出最大和最 小值 range: lowest through n:最小值到某個給定值 range: n through highest:某個給定值到最大值 數(shù)據(jù)文件的分類匯總 (1)含義: 按指定的分類變量的變量值對個案分組; 計(jì)算
25、每組個案的匯總變量的基本統(tǒng)計(jì)量; 將計(jì)算結(jié)果生成到一新文件中,即:在新文件中對 應(yīng)分類變量的每一個分類值產(chǎn)生一個個案。 性別年齡獎金 男 401000 女 35550 男 20200性別_1年齡_1獎金_1 男30600 女35550 原始數(shù)據(jù) 按性別變量匯總數(shù)據(jù) 數(shù)據(jù)文件的分類匯總 (2)菜單選項(xiàng): data - aggregate (3)說明: 多重分組時(shí),變量名的選擇順序。 生成的新文件名默認(rèn)為:aggr.sav??尚薷摹?生成的新變量名默認(rèn)為原變量名后加_1??尚?改。 可以在新文件中存貯個分組個案數(shù). 數(shù)據(jù)分組 目的:了解數(shù)據(jù)的總體分布狀況 思路: 指定按哪個變量分組,即:指定分組變
26、量 定義分組變量的分組區(qū)間(不重、不漏) 指定一個存放分組結(jié)果的標(biāo)志變量 分組方法: 自動分組 手工分組 數(shù)據(jù)分組 (一)自動分組 單變量值分組 (1)含義: 分組變量值相同的個案分在同一組,同組中的標(biāo)志變量相同。 標(biāo)志變量依照分組變量值的大小次序給定。(單變量分組,通常 只適合于離散變量且變量值較少的情況) (2)菜單選項(xiàng)菜單選項(xiàng): transform - automatic recode 分位值自動分組 (1)含義:將定距型變量按分位數(shù)要求自動劃分成相應(yīng)類 (2)菜單選項(xiàng):transform-categorize variables 數(shù)據(jù)分組 (二)手工分組(組距分組) (1)含義: 人工
27、定義分組區(qū)域,對所有個案或符合一定條 件的個案進(jìn)行等距或非等距分組。 (2)方法: 分組結(jié)果存入原變量、分組結(jié)果存入新變量 數(shù)據(jù)分組 (3)分組結(jié)果存入原變量: 定義分組區(qū)域: 定義某一區(qū)間的原變量值分組后所對應(yīng) 的新值是什么.未定義的原變量值保持不變。 菜單選項(xiàng): transform - recode - into same variables 說明: 可以指定對符合一定條件的個案進(jìn)行分組。 數(shù)據(jù)分組 (4)分組結(jié)果存入新變量: 定義分組區(qū)域:定義某一區(qū)間的原變量值分組后所對應(yīng) 的新值是什么.未定義的原變量值在新變量中為系統(tǒng)缺 失值。 菜單選項(xiàng): transform - recode - i
28、nto different variables 定義原變量分組后產(chǎn)生的相應(yīng)新變量(CHANGE鈕) 可以指定對符合一定條件的個案進(jìn)行分組。 單值區(qū)間可以實(shí)現(xiàn)數(shù)據(jù)轉(zhuǎn)換(問卷分析中的反向題重新 計(jì)分) 問卷分析中的反向題重新計(jì)分舉例 性格打分(內(nèi)向、一般、外向) 1、與生人交往會“自來熟” (1)從不 (2)偶爾 (3)有時(shí) (4)經(jīng)常 2、與不熟悉的異性交往,會臉紅 (1)從不 (2)偶爾 (3)有時(shí) (4)經(jīng)常 3、 在公眾場合下你會大聲發(fā)表自己的意見 (1)從不 (2)偶爾 (3)有時(shí) (4)經(jīng)常 極為內(nèi)向:3分 較為內(nèi)向:6分 較為外向:9分 極為外向:12分 指定加權(quán)變量 (1)含義:
29、指定某一變量為加權(quán)變量。如:平均蔬菜價(jià)格、男足打分 (2)菜單選項(xiàng): data - weight case (3)說明 如果取消加權(quán)變量應(yīng)重新定義: data-weight case do not weight cases 作業(yè) 根據(jù)給定的兩個關(guān)于學(xué)生成績的SPSS數(shù)據(jù)文件 做如下處理: 合并兩個數(shù)據(jù)文件(數(shù)據(jù)不一定是一一對應(yīng)的) 計(jì)算每個同學(xué)的總成績、平均成績、標(biāo)準(zhǔn)差 計(jì)算每個同學(xué)的得優(yōu)率和得良率 根據(jù)得優(yōu)率排名 將各門課程的成績按優(yōu)、良、中、及格和不及格重 新分組 分別計(jì)算男生和女生的各科的平均成績、標(biāo)準(zhǔn)差, 并保存計(jì)算結(jié)果到SPSS數(shù)據(jù)文件。 第四章 SPSS的基本統(tǒng)計(jì)分析 基本統(tǒng)計(jì)分析
30、 頻數(shù)分析 計(jì)算基本描述統(tǒng)計(jì)量(分布特征測度) 圖形分析工具 列聯(lián)分析 頻數(shù)分析 目的 粗略把握變量值的分布狀況。 例:研究被調(diào)查者的特征(如:性別、年齡、收入) 研究被調(diào)查者對某個問題的總體看法(如:教學(xué)方式、選修課程) 研究被調(diào)查者某方面的狀態(tài)(如:購買家電的類型、居民月支出狀況) 采用的方法 計(jì)算頻分布表:包括計(jì)算頻數(shù)、百分比、累計(jì)百分比 繪制統(tǒng)計(jì)圖形:條形圖、餅圖 頻數(shù)分析 基本操作步驟 (1)菜單選項(xiàng):analyze-descriptive statistics-frequencies (2)選擇幾個待分析的變量到variables框. (3)chart選項(xiàng),選擇所需要的圖形 頻數(shù)分
31、析 應(yīng)用舉例 儲戶的職業(yè)分析 特點(diǎn):定類數(shù)據(jù) 頻數(shù)分布表輸出按頻數(shù)升降序輸出 儲戶收入水平分析 特點(diǎn):定序數(shù)據(jù) 除使用頻數(shù)、百分比、總數(shù)外,還可以充分使用 累計(jì)百分比 頻數(shù)分析 頻數(shù)分析中的其他分析 計(jì)算分位數(shù):適用于定距數(shù)據(jù) 數(shù)據(jù)按升序排序后,找到若干個分位點(diǎn)上的變量值 quartiles:計(jì)算四分位數(shù)25%(QL)、50%(中位數(shù))、75%(QU) cut points for n equal groups:n等份 percentile:自定義百分位點(diǎn) 分位數(shù)的應(yīng)用 在排除極端值影響的條件下,通過計(jì)算分位數(shù)差,比較兩 組樣本數(shù)據(jù)的離散程度 例: ( QL=50,QU=80) 和 (QL=7
32、0,QU=75) 的比 較 分位數(shù)、中位數(shù)、眾數(shù)的應(yīng)用舉例 不同戶口所在地的儲戶取款金額比較 利用分位數(shù)(不顯示頻數(shù)分析表) 計(jì)算描述統(tǒng)計(jì)量 目的 精確把握變量的總體分布狀況,了解數(shù)據(jù)的集中趨 勢、離散趨勢、對稱程度、陡峭程度。 基本方法 計(jì)算基本描述統(tǒng)計(jì)量 計(jì)算描述統(tǒng)計(jì)量 描述集中趨勢的統(tǒng)計(jì)量 均值(mean):表示某變量所有變量值集中趨勢或平均水平的統(tǒng)計(jì)量。 適用于定距數(shù)據(jù)。 特點(diǎn):利用了全部數(shù)據(jù),易受極端值的影響。 描述離散程度的統(tǒng)計(jì)量 標(biāo)準(zhǔn)差(standard deviation-Std Dev):表示某變量的所有變量值離散程度的 統(tǒng)計(jì)量。 SPSS中計(jì)算的是樣本標(biāo)準(zhǔn)差。 方差(var
33、iance):標(biāo)準(zhǔn)差的平方。 SPSS中計(jì)算的是樣本方差。 極差 (range):最大值(maximum)最小值(minimum) 計(jì)算描述統(tǒng)計(jì)量 描述對稱程度的統(tǒng)計(jì)量 偏度(skewness):描述某變量分布形態(tài)的偏斜程度和 方向的統(tǒng)計(jì)量. 偏度為0表示對稱; 大于0表示正偏差大(右偏),頻數(shù)最大的值比均值小,極值大 于均值; 小于0表示負(fù)偏差大(左偏) 計(jì)算描述統(tǒng)計(jì)量 描述陡峭程度的統(tǒng)計(jì)量 峰度(kurtosis):描述某變量所有變量值分布形態(tài)陡緩 程度的統(tǒng)計(jì)量。 峭度為0表示與標(biāo)準(zhǔn)正態(tài)分布峭度相同。 大于0表示比標(biāo)準(zhǔn)正態(tài)分布陡,尖峰。 小于0表示比標(biāo)準(zhǔn)正態(tài)分布緩;平峰。 計(jì)算描述統(tǒng)計(jì)量
34、其他統(tǒng)計(jì)量 標(biāo)準(zhǔn)誤差(standard error S.E):抽樣分布中的標(biāo)準(zhǔn)差, 反映樣本誤差。 均值標(biāo)準(zhǔn)誤差(means of S.E) 中心極限定理認(rèn)為:樣本均值N(u,2/n) 反映樣本均值與總體真值間的平均離散程度 樣本數(shù)越大,樣本均值的離散程度越小,對真值的估計(jì)越 準(zhǔn)確 計(jì)算描述統(tǒng)計(jì)量 基本操作步驟 (1)菜單選項(xiàng):analyze-descriptive statistics-descripive (2)選擇將參加計(jì)算的數(shù)值型數(shù)值型變量名到variables框。 分析比較不同戶口所在地儲戶取款情況 比較集中趨勢 比較離散趨勢 比較偏斜程度 比較陡峭程度 實(shí)現(xiàn)方式:數(shù)據(jù)拆分 其他功能
35、 數(shù)據(jù)標(biāo)準(zhǔn)化處理 新變量的均值為0,標(biāo)準(zhǔn)差為1; 小于0表示在平均水平下,大于0反之. 正態(tài)分布的數(shù)據(jù)標(biāo)準(zhǔn)化后呈標(biāo)準(zhǔn)正態(tài)分布(68.2%, 95.4%,99.7%) save standardized values as variables選項(xiàng) 將變量作標(biāo)準(zhǔn)化后,結(jié)果存入名為“Z+原變量名”的新變 量中. 數(shù)據(jù)標(biāo)準(zhǔn)化處理應(yīng)用舉例 你能以較簡便的方法快速找到取款數(shù)目出眾的儲戶嗎? SDxxz ii / )( 計(jì)算描述統(tǒng)計(jì)量 基本統(tǒng)計(jì)分析的圖形工具 以制作條形圖為例 繪制簡單條圖(單式條圖) 繪制復(fù)式條圖 繪制堆積條圖(分段條圖) 定義統(tǒng)計(jì)圖中數(shù)據(jù)的表達(dá)類型: 同一變量若干條記錄的分組匯總 條圖反
36、映了不同變量的匯總 條圖反映了個體觀察值 戶口所在地 邊遠(yuǎn)郊區(qū)中心城市 Count 220 200 180 160 140 120 100 80 60 以制作條形圖為例 第一種模式下的三種圖形第一種模式下的三種圖形:用于某變量在各分類情況的比較用于某變量在各分類情況的比較 基本統(tǒng)計(jì)分析的圖形工具 戶口所在地 邊遠(yuǎn)郊區(qū)中心城市 Count 140 120 100 80 60 40 20 0 收入水平 1000元以下 10003000元 30005000元 1500元以上 戶口所在地 邊遠(yuǎn)郊區(qū)中心城市 Count 300 200 100 0 收入水平 1500元以上 30005000元 10003
37、000元 1000元以下 以制作條形圖為例 第二種模式下的三種圖形第二種模式下的三種圖形:用于若干變量的統(tǒng)計(jì)量的比較用于若干變量的統(tǒng)計(jì)量的比較 未來收入情況收入情況 N 2 62 60 58 56 54 52 50 48 46 基本統(tǒng)計(jì)分析的圖形工具 戶口所在地 邊遠(yuǎn)郊區(qū)中心城市 N 2 50 40 30 20 10 0 收入情況 未來收入情況 戶口所在地 邊遠(yuǎn)郊區(qū)中心城市 N descriptive statistics- crosstabs (2)選擇一個變量作為行變量到row框. (3)選擇一個變量作為列變量到column框. (4)可選一個或多個變量作為控制變量到layer框. 控制變
38、量的層次設(shè)置:同層為水平數(shù)加水平數(shù)加;不同層為水平數(shù)積水平數(shù)積. (5)是否顯示各分組的棒圖(display clustered bar charts ) 產(chǎn)生交叉列聯(lián)表 應(yīng)用舉例 戶口與收入水平有關(guān)聯(lián)嗎嗎? 行變量:戶口;列變量:月收入 不同戶口不同收入水平的儲戶對物價(jià)水平的看法一致 嗎? 行變量:收入水平; 列變量:物價(jià)水平; 控制變量:戶口 產(chǎn)生交叉列聯(lián)表 應(yīng)用舉例 不同戶口不同收入 水平的儲戶對物價(jià) 水平水平的看法一 致嗎? 產(chǎn)生交叉列聯(lián)表 進(jìn)一步計(jì)算 cells選項(xiàng):選擇在頻數(shù)分析表中輸出各種百分比. row:行百分比(Row pct); column:列百分比(Col pct);
39、total:總百分比(Tot pct); 分析列聯(lián)表中變量間的關(guān)系 目的: 通過列聯(lián)表分析,檢驗(yàn)行列變量之間是否獨(dú)立。 方法: 卡方檢驗(yàn):對品質(zhì)數(shù)據(jù)的相關(guān)性進(jìn)行度量 分析列聯(lián)表中變量間的關(guān)系 卡方檢驗(yàn) 年齡與工資收入交叉列聯(lián)表 低 中 高 青 400 00 中 0 5000 老 0 0600 低 中 高 青 0 0500 中 0 6000 老 400 00 分析列聯(lián)表中變量間的關(guān)系 卡方檢驗(yàn)基本步驟 (1)H0:行列變量之間無關(guān)聯(lián)或相互獨(dú)立 (2)構(gòu)造卡方統(tǒng)計(jì)量 統(tǒng)計(jì)量服從(r-1)*(c-1)個自由度的卡方分布 count:觀察(實(shí)際)頻數(shù) expected count:期望頻數(shù) (期望頻數(shù)
40、反映的是H0成立情況下的數(shù)據(jù)分布特 征) Residual:剩余 (觀察頻數(shù)-期望頻數(shù)) e eo f ff 2 2 )( 分析列聯(lián)表中變量間的關(guān)系 卡方檢驗(yàn)基本步驟 (3)計(jì)算卡方統(tǒng)計(jì)量的值,并得到該統(tǒng)計(jì)量值的概率P 值 (4)決策。概率P與顯著性水平比較,小于等于則拒絕 H0,否則不能拒絕 實(shí)現(xiàn)步驟 statistics選項(xiàng) cells選項(xiàng) 分析列聯(lián)表中變量間的關(guān)系 應(yīng)用舉例 戶口對平均收入水平的分布會產(chǎn)生影響嗎? 獨(dú)立性檢驗(yàn):從一個總體中隨機(jī)抽樣。按某兩個屬性變量 將樣本進(jìn)行分類 不同行業(yè)人對的自己職業(yè)的選擇標(biāo)準(zhǔn)是否存在差異? 一致性檢驗(yàn):從兩個總體中獨(dú)立抽樣,根據(jù)一個屬性變量 將樣本進(jìn)
41、行分類。 制造業(yè) 服務(wù)業(yè) 物質(zhì)報(bào)酬 105 45 穩(wěn)定性 40 35 分析列聯(lián)表中變量間的關(guān)系 卡方檢驗(yàn)的要求: 一般要求列聯(lián)表中期望頻數(shù)小于5的格子數(shù)不超過 20%,否則會夸大卡方值,容易得出拒絕結(jié)論,可 以合并單元格。 卡方值會受樣本數(shù)的影響 分析列聯(lián)表中變量間的關(guān)系 行列變量相關(guān)性的其他測度指標(biāo) phi系數(shù):適用于22列聯(lián)表 當(dāng)行列變量獨(dú)立時(shí): 有: 當(dāng)行列變量完全相關(guān)時(shí): 有: 越接近于1,相關(guān)性越強(qiáng)。越接近0,相關(guān)性越弱 2 12 1 11 C A C A 2121 21122211 2 CCRR AAAA n 0 2211 AA 1 分析列聯(lián)表中變量間的關(guān)系 行列變量相關(guān)性的其他測
42、度指標(biāo) 列聯(lián)C系數(shù)(contingency coefficient), 通常為0,1),取值受到行 列數(shù)的影響(見EXCEL) V系數(shù) 0,1 值越大表示行列變量的相關(guān)性越大 n C 2 2 )1(),1min( 2 crn V 多選項(xiàng)分析 多選項(xiàng)分析的基本思路 定義多選項(xiàng)變量集 多選項(xiàng)頻數(shù)分析 多選項(xiàng)交叉分組下的頻數(shù)分析 多選項(xiàng)分析 定義多選項(xiàng)變量集 目的:將已分解的變量定義為一個集合,便于進(jìn)行多選 項(xiàng)分析 菜單選項(xiàng):analyze-multiple response-define sets 從原變量中選取被分解的變量(數(shù)值型)到variables in sets框 指定被分解的變量是按多選
43、項(xiàng)二分法(dichotomize) 分解還是按多選項(xiàng)分類法(categories)分解的 為變量集命名。系統(tǒng)自動在名字前加字符$. 多選項(xiàng)分析 多選項(xiàng)頻數(shù)分析 菜單選項(xiàng):analyze-multiple response-frequencies 多選項(xiàng)交叉分析下的頻數(shù)分析 菜單選項(xiàng):analyze-multiple response-crosstabs 多選項(xiàng)分析 多選項(xiàng)分析實(shí)例 分析居民的儲蓄目的 采用多選項(xiàng)分類法組織數(shù)據(jù) 在某次市場調(diào)查中收集了北京、上海和廣州三個城 市的受訪者對幾種常見飲料的喜好情況,可選的飲 料有茶、牛奶、咖啡、果汁、礦泉水。(數(shù)據(jù)是從 原始數(shù)據(jù)庫中抽出的一小部分資料)
44、,作以下分析: 采用二分法組織數(shù)據(jù) 受訪人群中最受歡迎的飲料是哪種? 男、女喜愛的飲料有無差異? 三個城市的人群對飲料的喜好有無差異? 作業(yè) 根據(jù)第三章的關(guān)于學(xué)生成績的合并后的 SPSS數(shù)據(jù)文件做以下處理: 對各門課程分組后,做頻數(shù)分析, 繪制某兩門課程成績的直方圖 繪制男女生構(gòu)成的餅圖 分別計(jì)算男女生各門成績的基本描述統(tǒng)計(jì)量, 并對數(shù)據(jù)的集中趨勢、離散程度和偏度加以 比較(數(shù)字和圖形的對比) 第五章 SPSS參數(shù)檢驗(yàn) 假設(shè)檢驗(yàn)概述 假設(shè)檢驗(yàn)是一種根據(jù)樣本數(shù)據(jù)來推斷總體的 分布或均值、方差等總體統(tǒng)計(jì)參數(shù)的方法。 根據(jù)樣本來推斷總體的原因: 總體數(shù)據(jù)不可能全部收集到。如:質(zhì)量檢測問 題 收集到總
45、體全部數(shù)據(jù)要耗費(fèi)大量的人力和財(cái)力 假設(shè)檢驗(yàn)包括: 參數(shù)檢驗(yàn) 非參數(shù)檢驗(yàn) 假設(shè)檢驗(yàn)的基本原理 基本信念:利用小概率原理進(jìn)行反證明。小概 率事件在一次實(shí)驗(yàn)中不可能發(fā)生。 例如:對人民大學(xué)男生平均身高進(jìn)行推斷 H0:平均身高為173 樣本平均身高為178,由于存在抽樣誤差,不能直接拒絕H0。 而需要考慮:在H0成立的條件下,一次抽樣得到平均身高為 178的可能性有多大。如果可能性較大,是個大概率事件(與 相比較),則不能認(rèn)為H0不正確。否則,如果可能性較小, 是個小概率事件,但確實(shí)發(fā)生了,則只能認(rèn)為H0不正確。 概率P值即為觀測結(jié)果或更極端現(xiàn)象在零假設(shè)成立時(shí)出現(xiàn)的概 率 假設(shè)檢驗(yàn)的基本步驟 (1)根
46、據(jù)檢驗(yàn)的目標(biāo),對待推斷的總體參數(shù)或分布作 一個基本假設(shè)H0 (2)構(gòu)造檢驗(yàn)統(tǒng)計(jì)量,且該統(tǒng)計(jì)量服從某種已知分布. (3)利用收集到的樣本數(shù)據(jù)和基本假設(shè)計(jì)算檢驗(yàn)統(tǒng)計(jì) 量的值,并得到相應(yīng)的相伴概率P值,即:檢驗(yàn)統(tǒng)計(jì) 量在某個特定的極端區(qū)域取值在H0成立時(shí)的概率. (4)如果概率P值小于用戶給定的顯著性水平a,則拒 絕H0 .否則,不拒絕H0 . SPSS中的參數(shù)檢驗(yàn)方法 單樣本t檢驗(yàn) 兩獨(dú)立樣本t檢驗(yàn) 兩配對樣本t檢驗(yàn) SPSS單樣本t檢驗(yàn) (一)含義: 檢驗(yàn)?zāi)匙兞康目傮w均值與指定的檢驗(yàn)值之間是 否存在顯著差異。 例如:周歲兒童的平均身高是否為75厘米 (二)要求: 樣本來自的總體服從正態(tài)分布 為什
47、 么? SPSS單樣本t檢驗(yàn) (三)基本思路: H0:u=u0,總體均值與檢驗(yàn)值之間不存在顯著差異. 構(gòu)造檢驗(yàn)統(tǒng)計(jì)量.從樣本均值的分布出發(fā),即:N(u0, 2/n).于 是: 總體方差未知時(shí)構(gòu)造t統(tǒng)計(jì)量 D=X- u0 t統(tǒng)計(jì)量服從n-1個自由度的t分布 計(jì)算t統(tǒng)計(jì)量和對應(yīng)的相伴概率P(絕對值大于等于的雙側(cè)概 率) 結(jié)論:P,則拒絕H0,認(rèn)為總體均值與檢驗(yàn)值之間有顯著差 異.P ,不能拒絕H0. nS D t / SPSS單樣本t檢驗(yàn) (四)基本操作步驟 (1).菜單選項(xiàng): Analyze-compare means-one-samples T test (2).指定檢驗(yàn)值: 在test后的框
48、中輸入檢驗(yàn)值 SPSS單樣本t檢驗(yàn) (五)option選項(xiàng) confidence interval:指定輸出0的置信區(qū)間.默認(rèn)值為 95%. Missing values: 缺失值的處理(單樣本檢驗(yàn)時(shí)以下選項(xiàng)沒 有差別) exclude cases analysis by analysis:當(dāng)分析時(shí)涉及到有 缺失值變量時(shí)再剔除相應(yīng)的個案 exclude cases listwise:剔除所有含缺失值的個案后再 分析 SPSS單樣本t檢驗(yàn) (六)應(yīng)用舉例 周歲兒童的平均身高為75厘米嗎? 根據(jù)以前的大量調(diào)查,已知顧客對某產(chǎn)品的 滿意度評分在72分左右,現(xiàn)該產(chǎn)品進(jìn)行了重 新包裝,收集了一批顧客的滿
49、意度評分,現(xiàn) 在的評價(jià)是否顯著高于以前? SPSS兩獨(dú)立樣本t檢驗(yàn) (一)含義: 根據(jù)兩獨(dú)立樣本的數(shù)據(jù),對兩總體均值是否有顯著差異 進(jìn)行推斷。 例如:男生和女生的計(jì)算機(jī)平均成績有顯著差異嗎? (二)要求: 兩樣本必須相互獨(dú)立,即:抽取其中一批樣本對抽取另一 批樣本沒有任何影響.(如:北京周歲兒童與上海兒童的平均身 高) 兩總體服從正態(tài)分布為什 么? SPSS兩獨(dú)立樣本t檢驗(yàn) (三)基本思路: H0:u1-u2=0,兩總體均值無顯著差異. 構(gòu)造檢驗(yàn)統(tǒng)計(jì)量.從兩樣本均值差的分布出發(fā), 即:N(u1-u2, 2x1-x2).于是兩總體均方差未知時(shí)構(gòu)造t統(tǒng) 計(jì)量: 兩總體均值差的抽樣分布標(biāo)準(zhǔn)差: 方差
50、相等:用合并方差 方差不等: 計(jì)算t統(tǒng)計(jì)量和對應(yīng)的相伴概率P (絕對值大于等于該值的雙側(cè)概率) )2( / 21 2 2 1 2 21 nnt nSpnSp xx t )( / )( 2 2 21 2 1 21 ft nSnS xx t 1 )( 1 )( )( 2 2 2 2 2 1 2 1 2 1 2 2 2 2 1 2 1 n n S n n S n S n S f SPSS兩獨(dú)立樣本t檢驗(yàn) (三)基本思路: 結(jié)論: 方差齊性F檢驗(yàn) 利用Levene F檢驗(yàn)確定兩總體方差是否齊性.H0:兩總 體方差無顯著差異. 該檢驗(yàn)首先計(jì)算每個個案與所屬組均值之差并取絕 對值.然后對其進(jìn)行單因素方差分
51、析. SPSS兩獨(dú)立樣本t檢驗(yàn) (三)基本思路: 結(jié)論: 首先,如果F檢驗(yàn)的P,則拒絕F檢驗(yàn)的H0,認(rèn)為方差不齊性; 其次看Unequal行的t檢驗(yàn)概率.如果,則拒絕t檢驗(yàn)的H0, 認(rèn)為兩總體均值有顯著差異;如果,則不拒絕t檢驗(yàn)的H0. 首先,如果F檢驗(yàn)的P ,則不能拒絕F檢驗(yàn)的H0,認(rèn)為方差 齊性;其次看equal行的t檢驗(yàn)概率.其余同上 SPSS兩獨(dú)立樣本t檢驗(yàn) (四)基本操作步驟 (1).菜單選項(xiàng):analyze-compare means-independent- samples T (2).選擇若干變量作為檢驗(yàn)變量到test variables框 (3).選擇代表不同總體的變量作為分
52、組變量到grouping variable 框 (4).定義分組變量的分組情況Define Groups.: use specified values:定義分組變量的分組標(biāo)志值分別是什么 cut point:分組變量為連續(xù)變量.輸入一個數(shù)字,將大于等于該值 的分成一組,小于該值的分成另一組. SPSS兩獨(dú)立樣本t檢驗(yàn) 應(yīng)用舉例 上海周歲兒童的平均身高與北京周歲兒童的 平均身高有顯著差異嗎? 某商場為某種產(chǎn)品進(jìn)行了促銷活動,請比較 前后數(shù)日的銷售額,以確認(rèn)促銷活動對銷量 有無作用。 A、B兩種減肥產(chǎn)品的作用有明顯差異嗎? 隨機(jī)選了200名肥胖者服用A種減肥產(chǎn)品,其中: 92人體重明顯減輕了;另隨
53、機(jī)選了183名肥胖者 服用B減肥產(chǎn)品,其中:161人體重明顯減輕了。 SPSS兩配對樣本t檢驗(yàn) (一) 含義: 根據(jù)配對樣本對兩總體均值是否有顯著差異進(jìn) 行推斷. 例如: 某種減肥茶是否有效 (二)要求: 兩樣本數(shù)據(jù)必須兩兩配對,即:樣本個數(shù)相同,個 案順序相同.如:減肥茶的效果、不同廣告形式 對銷售額的影響.(控制了個案自身的影響) 兩總體服從正態(tài)分布 SPSS兩配對樣本t檢驗(yàn) (三)基本思路 H0:兩總體均值無顯著差異,差值序列的均值u0 =0. 構(gòu)造統(tǒng)計(jì)量:同單樣本均值檢驗(yàn) D=X- u0 S為差值序列的標(biāo)準(zhǔn)差 實(shí)質(zhì)是先求出每對測量值的差值;然后檢驗(yàn)差值序列 的均值是否與0有顯著差異.
54、如果差值的均值與0有顯著差異,則認(rèn)為兩總體均值 存在顯著差異;否則,與0無顯著差異,則認(rèn)為兩總體均 值不存在顯著差異. nS D t / SPSS兩配對樣本t檢驗(yàn) (三)基本思路 計(jì)算t統(tǒng)計(jì)量和對應(yīng)的相伴概率P(絕對值大于等于的雙 側(cè)概率) 結(jié)論:P,則拒絕H0,認(rèn)為兩總體均值有顯著差異.P , 不能拒絕H0. SPSS兩配對樣本t檢驗(yàn) (四)基本操作步驟 (1).菜單選項(xiàng): analyze-compare means-paired-samples T (2).選擇一對或若干對配對變量作為檢測變量到paired variables框. (3)option選項(xiàng) 同獨(dú)立樣本的T檢驗(yàn) SPSS兩配對
55、樣本t檢驗(yàn) 應(yīng)用舉例 某種減肥茶真起到減肥作用了嗎? 對促銷人員培訓(xùn)前和培訓(xùn)后銷售額的比較, 以確認(rèn)業(yè)務(wù)培訓(xùn)有無效果。 作業(yè) 一、給幼鼠以不同的飼料,研究每天鈣的留存量是否有顯著不 同。以下兩種方法涉及實(shí)驗(yàn)樣本: 方式1:同一鼠喂不同的飼料 鼠號 1 2 3 4 5 6 7 8 9 飼料1 33.1 33.1 26.8 36.3 39.5 30.9 33.4 31.5 28.6 飼料2 36.7 28.8 35.1 35.2 43.8 25.7 36.5 37.9 28.7 方式2:甲組12只喂飼料1,乙組9只喂飼料2 甲組:29.7 26.7 28.9 31.1 31.1 26.8 26.3
56、 39.5 30.9 33.4 33.1 28.6 乙組:28.7 28.3 29.3 32.2 31.1 30.0 36.2 36.8 30.0 二、根據(jù)學(xué)生成績數(shù)據(jù),分析: 是否有男女生平均成績存在明顯差異的課程 判斷學(xué)生在哪些課程上的平均成績差別不明顯 第六章 方差分析 方差分析概述 一、問題的提出 最優(yōu)方案的設(shè)計(jì) l如何獲得最佳的產(chǎn)品銷售量 l哪些因素是影響銷售量的主要因素 l哪些因素的那種情況更利于提高銷售量 l哪些因素的組合更利于提高銷售量 l可以利用方差分析的方法來實(shí)現(xiàn) 方差分析概述 二、方差分析 目的:方差分析從分析數(shù)據(jù)的差異入手,分析哪 些因素是影響數(shù)據(jù)差異的眾多因素中的主要
57、因素. 相關(guān)概念: (1)觀測變量:作為觀測的對象(如:畝產(chǎn)量、推銷量等). (2)控制因素:人為可以控制的因素(如:施肥量、品種、推 銷策略、價(jià)格、包裝方式等),在方差分析中稱為控制 因素.將控制變量的不同情況稱為控制變量的不同水平. (3)隨機(jī)因素:人為很難控制的因素(如:氣候、推銷人員的 形象、抽樣誤差等),方差分析中主要指抽樣誤差。 方差分析概述 三、核心問題 從數(shù)據(jù)差異角度看: 觀測變量的數(shù)據(jù)差異=控制因素造成+隨機(jī)因素造成 當(dāng)控制因素對實(shí)驗(yàn)結(jié)果有顯著影響時(shí),和隨機(jī)因素共同作 用必然使觀測變量產(chǎn)生顯著變動;反之,觀測變量的變動較 小,將歸結(jié)為隨機(jī)性造成的(這里指抽樣誤差造成的). 方
58、差分析概述 四、方差分析的類型 單因素方差分析: 只考慮一個控制因素的影響 多因素方差分析: 考慮兩個以上的控制因素和它們的交互作用 對觀測變量的影響 協(xié)方差分析: 在盡量排除其他因素的影響下,分析單個或 多個控制因素對觀測變量的影響.(引入?yún)f(xié)變量) 單因素方差分析 (一)目的 檢驗(yàn)?zāi)骋粋€一個控制因素的改變是否會給觀察變量 帶來顯著影響. 例如:應(yīng)用面很廣(科學(xué)試驗(yàn),社會經(jīng)濟(jì)問題) 考察不同肥料對某農(nóng)作物畝產(chǎn)量是否有顯著差異. 考察不同溫度下某化工產(chǎn)品的獲得率 考察婦女生育率在不同地區(qū)是否有顯著差異. 考察不同學(xué)歷是否對工資收入產(chǎn)生顯著影響. 單因素方差分析 (二)基本思路 (1)入手點(diǎn): 檢
59、驗(yàn)控制變量的不同水平下,各總體的分布是否存 在顯著差異,進(jìn)而判斷控制變量是否對觀測變量產(chǎn) 生了顯著影響. (2)前提: 各組樣本獨(dú)立 不同水平下各總體服從方差相等方差相等的正態(tài)分布正態(tài)分布. (3) H0:不同水平下,各總體均值無顯著差異.即:不同水平下 控制因素的影響不顯著. 通過參數(shù)檢驗(yàn)可以解決兩兩總體均值的比較 多個總體均值的檢驗(yàn)如何作?(如:北京、上海、廣州周歲兒童平均身 高的比較) 可以多次采用兩樣本t檢驗(yàn)方法實(shí)現(xiàn) 產(chǎn)生的問題:犯第一類錯誤的概率明顯增大 例如:K個變量兩兩進(jìn)行t檢驗(yàn),需要作N=k! (2! (k-2)!)次,如果為 0.05,那么每次不犯錯的概率為0.95。N次檢驗(yàn)
60、均不犯錯的概率為 0.95N,而犯錯的概率為1-0.95N,遠(yuǎn)遠(yuǎn)大于設(shè)定的0.05 可以利用方差分析的方法來實(shí)現(xiàn)多個總體的均值比較 單因素方差分析 單因素方差分析 (二)基本思路 (4) 構(gòu)造F統(tǒng)計(jì)量 因?yàn)?總變差=組間差異+組內(nèi)差異 可證明:SST= SSA+SSE(設(shè):k個水平,每個水平有ni 個數(shù)據(jù)) 考察平均的組間差異與平均的組內(nèi)差異的比值,于是: k i ii xxnSSA 1 2 )( k ii nj j iij xxSSE 1 2 )( MSE MSA knSSE kSSA F )/( ) 1/( k i nj j ij xxSST 11 2 )( F(k-1,n-k) 單因素方
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 【正版授權(quán)】 ISO/IEC 27562:2024 EN Information technology - Security techniques - Privacy guidelines for fintech services
- 知識產(chǎn)權(quán)和保密合同協(xié)議書
- 多維遙感技術(shù)應(yīng)用合作協(xié)議
- 企業(yè)文化與品牌形象塑造合同
- 物流公司聘用駕駛員勞動合同
- 雙方協(xié)商培育樹苗合同書
- 挖機(jī)買賣合同書樣本
- 場食品安全協(xié)議書
- 招投標(biāo)合作代理協(xié)議
- 資源租賃合同
- 2025年度劇本殺劇本版權(quán)授權(quán)與收益分成合同
- 2025年春季學(xué)期學(xué)校工作計(jì)劃及安排表
- 2025年一種板式過濾膜裝置項(xiàng)目投資可行性研究分析報(bào)告
- BMS基礎(chǔ)知識培訓(xùn)
- 水刀除銹施工方案
- 醫(yī)院培訓(xùn)課件:《靜脈采血法并發(fā)癥的預(yù)防及處理》
- 《修繕學(xué)習(xí)交底資料》課件
- 2024-2025學(xué)年高二上學(xué)期期末復(fù)習(xí)解答題壓軸題十七大題型專練(范圍:第四、五章)(含答案)
- 筑牢安全防線共創(chuàng)平安校園
- 2024年大學(xué)生電子版三方協(xié)議書模板
- 2024初中數(shù)學(xué)課程標(biāo)準(zhǔn)測試題(含答案)精華版
評論
0/150
提交評論