




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、SPSS數(shù)據(jù)分析高級(jí)應(yīng)用培訓(xùn)班培訓(xùn)資料(僅供培訓(xùn)使用)目 錄第1講 統(tǒng)計(jì)工具與SPSS軟件11.1 統(tǒng)計(jì)工具含義11.2 統(tǒng)計(jì)工具作用11.3運(yùn)用統(tǒng)計(jì)工具注意事項(xiàng)11.4 統(tǒng)計(jì)工具與SPSS軟件關(guān)系1第2講 SPSS入門(mén)22.1 SPSS歷史沿革22.2 SPSS基本界面22.3 常規(guī)功能設(shè)置32.3 數(shù)據(jù)變量(詳細(xì)介紹在課堂上演示)32.3.1 計(jì)量尺度32.3.2 常量與變量32.3.3 變量標(biāo)簽32.3.4 變量缺失值4第3講 數(shù)據(jù)采集與整理53.1數(shù)據(jù)編輯器簡(jiǎn)介53.2 數(shù)據(jù)文件的建立53.3 數(shù)據(jù)的編輯53.3.1 查看數(shù)據(jù)信息53.3.2 數(shù)據(jù)定位53.3.3 插入與刪除變量和觀測(cè)
2、量53.3.4 實(shí)用數(shù)據(jù)文件操作63.4 單選題、多選題與開(kāi)放題的數(shù)據(jù)錄入,檢查異常值83.5 SPSS函數(shù)10第4講 描述性統(tǒng)計(jì)分析134.1 常用統(tǒng)計(jì)量134.1.1 描述集中趨勢(shì)的統(tǒng)計(jì)量(將融合在后續(xù)演示中)134.1.2 描述離散程度的統(tǒng)計(jì)量(將融合在后續(xù)演示中)134.1.3 描述分布形態(tài)的統(tǒng)計(jì)量(將融合在后續(xù)演示中)134.2 常用統(tǒng)計(jì)表134.2.1 在線處理分析報(bào)告(OLPA)134.2.2 個(gè)案摘要報(bào)告144.2.3 行形式摘要報(bào)告和列形式摘要報(bào)告(略,學(xué)員可獨(dú)立學(xué)習(xí))144.3 頻數(shù)分析144.4 描述性分析154.5 探索性分析164.6 常用統(tǒng)計(jì)圖(課堂現(xiàn)場(chǎng)演示)16第
3、5講 一般推斷性統(tǒng)計(jì)分析175.1 統(tǒng)計(jì)推斷理論(課堂現(xiàn)場(chǎng)講授)175.2 均值比較175.2.1 均值過(guò)程175.2.2 單樣本t檢驗(yàn)185.2.3獨(dú)立樣本t檢驗(yàn)195.2.4配對(duì)樣本t檢驗(yàn)205.3 相關(guān)分析225.3.1 簡(jiǎn)單相關(guān)分析225.3.2 偏相關(guān)分析235.3.3 距離分析255.4 回歸分析275.4.1 線性回歸分析285.4.2 曲線回歸分析295.4.3 非線性回歸分析315.5 方差分析325.5.1 單因素方差分析325.5.2 多因素方差分析355.5.3重復(fù)測(cè)量方差分析375.5.4 協(xié)方差分析39第6講 多元統(tǒng)計(jì)分析426.1 聚類(lèi)分析426.1.1 理論背景
4、426.1.2距離和相似系數(shù)426.1.4 K-Means聚類(lèi)466.1.5 分層聚類(lèi)476.3 判別分析486.3 因子分析546.3.1 基本概念546.3.2 基本步驟546.3.3 實(shí)例演示556.4 主成分分析576.4.1 基本概念576.4.2 基本步驟576.4.3 實(shí)例演示59第7講 定性數(shù)據(jù)分析607.1 列聯(lián)表607.1.1 基本概念607.1.2 實(shí)例演示617.2 Logistic回歸627.2.1 基本概念627.2.2 實(shí)例演示63第8講 時(shí)間序列分析658.1 組成要素658.2 ARMA模型658.2.1 ARMA模型及基本原理658.2.2 ARMA模型的基
5、本形式658.3 實(shí)例演示66第9講 其他統(tǒng)計(jì)分析679.1信度分析679.1.1 基本分類(lèi)679.1.2 實(shí)例演示679.2生存分析689.2.1 生存分析的目的689.2.2 生存數(shù)據(jù)699.2.3 生存時(shí)間函數(shù)699.2.4 生存分析的基本方法709.2.5 實(shí)例演示71第10講 綜合案例分析7610.1 案例背景7610.2 RFM模型簡(jiǎn)介7610.3 實(shí)例演示(課堂演示)77第11講 SPSS編程簡(jiǎn)介7811.1 程序編輯窗口操作入門(mén)7811.1.1 Syntax 與 UI7811.1.2 生成和運(yùn)行syntax7911.2 syntax 基本規(guī)則7911.2.1 syntax簡(jiǎn)介7
6、911.2.2 命令分類(lèi)8211.3 結(jié)構(gòu)化語(yǔ)句8411.3.1 分支語(yǔ)句(條件語(yǔ)句)8411.3.2 循環(huán)語(yǔ)句8411.4 實(shí)例演示85第1講 統(tǒng)計(jì)工具與SPSS軟件1.1 統(tǒng)計(jì)工具含義統(tǒng)計(jì)學(xué)是通過(guò)搜索、整理、分析數(shù)據(jù)等手段,以達(dá)到推斷所測(cè)對(duì)象的本質(zhì),甚至預(yù)測(cè)對(duì)象未來(lái)的一門(mén)綜合性科學(xué)。其中用到了大量的數(shù)學(xué)及其它學(xué)科的專(zhuān)業(yè)知識(shí),它的使用范圍幾乎覆蓋了社會(huì)科學(xué)和自然科學(xué)的各個(gè)領(lǐng)域。統(tǒng)計(jì)工具是實(shí)現(xiàn)上述過(guò)程的手段與方法,包括理論方法與計(jì)算軟件。1.2 統(tǒng)計(jì)工具作用在古代,治國(guó)安天下多數(shù)通過(guò)邏輯分析和簡(jiǎn)單計(jì)算就能滿足,在現(xiàn)今社會(huì),單純靠邏輯分析和推斷無(wú)法滿足實(shí)際需要,人們往往需求的是隱藏在表面之后的規(guī)
7、律,需要借助統(tǒng)計(jì)工具加以實(shí)現(xiàn),比如:利用C-D生產(chǎn)函數(shù)來(lái)判斷國(guó)家的GDP中,多大程度受固定資產(chǎn)影響,多大程度受人力資本影響,科技進(jìn)步有多大。諸如此類(lèi)問(wèn)題都需要通過(guò)統(tǒng)計(jì)工具實(shí)現(xiàn),由此,可以得出統(tǒng)計(jì)工具的主要作用就是實(shí)現(xiàn)人們想了解到的、可以了解到的那些潛在的關(guān)系和規(guī)律。1.3運(yùn)用統(tǒng)計(jì)工具注意事項(xiàng)在說(shuō)明統(tǒng)計(jì)工具在使用中需注意問(wèn)題之前,舉個(gè)實(shí)際例子?!纠?.1】有人說(shuō):“統(tǒng)計(jì)方法沒(méi)什么用,我想知道明天幾點(diǎn)幾分下雨,統(tǒng)計(jì)方法根本無(wú)法實(shí)現(xiàn)”。這樣的說(shuō)法正確嗎?分析與解答:該種說(shuō)法錯(cuò)誤,從供給和需求角度進(jìn)行分析。需求方面:實(shí)際生活中,人們期望獲取一具體點(diǎn)值,屬于微觀問(wèn)題供給方面:利用統(tǒng)計(jì)方法得到的點(diǎn)估計(jì)屬于
8、宏觀問(wèn)題,只有在大量重復(fù)情況下才能實(shí)現(xiàn),舉點(diǎn)估計(jì)的評(píng)價(jià)標(biāo)準(zhǔn)為例說(shuō)明(課堂講授)。從供給和需求方面可以看出,統(tǒng)計(jì)工具是在滿足某些約束條件下得出的結(jié)果,具體在統(tǒng)計(jì)工具運(yùn)用中需注意如下事項(xiàng):1、注意統(tǒng)計(jì)工具滿足的基本假定;2、統(tǒng)計(jì)工具計(jì)算的結(jié)果一定存在誤差;3、只要不影響實(shí)際決策的誤差可以認(rèn)為是統(tǒng)計(jì)上允許的誤差;4、統(tǒng)計(jì)結(jié)果往往具有實(shí)際意義,不要為了面子而濫用統(tǒng)計(jì)工具。1.4 統(tǒng)計(jì)工具與SPSS軟件關(guān)系SPSS軟件是一種實(shí)現(xiàn)理論計(jì)算方法,幫助統(tǒng)計(jì)研究者簡(jiǎn)化計(jì)劃,提高工作效率的電腦軟件,通過(guò)該軟件可迅速實(shí)現(xiàn)描述性統(tǒng)計(jì)分析、確定性統(tǒng)計(jì)分析、隨機(jī)統(tǒng)計(jì)分析等。第2講 SPSS入門(mén)2.1 SPSS歷史沿革SP
9、SS是世界上最早的統(tǒng)計(jì)分析軟件,全稱(chēng)為Statistical Package for Social Science,也稱(chēng)社會(huì)科學(xué)統(tǒng)計(jì)軟件。由美國(guó)斯坦福大學(xué)的三位研究生Norman H. Nie、C. Hadlai (Tex) Hull 和 Dale H. Bent于1968年研究開(kāi)發(fā)成功,同時(shí)成立了SPSS公司,并于1975年成立法人組織、在芝加哥組建了SPSS總部。1984年SPSS總部首先推出了世界上第一個(gè)統(tǒng)計(jì)分析軟件微機(jī)版本SPSS/PC+,開(kāi)創(chuàng)了SPSS微機(jī)系列產(chǎn)品的開(kāi)發(fā)方向,極大地?cái)U(kuò)充了它的應(yīng)用范圍,并使其能很快地應(yīng)用于自然科學(xué)、技術(shù)科學(xué)、社會(huì)科學(xué)的各個(gè)領(lǐng)域。世界上許多有影響的報(bào)刊雜
10、志紛紛就SPSS的自動(dòng)統(tǒng)計(jì)繪圖、數(shù)據(jù)的深入分析、使用方便、功能齊全等方面給予了高度的評(píng)價(jià)。隨著應(yīng)用領(lǐng)域的不斷擴(kuò)大,SPSS已經(jīng)有原來(lái)的名字改為Statistics Product and Service Solution,即統(tǒng)計(jì)產(chǎn)品與服務(wù)解決方案。SPSS 15.0.1 - 2006年11月SPSS 16.0.2 - 2008年4月SPSS Statistics 17.0.1 - 2008年12月PASW Statistics 17.0.2 - 2009年3月PASW Statistics 17.0.3 - 2009年11月PASW Statistics 18.0.0 - 2009年8月PAS
11、W Statistics 18.0.1 - 2009年12月PASW Statistics 18.0.2 - 2010年4月PASW Statistics 18.0.3 - 2010年9月IBM SPSS Statistics 19.0 - 2010年8月IBM SPSS Statistics 20.0 - 2011年8月IBM SPSS Statistics 21.0 - 2012年8月IBM SPSS Statistics 22.0 - 2013年8月2.2 SPSS基本界面安裝SPSS22.0之后,第一次啟動(dòng)將出現(xiàn)如下界面。在點(diǎn)擊“取消”可出現(xiàn)以下常規(guī)界面。2.3 常規(guī)功能設(shè)置通過(guò)“編輯
12、”“選項(xiàng)”,獲取如下對(duì)話框?qū)Φ谝恍忻钪鹨稽c(diǎn)開(kāi),會(huì)出現(xiàn)關(guān)于SPSS如阿年常規(guī)功能設(shè)置的所有界面(課堂演示)2.3 數(shù)據(jù)變量(詳細(xì)介紹在課堂上演示)2.3.1 計(jì)量尺度無(wú)論是觀測(cè)數(shù)據(jù)還是試驗(yàn)數(shù)據(jù),都需要度量。統(tǒng)計(jì)數(shù)據(jù)是對(duì)客觀現(xiàn)象進(jìn)行計(jì)量的結(jié)果,按照對(duì)事物的精確程度,可將所采用的計(jì)量尺度有低級(jí)到高級(jí)分為:名義尺度、定序尺度和間隔尺度(又分為定距尺度和定比尺度)2.3.2 常量與變量常量分為數(shù)值型常量、字符型常量、日期型常量變量分為數(shù)值型變量、字符型變量、日期型變量。數(shù)值型變量包括:標(biāo)準(zhǔn)型、逗號(hào)型、圓點(diǎn)型、科學(xué)計(jì)數(shù)法型、美元型和自定義貨幣型。2.3.3 變量標(biāo)簽變量標(biāo)簽是對(duì)變量名進(jìn)一步解釋和說(shuō)明,包
13、括變量名標(biāo)簽和變量值標(biāo)簽。變量名標(biāo)簽是對(duì)變量名含義的進(jìn)一步解釋和說(shuō)明,在SPSS界面中表現(xiàn)為“標(biāo)簽”列。變量值標(biāo)簽是對(duì)數(shù)值型變量各個(gè)取值的含義進(jìn)行解釋和說(shuō)明,尤其是定型數(shù)據(jù),在SPSS界面中表現(xiàn)為“值”列。2.3.4 變量缺失值在調(diào)查問(wèn)卷中,被調(diào)查者沒(méi)有填寫(xiě)調(diào)查表要求填寫(xiě)的某些數(shù)據(jù)或填寫(xiě)的數(shù)據(jù)失真,造成缺失值。這些情況稱(chēng)為數(shù)據(jù)缺失或數(shù)據(jù)不全,缺失或不完全的數(shù)據(jù)在統(tǒng)計(jì)分析中不能使用,需標(biāo)出,在在SPSS界面中表現(xiàn)為“缺失”列。第3講 數(shù)據(jù)采集與整理3.1數(shù)據(jù)編輯器簡(jiǎn)介數(shù)據(jù)編輯器主要由標(biāo)題欄、當(dāng)前數(shù)據(jù)欄、輸入數(shù)據(jù)欄和數(shù)據(jù)顯示區(qū)組成。3.2 數(shù)據(jù)文件的建立建立數(shù)據(jù)文件可通過(guò)如下兩種方式實(shí)現(xiàn):1、“文
14、件”“新建”命令2、在啟動(dòng)SPSS時(shí)選擇“輸入數(shù)據(jù)”選項(xiàng)數(shù)據(jù)錄入方法包括:按單元格輸入數(shù)據(jù)、按變量錄入數(shù)據(jù)、按觀測(cè)量錄入數(shù)據(jù)和輸入帶有變量標(biāo)簽的數(shù)據(jù)。3.3 數(shù)據(jù)的編輯3.3.1 查看數(shù)據(jù)信息1、查看變量信息在數(shù)據(jù)編輯器窗口中切換到“變量視圖”區(qū)域查看變量信息或者執(zhí)行菜單“應(yīng)用程序”“變量”命令2、查看文件信息執(zhí)行菜單“文件”“顯示數(shù)據(jù)文件信息”命令3.3.2 數(shù)據(jù)定位1、按個(gè)案序號(hào)自動(dòng)定位執(zhí)行菜單“編輯”“轉(zhuǎn)至個(gè)案”命令2、按變量值自動(dòng)定位執(zhí)行菜單“編輯”“查找”命令3.3.3 插入與刪除變量和觀測(cè)量插入變量可通過(guò)以下三種方式實(shí)現(xiàn):1、通過(guò)數(shù)據(jù)編輯器窗口中相關(guān)快捷命令2、利用鼠標(biāo)右鍵完成3、
15、執(zhí)行菜單“編輯”“插入變量”命令刪除變量可通過(guò)以下兩種方式實(shí)現(xiàn):1、利用鼠標(biāo)右鍵完成2、執(zhí)行菜單“編輯”“清除”命令觀測(cè)量(個(gè)案)的插入和刪除方法同變量類(lèi)似,課堂演示。3.3.4 實(shí)用數(shù)據(jù)文件操作1、數(shù)據(jù)的打開(kāi)和保存(略)2、數(shù)據(jù)排序(1)執(zhí)行菜單“數(shù)據(jù)”“排序個(gè)案”命令(2)需要根據(jù)哪個(gè)變量排序,則單擊該變量“排序依據(jù)”(3)選擇“升序”還是“降序”(4)點(diǎn)擊“確定”3、數(shù)據(jù)文件的分解(1)執(zhí)行菜單“數(shù)據(jù)”“拆分文件”命令(2)選擇不同的拆分方式:分析所有個(gè)案,不創(chuàng)建組(默認(rèn)方式)、比較組或按組組織輸出(3)選擇不創(chuàng)建組(默認(rèn)方式)、比較組或按組組織輸出需選取“分組方式”(4)點(diǎn)擊“確定”4
16、、數(shù)據(jù)文件的合并1、增加變量(1)執(zhí)行菜單“數(shù)據(jù)”“合并文件”“添加變量”命令(2)選中所添加的變量后點(diǎn)擊“繼續(xù)”命令(3)點(diǎn)擊“確定”2、增加觀測(cè)值(1)執(zhí)行菜單“數(shù)據(jù)”“合并文件”“添加個(gè)案”命令(2)選中所添加的變量后點(diǎn)擊“繼續(xù)”命令(3)點(diǎn)擊“確定”5、數(shù)據(jù)文件的轉(zhuǎn)置執(zhí)行菜單“數(shù)據(jù)”“變換”命令3.4 單選題、多選題與開(kāi)放題的數(shù)據(jù)錄入,檢查異常值1、單選題的數(shù)據(jù)錄入通過(guò)具體例子說(shuō)明【例3.1】對(duì)馬航失聯(lián)客機(jī)的結(jié)果有如下幾種,選擇最可能的一種?( )A 墜入海洋 B 恐怖分子劫機(jī) C 被海盜劫機(jī) D 政府行為具體實(shí)現(xiàn)方法有兩種:(1)二分法。對(duì)每個(gè)選項(xiàng)賦值“0”或者“1”(2)對(duì)每個(gè)選項(xiàng)
17、分別賦值“1,2,3,4”2、多選題的數(shù)據(jù)錄入(1)多重二分法處理方法同單選題數(shù)據(jù)錄入的(1),此處略。(2)多重分類(lèi)法若假定最多選2個(gè),先對(duì)對(duì)每個(gè)選項(xiàng)分別賦值“1,2,3,4”,后給出2個(gè)備選變量即可。若沒(méi)有限制選項(xiàng)個(gè)數(shù),則將所有的備選變量給出。3、開(kāi)放題的錄入開(kāi)放型問(wèn)題的處理一般不需要編碼的操作,當(dāng)然也不需要輸入到SPSS中進(jìn)行分析處理,只能通過(guò)調(diào)查者的匯總歸納概括,因此開(kāi)放型問(wèn)題在問(wèn)卷中應(yīng)該盡可能的減少;原因在于一是不便于分析處理,二是開(kāi)放型問(wèn)題的回答率一般較低。4、異常值的查找離群值:(箱圖)值與框的上下邊界的距離在1.5倍框的長(zhǎng)度到3倍框的長(zhǎng)度之間的個(gè)案??虻拈L(zhǎng)度是內(nèi)距。極端值:(箱
18、圖)值距離框的上下邊界超過(guò)3倍框的長(zhǎng)度的個(gè)案??虻拈L(zhǎng)度是內(nèi)距在回歸模型診斷里面,一般稱(chēng)預(yù)測(cè)值與實(shí)際值的偏差為殘差,按照需要取一殘差,再按照某種標(biāo)準(zhǔn)取一個(gè)閥值來(lái)限定異常點(diǎn),只要那個(gè)點(diǎn)的殘差大于閥值,就可以認(rèn)為它是異常點(diǎn)。在時(shí)間序列分析中,異常值的統(tǒng)計(jì)檢驗(yàn)方法可以通過(guò)殘差的正態(tài)性檢驗(yàn)實(shí)現(xiàn)。3.5 SPSS函數(shù)SPSS函數(shù)是一個(gè)常用程序(rountine),并且利用一個(gè)或多個(gè)自變量(參數(shù))來(lái)執(zhí)行。每個(gè)SPSS函數(shù)均有一個(gè)關(guān)鍵名稱(chēng)(keywordname),且絕不能寫(xiě)錯(cuò)。通常,函數(shù)的格式為:函數(shù)名稱(chēng)(自變量,自變量,),某些函數(shù)可能只含有一個(gè)自變量,而有些函數(shù)則可能含有多個(gè)自變量,當(dāng)一個(gè)函數(shù)含有多個(gè)自
19、變量時(shí),各自變量間用逗號(hào)(,)隔開(kāi),而函數(shù)的自變量通常又可分為以下三種:1)常數(shù),如SQRT(100):2)變量名稱(chēng),如MEAN(VAR1,VAR2,VAR3);3)表達(dá)式,如MIN(30,SQRT(100)。總之,SPSS函數(shù)和我們平時(shí)EXCEL里面函數(shù)格式規(guī)則并無(wú)差別。SPSS提供了180多種函數(shù),共可分為十多類(lèi)。和EXCEL一樣,我們也不可能記住所有函數(shù),只要知道一些常用函數(shù),至于其他函數(shù)要用的時(shí)候再去查找也不遲,下面本人將列舉一些常用函數(shù):1 算術(shù)函數(shù)函數(shù)說(shuō)明范例(x=2.6,y=3)ABS(numbexpr)絕對(duì)值函數(shù)ABS(y-x)=0.4RND(numbexpr)四舍五入函數(shù)RN
20、D(x)=3TRUNC(numbexpr)取整函數(shù)TRUNC(x)=2SORT(numbexpr)平方根函數(shù)SQRT(y)=1.71MOD(numbexpr,modulus)求算兩數(shù)相除后的余數(shù)MOD(y,x)=0.4EXP(numbexpr)以e為底的指數(shù)函數(shù)EXP(y)=20.09LG10(numbexpr)以10底的對(duì)數(shù)函數(shù)LG10(x*10)=1.41LN(numbexpr)自然對(duì)數(shù)函數(shù)LN(y)=1.12 統(tǒng)計(jì)函數(shù)函數(shù)說(shuō)明范例(X1=2X2=5X3=8)MEAN(numexpr,numexpr,)自變量的平均值MEAN(X1,X2,X3)=5MIN(value, value,)自變量
21、的最小值MIN(X1,X2,X3)=1MAX(value, value,)自變量的最大值MAX(X1,X2,X3)=8SUM(numexpr,numexpr,)求和SUM(X1,X2,X3)=15SD(numexpr,numexpr,)求標(biāo)準(zhǔn)差SD(X1,X2,X3)=3VARIANCE(numexpr,numexpr,)求方差VAR(X1,X2,X3)=9CFVAR(numexpr,numexpr,)求變異系數(shù)CFVAR(X1,X2,X3)=0.6 3 缺失值函數(shù)函數(shù)說(shuō)明范例MISSING(variable)若變量缺失,則為T(mén)或1,否則為F或0MISSING(X1)=1MISSING(X2)
22、=1MISSING(X3)=0SYSMIS(numvar)若變量是系統(tǒng)缺失值則為T(mén)或1,如為自定缺失或非缺失則為F或0SYSMIS(X1)=0SYSMIS(X2)=1SYSMIS(X3)=0NMISS(variable,)缺失值個(gè)數(shù)NMISS(X1,X2,X3)=2NVALID(variable,)有效值個(gè)數(shù)NVALID(X1,X2,X3)=1VALUE(variable,)忽略自定義缺失值,當(dāng)作非缺失VALUE(X1)=X1注:X1為使用者界定缺失值,X2為系統(tǒng)缺失值,X3為非缺失值4 字符串型函數(shù)函數(shù)說(shuō)明范例ANY(test,value,value)若自變量1和后面自變量竄相同則為真,記為
23、1ANY(is, this)=0ANY(is,this,is)=1CONCAT(strexpr,strexpr)將自變量連成一個(gè)新自變量CONCAT(th,is)=thisINDEX(haystack,needle,divisor)Divisor在needle最左側(cè)開(kāi)始出現(xiàn)的位置INDEX(this is,is)=3LENGTH(strexpr)自變量所含文字的個(gè)數(shù)(包括特殊字符和空格)LENGTH(th is)=5LOWER(strexpr)自變量中的大寫(xiě)字母改為小寫(xiě)字母LOWER(This)=thisUPCASE(strexpr)將自變量中的小寫(xiě)字母改為大寫(xiě)字母UPCASE(this)=T
24、HISLTRIM(strexpr,char)在strexpr開(kāi)始處去除char所形成的常量,如無(wú)char則去除strexpr左側(cè)的空格LTRIM(this,t)=hisLTRIM(this,is)=thLTRIM( this)=thisNUMBER (strexpr,format)當(dāng)自變量為數(shù)字的文字變量時(shí),按文字變量指定格式轉(zhuǎn)換為數(shù)字變量NUMBER(23,F8.1)=2.3NUMBER(23,F8.0)=23RANGE(test,lo,hi,lo,hi)如果自變量1的值包含在自變量集lo至hi的范圍內(nèi),則為T(mén)或1RANGE(c,a,k)=TSTRING(strexpr,format)按指定
25、格式將自變量轉(zhuǎn)換為文字型變量STRING(3+4,F8.2)=7.00SUBSTR(sterxpr,pos,length)從strexpr子竄的第pos位置開(kāi)始取length的字符串長(zhǎng)度SUBSTR(this is,6,2)=is5 時(shí)間日期函數(shù)函數(shù)說(shuō)明范例DATA.DMY(d,m,y)與指定日月年對(duì)應(yīng)的日期DATA.DMY(3,5,99)=05/03/99DATA.MDY(m,d,y)與指定月日年對(duì)應(yīng)的日期DATA.MDY(5,3,99)=05/03/99DATA.YRDA(y,d)與指定年日對(duì)應(yīng)的日期DATA.YRDA(99,35)=02/04/99DATA.QYR(q,y)指定的季節(jié)年份
26、對(duì)應(yīng)的日期DATA.QYR(2,99)=04/01/99DATA.MOYR(m,y)與指定的月年度對(duì)應(yīng)的日期DATA.MOYR(5,99)=05/01/99DATA.WKYR(w,y)與指定的周年度對(duì)應(yīng)的日期DATA.WKYR(38,98)=9/17/98注:1. 要正確顯示以上函數(shù)值,必須先賦予其SPSS得日期型變量(DATA)格式,假設(shè)以上日期用mm/dd/yy格式顯示,時(shí)間則用hh:mm:ss格式表示 2. 1=d=31、1=m=12、1=w=52、1=q=4(六)其他函數(shù)SPSS除了上述函數(shù)外,尚有日期和時(shí)間轉(zhuǎn)換函數(shù)(YOMODACTMIESDAYSCTIMEHOURSMDAYS等)、
27、連續(xù)幾率密度函數(shù)(CDFBINOMCHISQCDFEXPLOGISTIC等),此外還有NORMAL(stddev)可產(chǎn)生平均數(shù)為0,標(biāo)準(zhǔn)差為stddev的正態(tài)分布隨機(jī)數(shù)字。UNIFORM(max)可產(chǎn)生平均數(shù)為0與max間呈均等分布的隨機(jī)數(shù)字。第4講 描述性統(tǒng)計(jì)分析4.1 常用統(tǒng)計(jì)量4.1.1 描述集中趨勢(shì)的統(tǒng)計(jì)量(將融合在后續(xù)演示中)1、均值2、中位數(shù)3、眾數(shù)4、百分位數(shù)4.1.2 描述離散程度的統(tǒng)計(jì)量(將融合在后續(xù)演示中)1、樣本方差2、樣本標(biāo)準(zhǔn)差3、均值標(biāo)準(zhǔn)差4、極差5、離散系數(shù)4.1.3 描述分布形態(tài)的統(tǒng)計(jì)量(將融合在后續(xù)演示中)1、偏度系數(shù)(以眾數(shù)為衡量指標(biāo))2、峰度系數(shù)(高矮) 全
28、方位的刻畫(huà)和定義一組數(shù)據(jù),均數(shù)、方差、風(fēng)度系數(shù)偏度系數(shù)4.2 常用統(tǒng)計(jì)表4.2.1 在線處理分析報(bào)告(OLPA)該過(guò)程對(duì)于按一個(gè)或多個(gè)分組變量所分的組,計(jì)算所考察變量的總值、均值及其他統(tǒng)計(jì)量,并且以分層的方式輸出結(jié)果,表中每一層是依據(jù)一個(gè)分組變量的結(jié)果輸出。執(zhí)行菜單“分析”“報(bào)告”“OLPA多維數(shù)據(jù)集”命令4.2.2 個(gè)案摘要報(bào)告?zhèn)€案摘要報(bào)告又成觀測(cè)量摘要報(bào)告,主要用于按指定分組統(tǒng)計(jì)不同水平的交叉匯編,對(duì)變量進(jìn)行記錄列表,并計(jì)算相應(yīng)統(tǒng)計(jì)量。可通過(guò)“個(gè)案匯總”命令來(lái)預(yù)覽和打印數(shù)據(jù)。執(zhí)行菜單“分析”“報(bào)告”“個(gè)案匯總”命令4.2.3 行形式摘要報(bào)告和列形式摘要報(bào)告(略,學(xué)員可獨(dú)立學(xué)習(xí))專(zhuān)門(mén)用于生成
29、復(fù)雜報(bào)表,他們均可以對(duì)輸出表格進(jìn)行精密定義,以滿足客戶的各種嚴(yán)格要求,且輸出格式為文本格式4.3 頻數(shù)分析頻數(shù)分析是描述性統(tǒng)計(jì)分析中最常用的方法之一,可以通過(guò)對(duì)數(shù)據(jù)的分布趨勢(shì)進(jìn)行初步的分析,以便掌握數(shù)據(jù)分布的特征,對(duì)數(shù)據(jù)作進(jìn)一步分析。執(zhí)行菜單“分析”“描述統(tǒng)計(jì)”“頻率”命令(1) 在菜單欄中選擇“分析描述統(tǒng)計(jì)頻率”命令,打開(kāi)如下所示的對(duì)話框。 (2) 選擇“分組后的人均面積”作為需要分析的變量,單擊按鈕進(jìn)入“變量”文本框。由于本案例中不要求計(jì)算其他統(tǒng)計(jì)量,所以不用在“統(tǒng)計(jì)量”中進(jìn)行相關(guān)設(shè)置,只需在“圖表”中選擇圖形類(lèi)型即可。(3) 選擇“直方圖”項(xiàng),激活“在直方圖上方顯示正態(tài)曲線”復(fù)選框。(4
30、) 單擊“確定”按鈕,系統(tǒng)開(kāi)始分析。4.4 描述性分析通過(guò)此過(guò)程可對(duì)變量進(jìn)行描述性統(tǒng)計(jì)量的分析,計(jì)算并列出一系列相應(yīng)的指標(biāo),包括平均值、算數(shù)和、標(biāo)準(zhǔn)差、最大值、最小值、方差、全距、和均值標(biāo)準(zhǔn)誤差等,并可以將原始數(shù)據(jù)轉(zhuǎn)換成標(biāo)準(zhǔn)Z分布存入數(shù)據(jù)庫(kù),在數(shù)據(jù)集中生成一個(gè)新的變量,該變量自動(dòng)命名為“Z+原變量名稱(chēng)”。執(zhí)行菜單“分析”“描述統(tǒng)計(jì)”“描述”命令,在執(zhí)行該命令前,執(zhí)行菜單“數(shù)據(jù)”“拆分文件”“比較組”命令(1) 打開(kāi)數(shù)據(jù)文件,按“班級(jí)”數(shù)量對(duì)數(shù)據(jù)進(jìn)行分組。從菜單欄中選擇“數(shù)據(jù)拆分文件”命令,打開(kāi)“拆分文件”對(duì)話框。選擇“比較組”按鈕,然后將“班級(jí)”變量選入“分組方式”列表框。單擊“確定”按鈕,完
31、成分組。(2) 打開(kāi)下圖的“描述性”對(duì)話框,從變量列表框中選擇變量年齡、體重和身高。單擊按鈕將選中的變量移動(dòng)到“變量”文本框,并且選擇“將標(biāo)準(zhǔn)化得分另存為變量”復(fù)選框,即要求以變量形式保存Z分值。(3) 選擇完變量后,單擊“選項(xiàng)”選項(xiàng),進(jìn)行統(tǒng)計(jì)量的選擇。在本例中,選擇范圍、最大值、最小值、均值、標(biāo)準(zhǔn)差和方差。單擊“繼續(xù)”按鈕確認(rèn)并返回主對(duì)話框。(4) 設(shè)置完畢后,單擊“確定”按鈕,系統(tǒng)將執(zhí)行描述性分析。4.5 探索性分析探索性分析可以對(duì)變量進(jìn)行更為深入詳盡的統(tǒng)計(jì)分析,主要用于當(dāng)對(duì)數(shù)據(jù)的性質(zhì)、分布特點(diǎn)等完全不知道的時(shí)候,檢查數(shù)據(jù)是否有錯(cuò)誤,獲得數(shù)據(jù)基本特征,以及對(duì)數(shù)據(jù)規(guī)律作初步觀察。在常用描述性
32、統(tǒng)計(jì)指標(biāo)的基礎(chǔ)上,探索性分析增加了有關(guān)數(shù)據(jù)詳細(xì)分布特征的文字與圖形描述,還可以為方差齊性為目的的變量變換提供線索。執(zhí)行菜單“分析”“描述統(tǒng)計(jì)”“探索”命令(1) 選擇“分析統(tǒng)計(jì)描述探索”命令,打開(kāi)如下所示的“探索”對(duì)話框。 (2) 選擇height變量進(jìn)入“因變量列表”框作為待摘要變量;選擇area變量進(jìn)入“因子列表”框作為分組變量。(3) 在輸出欄中,選擇“兩者都”項(xiàng)。(4) 單擊“統(tǒng)計(jì)量”按鈕,打開(kāi)統(tǒng)計(jì)量對(duì)話框。選中描述性、M-估計(jì)量、界外值和百分位數(shù)復(fù)選框,然后單擊“繼續(xù)”按鈕,確認(rèn)選擇并返回“探索”對(duì)話框。(5) 單擊“繪制”按鈕, “探索:圖”對(duì)話框。選擇“箱圖”欄中的“按因子水平分
33、組”項(xiàng),選擇獎(jiǎng)分組結(jié)果顯示在同一張圖上;選擇“描述性”欄內(nèi)的“莖葉圖”復(fù)選框,輸出莖葉圖,同時(shí)選中“帶檢驗(yàn)的正態(tài)圖”復(fù)選框,要求進(jìn)行正態(tài)性檢驗(yàn);選擇“伸展與級(jí)別Levene檢驗(yàn)”中的“冪估計(jì)”項(xiàng)估計(jì)冪次使組間方差齊次。單擊“繼續(xù)”按鈕,確認(rèn)并選擇返回“探索”對(duì)話框。(6) 在“探索”對(duì)話框中單擊“確定”按鈕,完成設(shè)置并執(zhí)行探索性分析。4.6 常用統(tǒng)計(jì)圖(課堂現(xiàn)場(chǎng)演示)常用的統(tǒng)計(jì)圖形包括條形圖、3-D條形圖、面積圖、線圖、餅圖、高低圖、箱圖、誤差條形圖、人口金子塔圖、散點(diǎn)/點(diǎn)狀圖、直方圖等。第5講 一般推斷性統(tǒng)計(jì)分析5.1 統(tǒng)計(jì)推斷理論(課堂現(xiàn)場(chǎng)講授)5.2 均值比較5.2.1 均值過(guò)程均值過(guò)程
34、傾向于對(duì)樣本進(jìn)行描述,他可以對(duì)需要比較的各組計(jì)算描述指標(biāo)進(jìn)行檢驗(yàn)前的預(yù)分析。執(zhí)行菜單“分析”“比較平均值”“平均值”命令(1) 在數(shù)據(jù)管理窗口中打開(kāi)house. Sav數(shù)據(jù)文件。(2) 從菜單欄中選擇“分析比較均值均值”命令,打開(kāi)如下所示的“均值”對(duì)話框。(3) 在“均值”對(duì)話框左側(cè)變量列表中選中price和sale變量,單擊按鈕將其移入“因變量列表”列表框中,并將district變量移入“自變量列表”列表框。單擊“選項(xiàng)”按鈕,打開(kāi)“均值:選項(xiàng)”對(duì)話框,如下圖所示。(4) 在“選項(xiàng)”對(duì)話框中選擇需要分析的統(tǒng)計(jì)量,本例中選擇統(tǒng)計(jì)項(xiàng)目。從“單元格統(tǒng)計(jì)量”列表中,選中均值、標(biāo)準(zhǔn)差、最小值、最大值和個(gè)
35、案數(shù)5個(gè)統(tǒng)計(jì)量,然后單擊“繼續(xù)”按鈕確認(rèn),返回“均值”對(duì)話框。(5) 在“均值”對(duì)話框中,單擊“確定”按鈕,完成設(shè)置并執(zhí)行操作。5.2.2 單樣本t檢驗(yàn)用樣本均數(shù)代表的未知總體均數(shù)和已知總體均數(shù)進(jìn)行比較,來(lái)觀察此組樣本與總體的差異性。既是單樣本本身無(wú)法比較,進(jìn)行的是均數(shù)與已知總體均數(shù)間的比較。1基本假定(1) 樣本來(lái)自正態(tài)或近似正態(tài)總體;(2) 已知總體均值,可得到樣本均值和標(biāo)準(zhǔn)差2 t檢驗(yàn)統(tǒng)計(jì)量 其中 為樣本平均數(shù);為總體平均數(shù);為樣本標(biāo)準(zhǔn)差;n為樣本容量;t為樣本平均數(shù)與總體平均數(shù)的離差統(tǒng)計(jì)量;3 計(jì)算原理(1) 建立假設(shè),確定檢驗(yàn)水平 H0: = 0 H1: 0; (2) 計(jì)算統(tǒng)計(jì)量;(
36、3) 查相應(yīng)的界值表,確定p值,下結(jié)論;4 SPSS實(shí)例演示執(zhí)行菜單“分析”“比較平均值”“單樣本t檢驗(yàn)”命令(1) 打開(kāi)數(shù)據(jù)文件pulse.sav之后,從菜單欄選擇“分析比較均值單樣本T檢驗(yàn)”命令,打開(kāi)如下所示的“單樣本T檢驗(yàn)”對(duì)話框。(2) 將變量pulse選入“檢驗(yàn)變量”列表框。(3) 在“檢驗(yàn)值”框中輸入已知母體平均數(shù)72。(4) 單擊“確定”按鈕,完成設(shè)置并執(zhí)行上述操作。5.2.3獨(dú)立樣本t檢驗(yàn) “獨(dú)立樣本 T 檢驗(yàn)”過(guò)程比較兩組個(gè)案的均值。理想的情況下,對(duì)于此檢驗(yàn),主體應(yīng)隨機(jī)地分配到兩個(gè)組中,以便響應(yīng)的任何差別是由于處理(或缺少處理)而非其他因素造成的。例如而比較男性和女性的平均收
37、入則不屬于此情況人不是隨機(jī)指定為男性或女性的。在這些情況下,應(yīng)確保其他因素中的差別沒(méi)有掩飾或夸大均值中的顯著性差異。平均收入的差值還可能受諸如教育之類(lèi)的因素影響(而非僅僅受性別影響)。1 基本假定(1) 兩個(gè)樣本獨(dú)立; (2) 樣本來(lái)自的正態(tài)總體服從正態(tài)分布;2 獨(dú)立樣本t檢驗(yàn)統(tǒng)計(jì)量t分兩種情況:(1) 兩總體方差未知且相等 (2) 兩總體方差未知且不等 , 3 計(jì)算原理設(shè)總X1服從正態(tài)分布N(1,12),總體X2服從正態(tài)分布N(2,22),分別從這兩個(gè)總體中抽取樣本(x11,x12,x13,x1n)和(x21,x22,x23,x2n),且兩樣本相互獨(dú)立,要求檢驗(yàn)1和2是否有顯著性差異。(1) 建立假設(shè),確定檢驗(yàn)水平;H0:1 = 2 H1:1 2; (2) 判斷兩總體方差是否相等,F(xiàn)檢驗(yàn)法(spss會(huì)自動(dòng)檢驗(yàn)方差是否相等),若F值所對(duì)應(yīng)的P值顯著水平,則
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024計(jì)算機(jī)二級(jí)考試參考試題及答案
- 信息化對(duì)于物流服務(wù)質(zhì)量的影響試題及答案
- 醫(yī)美行業(yè)經(jīng)濟(jì)分析
- 2024監(jiān)理工程師春季考試試題及答案
- 2024人力資源管理師案例分析方法試題及答案
- 數(shù)字化進(jìn)程下的全媒體挑戰(zhàn)試題及答案
- 黑龍江民族職業(yè)學(xué)院《高層建筑結(jié)構(gòu)課程設(shè)計(jì)》2023-2024學(xué)年第一學(xué)期期末試卷
- 黑龍江省雙鴨山一中2025屆普通高中畢業(yè)班質(zhì)量檢查數(shù)學(xué)試題文試題含解析
- 掌握2024計(jì)算機(jī)二級(jí)考試基礎(chǔ)試題及答案
- 黑龍江省大興安嶺漠河一中2025屆普通高中畢業(yè)班綜合測(cè)試(二)英語(yǔ)試題含解析
- 危險(xiǎn)化學(xué)品安全周知卡(鹽酸)
- 2023年江蘇鹽城市射陽(yáng)縣農(nóng)業(yè)水利投資開(kāi)發(fā)集團(tuán)有限公司招聘筆試題庫(kù)及答案解析
- GB/T 8545-2012鋁及鋁合金模鍛件的尺寸偏差及加工余量
- GB/T 6730.65-2009鐵礦石全鐵含量的測(cè)定三氯化鈦還原重鉻酸鉀滴定法(常規(guī)方法)
- 威尼斯的小艇 省一等獎(jiǎng)
- 企業(yè)人力資源管理師(四級(jí))教材
- 教科版六年級(jí)下冊(cè)科學(xué)第一單元測(cè)試卷(原卷版)
- 【教學(xué)課件】正確行使訴訟權(quán)利-示范課件
- 促進(jìn)市級(jí)醫(yī)院臨床技能與臨床創(chuàng)新三年行動(dòng)計(jì)劃
- 主觀幸福感(GWB)量表
- 臨床試驗(yàn)疑難問(wèn)題解答
評(píng)論
0/150
提交評(píng)論