版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、PAGE PAGE 154第一單元 SPSS基本操作實驗一 SPSS基本操作一、實驗?zāi)康?、掌握SPSS數(shù)據(jù)分析的一般步驟;2、能根據(jù)實際情況定義變量,建立SPSS數(shù)據(jù)文件;3、能根據(jù)數(shù)據(jù)分析的要求,對原始數(shù)據(jù)進(jìn)行適當(dāng)?shù)念A(yù)處理;4、能夠?qū)PSS的運(yùn)行結(jié)果進(jìn)行適當(dāng)?shù)木庉嫴?dǎo)入到分析報告中。二、實驗原理及步驟講解(一)SPSS概述SPSS(Statistical Package for the Social Science,社會科學(xué)統(tǒng)計軟件包)是世界著名的統(tǒng)計軟件之一。1968年美國斯坦福大學(xué)三位研究生研制了最早的SPSS統(tǒng)計軟件系統(tǒng),并基于這一系統(tǒng)于1975年在芝加哥成立SPSS公司,推出SP
2、SS 中小型機(jī)版SPSSX。1984年推出世界第一個統(tǒng)計分析軟件微機(jī)版SPSS/PC+。迄今為止軟件已有30多年的成長歷史,應(yīng)用遍布于通信、醫(yī)療、銀行、證券、保險、制造、商業(yè)、市場研究、科學(xué)教育等領(lǐng)域,是世界上應(yīng)用最廣泛的專業(yè)統(tǒng)計軟件。隨著SPSS產(chǎn)品服務(wù)領(lǐng)域的擴(kuò)大和服務(wù)深度的加深,2002年公司將軟件更名為Statistical Product and Service Solutions,意為“統(tǒng)計產(chǎn)品與服務(wù)解決方案”。SPSS主界面有兩個,一個是SPSS數(shù)據(jù)編輯窗口,另一個是SPSS結(jié)果輸出窗口。數(shù)據(jù)編輯窗口是最重要的,使用也最為頻繁,是SPSS的基本操作平臺。對SPSS的數(shù)據(jù)進(jìn)行定義、錄
3、入、修改、管理等基本操作的窗口,各統(tǒng)計分析功能都是針對該窗口中的數(shù)據(jù)進(jìn)行的;窗口中的數(shù)據(jù)以.sav存于磁盤上;SPSS運(yùn)行過程中自動打開,且只能打開一個窗口;運(yùn)行過程中無法關(guān)閉。本節(jié)先介紹數(shù)據(jù)編輯窗口。SPSS屬于電子表格軟件,其數(shù)據(jù)編輯窗口與微軟公司的Excel窗口有些相似,并且有一些功能也相同。不過SPSS的數(shù)據(jù)統(tǒng)計功能要比Excel強(qiáng)很多。數(shù)據(jù)編輯窗口由標(biāo)題欄、菜單欄、工具欄、編輯欄、變量名欄、內(nèi)容區(qū)、窗口切換標(biāo)簽頁和狀態(tài)欄組成。如圖1-1所示。標(biāo)題欄中顯示編輯的數(shù)據(jù)文件名,本圖中所編輯的數(shù)據(jù)文件為Hair&eye.sav。菜單欄中列出了SPSS的命令菜單,每個菜單對應(yīng)一組相應(yīng)的功能。其
4、中File是對SPSS文件的操作;Edit是SPSS文件的編輯菜單;Data是數(shù)據(jù)文件的建立和編輯菜單;View是用戶界面設(shè)置菜單;Transform是數(shù)據(jù)基本處理菜單;Analyze是統(tǒng)計分析菜單,主要統(tǒng)計功能都集中在該菜單中;Graphs是統(tǒng)計圖形菜單;Utilities是相關(guān)應(yīng)用和設(shè)置菜單;Windows是SPSS各窗口切換菜單;Help是SPSS幫助菜單。標(biāo)題欄編輯欄標(biāo)題欄編輯欄變量名欄菜單欄內(nèi)容區(qū)窗口切換標(biāo)簽狀態(tài)欄工具欄圖1-1 數(shù)據(jù)編輯窗口編輯欄中可以輸入數(shù)據(jù)。變量名欄中列出了該文件中所含有的變量名。SPSS自動命名變量名為var001、var002等。本文件中有三個變量:num、
5、hair、eye。內(nèi)容區(qū)列出了各個個案在變量中的取值。SPSS中每一行表示一個個案(記錄)。內(nèi)容區(qū)的最左邊是行的標(biāo)號,這和Excel類似。該窗口下方有兩個標(biāo)簽:“Data View”(數(shù)據(jù)視圖)和“Variable View”(變量視圖)。這兩種視圖提供了一種類似于電子表格的方法,用以產(chǎn)生和編輯SPSS數(shù)據(jù)文件中的變量和數(shù)據(jù)。“ Data View”對應(yīng)的表格用于查看、錄入和修改數(shù)據(jù);“ Variable View ”對應(yīng)的表格用于輸入和修改變量的定義。這樣使用者就可以非常方便地進(jìn)行變量類型的定義和數(shù)據(jù)的輸入。相對于Excel來講,“Data View ”所對應(yīng)表格有以下特點:(1)一個列對應(yīng)
6、一個變量,即每一列代表一個變量或一個被觀測量的特征。例如問卷上的每一項就是一個變量。(2)行是觀測,即每一行代表一個個體、一個觀測、一個樣品,在 SPSS中稱為事件(Case)。例如,問卷上的每一個人就是一個觀測。(3)單元包含值,即每個單元包括一個觀測中的單個變量值。單元(Cell)是觀測和變量的交叉。(4)數(shù)據(jù)文件是一張長方形的二維表。數(shù)據(jù)文件的范圍是由觀測和變量的數(shù)目決定的。數(shù)據(jù)編輯窗口最下面的狀態(tài)欄用來顯示SPSS當(dāng)前的運(yùn)行狀態(tài)。當(dāng)SPSS等待用戶操作時,會出現(xiàn)“SPSS Processor is ready”的提示信息。在數(shù)據(jù)編輯窗口中完成變量定義、數(shù)據(jù)輸入后,單擊某個統(tǒng)計功能菜單,
7、SPSS會自動完成統(tǒng)計分析,并將彈出結(jié)果輸出窗口,其中存放了數(shù)據(jù)統(tǒng)計的結(jié)果。(二)數(shù)據(jù)分析概述1、數(shù)據(jù)分析一般流程任何一個數(shù)據(jù)分析項目,如果按照整個分析過程的流程結(jié)構(gòu)來看,都可被劃分為大致7個階段:計劃階段、數(shù)據(jù)收集、數(shù)據(jù)獲取、數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)分析、結(jié)果報告和模型發(fā)布階段。計劃階段:在分析項目的初始階段,需要花費(fèi)大量的時間來設(shè)計分析計劃,以減少盲目分析,避免資源浪費(fèi)。該階段要對數(shù)據(jù)分析的各個行動步驟做好規(guī)劃確定以下幾個問題:確定研究問題。建立項目預(yù)算確定研究范圍即確定研究總體和個體確定樣本抽取方法分析評估所需樣本量確定數(shù)據(jù)收集方式確定與研究問題相關(guān)的數(shù)據(jù),即確定應(yīng)該收集個體的哪些數(shù)據(jù)確定研究問題
8、的分析方法和分析工具數(shù)據(jù)收集階段:如果手頭已經(jīng)有現(xiàn)成的數(shù)據(jù),就可不必再進(jìn)行數(shù)據(jù)收集。 數(shù)據(jù)收集的方式有很多種,可以是電話式訪問,可以是面談式收集,也可以是攔截式訪問。如果是從頭進(jìn)行數(shù)據(jù)收集,則應(yīng)當(dāng)有標(biāo)準(zhǔn)問卷,問題的設(shè)計不僅要相關(guān),還要能夠從中的出有意義的結(jié)論。數(shù)據(jù)獲取階段。該階段的目的是將分散的、原始格式各不相同的數(shù)據(jù)讀入分析工具中,使分析工具可以對數(shù)據(jù)進(jìn)行分析。數(shù)據(jù)準(zhǔn)備階段。該階段的主要任務(wù)是:清理數(shù)據(jù)以保證數(shù)據(jù)的準(zhǔn)確性。對數(shù)據(jù)進(jìn)行必要的轉(zhuǎn)換。如生成一些新的字段以供分析;將連續(xù)字段離散化;將字符型字段數(shù)值化等。目的是將數(shù)據(jù)結(jié)構(gòu)轉(zhuǎn)換成合適的形式。填充缺失數(shù)據(jù)。對各種缺失字段,利用適當(dāng)方法進(jìn)行填
9、補(bǔ)對數(shù)據(jù)進(jìn)行合并、匯總等。將數(shù)據(jù)文件進(jìn)行合并,將個體數(shù)據(jù)進(jìn)行匯總,生成各組數(shù)據(jù)。數(shù)據(jù)分析階段:利用各種數(shù)據(jù)分析工具對數(shù)據(jù)進(jìn)行分析,得出結(jié)論。數(shù)據(jù)分析階段可分為幾個部分:預(yù)分析:包括概括性描述統(tǒng)計和探索性統(tǒng)計推斷兩部分,使用統(tǒng)計圖和統(tǒng)計表對數(shù)據(jù)進(jìn)行更好的理解,基于對數(shù)據(jù)的理解開始嘗試進(jìn)行分析。精確分析:基于上一步得到的各種信息,開始嘗試擬和最佳的統(tǒng)計模型,以尋求對數(shù)據(jù)中所蘊(yùn)涵信息最完美的解釋。完成這一部分工作往往需要統(tǒng)計知識和專業(yè)知識相互補(bǔ)充,所使用的統(tǒng)計方法一般是多元統(tǒng)計分析方法。 結(jié)果報告階段:結(jié)果報告的目的是將整個數(shù)據(jù)分析項目的結(jié)果以一種非學(xué)術(shù)化的方式表達(dá)出來,使得決策者能夠快速理解,并基
10、于此分析結(jié)果做出決策。模型發(fā)布階段:結(jié)果報告僅僅是對基于歷史數(shù)據(jù)所建立的模型加以闡述。當(dāng)需要利用該模型進(jìn)行預(yù)測時,具體的做法是在分析軟件中加以預(yù)測,該階段的目標(biāo)是將分析階段得到的模型、信息和知識帶給機(jī)構(gòu)決策者以便他們能為機(jī)構(gòu)作出更好的未來規(guī)劃。在大多數(shù)分析過程中,不一定會經(jīng)歷所有的這7步。例如,根據(jù)分析目的,所需的數(shù)據(jù)僅是日常工作產(chǎn)生的交易數(shù)據(jù),那么就不必再經(jīng)歷“數(shù)據(jù)收集”階段,而直接進(jìn)入“數(shù)據(jù)獲取”階段。另外,各階段之間可能交叉進(jìn)行。例如,有時在對原始數(shù)據(jù)進(jìn)行分析之后,即進(jìn)入“數(shù)據(jù)分析”階段后,突然發(fā)現(xiàn)其他數(shù)據(jù)也是分析必需的,所以又返回“數(shù)據(jù)收集”階段。又如,在“數(shù)據(jù)分析”階段發(fā)現(xiàn)某個字段因
11、其格式不能參與分析,所以就需要進(jìn)行“數(shù)據(jù)準(zhǔn)備”階段所做的工作。2、用SPSS做數(shù)據(jù)分析作為一家信息統(tǒng)計決策支持服務(wù)的提供商,SPSS公司在以上涉及的各個數(shù)據(jù)分析階段均有相應(yīng)的產(chǎn)品與其對應(yīng),其核心功能是數(shù)據(jù)分析階段。建立SPSS數(shù)據(jù)文件,包括:定義數(shù)據(jù)文件結(jié)構(gòu);錄入、修改和編輯待分析的數(shù)據(jù)分析數(shù)據(jù)。根據(jù)設(shè)計初步判斷可能用到的統(tǒng)計方法,先進(jìn)行必要的預(yù)分析,以確定數(shù)據(jù)是否滿足方法的要求;根據(jù)預(yù)分析的結(jié)果,選擇適當(dāng)?shù)慕y(tǒng)計方法和模型進(jìn)行分析。結(jié)果的說明和解釋,若結(jié)果不合適,則重新選擇預(yù)分析和統(tǒng)計分析方法。數(shù)據(jù)和分析結(jié)果導(dǎo)出并保存(三)SPSS數(shù)據(jù)文件的建立與管理SPSS數(shù)據(jù)文件是一種有結(jié)構(gòu)的數(shù)據(jù)文件:姓
12、名性別學(xué)號 變量名張三女0101 記錄李四男01021、定義數(shù)據(jù)文件的變量(Variable view)例1.1:下面是國外某工廠的職員對周圍環(huán)境滿足程度的調(diào)查問卷(如下圖所示),1、對滿足度的調(diào)查對于下面事項您感覺滿足程度,請在橫線上用“鉤”表示。 很不滿意 不滿足 一般 滿足 很滿足(1)家庭 (2)工廠 (3)政治現(xiàn)實 (4)經(jīng)濟(jì)狀況 2、個人情況調(diào)查性別(1男,2女)學(xué)歷(1高中,2專科,3大學(xué)以上)年齡身高體重(cm/kg)平均收入(千元)生活費(fèi)(千元)家庭人口(人)住房面積(平方米)試據(jù)此定義數(shù)據(jù)文件結(jié)構(gòu)。打開數(shù)據(jù)編輯窗口后單擊下方的Variable View標(biāo)簽,切換到變量定義界
13、面,開始定義新變量。根據(jù)以上問卷內(nèi)容,定義x1x13,共13個變量來分別表示對家庭的滿意程度、表示對工廠的滿意程度、表示對政治的滿意程度、表示對經(jīng)濟(jì)的滿意程度、性別、學(xué)歷、年齡、身高、體重、平均收入、生活費(fèi)、家庭人口和住房面積。下面來具體看一看變量視圖中各個欄目的意義和用法:變量名(Variable name)Name欄:用于設(shè)定變量名,變量名是變量存取的唯一標(biāo)志。SPSS11中變量名長度應(yīng)在8位以內(nèi),但SPSS13已無此限制。雖然鍵入中文也可以,但最好使用英文,由于SPSS是英文軟件,變量名采用中文可能會有潛在的沖突(100%的兼容性是不存在的,典型的例子就是微軟公司的產(chǎn)品);其次,當(dāng)需要將
14、數(shù)據(jù)轉(zhuǎn)換為其他格式時,中文變量名也可能不能被完全識別,這里分別對13個變量命名為x1x13。Type欄:選擇該框時右側(cè)會出現(xiàn)形如的按鈕,單擊它會彈出變量類型對話框,用于設(shè)置變量類型,相應(yīng)的可以在右側(cè)更改變量運(yùn)算寬度等格式,一般按默認(rèn)的普通數(shù)值型(Numeric)即可。SPSS 中變量一共有三種:數(shù)值型、字符型(String)和日期型(Date),根據(jù)不同的顯示方式,數(shù)值型又被細(xì)分為五種,所以SPSS中的變量類型共有八種,但實際上只要分得清楚數(shù)值型、字符型和日期型就可以了。這里13個變量全部定義為普通數(shù)值型。With欄:設(shè)置變量運(yùn)算寬度,如數(shù)值型默認(rèn)為8位,一般不用變。該寬度只會改變輸出結(jié)果的顯
15、示寬度,數(shù)據(jù)的存儲結(jié)果和運(yùn)算精度完全不受影響。Decimals欄:設(shè)置小數(shù)位,默認(rèn)為2位,即數(shù)值型變量默認(rèn)情況下為5位整數(shù)、1位小數(shù)點位和2位小數(shù)。Label欄:用于定義變量名標(biāo)簽,該變量名標(biāo)簽是對對變量名的進(jìn)一步描述,長度可達(dá)120個字符,可以是中文,變量名標(biāo)簽會在結(jié)果中輸出,閱讀會非常方便。如上題中若用x1這個變量表示對家庭的滿意程度,x1為變量名,變量名標(biāo)簽可定義為“對家庭的滿意程度”,從而是x1的含義較明確。Value:用于定義變量值標(biāo)簽,變量值標(biāo)簽是對對變量的每一個可能取值的進(jìn)一步描述。該功能非常有用。以變量x5為例,單擊value框右部的省略號,會彈出變量值標(biāo)簽對話框如圖所示。|上
16、部的兩個文本框分別為變量值輸入框和變量值標(biāo)簽輸入框,分別在其中輸入“1”和“男”,此時下方的Add鈕變黑,單擊它,該變量值標(biāo)簽就會被加入下方的標(biāo)簽框內(nèi)。與此類似定義變量值“2”為“女”,最后按OK,變量值標(biāo)簽就設(shè)置完成。這樣,一方面使閱讀該數(shù)據(jù)文件的人能清楚得理解數(shù)據(jù),另外做任何分析,在結(jié)果中都有相應(yīng)的標(biāo)簽出現(xiàn),閱讀結(jié)果也就更方便了。Missing欄:用于定義變量缺失值。SPSS中默認(rèn)缺失值用表示,如果所用數(shù)據(jù)集中還有其他表示方法,則用該框來定義。Columns欄:定義顯示的列寬,實際上它用的非常少,因為改變列寬簡便的方法就是將鼠標(biāo)放在數(shù)據(jù)窗口中兩個變量名的中間直接拖動。Align欄:定義顯示
17、對齊方式,按照默認(rèn)的右對齊即可。Measure欄:定義變量的測量尺度,這一項不應(yīng)被忽略,它可以對變量進(jìn)行精確的定義。僅靠變量類型還不足以完全傳遞所有信息,比如說有序分類變量和連續(xù)性變量的類型都是數(shù)值型,并無差異。為此,在SPSS中又引入了測量尺度的概念,它和變量類型聯(lián)合起來可以對變量作更精確的限定,測量尺度一共有以下三種:標(biāo)度測量 (scale Measurement) :是測量的最高水平,數(shù)值可以是兩個測量間的差值,比如溫度,35和50相差就是15;可以是兩個測量間的比值,如比例測量,如重量,80公斤就是40公斤的兩倍??梢允褂脴?biāo)度測量的數(shù)據(jù)只能是數(shù)值型變量。本例中的月收入、年齡等均為標(biāo)度測
18、量。有序測量(Ordinal Measurement):比標(biāo)度測量的信息量少一些,測量數(shù)值代表了有序分類,如4、3、2、1代表了優(yōu)、良、中、差,顯然這里“優(yōu)”并非“中”的兩倍,即測量數(shù)值不代表絕對的數(shù)量大小。能使用有序測量的數(shù)據(jù)可以是數(shù)值型,也可以是字符型變量。本例中的學(xué)歷即為有序測量。名義測量(Nominal Measurement):是幾種測量中最低的水平,其數(shù)值僅代表某些分類或?qū)傩?,它們之間無法比較出大小。比如說測量的血型值,只能分為A、B、AB、O四種,不可能分出哪個高哪個低。能使用名義測量的數(shù)據(jù)可以是數(shù)值型,也可以是字符型變量。本例中的性別即為名義測量。2、數(shù)據(jù)錄入和保存直接錄入在數(shù)
19、據(jù)編輯窗口單擊Data View標(biāo)簽,切換到數(shù)據(jù)視圖,在該視圖下可直接輸入數(shù)據(jù),輸入時注意數(shù)據(jù)和變量的對應(yīng)關(guān)系。中小批量的數(shù)據(jù),直接用SPSS輸入比較方便的,如果數(shù)據(jù)量非常大,就應(yīng)備考慮采用專用數(shù)據(jù)庫軟件,如Access來錄入。數(shù)據(jù)錄入技巧和其他常用統(tǒng)計軟件相比,SPSS數(shù)據(jù)界面最大的優(yōu)勢就是支持鼠標(biāo)的拖放操作,以及拷貝粘貼等命令,下面的數(shù)據(jù)錄入技巧就是對這些功能的利用。連續(xù)多個相同值的輸入:如果變量有連續(xù)多個相同數(shù)據(jù)輸入,比如連續(xù)幾個單元格都要輸入1,可以在第一格內(nèi)輸入1并回車,然后回到剛才的單元格并單擊copy,最后用拖放方式選中所有應(yīng)輸入1的單元格,單擊右鍵并選擇paste,所有選中的單
20、元格就:會都被剛才拷貝的1填充。將Excel數(shù)據(jù)直接引入SPSS:Excel已經(jīng)打開原數(shù)據(jù),并且數(shù)據(jù)量較少的時候,可以直接用拷貝粘貼的方法將數(shù)據(jù)引入SPSS。先在Excel中選中所有的數(shù)據(jù)(不包括變量名),然后選擇拷貝命令,然后切換到SPSS,最好使行1列1單元格成為當(dāng)前單元格,然后執(zhí)行粘貼命令,數(shù)據(jù)就會全部轉(zhuǎn)入SPSS,再定義相應(yīng)的變量即可。如果數(shù)據(jù)中含有文本,則不能直接粘貼,否則會丟失數(shù)據(jù)。這是因為SPSS默認(rèn)的數(shù)據(jù)格式均為數(shù)值型,這樣將文本粘貼過來就會變?yōu)槿笔е怠ord中的數(shù)據(jù)表格直接引入SPSS:如果表格中全部都是數(shù)值,則可以選中整個表格,選擇拷貝命令然后切換到SPSS,再執(zhí)行粘貼
21、命令,數(shù)據(jù)就會全部轉(zhuǎn)入SPSS,并且原來的單元格會自動對應(yīng)為SPSS中的一個單元格。此時再定義相應(yīng)的變量名即可。用SPSS直接打開其他文件:SPSS可以直接打開多種其他類型文件,如各種版本的Excel文件、dBase文件、純文本文件等,這些文件可由SPSS直接引入。SPSS數(shù)據(jù)文件建立起來以后,單擊保存,可以保存為SPSS數(shù)據(jù)文件類型,擴(kuò)展名為.sav;也可以存為其他多種文件類型,如Excel、DBF、Access等。(四)SPSS數(shù)據(jù)管理SPSS數(shù)據(jù)(的基本加工和處理的)管理命令集中在Transform菜單和Data菜單,這些命令不屬于統(tǒng)計分析的范疇,其處理結(jié)果在數(shù)據(jù)文件上體現(xiàn)出來,而不在結(jié)
22、果輸出窗口,主要提供的是數(shù)據(jù)管理方面的基本功能,也可以看成是對數(shù)據(jù)預(yù)處理的過程。其中Data菜單主要實現(xiàn)變量級別的數(shù)據(jù)管理,如計算新變量、變量取值重新編碼等,Transform菜單主要實現(xiàn)文件級別的數(shù)據(jù)管理,如變量排序、文件合并拆分等。1、變量級別的數(shù)據(jù)管理Transform菜單Transform菜單主要集中了一些對變量進(jìn)行變換的過程,如對原始數(shù)據(jù)進(jìn)行四則運(yùn)算、對數(shù)據(jù)重新編碼、求變量秩次等,在統(tǒng)計分析的預(yù)處理中起著重要作用,下面列出常用的三個。計算新變量Compute過程計算新變量就是在原有SPSS數(shù)據(jù)文件的基礎(chǔ)之上,根據(jù)用戶要求,使用SPSS算術(shù)表達(dá)式以及函數(shù),對所有記錄或滿足條件的記錄,計
23、算出一個新結(jié)果,并將結(jié)果存入一個指定的變量中。這個指定變量可以是一個新變量,也可以是一個已經(jīng)存在的變量。Coumpute命令能輕松完成這樣的任務(wù)。例1.2:根據(jù)調(diào)查問卷.sav中的數(shù)據(jù),如果要對所有記錄的月收入上全部加上100元,并把新的月收入存入一個新變量,操作對話框如圖1-2。Target Variable框為用來存儲新數(shù)據(jù)的目標(biāo)變量名,可以是新變量,也可以是文件中已經(jīng)存在的變量(此時會覆蓋原內(nèi)容),此處輸入xx10;左下方為候選變量列表,用于將計算所需變量直接引入;Numeric Expression框用于給目標(biāo)變量賦值,這里選入x10,并給出賦值表達(dá)式:x10+100;Numeric
24、Expression框下方為軟鍵盤和備構(gòu)造表達(dá)式所需的函數(shù)。按OK后,原數(shù)據(jù)文件中會產(chǎn)生一個新變量xx10,其大小為對應(yīng)x10的值加上100。圖1-2 Compute過程主對話框?qū)ψ兞窟M(jìn)行分組和并Recode過程數(shù)據(jù)分析中,將連續(xù)變量轉(zhuǎn)換為等級變量,或者將分類變量不同的變量等級進(jìn)行合并是經(jīng)常采取的方法,Recode過程主要完成這一類工作。例1.3:根據(jù)調(diào)查問卷.sav中的數(shù)據(jù),根據(jù)年齡對受訪者重新分組,年齡小于等于30為一組,用1表示;年齡大于30為一組,用2表示,并將分組變量存入新變量xx7。操作如下:選擇菜單Transform,Recode Different Variables,Reco
25、de對話框如圖1-3所示。圖1-3 Recode into Different Variables 過程主對話框?qū)⒛挲g(x7)選入Input Variable-Variable框,此時Output Variable框變黑,在其中鍵入新變量名xx7,并單擊Change,可見原來的x7-?變成了x7-xx7,意即由原變量x7生成新變量xx7?,F(xiàn)在單擊O1d and New values,系統(tǒng)彈出變量值定義對話框如圖1-4所示。根據(jù)時間情況確定舊值和新值,需要注意的是所有范圍包含了端點,而且前面設(shè)定的變換會優(yōu)先于后側(cè)的變換。這里選擇Range:Lower through,右側(cè)框中輸入30,然后在右上
26、方的Value右側(cè)框中鍵入對應(yīng)的新變量值1,時下方Add鍵變黑,單擊它,Old -New框中就會加入Lower thru 30 -1;再選擇Range: through highest,右側(cè)框中輸入30,然后在右上方的Value右側(cè)框中鍵入對應(yīng)的新變量值2,時下方Add鍵變黑,單擊它,Old -New框中就會加入30 thru Highest 30 -2?,F(xiàn)在單擊Continue,再單擊OK,系統(tǒng)就會按要求生成新變量xx7。圖1-4 變量值定義子對話框求變量秩次Rank Case過程:Rank Cases過程就是用來排次序的一個專用過程。具體來說,它根據(jù)某變量的大小來排出次序(秩次),然后將秩
27、次結(jié)果存儲到一個新變量中去。例1.4:根據(jù)調(diào)查問卷.sav中的數(shù)據(jù),計算年齡的秩次。操作如圖1-5。圖1-5 Rank Case過程主對話框單擊OK后系統(tǒng)會自動生成一個新變量Rx7(即原變量前加r表示Rank之意),其取值為x7的秩次。2、文件級別的數(shù)據(jù)管理Data菜單Transform菜單是對變量進(jìn)行操作,而在許多情況下,我們需要對整個數(shù)據(jù)文進(jìn)行加工整理,比如根據(jù)統(tǒng)計分析的要求對數(shù)據(jù)進(jìn)分組、合并等操作。Data菜單主要是對整個文件的加工整理,排序、篩選、分組、合并、轉(zhuǎn)置等。這里只介紹最常用的四個過程。記錄排序Sort cases過程即變量排序過程,變量排序是非常常用的一項功能,學(xué)會它的使用技
28、巧會使工作效率大大提高,例如:數(shù)據(jù)輸入完畢后, 某個變量按升序或降序排列,利于發(fā)現(xiàn)輸入錯誤、查找數(shù)據(jù)及了解數(shù)據(jù)。例1.5:根據(jù)調(diào)查問卷.sav中的數(shù)據(jù),按月收入對所有記錄重新排序。在如下的Sort cases對話框中,將x10選入Sort by框,再按OK即可,原數(shù)據(jù)文件的記錄將按月收入從小到大排列。如果希望從大到小排列,則選擇Descending,即為降序排列。圖1-6 Sort cases主對話框數(shù)據(jù)匯總Aggregate過程Aggregate過程用于對數(shù)據(jù)進(jìn)分類匯總,所謂分類匯總就是按指定的分類變量對觀測值進(jìn)行組,對每組記錄的各變量值求指定的描述統(tǒng)計量,并對結(jié)果進(jìn)行存儲。例1.6:根據(jù)調(diào)
29、查問卷.sav中的數(shù)據(jù),計算男女兩個人群的平均月收入。該問題屬于分組進(jìn)行描述統(tǒng)計,用Aggregate過程。操作界面如圖1-7。圖1-7 Aggregate過程主對話框圖中Break Variables框用于選擇分組變量,這里選入x5(性別);Summaries of Variables框用于選擇被匯總的變量,這里選入x10(月收入);Name & Label用于定義新產(chǎn)生的匯總變量的名稱和標(biāo)簽;function按鈕用來定義匯總函數(shù),共有五組函數(shù),分別為常用匯總函數(shù)、特定值、記錄數(shù)、百分比和百分片斷。以最常用的一組可選的函數(shù)有均數(shù)、中位數(shù)、總和、標(biāo)準(zhǔn)差四種,這里選擇均值;Save 用于定義分類
30、匯總結(jié)果的存儲方式:將分類匯總結(jié)果加入當(dāng)前數(shù)據(jù)文件,還是產(chǎn)生一個只包含分類匯總接的新文件,還是用分類匯總的結(jié)果代替當(dāng)前文件。這里按默認(rèn)選擇即可。單擊OK完成。這時當(dāng)前文件后面會產(chǎn)生一個新變量x10_mean,其值分別為男女的平均月收入。多個數(shù)據(jù)文件的合并Merge file過程Merge file過程用于合并數(shù)據(jù)文件,實際上包括了兩個過程,分別對應(yīng)了兩種合并方式:縱向合并,從外部數(shù)據(jù)文件中增加記錄到當(dāng)前數(shù)據(jù)文件中,用Add Cases對話;橫向合并從,指外部數(shù)據(jù)文件增加變量到當(dāng)前數(shù)據(jù)文件,用Add variable對話框完成。注意縱向合并要求互相合并的數(shù)據(jù)文件有相同的變量,否則會舍棄不匹配的變
31、量;橫向合并對數(shù)據(jù)集要求高,默認(rèn)按記錄號合并,若按關(guān)鍵變量匹配,則記錄應(yīng)按關(guān)鍵變量升序,且關(guān)鍵變量一一對應(yīng)。例1.7:將數(shù)據(jù)集tables.sav中的記錄添加到tab1.sav中,注意在tab1.sav中的變量 xingbie對應(yīng)了tables.sav中的sex。因為是記錄添加,所以用Add Cases。首先應(yīng)當(dāng)打開文件tab1.sav,然后選擇菜單DataMerge FileAdd Cases,系統(tǒng)會彈出打開數(shù)據(jù)文件對話框,選中需要添加的數(shù)據(jù)文件tables.sav并按OK,系統(tǒng)才彈出Add Cases對話框如圖1-8所示。圖1-8 Add Cases過程主對話如圖,左側(cè)顯示的是新、老數(shù)據(jù)文
32、件中不匹配的變量名。星號表示為當(dāng)前數(shù)據(jù)集中變量,加號代表是添加數(shù)據(jù)集中的變量,左側(cè)顯示的是已匹配的變量名,可以用Rename按鈕對不匹配變量改名再納入,這里我們用鼠標(biāo)強(qiáng)行匹配(即選中兩個需要匹配的變量再單擊Pare按鈕),此時兩個變量以Sex & xingbie的形式加入右側(cè),表明最終的變量數(shù)值為兩者的接和,但變量名仍以當(dāng)前數(shù)據(jù)集的sex為準(zhǔn)。右下方的Indicate case source variable復(fù)選框用于定義一個新變量以區(qū)分哪些記錄是新添加的,這里不使用。選擇完后單擊OK,該操作就完成了。例1.8:數(shù)據(jù)集brain1.sav中包含了ID號190(有缺號)的病人的性別、年齡和血小板
33、值,brain2.sav則包含了11100號病人的收縮壓、舒張壓和遲發(fā)性腦損傷結(jié)果。將兩個數(shù)據(jù)集按ID號合并,并盡可能多的保留病人記錄。根據(jù)題意,我們要將兩個數(shù)據(jù)集按ID號相同的原則進(jìn)行合并,并且要保留110和91100這些只存在于一個數(shù)據(jù)集內(nèi)的記錄。首先我們要將兩個數(shù)據(jù)集分別按ID進(jìn)行排序,然后重新打開brain1.sav,選擇菜單DataMerge FileAdd Variables,系統(tǒng)會首先彈出打開文件對話框,指定需要合并的第二個數(shù)據(jù)文件名,找到brain2.sav并單擊打開,系統(tǒng)就會彈出添加變量對話框如圖1-9所示:圖1-9 添加變量對話框New Working Data File框
34、內(nèi)被納入合并后新數(shù)據(jù)集的變量列表,同樣,星號表示來自當(dāng)前數(shù)據(jù)集,加號表示來自第二個數(shù)據(jù)集;Excluded variables框里為未被納入的變量列表;選中Match Case on key variables in sorted file,即按已排序關(guān)鍵字合并,此時系統(tǒng)默認(rèn)按記錄號相等來合并,顯然這不符合我們的要求,將ID選入Key Variable框作為關(guān)鍵子;下側(cè)的三個單選框變黑可用,它們分別表示納入兩個文件提供的所有記錄、以當(dāng)前數(shù)據(jù)為主納入外部文件的變量和以外部數(shù)據(jù)為主納入當(dāng)前文件的變量,顯然我們這里要選擇第一種情況。單擊OK即可。新產(chǎn)生的文件將包含1100號病人的ID、性別、年齡、血
35、小板值、收縮壓、舒張壓和遲發(fā)性腦損傷七個變量的信息。文件拆分Split file過程Split file過程用于將數(shù)據(jù)文件分組進(jìn)行處理。一般來講,若沒有特別設(shè)置,統(tǒng)計分析時將會把所有記錄一起處理。若想分組進(jìn)行處理,則可以在分析以前用Split file過程先將文件拆分為兩部分,則之后的分析將分組進(jìn)行。其對話框如圖1-10及解釋如下:圖1-10 Split file過程主對話Analyze all cases,do not create groups和下面的兩個單選框為一組,選中本框表示不拆分文件;Compare groups表示按所選變量拆分文件,各組分析結(jié)果放在一起便于比較;Organize
36、 output by groups意即按所選變量拆分文件,各組分析結(jié)果單獨(dú)放置;Groups based on框用于選擇拆分?jǐn)?shù)據(jù)文件的變量;Sort the file by grouping variables與File is already sorted為一組,用于選擇是否要求拆分時將數(shù)據(jù)按所用的拆分變量排序,或所用的拆分變量已經(jīng)排過序了。(五)SPSS的結(jié)果瀏覽窗口和結(jié)果的導(dǎo)出SPSS的結(jié)果瀏覽窗口和Windows資源管理器的結(jié)構(gòu)完全相同,操作也幾乎相同。除了菜單欄和工具欄以外,窗口被分為左右兩部分:左側(cè)為大綱視圖,又稱結(jié)構(gòu)視圖,用于概要地顯示結(jié)果的結(jié)構(gòu),在宏觀上對結(jié)果進(jìn)行管理;右側(cè)顯示詳
37、細(xì)的統(tǒng)計分析結(jié)果(統(tǒng)計表、統(tǒng)計圖及文本)兩側(cè)的元素是完全一一對應(yīng),當(dāng)選中左側(cè)大綱視圖中的某一元素,則右側(cè)的該元素的具體輸出結(jié)果也被選中。1、結(jié)果的導(dǎo)出選中要導(dǎo)出的結(jié)果,右擊彈出屬性菜單,單擊Export,打開Export對話框如圖1-11。其中Export下拉列表用于確定需要輸出的內(nèi)容,有全部結(jié)果、無統(tǒng)計圖的文檔和只輸出統(tǒng)計圖三種選擇;在Export File框里輸入輸出目標(biāo)文件位置和目標(biāo)文件名,也可以用右側(cè)的Browse按鈕指定;Export What單選鈕組用于確定輸出的范圍,有全部對象、全部可見對象和所選擇的對象三種選擇;Export Format下拉列表用于選擇導(dǎo)出文件的格式,有HTM
38、L、Excel、PowerPoit和文本格式等。選好后單擊OK,系統(tǒng)就會將結(jié)果按你的要求輸出。圖1-11 Export主對話框2、如何在WORD等軟件中引用分析結(jié)果現(xiàn)在Word、Excel等辦公處理軟件使用的越來越廣,SPSS漂亮的輸出結(jié)果如果無法在Word等中使用將會帶來極大地不便。統(tǒng)計表格:選中需要的統(tǒng)計表,在拷貝時會有兩種選擇:拷貝(Copy)或拷貝對象(Copy Object),拷貝時是將統(tǒng)計表按普通的Word表格來拷貝,粘貼后格式大部分會丟失,但被轉(zhuǎn)換為Word表格,可以進(jìn)一步修改;拷貝對象是將統(tǒng)計表拷貝為特殊的圖片,格式與以前完全一樣,但不能進(jìn)行修改。含中文字符的統(tǒng)計表格:如果所用
39、的統(tǒng)計表格里有中文字符,則不能直接用拷貝粘貼的方法讀入Word,粘貼過去的中文可能會全部變成亂碼,需要一律重新輸入。這時可在Word中使用編輯菜單的“選擇性粘貼”然后選擇其中的無格式文本,這樣整個表格就會按照Tab鍵分隔的純文本形式粘貼入Word,里面的中文也完好無損。再將文本選中,使用表格菜單中的“文字轉(zhuǎn)換到表格”,就又可以轉(zhuǎn)換為表格,且中文完好無損。統(tǒng)計圖:和統(tǒng)計表的情況類似,這里也有拷貝或拷貝對象兩種選擇,但我們推薦一直使用后者,直接粘貼過去的就是普通的圖片。在Excel 2000中使用輸出結(jié)果:在 Excel2000建議中使用普通的拷貝/粘貼方式來操作。Excel的兼容性要比Word好
40、些,可以完全兼容SPSS輸出的表格,表格內(nèi)容就會基本無損的被移入Excel工作表單中,含中文的表格粘貼過來后,中文并不會變?yōu)閬y字符,并且可以進(jìn)一步修改貼。三、實驗報告1、紐約55名棒球佼佼者樣本的位置數(shù)據(jù)列在下表,每一項數(shù)據(jù)表示這些佼佼者們所擔(dān)任的首要位置:投手(P)、接手(H)、一壘(1)、二壘(2)、三壘(3)、游擊手(S)、左外場(L)、中外場(C)和右外場(R)。L P C H 2 P R 1 S S 1 L P R P R 1 2 H S P P P R C S L R P C C P P R P 3 H 2 L P2 3 P H L P 1 C P P P S 1 L R 根據(jù)以上
41、信息建立SPSS數(shù)據(jù)文件。2、美國個人投資協(xié)會報道了90家新的影子股票。術(shù)語“影子”表示中小型企業(yè)的股票,不被證券公司緊緊跟隨。有關(guān)股票在哪交易(OTC、AMEX、NYSE),每股贏余和價格/贏余比率的信息由20個影子股票的樣本給出。(數(shù)據(jù)見影子價格)每股贏余數(shù)據(jù)用組限0.000.19,0.200.39等,價格/贏余比率數(shù)據(jù)用組限0.09.9,10.019.9。根據(jù)以上規(guī)則實現(xiàn)對數(shù)據(jù)的重新編碼。完成以上兩道題,并完成實驗報告。四、上機(jī)選做練習(xí)題1、下面是30名學(xué)生對食堂情況的反饋問卷,根據(jù)問卷內(nèi)容完成對SPSS數(shù)據(jù)文件變量的設(shè)計。(1)你在食堂用餐時認(rèn)為下面內(nèi)容的重要程度如何完全不重要 一般
42、非常重要 1 2 3 4 5 6 7衛(wèi)生飯量等待時間味道親切(2)你每周去這個食堂幾次?(3)性別(1男,2女)2、根據(jù)成績表.sav中的數(shù)據(jù),按90以上(包括90)、8090(包括80)、7080(包括70)、6070(包括60)及60以下的標(biāo)準(zhǔn),對現(xiàn)代企業(yè)管理的成績進(jìn)行重新編碼,用優(yōu)、良、中、及格和不及格表示。第二單元 描述統(tǒng)計與基本統(tǒng)計分析統(tǒng)計描述是對所收集的數(shù)據(jù)資料進(jìn)行加工整理、綜合概括,通過圖示、列表和計數(shù)對資料進(jìn)行分析和描述。但統(tǒng)計描述只能對統(tǒng)計數(shù)據(jù)的結(jié)構(gòu)和總體情況進(jìn)行描述,并不能深入了解統(tǒng)計數(shù)據(jù)的內(nèi)部規(guī)律。統(tǒng)計描述主要分三方面的內(nèi)容:單變量截面數(shù)據(jù)的描述;相對數(shù)的統(tǒng)計描述;雙變量
43、截面數(shù)據(jù)的描述。描述性統(tǒng)計分析是統(tǒng)計分析的第一步,做好這一步是進(jìn)行正確的統(tǒng)計推斷的先決條件。SPSS的許多模塊均可進(jìn)行描述性統(tǒng)計,但專門為該目的而設(shè)計的模塊集中在Descriptive Statistics菜單中。有五個過程:Frequencies過程的主要功能是產(chǎn)生頻數(shù)表;Descriptive 過程則是一般性的統(tǒng)計描述;Explore過程用于對數(shù)據(jù)概括不清時的探索性分析;Crosstabs過程則完成計數(shù)資料和等級資料的統(tǒng)計描述和一般的統(tǒng)計檢驗;Ratio過程描述了兩個定比變量的比率。實驗二 單變量截面數(shù)據(jù)的描述性分析一、實驗?zāi)康?、能夠應(yīng)用SPSS完成描述統(tǒng)計量的計算:計算算術(shù)平均數(shù)、中位
44、數(shù)、眾數(shù);計算全距、四分位間距、標(biāo)準(zhǔn)差、方差等,并根據(jù)統(tǒng)計指標(biāo)對數(shù)據(jù)分布給予解釋;2、能夠做出數(shù)據(jù)的頻數(shù)分布表,并利用頻數(shù)分布表解決問題;3、能夠完成統(tǒng)計圖的繪制(主要包括直方圖、箱圖、莖葉圖等),并作出合理的解釋;4、能根據(jù)統(tǒng)計指標(biāo)的含義解決實際問題。二、實驗原理及步驟講解(一)單變量截面數(shù)據(jù)的描述統(tǒng)計概述單變量截面數(shù)據(jù)又稱一維變量,是指總體各單位所承載的某一數(shù)據(jù)標(biāo)志的一系列觀察結(jié)果。一維變量的統(tǒng)計數(shù)據(jù)經(jīng)過整理后,形成了次數(shù)分布的各種圖表,這些圖表在一定程度上已經(jīng)表現(xiàn)了一組數(shù)據(jù)的分布規(guī)律和特征。如果仔細(xì)觀察這些數(shù)據(jù)就可以發(fā)現(xiàn),即使在同一組內(nèi),一方面各種數(shù)據(jù)存在參差不齊,另一方面各種數(shù)據(jù)又有集
45、中在某一個數(shù)值周圍的趨勢,這就是單變量截面數(shù)據(jù)次數(shù)分布的三個重要特征:集中趨勢、離散趨勢及偏態(tài)和峰度。1、集中趨勢頻數(shù)分布數(shù)列中各觀察值有一種向中心集中的趨勢,在中心附近的觀察值數(shù)目較多,遠(yuǎn)離中心的較少,這稱為集中趨勢。常用的集中趨勢的指標(biāo)是:眾數(shù)、中位數(shù)、均值。眾數(shù):在數(shù)據(jù)分布中出現(xiàn)最多的變量的值。它代表數(shù)據(jù)集中程度。對于不分組的資料,確定眾數(shù)意義不大,甚至沒意義。中位數(shù):中位數(shù)就是一組n個數(shù)據(jù)的資料, x1,x2xn,若按大小順序排列,處在數(shù)列的中點的數(shù)據(jù)。也就是說,把一個有序變量的全部數(shù)值分成數(shù)量相等的兩部分,一半比它大,一半比它小。中位數(shù)是反映現(xiàn)象的一般水平和集中趨勢的代表性數(shù)值。均值
46、:也稱算術(shù)平均值,它是一個分布數(shù)列的全部值的和除以數(shù)列項數(shù)所得的商。均值是變量集中趨勢的主要測量度,同時均值也是變量的重心,是變量規(guī)律性的反映。其中均值適用于正態(tài)分布和對稱分布資料,對嚴(yán)重偏態(tài)的分布會失去其代表性,中位數(shù)適用于所有分布類型的資料。2、離散趨勢離散趨勢與集中趨勢相反,離散趨勢反映的是一組資料中各觀測值之間的差異和離散程度。集中趨勢和離散趨勢的計量指標(biāo)相反,離散趨勢較小時,集中趨勢指標(biāo)的代表性就高。常用離散趨勢指標(biāo)有:方差和標(biāo)準(zhǔn)差、四分位間距、極差等。四分位間距是從小到大排序后的數(shù)列中的第三個四分位數(shù)和第一個四分位數(shù)之差。它避免了受極端值影響,但數(shù)據(jù)資料的利用率很低。方差和標(biāo)準(zhǔn)差:
47、四分位間距是用于有序變量的較為粗糙的離散趨勢的計量,而方差和標(biāo)準(zhǔn)差是測量離散趨勢的最重要、最常用的計量指標(biāo)。其中方差和標(biāo)準(zhǔn)差只適用于正態(tài)分布資料,四分位間距適用于各種分布類型的資料。3、分布特征偏態(tài)和峰度的計量除了以上兩種基本趨勢之外,隨著對數(shù)據(jù)特征的了解的深入,還應(yīng)了解 數(shù)據(jù)應(yīng)當(dāng)是服從什么分布的。針對每一種分布類型,都可以由一系列的只來描述數(shù)據(jù)偏離分布的程度。例如對于正態(tài)分布,偏度系數(shù)、峰度系數(shù)反映當(dāng)前數(shù)據(jù)偏離正態(tài)分布的嚴(yán)重程度。一般這些指標(biāo)使用較少。偏度系數(shù)(skewness)是描述頻數(shù)分布數(shù)列中各觀察值是否對稱地分布在中心兩側(cè),或者說某一側(cè)的觀察值是否比另一側(cè)的觀察值對中心偏離得更遠(yuǎn)一些
48、。偏態(tài)系數(shù)小于0時,均值在眾數(shù)左側(cè),是一種左偏的分布,圖象左邊有“小尾巴”;偏態(tài)系數(shù)大于0時,均值在眾數(shù)右側(cè),是一種右偏的分布,圖象右邊有“小尾巴”;偏態(tài)系數(shù)等于0時,圖形與正態(tài)分布圖形相似,為對稱形分布。峰度系數(shù)可描述頻數(shù)分布數(shù)列中各觀察值是否較為均勻地分布,還是側(cè)重出現(xiàn)在中心附近。即描述次數(shù)分布曲線的高峰形態(tài)。峰越高尖,峰度值越大;峰越低闊,峰度值越小。峰度高低程度以正態(tài)分布為標(biāo)準(zhǔn)進(jìn)行比較,正態(tài)分布的峰度系數(shù)為0,大于0者成為高狹峰,小于0者稱為低闊峰。SPSS的許多模塊都可以進(jìn)行描述性分析,單變量截面數(shù)據(jù)的描述性分析的專門工具有三個:Frequencies、Descriptive和 Ex
49、plore,集中在Descriptive Statistics菜單中。其中Frequencies過程的特色是產(chǎn)生頻數(shù)分布表,對分類資料和定量資料都適用;Descriptive過程進(jìn)行一般性的統(tǒng)計描述,適用于定量資料;Explore過程用于對數(shù)據(jù)分布不清時的探索性分析,能給出各種可能用到的統(tǒng)計指標(biāo)和統(tǒng)計圖,適用于定量資料。下面分別介紹。(二)頻數(shù)(Frequencies)過程頻數(shù)分布表是描述性統(tǒng)計中最常用的方法之一,F(xiàn)requencies過程就是專門為產(chǎn)生頻數(shù)分布表設(shè)計的,它不僅能產(chǎn)生頻數(shù)分布表,而且還能產(chǎn)生常用的條圖、圓圖等統(tǒng)計圖。例2.1:根據(jù)調(diào)查問卷.sav中的數(shù)據(jù),對年齡進(jìn)行頻數(shù)分析,你
50、能得到什么信息?AnalyzeDescriptive StatisticsFrequenciesVariable框:x7 *選入要分析的變量Statistics : Mean Median Std.deviation *要求計算均數(shù)、中位數(shù)和標(biāo)準(zhǔn)差 Percentiles:鍵入2.5:Add *要求計算P2.5和P97.5百分位數(shù) Percentiles:鍵入97.5:Add Continue Charts Bar charts *做頻數(shù)分布的直方圖 ContinueOK 主要界面說明【主對話框】(見圖2-1)1、Variable(s)框:用于選入需要進(jìn)行描述的變量,若選入多個,系統(tǒng)會分別進(jìn)行
51、分析。2、Display frequency tables:確定是否在結(jié)果中輸出頻數(shù)表,默認(rèn)輸出。圖2-1 Frequencies過程主對話框【Statistics子對話框】(見圖2-2)該對話框的功能為定義需要計算的各種描述統(tǒng)計量。(或以表格形式給出)1、Percentile Values復(fù)選框組:定義需要輸出的百分位數(shù),可計算四分位數(shù),可以計算四分位數(shù)(Quartiles)、每隔指定百分位輸出當(dāng)前百分位數(shù)(Cut points for equal groups)或直接指定某個百分位數(shù)(Percentiles),本例就在其中直接指定輸出P2.5和P97.5。2、Central tendenc
52、y復(fù)選框組:用于定義描述集中趨勢的一組指標(biāo):均數(shù)(Mean)、中位數(shù)(Median)、眾數(shù)(Mode)、總和(Sum)。圖2-2 Statistics子對話框3、Dispersion復(fù)選框組:用于定義描述離散趨勢的一組指標(biāo):標(biāo)準(zhǔn)差(Std. Deviation)、方差(Variance)、全距(Range)、最小值例Minimum)、最大值(Maximum)、標(biāo)準(zhǔn)誤(S.E mean)。4、Distribution復(fù)選框組:用于定義描述分布特征的兩個指:偏度系數(shù)(Skewness)和峰度系數(shù)(kurtosis)。5、Values are group midpoints:當(dāng)輸出的數(shù)據(jù)是分組頻數(shù)數(shù)
53、據(jù),并且具體數(shù)值是組中值時,選中該復(fù)選框以通知SPSS,這樣它在計算各種百分位數(shù)的時候會將數(shù)據(jù)按頻數(shù)表對待,而不會認(rèn)為同一組內(nèi)的數(shù)據(jù)取值都是組中值的大小。當(dāng)然,如果你不計算百分位數(shù),選不選它無所謂?!綜harts子對話框】(見圖2-3)該對話框用于設(shè)定所做的統(tǒng)計圖。1、Chart type單選鈕組:定義統(tǒng)計圖類型,有四種選擇:無、條圖(Bar charts)、餅圖(Pie charts)、直方圖(Histograms)。其中直方圖還可以選擇是否加上正態(tài)曲線(With normal curve)。2、Chart Values單選鈕組:當(dāng)選擇繪制條圖和餅圖時定義是按照頻數(shù)還是按百分比做圖(即影響縱
54、坐標(biāo)刻度)。【Format子對話框】(見圖2-4)用于定義輸出頻數(shù)表的格式,不過一般不用更改,使用默認(rèn)設(shè)置即可。1、Order by單選鈕組:定義頻數(shù)表的排列次序,有四個選項:Ascending values:根據(jù)數(shù)值按升序從小到大作頻數(shù)分布。Descending values:根據(jù)數(shù)值按降序從大到小作頻數(shù)分布。Ascending counts:根據(jù)頻數(shù)按升序從少到多作頻數(shù)分布。Descending counts:根據(jù)頻數(shù)按降序從多到少作頻數(shù)分布。 圖2-3 Charts子對話框 圖2-4 Format子對話框2、Multiple variables單選鈕組:如果選擇了兩個以上變量做頻數(shù)表,則
55、Compare variables可以將它們的結(jié)果在同一個頻數(shù)表過程輸出結(jié)果中顯示,便于互相比較;Organize output by variables則將結(jié)果在不同的頻數(shù)表中顯示結(jié)果。主要結(jié)果解釋Statistics年齡 NValid28 Missing2Mean32.21Median31.00Std. Deviation5.724Skewness.386Std. Error of Skewness.441Kurtosis-.240Std. Error of Kurtosis.858Percentiles2.522.00 2528.00 5031.00 7535.00 97.545.00上
56、表輸出了各種統(tǒng)計量,表格做上方指分析的變量為年齡,有效人數(shù)為28人 (即對年齡應(yīng)答人數(shù)),缺失值2(有2人沒對年齡作回答),平均年齡為32.21歲,中位數(shù)為31,均值和中位數(shù)相差不大,說明數(shù)據(jù)分布應(yīng)該基本對稱;標(biāo)準(zhǔn)差為5.724歲;峰度系數(shù)為-0.240, 表示正偏,即圖象右邊有小尾巴。表格最下方為五個百分位數(shù)。年齡 FrequencyPercentValid PercentCumulative PercentValid2213.33.63.6 2313.33.67.1 2513.33.610.7 2613.33.614.3 2713.33.617.9 28310.010.728.6 3041
57、3.314.342.9 31310.010.753.6 3226.77.160.7 3413.33.664.3 35413.314.378.6 3713.33.682.1 3913.33.685.7 4013.33.689.3 4113.33.692.9 4213.33.696.4 4513.33.6100.0 Total2893.3100.0 MissingSystem26.7 Total30100.0 上表為對年齡做的頻數(shù)分布表,Valid右側(cè)為原始值,為頻數(shù),Percent為各組頻數(shù)占總例數(shù)的百分比(包括缺失值),Valid Percent為各組頻數(shù)占總例數(shù)的有效百分比(即不包括缺失值)
58、,Cumulative Percent,各組頻數(shù)占總例數(shù)的累積百分比,如89.3表示40歲以下的人占總?cè)藬?shù)的89.3%。SPSS的頻數(shù)分布表是按單個值給出的頻數(shù)分布和累積頻數(shù)分布,而不能按某種要求確定組距和組數(shù),所以它更適合對離散變量做頻數(shù)分析,對于連續(xù)變量做頻數(shù)分析意義不太大。如果想用Frequencies過程得到分組的頻數(shù)分布表,可以先用Recode過程產(chǎn)生一個新變量代表所需的各組段,再對該新的分類變量做頻數(shù)表。圖2-5 直方圖上圖為直方圖,可見數(shù)據(jù)基本上呈正態(tài)分布,圖上曲線為正態(tài)曲線,可以把直方圖與理論上的正態(tài)曲線作比較。右側(cè)為年齡的均值、標(biāo)準(zhǔn)差和有效例數(shù)。實例引申把分析變量該成x1(對
59、家庭的滿意程度),則得到的頻數(shù)表為:對家庭的滿意程度 FrequencyPercentValid PercentCumulative PercentValid很不滿意310.010.010.0 不滿意1033.333.343.3 一般826.726.770.0 滿意620.020.090.0 很滿意310.010.0100.0 Total30100.0100.0 這是一張分類變量的頻數(shù)表,可見對家庭很不滿意的人占10%,不滿意的人占33.3%,無所謂的占26.7%,累計占到70%,說明現(xiàn)代社會人們對家庭的滿意程度上并不是很理想。相對于連續(xù)變量的頻數(shù)表,分類變量的頻數(shù)表更有意義。(三)Descr
60、iptive 過程Descriptive 過程是連續(xù)資料統(tǒng)計描述應(yīng)用最多的過程,它對變量進(jìn)行描述性統(tǒng)計分析,計算出一系列的統(tǒng)計指標(biāo)。AnalyzeAnalyzeDescriptive StatisticsDescriptiveVariable框:x10 *選入要分析的變量月收入OK主要界面介紹【主對話框】(見圖2-6)1、Variables框:用于選入需要進(jìn)行描述的變量,如果選入多個,系統(tǒng)會對它們依次進(jìn)行描述,并輸出在同一張表格里。2、 standardized values as variables: 確定是否要將原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)正態(tài)變換并存為新變量。當(dāng)要把數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)正態(tài)變換時這是一個非常
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 駕校加盟合同范例
- 2024至2030年球型測電筆項目投資價值分析報告
- 江蘇epc合同范例
- 2024至2030年平轉(zhuǎn)反吹扁袋除塵器項目投資價值分析報告
- 陜西學(xué)前師范學(xué)院《現(xiàn)代冶金工程設(shè)計原理》2023-2024學(xué)年第一學(xué)期期末試卷
- 陜西學(xué)前師范學(xué)院《空調(diào)工程課程設(shè)計》2023-2024學(xué)年第一學(xué)期期末試卷
- 商品采購合同范例寫
- 陜西鐵路工程職業(yè)技術(shù)學(xué)院《電子技術(shù)綜合課程設(shè)計》2023-2024學(xué)年第一學(xué)期期末試卷
- 2024全新股權(quán)法人轉(zhuǎn)讓合同附帶競業(yè)禁止條款下載3篇
- 布道華夏租車合同范例
- 2024《整治形式主義為基層減負(fù)若干規(guī)定》全文課件
- 常用統(tǒng)計軟件應(yīng)用智慧樹知到期末考試答案章節(jié)答案2024年揚(yáng)州大學(xué)
- 中國法律史-第三次平時作業(yè)-國開-參考資料
- 區(qū)域分析與規(guī)劃智慧樹知到期末考試答案章節(jié)答案2024年寧波大學(xué)
- 食品營養(yǎng)學(xué)(暨南大學(xué))智慧樹知到期末考試答案2024年
- 【word模板】圣誕節(jié)圣誕元素信紙
- 礦業(yè)公司管理制度(全冊參考范本)
- 電子營業(yè)執(zhí)照下載確認(rèn)書
- CA6140撥叉831002課程設(shè)計工序卡
- 全國醫(yī)療服務(wù)價格項目規(guī)范(2012年版)
- MATLAB論文基于MATLAB的自動控制系統(tǒng)及案例分析
評論
0/150
提交評論