SPSS經濟統(tǒng)計實務new_第1頁
SPSS經濟統(tǒng)計實務new_第2頁
SPSS經濟統(tǒng)計實務new_第3頁
SPSS經濟統(tǒng)計實務new_第4頁
SPSS經濟統(tǒng)計實務new_第5頁
已閱讀5頁,還剩47頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、SPSS經濟統(tǒng)計實務讀書破萬卷 王吉林 主講二一一年八月Tel-mail:第一章 SPSS簡介統(tǒng)計要與大量的數據打交道,涉及繁雜的計算和圖表繪制?,F代的數據分析工 作如果離開統(tǒng)計軟件幾乎是無法正常開展。在準確理解和掌握了各種統(tǒng)計方法原理 之后,再來掌握幾種統(tǒng)計分析軟件的實際操作,是十分必要的。 常見的統(tǒng)計軟件有 SAS,SPSS,MINITAB,EXCEL 等。這些統(tǒng)計軟件的功能 和作用大同小異,各自有所側重。其中的 SAS 和 SPSS 是目前在大型企業(yè)、各類院 校以及科研機構中較為流行的兩種統(tǒng)計軟件。特別是 SPSS,其界面友好、功能強

2、大、 易學、易用,包含了幾乎全部尖端的統(tǒng)計分析方法,具備完善的數據定義、操作管 理和開放的數據接口以及靈活而美觀的統(tǒng)計圖表制作。SPSS 在各類院校以及科研機 構中更為流行。 自 20 世紀 60 年代 SPSS 誕生以來,為適應各種操作系統(tǒng)平臺的要求經歷了多次版本更新,各種版本的 SPSS for Windows 大同小異,在本實驗課程中我們選擇 PASW Statistics SPSS(Statistical Product and Service Solutions,意為統(tǒng)計產品與服務解決方案)18.0 作為統(tǒng)計分析應用實驗活動的工具。 1SPSS 的運行模式 SPSS 主要有三種運行模

3、式: (1) 批處理模式 這種模式把已編寫好的程序(語句程序)存為一個文件,提交給開始菜單上 SPSS for WindowsProduction Mode Facility程序運行。 (2) 完全窗口菜單運行模式 這種模式通過選擇窗口菜單和對話框完成各種操作。用戶無須學會編程,簡單 易用。 (3) 程序運行模式 這種模式是在語句(Syntax)窗口中直接運行編寫好的程序或者在腳本(script) 窗口中運行腳本程序的一種運行方式。這種模式要求掌握 SPSS 的語句或腳本語言。 本實驗指導手冊為初學者提供入門實驗教程,采用“完全窗口菜單運行模式”。 2SPSS 的啟動 (1)在 windows

4、開始程序PASW,在它的次級菜單中單擊“SPSS 12.0 for Windows”即可啟動 SPSS 軟件,進入 SPSS for Windows 對話框3SPSS 軟件的退出SPSS 軟件的退出方法與其他 Windows 應用程序相同,有兩種常用的退出方法: 按 FileExist 的順序使用菜單命令退出程序。 直接單擊 SPSS 窗口右上角的“關閉”按鈕,回答系統(tǒng)提出的是否存盤的問題之后即可安全退出程序。 4SPSS 的主要窗口介紹SPSS 軟件運行過程中會出現多個界面,各個界面用處不同。其中,主要的界 面有三個:數據編輯窗口、結果輸出窗口和語句窗口。 (1) 數據編輯窗口 啟動 SPS

5、S 后看到的第一個窗口便是數據編輯窗口,如圖 1.3 所示。在數據編輯窗口中可以進行數據的錄入、編輯以及變量屬性的定義和編輯,是 SPSS 的基本界面。主要由以下幾部分構成:標題欄、菜單欄、工具欄、編輯欄、變量名欄、觀測序號、窗口切換標簽、狀態(tài)欄。 標題欄:顯示數據編輯的數據文件名。 菜單欄:通過對這些菜單的選擇,用戶可以進行幾乎所有的 SPSS 操作。關 于菜單的詳細的操作步驟將在后續(xù)實驗內容中分別介紹。 為了方便用戶操作,SPSS 軟件把菜單項中常用的命令放到了工具欄里。當鼠 標停留在某個工具欄按鈕上時,會自動跳出一個文本框,提示當前按鈕的功能。另 外,如果用戶對系統(tǒng)預設的工具欄設置不滿意

6、,也可以用視圖工具欄 設定 命令對工具欄按鈕進行定義。 編輯欄:可以輸入數據,以使它顯示在內容區(qū)指定的方格里。 變量名欄:列出了數據文件中所包含變量的變量名 觀測序號:列出了數據文件中的所有觀測值。觀測的個數通常與樣本容量的 大小一致。 窗口切換標簽:用于“數據視圖”和“變量視圖”的切換。即數據瀏覽窗口與變 量瀏覽窗口。數據瀏覽窗口用于樣本數據的查看、錄入和修改。變量瀏覽窗口用于 變量屬性定義的輸入和修改。 狀態(tài)欄:用于說明顯示 SPSS 當前的運行狀態(tài)。SPSS 被打開時,將會顯示 “PASW Statistics Processor”的提示信息。 (2)結果輸出窗口 第二章:SPSS 統(tǒng)計

7、繪圖功能詳解在常用的統(tǒng)計軟件中,SAS 繪制的統(tǒng)計圖不太美觀;而 SPSS 繪制的統(tǒng)計圖較為美觀,可以滿足大多數情況下的要求;STATA 繪制的統(tǒng)計圖形最為精美,但由于 它采用命令行方式操作,美觀的圖形需要添加大量選項,普通人不易掌握;而S-PLUS、MATHLAB 等偏數理統(tǒng)計的軟件雖然繪圖能力也非常強,但由于自身的定位問題,并不為大多數人所熟悉。因此,在各種統(tǒng)計軟件中,以SPSS 制作的統(tǒng)計圖應用最為廣泛。EXECL 的統(tǒng)計繪圖功能非常的強,我們還有必要學習 SPSS 的繪圖功能嗎?這個問題我的看法是:EXCEL 由于它的純中文界面和簡單而強大的繪圖功能,使得 可以用它來直接繪制各種簡單的

8、統(tǒng)計圖,但是,EXCEL 可以直接繪制的統(tǒng)計圖種類 有限,象誤差條圖、自回歸圖等它就無能為力,即是它支持的線圖、條圖等,如果 過于復雜,如疊式條圖、累計條圖等也無法作出,而這些圖在統(tǒng)計中是經常會碰到 的,此時就只有采用統(tǒng)計軟件來繪制,SPSS 就是其中的佼佼者。常用統(tǒng)計圖在 SPSS 10.0 版中,除了生存分析所用的生存曲線圖被整合到分析( ANALYZE)菜單中外,其他的統(tǒng)計繪圖功能均放置在圖形(graph) 菜單中。該菜單具體分為以下幾部分:Gallery:相當于一個自學向導,將統(tǒng)計繪圖功能做了簡單的介紹,初學者可以 通過它對 SPSS 的繪圖能力有一個大致的了解。常用的普通統(tǒng)計圖具體來

9、說有:條圖、散點圖、線圖、直方圖、餅圖、面積圖、箱式圖、正態(tài)Q-Q 圖、正態(tài) P-P 圖、質量控制圖、Pareto圖、自回歸曲線圖、高低圖、交互相關圖、序列圖、頻譜圖、誤差線圖。其中后面幾種圖形用于時間序列分析。我們的講解將這些常規(guī)統(tǒng)計圖為主, 對交互式統(tǒng)計圖和統(tǒng)計地圖只舉例介紹,就不再全面講述了。我們所用的數據集為SPSS 自帶的 anxiety.sav,本章的大多數例子都將圍繞該數據集展開。1.條圖由于不同圖形的繪圖對話框有相當強的共性,下面我們通過一個簡單的例子來 看看繪圖菜單的大致界面是怎么樣的,通過這個例子大家可以舉一反三。例:在數據集 anxiety.sav 中分不同的subjec

10、t對變量score值(之和)繪制條圖。選擇 圖形(graphs)條形圖(bar)后,系統(tǒng)首先會彈出一個簡單的導航對話框如下所示: 簡單箱圖(單式條圖):多用于單個指標的大小。復式條圖 :多用于兩個或多個指標,比如同是進行男女性血紅細胞和血紅蛋白值的比較。堆積條圖(分段條圖):可以用以表現每個直條中某個因素各種水平構成情況,比如男女兩種性別的某種指標構成的比較。定義統(tǒng)計圖中數據的表達類型: 個案組摘要:條圖反映了按同一類變量取值不同做分組匯總。各個變量的摘要:條圖反映了按照不同變量的匯總。個案值:條圖反映了個體觀察值。在該對話框中,SPSS 將條圖進行了大致的分類,對話框的上半部分用于選擇條圖類

11、型,下半部分的 圖表中德數據為(Data in Chart are)單選框組用于定義條圖中數據的表達類型。這里根據我們所需繪制條圖的類型,應該選擇簡單條圖,在表達類型中則應選擇個案組摘要(Summaries for groups of cases)。選好后單擊定義鈕,系統(tǒng)開啟正式的條圖定義對話框如下:對話框左側為通用的侯選變量列表框,右側的對話框元素依次解釋如下:用于定義條圖中直條所代表的含義,可以是樣本例數、樣本數所占的百分比、 累計樣本例數、累計樣本數所占的百分比或其余匯總函數,在例中我們要對變量 score 的值繪圖,因此選擇最后一項Other summary function,系統(tǒng)開啟

12、 summary function 對話框如下所示:該對話框中列出了更多的統(tǒng)計匯總函數,可以滿足絕大多數情況的需要。具體有: 上部:包括大多數常用統(tǒng)計匯總函數,如均數、標準差、中位數、方差、眾數、最大、最小值、樣本例數、變量值之和、累計變量值。 中部:可對各記錄按大小進行篩選,如上側百分之多少,或者只選擇小于某 個數值的記錄。具體的數值在 value 框中輸入。 下部:可按數值大小值選擇取值在某個范圍內的記錄,具體的范圍在低(low)和 高(high) 框中輸入。注意上面的一些函數是和前面重復的,如樣本例數。此外,對話框最下側還有一個 Values are grouped midpoints

13、復選框,當選中median of values 或 percentile 單選框時該框變?yōu)榭蛇x,選中則表明數據為頻數表格式,所輸入的數值為組中值。根據我們的目的,這里選擇 sum of values 單選框,單擊 continue 后系統(tǒng)回到上 一個對話框。 類別軸:用于選擇所需的分類變量,此處必選。這里根據要求,將subject選入,可以見到此時確定已經變黑可用了。 面板依據:用于選擇繪制條圖的模板,一般較少用。標題:用于輸入統(tǒng)計圖的標題和腳注,最多可以輸入兩行主標題,一行副標題,兩行腳注。選項:彈出 Options 對話框,用于定義相關的選項,有:置信區(qū)間(Confidence Inter

14、val)框 輸入需要計算的均數差值可信區(qū)間范圍,默認為95%。如果是和總體均數為0相比,則此處計算的就是樣本所在總體均數的可信區(qū)間。 缺省值(Missing Values):定義分析中對缺失值的處理方法,可以是具體分析用到的變量有缺失值才去除該記錄, 或只要相關變量有缺失值,則在所有分析中均將該記錄去除。默認為前者,以充分利用數據。 現在,我們已經完成了繪制該圖所需的工作,單擊確定,系統(tǒng)繪出統(tǒng)計圖如下:至于另兩種情況,其對話框界面極為簡單,可以說是一目了然,這里不再多講,只指出以下幾點: 在各個變量的摘要(Summaries of separate variables)的對話框中,可以用 Ch

15、ange summary 鈕更改匯總函數。 在個案值(Values of individual cases)的對話框中,下方分類標簽(category labels)的選擇并不影響做出直條的多少,只會影響 X 軸表示的內容,默認是記錄號。 2.復式條圖與分段條圖的界面復式條圖與分段條圖的界面并非全新的東西,只是在前面的簡單界面上增加了 一些元素,讓我們再通過一個例子來看看:例:在數據集 anxiety.sav 中分不同的 subject對變量score值(之和)繪制條圖,并且按變量trial的不同取值堆積(分段):由于要按變量trial的不同取值分段,因此在導航對話框中就不能選簡單箱圖,而應根

16、據目的選擇堆積條圖(stacked),單擊定義后系統(tǒng)開啟的條圖定義對話框和我們前面所用的略有不同,具體來說在 分類軸(Category Axis)框附近不同,現在分類軸框下面多了些東西如下所示:顯然,當需要做復式條圖時,將所需的分類變量選入堆棧(stacks )框中即可,做分段條圖的情況也與此類似。繪出的條圖如下所示:但是,在個案值( Values of individual cases )的對話框中情況有些不同,原先條的特征(Bars repersent)框只能選入一個變量,做復式條圖和分段條圖時該框中可以選入多個變量了,其他的內容不變。 3.散點圖散點圖是各種統(tǒng)計圖中比較簡單的一種,共分為

17、 simple、matrix(以矩陣的形式顯示多個變量間兩兩的散點圖)、overlay(將多個變量間兩兩的散點圖同時做在一張圖上)和 3D(將 X、Y、Z 三個變量間的相關散點圖做在一個立體空間中)四種,其中需要解釋的比較特殊的內容有:設置標記(Set marks by):選入一個標記變量,根據該變量取值的不同對同一個散點圖中的各點標以不同的顏色(或形狀),例如在數據 cars 中我們以 horse做圖,如果用orgion的大小來做marks,則做出的圖如下:標注個案( Label cases):當編輯圖形在圖形選項中選擇顯示labels 時,圖形默認顯示記錄號,如果在這里選擇了label 變

18、量,則顯示該變量的取值。 做出的 3D 圖形可以在編輯時進行三維旋轉,從多個角度進行觀察。 4.線圖 線圖實際上和條圖是一回事,可以認為它就是條圖的變形,條圖是用直條的高 低表示多少,而線圖是用點的高低來表示,然后又用直線將各點連接而成。 5.餅圖 餅圖的做法簡直太簡單了,不值一提! 6.面積圖 面積圖的做法是和線圖、餅圖類似的,比如堆積面積圖是將各個指標值相加而 成,和分段式條圖非常類似。 7.直方圖 直方圖用于觀察某個變量的分布情況,如果選擇了 display normal curve 復選框, 則會同時做出一條當前變量理想狀況的正態(tài)分布曲線來,和該曲線相比,你就可以 知道變量的實際分布究

19、竟差了多遠。8.其他 P-P 圖和 Q-Q 圖都是用來觀察變量是否服從正態(tài)分布的;質量控制圖則用來觀 察個體值是否有超過正常值范圍的情況出現;箱式圖的作用和它類似,只是換了一 種表達方式;其余的幾種圖幾乎都是用與時間序列模型的。 實驗1 數據文件管理一、實驗目的與要求通過本實驗項目,使學生理解并掌握 SPSS 軟件包有關數據文件創(chuàng)建和整理的基本操作,學習如何將收集到的數據輸入計算機,建成一個正確的 SPSS 數據文件, 并掌握如何對原始數據文件進行整理,包括數據查詢,數據修改、刪除,數據的排序等等。 二、實驗原理 SPSS 數據文件是一種結構性數據文件,由數據的結構和數據的內容兩部分構成,也可

20、以說由變量和觀測值兩部分構成。一個典型的 SPSS 數據文件如表 2.1 所示。 表 2.1姓名性別年齡張三145李四223王五245SPSS 變量的屬性 SPSS 中的變量共有 11 個屬性,分別是變量名(Name)、變量類型(Type)、長度(Width)、小數點位置(Decimals)、變量名標簽(Label)、變量名值標簽(Value)、缺失值(Missing)、數據列的顯示寬度(Columns)、對其方式(Align)和度量尺度以及角色。定義一個變量至少要定義它的兩個屬性,即變量名和變量類型,其他屬性可以暫時采用系統(tǒng)默認值,待以后分析過程中如果有需要再對其進行設置。在 SPSS數據編

21、輯窗口中單擊“變量視圖”標簽,進入變量視圖界面(如圖 2.1 所示)即可對變量的各個屬性進行設置。圖2.1三、實驗內容與步驟 1創(chuàng)建一個數據文件 數據文件的創(chuàng)建分成三個步驟: (1)選擇菜單 【文件】【新建】【數據】新建一個數據文件,進入數據 編輯窗口。窗口頂部標題為“SPSS Statistics 數據編輯器”。(2)單擊左下角【變量視窗】標簽進入變量視圖界面,根據實驗的設計定義每個變量類型。(3)變量定義完成以后,單擊【數據視窗】標簽進入數據視窗界面,將每個具 體的變量值錄入數據庫單元格內。 2讀取外部數據 當前版本的 SPSS 可以很容易地讀取 Excel 數據,步驟如下: (1)按【文

22、件】【打開】【數據】的順序使用菜單命令調出打開數據對話 框,在文件類型下拉列表中選擇數據文件,如圖 2.2 所示。圖2.2(2)選擇要打開的 Excel 文件,單擊“打開”按鈕,調出打開 Excel 數據源對話框,如圖 2.3 所示。圖 2.3對話框中各選項的意義如下: 工作表下拉列表:選擇被讀取數據所在的 Excel 工作表。 范圍輸入框:用于限制被讀取數據在 Excel 工作表中的位置。 3數據編輯 在 SPSS 中,對數據進行基本編輯操作的功能集中在 編輯(Edit)和數據(Data) 菜單中。 4SPSS 數據的保存 SPSS 數據錄入并編輯整理完成以后應及時保存,以防數據丟失。保存數

23、據文件可以通過【文件】【保存】或者【文件】【另存為】菜單方式來執(zhí)行。在數據保存對話框(如圖 2.4 所示)中根據不同要求進行 SPSS 數據保存。圖 2.45. 數據整理在 SPSS中,數據整理的功能主要集中在【數據】和【轉換】兩個主菜單下。 (1)數據排序(Sort Case) 對數據按照某一個或多個變量的大小排序將有利于對數據的總體瀏覽,基本操 作說明如下: 選擇菜單【數據】【排列個案】,打開對話框,如圖 2.5所示。 圖2.5(2)抽樣(Select Case) 在統(tǒng)計分析中,有時不需要對所有的觀測進行分析,而可能只對某些特定的對象有興趣。利用SPSS的Select Case命令可以實現

24、這種樣本篩選的功能。以SPSS安裝配套數據文件accidents.sav為例,選擇accidents大于 60000 的觀測,基本操作說明如下:打開數據文件accidents.sav,選擇【數據】【選擇個案】命令,打開對話框,如圖 2.6圖 2.6 指定抽樣的方式:【全部個案】不進行篩選;【如果條件滿足】按指定條件進行篩選。本例設置:accidents60000,如圖 2.7 所示; 圖2.7設置完成以后,點擊 繼續(xù)(continue),進入下一步。 確定未被選擇的觀測的處理方法,這里選擇默認選項【過濾掉未選定的個案】。 單擊確定(ok)進行篩選,結果如圖 2.8圖 2.8(3)增加個案的數據

25、合并(【合并文件】【添加個案】) 將新數據文件中的觀測合并到原數據文件中,在 SPSS 中實現數據文件縱向合 并的方法如下: 選擇菜單【數據】【合并文件】【添加個案】,如圖 2.9,選擇需要追加的數據文件,單擊打開按鈕,彈出添加個案(Add Cases)對話框,如圖 2.9。 圖2.9選擇個體數據來源的文件(4)增加變量的數據合并(【合并文件】【添加變量】) 增加變量時指把兩個或多個數據文件實現橫向對接。例如將不同課程的成績文 件進行合并,收集來的數據被放置在一個新的數據文件中。在 SPSS 中實現數據文 件橫向合并的方法如下: 選擇菜單【數據】【合并文件】【添加變量】,選擇合并的數據文件,單

26、擊 “打開”,彈出添加變量,如圖 2.12 所示。 圖2.10選擇變量 單擊確定(Ok)執(zhí)行合并命令。這樣,兩個數據文件將按觀測的順序一對一地橫向合并。 (5)數據拆分(Split File) 在進行統(tǒng)計分析時,經常要對文件中的觀測進行分組,然后按組分別進行分析。 例如要求按性別不同分組。在 SPSS 中具體操作如下: 選擇菜單【數據】【分割文件】,打開對話框,如圖2.11所示。 圖2.11分割文件對話框 選擇拆分數據后,輸出結果的排列方式,該對話框提供了3 種方式:對全部觀測進行分析,不進行拆分;在輸出結果種將各組的分析結果放在一起進行比較;按組排列輸出結果,即單獨顯示每一分組的分析結果。

27、選擇分組變量 選擇數據的排序方式 單擊確定(ok)按鈕,執(zhí)行操作 (6)計算新變量 在對數據文件中的數據進行統(tǒng)計分析的過程中,為了更有效地處理數據和反映 事務的本質,有時需要對數據文件中的變量加工產生新的變量。比如經常需要把幾 個變量加總或取加權平均數,SPSS 中通過【計算】菜單命令來產生這樣的新變量, 其步驟如下: 選擇菜單【轉換】【計算變量】,打開對話框,如圖 2.12 所示。 圖2.12 計算變量(Compute Variable) 對話框 在目標變量輸入框中輸入生成的新變量的變量名。單擊輸入框下面類型與標簽按鈕,在跳出的對話框中可以對新變量的類型和標簽進行設置。 在數字表達式輸入框中

28、輸入新變量的計算表達式。例如“年齡20”。 單擊【如果】按鈕,彈出子對話框,如圖 2.13所示。包含所有個體:對所有的觀測進行計算;如果個案滿足條件則包括:僅對滿足條件的觀測進行計算。圖2.13 如果子對話框 單擊確定(Ok)按鈕,執(zhí)行命令,則可以在數據文件中看到一個新生成的變量。 四、備擇實驗某航空公司38名職員性別和工資情況的調查數據,如表 2.3 所示,試在 SPSS 中進行如下操作: (1)將數據輸入到 SPSS 的數據編輯窗口中,將gender定義為字符型變量,將 salary 定義為數值型變量,并保存數據文件,命名為“實驗 1-1.sav”。(2)插入一個變量 income,定義為

29、數值型變量。(3)將數據文件按性別分組 (4)查找工資大于 40000 美元的職工 (5)當工資大于 40000 美元時,職工的獎金是工資的 20;當工資小于 40000 美元時,職工的獎金是工資的 10%,假設實際收入工資獎金,計算所有職工的實 際收入,并添加到 income 變量中。IdGenderSalaryIdGenderSalary1M$ 5700020F$ 262502M$ 4020021F$ 388503F$ 2145022M$ 217504F$ 2190023F$ 240005M$ 4500024F$ 169506M$ 3210025F$ 211507M$ 3600026M$

30、310508F$ 2190027M$ 603759F$ 2790028M$ 3255010F$ 2400029M$ 13500011F$ 3030030M$ 3120012M$ 2835031M$ 3615013M$ 2775032M$ 11062514F$ 3510033M$ 4200015M$ 2730034M$ 9200016M$ 4080035M$ 8125017M$ 4600036F$ 3135018M$10375037M$ 2910019M$ 4230038M$ 31350實驗2 描述統(tǒng)計一、實驗目的與要求統(tǒng)計分析的目的在于研究總體特征。但是,由于各種各樣的原因,我們能夠得 到的往

31、往只能是從總體中隨機抽取的一部分觀察對象,他們構成了樣本,只有通過 對樣本的研究,我們才能對總體的實際情況作出可能的推斷。因此描述性統(tǒng)計分析 是統(tǒng)計分析的第一步,做好這一步是進行正確統(tǒng)計推斷的先決條件。通過描述性統(tǒng) 計分析可以大致了解數據的分布類型和特點、數據分布的集中趨勢和離散程度,或 對數據進行初步的探索性分析(包括檢查數據是否有錯誤,對數據分布特征和規(guī)律 進行初步觀察)。 本本實驗旨在于:引到學生利用正確的統(tǒng)計方法對數據進行適當的整理和顯 示,描述并探索出數據內在的數量規(guī)律性,掌握統(tǒng)計思想,培養(yǎng)學生學習統(tǒng)計學的 興趣,為繼續(xù)學習推斷統(tǒng)計方法及應用各種統(tǒng)計方法解決實際問題打下必要而堅實 的

32、基礎。 二、實驗原理 描述統(tǒng)計是統(tǒng)計分析的基礎,它包括數據的收集、整理、顯示,對數據中有用 信息的提取和分析,通常用一些描述統(tǒng)計量來進行分析。 集中趨勢的特征值:算術平均數、調和平均數、幾何平均數、眾數、中位數等。 其中均數適用于正態(tài)分布和對稱分布資料,中位數適用于所有分布類型的資料。 離散趨勢的特征值:全距、內距、平均差、方差、標準差、標準誤、離散系數 等。其中標準差、方差適用于正態(tài)分布資料,標準誤實際上反映了樣本均數的波動 程度。 分布特征值:偏態(tài)系數、峰度系數、他們反映了數據偏離正態(tài)分布的程度。 三、實驗內容與步驟 下面給出的一個例題是來自 SPSS 軟件自帶的數據文件“employee

33、 data.sav”,該文件包含某公司員工的工資、工齡、職業(yè)等變量,我們將利用此例題給出相關的描述 統(tǒng)計說明,本例中,我們將以員工的當前工資為例,計算該公司員工當前工資的一 些描述統(tǒng)計量,如均值、頻數、方差等描述統(tǒng)計量的計算。 1 頻數分析(Frequencies) 頻數分析多適用于離散變量,其功能是描述離散變量的分布特征?;窘y(tǒng)計分析往往從頻數分析開始。通過頻數分析能夠了解變量取值的狀況,頻數分析多適用于離散變量,其功能是描述離散變量的分布特征。對把握數據的分布特征是非常有用的。比如,在某項調查中,想要知道被調查者的 性別分布狀況。頻數分析的第一個基本任務是編制頻數分布表。SPSS 中的頻數

34、分布 表包括的內容有: (1)頻數(Frequency)即變量值落在某個區(qū)間中的次數。(2)百分比(Percent)即各頻數占總樣本數的百分比。 (3)有效百分比(Valid Percent)即各頻數占有效樣本數的百分比。這里有效 樣本數總樣本缺失樣本數。 (4)累計百分比(Cumulative Percent)即各百分比逐級累加起來的結果。終 取值為百分之百。 頻數分析的第二個基本任務是繪制統(tǒng)計圖。統(tǒng)計圖是一種為直接的數據刻畫 方式,能夠非常清晰直觀地展示變量的取值狀況。頻數分析中常用的統(tǒng)計圖包括: 條形圖,餅圖,直方圖等。 頻數分析的應用步驟 在 SPSS 中的頻數分析的實現步驟如下: 選

35、擇菜單“【文件】【打開】【數據】”在對話框中找到需要分析的數據 文件“SPSS/Employee data”,然后選擇“打開”。 選擇菜單“【分析】【描述統(tǒng)計】【頻率】”。如圖 2.1 所示 圖2.1 Frequencies對話框 確定所要分析的變量,例如 年齡 在變量選擇確定之后,在同一窗口上,點擊統(tǒng)計量(Statistics)按鈕,打開統(tǒng)計量對話框,如下圖 2.2 所示,選擇統(tǒng)計輸出選項。 圖2.2 統(tǒng)計量子對話框 圖2.3 圖表(Charts)子對話框 結果輸出與分析點擊頻率(Frequencies)對話框中的確定(OK)按鈕,即得到下面的結果。 表2.4 描述性統(tǒng)計量 統(tǒng)計量Gende

36、rN有效474缺失0Gender頻率百分比有效百分比累積百分比有效Female21645.645.645.6Male25854.454.4100.0合計474100.0100.0圖2.4 變量gender的餅圖2 描述統(tǒng)計(Descriptives) 描述統(tǒng)計主要對定距型或定比型數據的分布特征作具體分析。SPSS 的【描述】命令專門用于計算各種描述統(tǒng)計性統(tǒng)計量。本節(jié)利用學生考試成績數據來介紹描述統(tǒng)計量在 SPSS 中的計算方法。具體操作步驟如下選擇菜單【分析】【描述統(tǒng)計】【描述】,如圖所示 圖2.5 描述性圖圖2.6 描述選項描述統(tǒng)計量N極小值極大值均值標準差偏度峰度統(tǒng)計量統(tǒng)計量統(tǒng)計量統(tǒng)計量統(tǒng)

37、計量統(tǒng)計量標準誤統(tǒng)計量標準誤成績7533.0099.0073.013310.85344-.596.2771.968.548有效的 N (列表狀態(tài))75從偏度和峰度的值可以看出,成績大致符合正太分布??梢淹ㄟ^頻率選項畫出帶有正太曲線的直方圖。圖2.7考試成績直方圖3.探索分析(Explore)調用此過程可對變量進行更為深入詳盡的描述性統(tǒng)計分析,故稱之為探索分 析。它在一般描述性統(tǒng)計指標的基礎上,增加有關數據其他特征的文字與圖形描述, 顯得更加細致與全面,對數據分析更進一步。 探索分析一般通過數據文件在分組與不分組的情況下獲得常用統(tǒng)計量和圖形。 一般以圖形方式輸出,直觀幫助研究者確定奇異值、影響點

38、、還可以進行假設檢驗, 以及確定研究者要使用的某種統(tǒng)計方式是否合適。在打開的數據文件上,選擇如下命令:選擇菜單“【分析】【描述統(tǒng)計】 【探索】”,打開對話框。圖2.8 探索性分析對話框因變量列表;待分析的變量名稱,例如將每股收益率作為研究變量。 因子列表:從源變量框中選擇一個或多個變量進入因子列表,分組變量可以將 數據按照該觀察值進行分組分析。 標準個案:在源變量表中指定一個變量作為觀察值的標識變量。 在輸出欄中,選擇兩者都,表示輸出圖形及描述統(tǒng)計量。選擇【統(tǒng)計量】按鈕,選擇想要計算的描述統(tǒng)計量。如圖所示 圖2.9 統(tǒng)計量子對話框對所要計算的變量的頻數分布及其統(tǒng)計量值作圖 打開“Plots 對

39、話框”,出現如 下圖。 描述統(tǒng)計量標準誤成績均值73.01331.25325均值的 95% 置信區(qū)間下限70.5162上限75.51055% 修整均值73.3296中值72.0000方差117.797標準差10.85344極小值33.00極大值99.00范圍66.00四分位距14.00偏度-.596.277峰度1.968.548(4)莖葉圖描述 莖葉圖自左向右可以分為3 大部分:頻數(Frequency)、莖(Stem)和葉(Leaf)。莖表 示數值的整數部分,葉表示數值的小數部分。每行的莖和每個葉組成的數字相加再乘以莖寬(Stem Width),即莖葉所表示的實際數值的近似值。 圖2.9 莖

40、葉圖(5)箱線圖描述圖中灰色區(qū)域的方箱為箱圖的主體,上中下3 條線分別表示變量值的第75、50、25百分位 數,因此變量的50%觀察值落在這一區(qū)域中。方箱中的中心粗線為中位數。箱圖中的觸須線是中間的縱向直線,上端截至線為變量的最大值,下端截至線為變量的最小值。圖2.10 箱線圖四、備擇實驗 完成下列實驗內容,并按實驗(1)所附實驗報告的格式撰寫報告。 1.表2.7為某班級16位學生的身高數據,對其進行頻數分析,并對實驗報告作出說明。學號性別身高(cm)學號性別身高(cm)1M1709M1502F17310M1573F16911F1774M15512M1605F17413F1696F17814M

41、1547M15615F1728F17116F1802.測量18臺電腦筆記重量,見表2.8,對其進行描述統(tǒng)計量分析,并對實驗結果作出說明。序號123456789重量1.751.921.591.851.831.681.891.701.79序號101112131415161718重量1.661.801.832.051.911.761.881.831.79實驗3:統(tǒng)計推斷一、實驗目的與要求1.熟悉點估計概念與操作方法 2.熟悉區(qū)間估計的概念與操作方法 3.熟練掌握T檢驗的SPSS操作 4.學會利用T檢驗方法解決身邊的實際問題二、實驗原理 1.參數估計的基本原理 2.假設檢驗的基本原理 三、實驗演示內容

42、與步驟 1.單個總體均值的區(qū)間估計 打開SPSS,建立數據文件:“實驗3.sav”。這里,研究變量為:GPA,即平均績點。 選擇區(qū)間估計選項,方法如下:選擇菜單【分析】【描述統(tǒng)計】【探 索】”,打開圖3.1探索(Explore)對話框。圖表 3.1 探索對話框 從源變量清單中將“GPA”變量移入因變量列表(Dependent List)框中。 單擊上圖右方的“統(tǒng)計量”按鈕打開“探索:統(tǒng)計量”對話框。設置均值的置信水平,如鍵入95,完成后單擊“繼續(xù)”按鈕回到主窗口。 圖 統(tǒng)計量子對話框返回主窗口點擊確定(ok)運行操作。計算結果簡單說明:如上表顯示。從上表“均值的95%置信區(qū)間(95 Confi

43、dence Interval for Mean)”中可以得出,GPA的區(qū)間估計(置信度為95) 為:(3.3273,3.4804),點估計是:3.4039。 2兩個總體均值之差的區(qū)間估計 例題:有甲乙兩組同學,測得他們的身高如下表,(單位cm)甲組172171166160155173166170167173甲組178173163165170163172182171177乙組171169170172169167175164166169乙組167179176182186166169173169171 要求對平均身高之差進行區(qū)間估計,預設的置信度為95。 打開SPSS,按如下圖示格式輸入原始數據,建

44、立數據文件:“身高差別.sav”。 計算兩總體均值之差的區(qū)間估計,采用“獨立樣本T 檢驗”方法。選擇菜單“【分析】【比較均值】獨立樣本T檢驗”,打開對話框。圖 獨立樣本T檢驗 變量選擇 (1)從源變量清單中將“身高”變量移入檢驗變量框中。表示要求該變量的均值的區(qū)間估計。 (2)從源變量清單中將“組別”變量移入分組變量框中。表示總體的分類變量。 定義分組 單擊定義組按鈕,打開定義組(Define Groups)對話框。在組一(Group1)中輸入1,在Group2 中輸入2(1表示非工會會員,2 表示工會會員)。完成后單擊“繼續(xù)”按鈕回到主窗口。 計算結果單擊上圖中確定(OK)按鈕,輸出結果如下

45、圖所示。(1)分組統(tǒng)計量(Group Statistics)表分別給出不同總體下的樣本容量、均值、標準差和平均標準誤。從該表中可以看出,甲組的平均身高為169.35,乙組學生的平均身高為171.50。 (2)獨立樣本T 檢驗(Independent Sample Test)表Levenes Test for Equality of Variance,為方差檢驗,在原假設:方差相等(Equal variances assumed)下,F=0.389,因為其P-值大于顯著性水平,即:Sig.=0.5360.05, 說明不能拒絕方差相等的原假設,接受兩個總體方差是相等的假設。因此甲乙兩組學生平均身高

46、差的95置信度的區(qū)間估計為-6.004,1.704均值方程的t檢驗(T-test for Equality of Means)為檢驗總體均值是否相等的t檢驗,由于在本例中,其P-值大于顯著性水平,即:Sig.=0.2260.05, 因此不應該拒絕原假設,也就是說甲乙兩組同學的平均身高沒有顯著差異。3.單樣本T檢驗例題:某種品牌的沐浴肥皂制造程序的設計規(guī)格中要求每批平均生產120塊肥皂,高于或低于該數量均被認為是不合理的,在由10 批產品所組成的一個樣本中, 每批肥皂的產量數據見下表,在0.05 的顯著水平下,檢驗該樣本結果能否說明制造 過程運行良好? 118.93 118.25 118.14

47、119.90 118.47 119.07 118.49 119.87 118.88 119.17 118.08118.6118.13118.32119.82119.12118.02119.39118.46118.83119.78118.49119.06118.32118.6118.26118.18119.77118.86119.07119.28119.4119.79119.15119.19118.52118.85119.27118.44118.07119.99118.22119.78119.33118.93119.43119.56118.43118.48119.21121.06120.1120

48、.38120.32120.11121.53121.45121.39121.56121.9120.6120.99120.92121.34120.23120.34121.77121.34121.96121.98 軟件實現程序 打開已知數據文件,然后選擇菜單“【分析】【比較均值】單樣本T檢驗”,打開One-Sample T Test 對話框。從源變量清單中將“產品數量” 向右移入“Test Variables”框中。 在“Test Value” 框里輸入一個指定值(即假設檢驗值,本例中假設為120),T 檢驗過程將對每個檢驗變量分別檢驗它們的平均值與這個指定數值相等的假設。 單樣本檢驗“One-Sa

49、mple T Test”窗口中“OK”按鈕,輸出結果如下表所示。 (1)單個樣本的統(tǒng)計量(One-Sample Statistics)表分別給出樣本的容量、均值、標準差和平均標準誤。本例中,產品數量均值為119.5273。(2)單個樣本的檢驗(One-Sample Test)表中的t 表示所計算的T檢驗統(tǒng)計量的數值,本例中為3.705。 表中的“df”,表示自由度,本例中為69。表中的“Sig”(雙尾T 檢驗),表示T統(tǒng)計量的P-值,并與雙尾T檢驗的顯著性的大小進行比較: Sig.=0.0010.05,所以,學校的所謂新式培訓并未帶來學生成績的顯著變化。 四、備擇實驗 1某省大學生四級英語測驗

50、平均成績?yōu)?65,現從某高校隨機抽取 20 份試卷,其分數為:72、76、68、78、62、59、64、85、70、75、61、74、87、83、54、76、56、66、68、62,問該校英語水平與全區(qū)是否基本一致?設 0.05 2分析某班級學生的高考數學成績是否存在性別上的差異。數據如表所示:男858975588680787684899995828760857580女9296868378877065706572563SPSS 自帶的數據文件 world95.sav 中,保存了 1995 年世界上 109 個國家和地區(qū)的部分指標的數據,其中變量“l(fā)ifeexpf”,“l(fā)ifeexpm”分別為各國或地區(qū)女性和男性人口的平均壽命。假設將這兩個指標數據作為樣本,試用配對樣本 T 檢驗,女性人口的平均壽命是否確實比男性人口的平均壽命

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論