數(shù)據(jù)統(tǒng)計(jì)分析及方法SPSS教程完整版課件_第1頁
數(shù)據(jù)統(tǒng)計(jì)分析及方法SPSS教程完整版課件_第2頁
數(shù)據(jù)統(tǒng)計(jì)分析及方法SPSS教程完整版課件_第3頁
數(shù)據(jù)統(tǒng)計(jì)分析及方法SPSS教程完整版課件_第4頁
數(shù)據(jù)統(tǒng)計(jì)分析及方法SPSS教程完整版課件_第5頁
已閱讀5頁,還剩426頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

數(shù)據(jù)統(tǒng)計(jì)分析及方法SPSS教程完整版精品課件第1章數(shù)據(jù)分析概述與軟件入門1.1SPSS軟件概述1.1.1SPSS簡介SPSS(StatisticsPackageforSocialScience)forWindows是一種運(yùn)行在Windows系統(tǒng)下的社會科學(xué)統(tǒng)計(jì)軟件軟件包。SPSS的基本功能包括數(shù)據(jù)管理、統(tǒng)計(jì)分析、圖表分析、輸出管理等,具體內(nèi)容包括描述統(tǒng)計(jì)、列聯(lián)分析,總體的均值比較、相關(guān)分析、回歸模型分析、聚類分析、主成份分析、時(shí)間序列分析、非參數(shù)檢驗(yàn)等多個(gè)大類,每個(gè)類中還有多個(gè)專項(xiàng)統(tǒng)計(jì)方法。精品課件一、功能強(qiáng)大(1)囊括了各種成熟的統(tǒng)計(jì)方法與模型,為統(tǒng)計(jì)分析用戶提供了全方位的統(tǒng)計(jì)學(xué)算法,為各種研究提供了相應(yīng)的統(tǒng)計(jì)學(xué)方法。(2)提供了各種數(shù)據(jù)準(zhǔn)備與數(shù)據(jù)整理技術(shù)。(3)自由靈活的表格功能。(4)各種常用的統(tǒng)計(jì)學(xué)圖形。精品課件二、SPSS的實(shí)驗(yàn)環(huán)境要求(1)系統(tǒng)運(yùn)行環(huán)境SPSS10.0以上版本軟件包可以工作在兩種模式下,單機(jī)模式和作為網(wǎng)絡(luò)系統(tǒng)的用戶界面模式。(2)輔助軟件環(huán)境三、SPSS的主要界面SPSS的主要界面有數(shù)據(jù)編輯窗口和結(jié)果輸出窗口。

四、SPSS的幫助系統(tǒng)SPSS對一些基本模塊中的統(tǒng)計(jì)提供了幫助,可以通過單擊Help菜單中的StatisticsCoach命令,選擇所需要的統(tǒng)計(jì)指導(dǎo)。精品課件精品課件五、SPSS的運(yùn)行方式SPSS提供了3種基本運(yùn)行方式:完全窗口菜單方式,程序運(yùn)行方式、混合運(yùn)行方式。程序運(yùn)行方式和混合運(yùn)行方式是使用者從特殊的分析需要出發(fā),編寫自己的SPSS命令程序,通過語句直接運(yùn)行。SPSS中使用的對話框主要有兩類,一類是文件操作對話框,文件操作對話窗口操作與Windows應(yīng)用軟件操作風(fēng)格一致。另一類是統(tǒng)計(jì)分析對話框,統(tǒng)計(jì)分析對話框可以分為主窗口和下級窗口,在該類對話框中,選擇參與分析的各類變量及統(tǒng)計(jì)方法是對話框的主要任務(wù)。精品課件1.1.2spss的安裝一、啟動(dòng)Windows后,把SPSS系統(tǒng)安裝軟盤(或光盤)插入軟驅(qū)(或光驅(qū)),并找到SPSS的安裝程序的可執(zhí)行文件Setup.exe。二、雙擊Setup.exe文件,安裝程序向?qū)⒔o出每一步操作的提示。在出現(xiàn)[Welcome(歡迎)]窗口后,選擇[Next]進(jìn)入下一步。三、安裝程序顯示[SoftwareLicenseAgreement]對話框時(shí),選擇[Yes]接受顯示的協(xié)議條款。精品課件1.2spss操作入門1.2.1spss軟件的啟動(dòng)與退出單擊Windows的[開始]按鈕,在[程序]菜單項(xiàng)[SPSSforWindows]中找到[SPSS10.0forWindows]并單擊。精品課件1.2.2SPSS的5個(gè)窗口(1)數(shù)據(jù)編輯窗口(SPSSDataEditor)Spss處理數(shù)據(jù)的工作全在此窗口進(jìn)行。精品課件精品課件(2)結(jié)果管理窗口(SPSSOutputviewer)此窗口用于存放分析結(jié)果。左邊是目錄區(qū),右邊是內(nèi)容區(qū)。精品課件(3)草稿結(jié)果窗口(SPSSDraftViewer)草稿結(jié)果是結(jié)果的一種簡化文本格式。實(shí)際上就是WORD所兼容的rtf超文本格式,因此可以在沒有安裝SPSS的PC機(jī)上使用文字編輯軟件打開。精品課件(4)語法編輯窗口(SPSSSyntaxEditor)精品課件(5)腳本窗口(SPSSScriptEditor)精品課件1.2.3SPSS的四種運(yùn)行方式一、菜單對話方式首先打開SPSS軟件,然后選擇菜單FileOpenfile。然后,利用菜單AnalyzeDescriptiveStatisticsFrequencies,精品課件精品課件二、程序方式在Syntax編輯窗口中鍵入以下程序:Getfile=‘c:\programfiles\spss\employeedata.sav’.Frequenciesvariables=jobcat/order=analysis。只需要選擇菜單RunAll,運(yùn)行該程序也一樣會出現(xiàn)相同的分析結(jié)果。精品課件三、Include命令方式當(dāng)編寫Syntax程序時(shí),如果發(fā)現(xiàn)將要編寫的程序語句正好是另一個(gè)Syntax文件的內(nèi)容;或者發(fā)現(xiàn)所需要的程序語句其實(shí)是幾個(gè)Syntax文件的總和是,除了可以通過“Copy”、“Paste”的方法利用資源,生產(chǎn)一個(gè)新的Syntax文件外,還可以利用Include命令。Include‘c:\sytaxsample.sps’.精品課件四、spssProductionFaccility方式在Windows的程序菜單中,spss菜單組除了有“spssforwindows”項(xiàng)之外,還有一個(gè)“spssproductionfacility”。精品課件(1)單擊Syntax框下的“Add”按鈕,到C盤根目錄下打開“syntaxsample”。(2)單擊Syntax框下的“Edit”按鈕,對程序進(jìn)行編輯。(3)單擊右下角的“uesrprompts”按鈕,添加對程序的交互分析界面。(4)單擊“Browse”按鈕制定結(jié)果保存路徑,單擊“exportoptions”按鈕還可以制定結(jié)果保存格式。精品課件1.2.4spss的四種輸出結(jié)果1、表格格式2、文本格式3、標(biāo)準(zhǔn)圖與交互圖4、結(jié)果的保存和導(dǎo)出精品課件精品課件第2章數(shù)據(jù)錄入與數(shù)據(jù)獲取本章主要解決兩個(gè)問題:第一個(gè)問題,根據(jù)問題類型的不同,將會從開放題、單選題和多選題的錄入方式為例進(jìn)行介紹。第二個(gè)問題,重點(diǎn)介紹如何用SPSS直接讀取Excel類型和文本格式的數(shù)據(jù),以及如何用ODBC接口讀取數(shù)據(jù)庫文件。精品課件2.1.1統(tǒng)計(jì)軟件中數(shù)據(jù)的錄入格式(1)不同觀測對象的數(shù)據(jù)不能在同一記錄中出現(xiàn),即同一觀測數(shù)據(jù)應(yīng)當(dāng)獨(dú)占一行。(2)每一個(gè)觀測量指標(biāo)或影響因素只能占據(jù)一列的位置,即同一指標(biāo)的數(shù)量觀測值都應(yīng)當(dāng)錄入到同一個(gè)變量中去。2.1數(shù)據(jù)格式概述即:一個(gè)觀測占一行,一個(gè)變量占一列精品課件在錄入數(shù)據(jù)時(shí),歸納為以下三步:第一步:定義變量名;第一步:指定每個(gè)變量的各種屬性;第一步:錄入數(shù)據(jù)。變量名不能與spss保留字相同,spss的保留字有ALL、END、BY、EQ、GE、GT、LE、LT、NE、NOT、OR、TO、WITH。2.1.2變量屬性介紹精品課件一、變量的儲存類型SPSS中,變量有三種的基本類型:數(shù)值型、字符型和日期型。標(biāo)準(zhǔn)數(shù)值型逗號數(shù)值型圓點(diǎn)數(shù)值型科學(xué)技術(shù)法數(shù)值型美元數(shù)值型用戶自定義型數(shù)值型:數(shù)值型的數(shù)據(jù)是0-9的阿拉伯?dāng)?shù)字和其他符號,如美元符號、逗號或圓點(diǎn)組成的。精品課件字符型:字符型數(shù)據(jù)的默認(rèn)顯示寬度為8個(gè)字符位,系統(tǒng)不區(qū)分變量名中的大小寫字母,并且不能進(jìn)行數(shù)學(xué)運(yùn)算。注意:在輸入數(shù)據(jù)時(shí)不應(yīng)輸入引號,否則雙引號將會作為字符型數(shù)據(jù)的一部分。日期型:日期型數(shù)據(jù)是用來表示日期或時(shí)間的。日期型數(shù)據(jù)的顯示格式有很多,SPSS以菜單方式列出日期型數(shù)據(jù)的顯示格式以供用戶選擇。事實(shí)上,SPSS存儲中的日期型變量是該實(shí)踐與1582年10月14日零點(diǎn)相差的秒數(shù)。精品課件關(guān)于日期型格式的幾點(diǎn)說明:“m”在年與日(字母y與d)之間表示月份;在時(shí)與秒(字母h與s)之間表示“分”鐘?!癿mm”表示要求書寫英文月份單詞的前三個(gè)字母組成的縮寫?!癲dd”三個(gè)字母d表示要求用從元月一日算起的日數(shù)表示日期。指定了日期變量的格式,不一定在輸入時(shí)就使用指定的格式??梢暂斎胗谩?”或“—”作分隔符的具體日期,回車后,系統(tǒng)將自動(dòng)將輸入的格式轉(zhuǎn)化為指定的格式,顯示在單元各種。精品課件二、變量的測量尺度在SPSS中使用Measure屬性對變量的測量尺度進(jìn)行定義。(1)定類尺度(NominalMeasurement):定類尺度是對事物的類別或?qū)傩缘囊环N測度,按照事物的某種屬性對其進(jìn)行分類或分組。特點(diǎn):其值僅代表了事物的類別和屬性,即能測度類別差異,不能比較各類之間的大小,所以各類之間沒有順序和等級。對定類尺度的變量只能計(jì)算頻數(shù)和頻率。在spss中,能適用定類尺度的數(shù)據(jù)可以是數(shù)值型,也可以是字符型變量。使用定類變量對事物進(jìn)行分類時(shí),必須符合窮盡原則和互斥原則。精品課件(2)定序尺度(OrdinalMeasurement):定序尺度是對事物之間的等級或順序差別的一種測度,可比較優(yōu)劣或排序。特點(diǎn):由于定序變量只能側(cè)度類別之間的順序,無法測出類別之間的準(zhǔn)確差值,即測量數(shù)值不代表絕對的數(shù)量大小,所以其測量結(jié)果只能排序,不能進(jìn)行運(yùn)算。(3)定矩尺度(IntervalMeasurement):定矩尺度是對事物類別或次序之間間距的測度。特點(diǎn):不僅能將事物區(qū)分為不同類型并進(jìn)行排序,而且可能準(zhǔn)確指出類別之間的差距是多少;定居變量通常以自然或物理單位為計(jì)量尺度,因此測量結(jié)果往往表現(xiàn)為數(shù)值,所以計(jì)量結(jié)果可以進(jìn)行加減運(yùn)算。精品課件(4)定比尺度(ScaleMeasurement):定比尺度是能夠測算兩個(gè)測度值之間比值的一種計(jì)量尺度,它的測量結(jié)果同定距變量一樣表現(xiàn)為數(shù)值。特點(diǎn):定必變量是測量尺度的最高水平,它除了具有其他三種測量尺度的全部特點(diǎn)外,還具有可計(jì)算兩個(gè)側(cè)度至之間筆直的特點(diǎn),因此它可以進(jìn)行加、減、乘、除運(yùn)算,而定居變量值可進(jìn)行加減運(yùn)算。精品課件三、變量名與變量標(biāo)簽值Label:定義變量名標(biāo)簽Value:定義變量值標(biāo)簽精品課件四、缺失值Spss中缺失值有用戶自定義缺失值和系統(tǒng)缺失值兩大類。在SPSS中,對字符型變量,默認(rèn)的缺失值為空格;對數(shù)值型變量,默認(rèn)的缺失值為零。精品課件2.2數(shù)據(jù)的直接錄入2.1.1操作界面說明標(biāo)尺欄菜單欄工具欄數(shù)據(jù)輸入?yún)^(qū)數(shù)據(jù)編輯區(qū)窗口標(biāo)簽標(biāo)題欄狀態(tài)欄當(dāng)前數(shù)據(jù)欄顯示區(qū)滾動(dòng)條DataView表可以直接輸入觀測數(shù)據(jù)值或存放數(shù)據(jù),表的左端列邊框顯示觀測個(gè)體的序號,最上端行邊框顯示變量名。精品課件VariableView表用來定義和修改變量的名稱、類型及其他屬性,如圖所示。如果輸入變量名后回車,將給出變量的默認(rèn)屬性。如果不定義變量的屬性,直接輸入數(shù)據(jù),系統(tǒng)將默認(rèn)變量Var00001,Var00002等。精品課件在VariableView表中,每一行描述一個(gè)變量,依次是:Name:變量名。變量名必須以字母、漢字及@開頭,總長度不超過8個(gè)字符,共容納4個(gè)漢字或8個(gè)英文字母,英文字母不區(qū)別大小寫,最后一個(gè)字符不能是句號。Type:變量類型。變量類型有8種,最常用的是Numeric數(shù)值型變量。其它常用的類型有:String字符型,Date日期型,Comma逗號型(隔3位數(shù)加一個(gè)逗號)等。Width:變量所占的寬度。Decimals:小數(shù)點(diǎn)后位數(shù)。Label:變量標(biāo)簽。關(guān)于變量涵義的詳細(xì)說明。Values:變量值標(biāo)簽。關(guān)于變量各個(gè)取值的涵義說明。Missing:缺失值的處理方式。Columns:變量在DateView中所顯示的列寬(默認(rèn)列寬為8)。Align:數(shù)據(jù)對齊格式(默認(rèn)為右對齊)。Measure:數(shù)據(jù)的測度方式。系統(tǒng)給出名義尺度、定序尺度和等間距尺度三種(默認(rèn)為等間距尺度)。精品課件為了在統(tǒng)計(jì)分析過程中能有效的利用其它軟件產(chǎn)生的數(shù)據(jù),SPSS軟件編輯窗口除可以使用*.sav擴(kuò)展名數(shù)據(jù)文件,還可以直接打開和保存下述類型的文件:SPSSDOS版本產(chǎn)生的數(shù)據(jù)文件*.sys;Excel報(bào)表程序產(chǎn)生的數(shù)據(jù)文件*.xls;DBASE數(shù)據(jù)庫格式文件*.dbf;SAS統(tǒng)計(jì)軟件產(chǎn)生的數(shù)據(jù)文件。精品課件2.2.2開放題和簡單單選題的錄入一、在spss中定義變量錄入數(shù)據(jù)的第一步是定義變量屬性,隨后才能進(jìn)行數(shù)據(jù)錄入。二、開放題的錄入精品課件三、單選題的錄入單選題的錄入可以采用字符直接錄入、字符代碼+值標(biāo)簽、數(shù)值代碼+值標(biāo)簽三種方式。精品課件2.2.3多選題的錄入一、多重二分法(MultipleDichotomyMethod)所謂多重二分法,是在編碼的時(shí)候,對應(yīng)每一個(gè)選項(xiàng)都要定義一個(gè)變量,有幾個(gè)選項(xiàng)就有幾個(gè)變量,這些變量均為二分類,他們各自代表對一個(gè)選項(xiàng)的選擇結(jié)果。二、多重分類法(MultipleCategoryMethod)多重分類法,也是利用多個(gè)變量對一個(gè)多選題的答案進(jìn)行定義,應(yīng)該用多少個(gè)變量,由被訪者實(shí)際可能給出的最多答案數(shù)而定。精品課件三、多選題錄入在spss中的實(shí)現(xiàn)精品課件2.3外部數(shù)據(jù)的獲取SPSS讀入非SPSS類型的文件數(shù)據(jù),有三種主要方式:直接打開,利用文本導(dǎo)向讀入文本數(shù)據(jù)以及利用數(shù)據(jù)庫OBDC接口讀入數(shù)據(jù)。2.3.1電子表格數(shù)據(jù)如何導(dǎo)入spss中SPSS中可以直接讀入許多常用格式的數(shù)據(jù)文件,選擇菜單FileOpenData或直接單擊快捷鍵工具欄上的快捷按鈕,系統(tǒng)就會彈出OpenFile對話框,單擊“文件類型”列表框,在里面能夠看到可以直接打開的數(shù)據(jù)文件格式。精品課件2.3.2文本數(shù)據(jù)如何導(dǎo)入spss中第一步:首先,在OpenFile文件框中選中文件,單擊“打開”,系統(tǒng)會自動(dòng)啟動(dòng)文本倒入向?qū)υ捒颉5诙剑哼x擇“NO”并單擊“下一步”按鈕。精品課件用某種字符區(qū)分固定寬度第三步:分別選擇“Delimited”和“yes”,然后單擊“下一步”按鈕。精品課件第四步精品課件第五步精品課件第六步精品課件第七步精品課件2.4數(shù)據(jù)的保存2.4.1存為spss格式2.4.2存為其他數(shù)據(jù)格式精品課件第3章數(shù)據(jù)管理3.1變量級別的數(shù)據(jù)管理對變量進(jìn)行操作的內(nèi)容主要集中于Transform菜單中,包括新變量的生成、記錄的排序、對變量進(jìn)行計(jì)數(shù)等。

計(jì)算新變量:就是用Compute過程。

變量轉(zhuǎn)換:包括Recode、VisualBander、Count、RankCase、AutomaticRecode這五個(gè)過程。

專用過程:包括建立時(shí)間序列、缺失值代替和設(shè)定隨機(jī)種子三個(gè)過程。

RunPendingTransforming:用于執(zhí)行編程中被掛起的數(shù)據(jù)整理操作。精品課件計(jì)算產(chǎn)生新變量變量值自動(dòng)編碼設(shè)定隨機(jī)數(shù)種子創(chuàng)建代替缺失值變量創(chuàng)建時(shí)間序列變量運(yùn)行其它轉(zhuǎn)換程序變量值重新編碼創(chuàng)建計(jì)數(shù)變量觀測量排秩連續(xù)變量進(jìn)行分段精品課件3.1.1計(jì)算新變量計(jì)算新變量的功能就是在原有spss數(shù)據(jù)文件的基礎(chǔ)上,根據(jù)用戶的要求,使用spss算術(shù)表達(dá)式及函數(shù),對所有記錄或滿足SPSS條件表達(dá)式的記錄,計(jì)算出一個(gè)新結(jié)果,并將結(jié)果存入一個(gè)用戶指定的變量中。一、常用基本概念(1)spss算術(shù)表達(dá)式

spss算術(shù)表達(dá)式是由常量、spss變量名、spss的算術(shù)運(yùn)算符、圓括號等組成的式子。(2)spss函數(shù)

spss提供了多達(dá)70多種函數(shù),分為八大類:算術(shù)函數(shù)、統(tǒng)計(jì)函數(shù)、分布函數(shù)、邏輯函數(shù)、字符串函數(shù)、日期時(shí)間函數(shù)、缺失值函數(shù)和其它函數(shù)。(3)spss條件表達(dá)式通過spss的算術(shù)表達(dá)式和函數(shù)可以對所有記錄計(jì)算一個(gè)結(jié)果,如果僅希望對部分記錄進(jìn)行計(jì)算,則應(yīng)當(dāng)利用spss的條件表達(dá)式指定對那些記錄進(jìn)行計(jì)算。精品課件二、compute過程的分析實(shí)例例3.1統(tǒng)計(jì)英語成績在60分以上的學(xué)生的數(shù)學(xué)和語文的平均成績。精品課件精品課件例3.2計(jì)算工人工資的所得稅。學(xué)生自己練習(xí)。精品課件3.1.2對變量值進(jìn)行分組合并一、對連續(xù)變量進(jìn)行分組在SPSS中可以將連續(xù)變量轉(zhuǎn)換為離散(等級或定序)變量,按照某種一一對應(yīng)的關(guān)系生成新變量值,可以將新值賦給原變量。Recode過程和VisualBander過程都可以完成這一任務(wù),但前者給為簡單和常用。例3.3

當(dāng)學(xué)生英語成績小于60時(shí)取值為“不及格”,大于等于60且小于70為“及格”,大于等于70且小于80為“較好”,大于等于80為“優(yōu)秀”。精品課件精品課件二、分類變量類別的合并Recode過程也常用于合并某個(gè)分類變量的幾個(gè)水平為一個(gè)水平。將上例grade中優(yōu)秀、良好和及格三個(gè)等級合并為一個(gè)等級“PASS”,將grade的等級“不及格”轉(zhuǎn)換為“NOPASS”。精品課件精品課件3.1.3連續(xù)變量的可視化分段VISUALBander用于將連續(xù)變量進(jìn)行分段,該過程使用百分位數(shù)、標(biāo)準(zhǔn)差范圍或者等間距方式將連續(xù)變量劃分為若干組段,并采用圖形化操作的方式。例3.4對數(shù)學(xué)成績進(jìn)行分段,假設(shè)現(xiàn)在希望按變量math將學(xué)生分為5組,60分以下為第一組,60分以上的按照等間距的方式分為4組。精品課件精品課件精品課件精品課件3.1.4將字符變量轉(zhuǎn)換為數(shù)值變量用automaticrecode將字符變量轉(zhuǎn)換為數(shù)值變量。精品課件3.1.5變量的編秩所謂編秩,就是對記錄按照某個(gè)變量值大小來排序。Rankcase過程就是用來排序的一個(gè)專用過程。例:根據(jù)性別分組計(jì)算數(shù)學(xué)成績的秩次。精品課件精品課件3.1.6Transform菜單中的其它功能(1)count過程如果用戶需要對滿足某項(xiàng)條件的數(shù)據(jù)進(jìn)行計(jì)數(shù),可以使用Count命令。先在TargetVariable中指定一個(gè)變量(可以是已經(jīng)存在的變量或新變量),并定義變量標(biāo)簽,然后指定要統(tǒng)計(jì)的變量加到NumericVariables框中,再單擊DefineValues按紐,打開ValuetoCount對話框。精品課件Value:輸入某個(gè)值為清點(diǎn)對象;System-missing:以系統(tǒng)的缺失值為清點(diǎn)對象;System-orusermissing:以系統(tǒng)或用戶指定的缺失值為清點(diǎn)對象;Range:指定數(shù)值的計(jì)數(shù)區(qū)域:其中包括:()through()在框內(nèi)指定下限和上限lowestthrough():在框內(nèi)只指定上限;()highestthrough:在框內(nèi)只指定下限。精品課件(2)randomNumberSeed過程:用于設(shè)定偽隨機(jī)函數(shù)的隨機(jī)種子。精品課件3.2文件級別的數(shù)據(jù)管理(一)數(shù)據(jù)編輯窗口的Data菜單為用戶創(chuàng)建和定義數(shù)據(jù)提供了方便的功能。這個(gè)菜單是SPSS統(tǒng)計(jì)軟件數(shù)據(jù)整理的特有功能菜單。它的功能包括:對變量、觀測量的編輯處理;對變量數(shù)據(jù)的變換;對觀察量數(shù)據(jù)整理。(1)簡單命令:包括插入變量、插入記錄和到達(dá)某條記錄,他們的功能實(shí)際上都可以用鼠標(biāo)在數(shù)據(jù)表界面上直接完成,很少會使用菜單來調(diào)用。(2)常用的簡單過程:包括排序、拆分文件、選擇記錄和加權(quán)記錄。(3)變量與數(shù)據(jù)文件屬性導(dǎo)向:用于定義數(shù)據(jù)字典,或者將于定義的數(shù)據(jù)字典直接引入當(dāng)前數(shù)據(jù)文件。精品課件(4)數(shù)重構(gòu)過導(dǎo)向:用于進(jìn)行數(shù)據(jù)轉(zhuǎn)置,或者對重復(fù)測量數(shù)據(jù)表進(jìn)行長型、寬型記錄間的轉(zhuǎn)換。(5)文件合并過程:將幾個(gè)數(shù)據(jù)文件合并為一個(gè)大的spss數(shù)據(jù)文件,含橫向合并和縱向合并兩種情況。(6)正交設(shè)計(jì)過程:實(shí)際上是聯(lián)合分析模塊的一部分,用于生成實(shí)施聯(lián)合分析所需要的設(shè)計(jì)。(7)其他過程:包括定義日期變量過程、數(shù)據(jù)匯總過程和查找重復(fù)記錄導(dǎo)向。精品課件定義變量屬性定義變量日期插入觀測量拷貝數(shù)據(jù)屬性插入一個(gè)變量定位觀測量觀測量排序重構(gòu)數(shù)據(jù)結(jié)構(gòu)分類或不分類匯總正交設(shè)計(jì)數(shù)據(jù)文件轉(zhuǎn)置合并數(shù)據(jù)文件標(biāo)識重復(fù)觀測量拆分?jǐn)?shù)據(jù)文件選擇觀測量觀測量加權(quán)精品課件3.2.1記錄排序一、排序的兩種方法:(1)在數(shù)據(jù)表格的變量名處單擊右鍵,彈出的右鍵菜單最后兩項(xiàng)就是“sortAscending”和“SortDescending”。(2)對于多變量排序,則需要使用SortCases過程來進(jìn)行。二、多變量排序需要注意的三點(diǎn):(1)在多重排序中,制定排序變量名是很關(guān)鍵的,先指定的變量在排序時(shí)必然優(yōu)先于后制訂的變量。(2)可以指定按某變量值升序排序的同時(shí)按另一變量值降序排序,或相反。(3)排序以后,原來記錄數(shù)據(jù)的排列次序?qū)⒈淮騺y。精品課件精品課件精品課件3.2.2記錄拆分SplitFile分割文件的功能是把當(dāng)前工作分割成兩個(gè)或兩個(gè)以上的組,隨后的分析將對每個(gè)組進(jìn)行。精品課件精品課件3.2.3記錄篩選SelectCases:當(dāng)用戶不需要分析全部的數(shù)據(jù),而是按要求分析其中的一部分,使用該選擇。Allcase:選擇所有數(shù)據(jù);Ifconditionissatisfied:按指定條件選擇數(shù)據(jù)。精品課件RandomSampleofcases:對觀察值進(jìn)行隨機(jī)抽樣。精品課件精品課件精品課件精品課件Usefiltervariable:用指定變量作過濾。先選擇一個(gè)變量,系統(tǒng)自動(dòng)在數(shù)據(jù)管理器中將該變量值為0的觀測單位標(biāo)上刪除記號,系統(tǒng)對標(biāo)有刪除記號的觀測單位不作分析。Basedontimeorcaserange:順序抽樣。單擊Range按紐,打開SelectCase:Range對話框,用戶自行定義從第幾個(gè)觀察值開始抽到第幾個(gè)觀察值結(jié)束。精品課件精品課件3.2.4加權(quán)記錄WeightCases:設(shè)定某變量為頻數(shù)變量。精品課件3.2.5數(shù)據(jù)匯總所謂分類匯總就是按指定的分類變量對觀測值進(jìn)行分組,對每組記錄的各變量求指定的描述統(tǒng)計(jì)量,結(jié)果可以存入新數(shù)據(jù)文件,也可以替換當(dāng)前數(shù)據(jù)文件。一、匯總的概念二、進(jìn)行分類匯總的方法1、打開“data”菜單,選擇“Aggregate”,展開aggregatedata”對話框。精品課件2、在左側(cè)的源變量框中選擇一個(gè)或多個(gè)變量作為分類變量進(jìn)入分類變量(BreakVariable[s])框中。3、在左側(cè)的源變量框中選擇一個(gè)或多個(gè)變量作為要求匯總的變量進(jìn)入?yún)R總變量(AggregateVariable[s])框中,即要求這些變量的值進(jìn)行分類匯總。4、“name&label”(名稱與標(biāo)簽):單擊此按鈕可以修改組合后所生成新變量名稱以及標(biāo)簽:可以在name后面的矩形框中輸入新變量名。在Label后面的矩形框中輸入新變量標(biāo)簽。單擊“continue”按鈕繼續(xù)。精品課件5、“Function”(函數(shù))選擇此項(xiàng)可以確定匯總變量的描述內(nèi)容;系統(tǒng)默認(rèn)函數(shù)為平均數(shù)。精品課件精品課件3.3文件級別的數(shù)據(jù)管理(二)3.3.1數(shù)據(jù)字典的定義與應(yīng)用在大型的數(shù)據(jù)分析項(xiàng)目中,數(shù)據(jù)管理是非常重要的一個(gè)環(huán)節(jié),為了保證工作質(zhì)量,數(shù)據(jù)處理人員往往會事先定義好一個(gè)非常詳細(xì)的數(shù)據(jù)格式,包括變量格式、變量標(biāo)簽、標(biāo)簽值、缺失值定義等,這被稱為數(shù)據(jù)字典。一、變量屬性定義導(dǎo)向:DefineVariableProperties具體說來,可以列出所選變量的所有值;分辨沒有值標(biāo)簽的值,并且提供自動(dòng)給出值標(biāo)簽的功能;可以將另一個(gè)變量的屬性拷貝到所選變量,也可以將所選變量的屬性拷貝到其他變量。精品課件精品課件精品課件二、復(fù)制數(shù)據(jù)文件屬性導(dǎo)向CopyDataProperties過程用于將定義好的數(shù)據(jù)字典直接應(yīng)用到當(dāng)前文件中。操作時(shí)不僅可以將一個(gè)外部數(shù)據(jù)文件相關(guān)屬性拷貝到當(dāng)前數(shù)據(jù)文件中,還可以進(jìn)行自行定義,只選擇某些變量,或者某些屬性進(jìn)行拷貝,這無疑大大提高了連續(xù)性項(xiàng)目對原有資源的利用程度。精品課件精品課件精品課件3.3.2查找重復(fù)記錄IdentifyingDuplicateCases:用于查找重復(fù)記錄。精品課件精品課件精品課件精品課件運(yùn)行結(jié)束后,結(jié)果窗口會給出本次操作的信息匯總:精品課件3.3.3數(shù)據(jù)文件的重新排列與轉(zhuǎn)置一、數(shù)據(jù)的長型與寬型格式:長型格式和寬型格式指的是重復(fù)測量數(shù)據(jù)的兩種不同的排列方式。由于重復(fù)測量模型可以使用不同的統(tǒng)計(jì)模型加以分析,因此根據(jù)模型的要求進(jìn)行長型格式和寬型格式之間的互轉(zhuǎn)換是數(shù)據(jù)分析中經(jīng)常要遇到的問題。精品課件精品課件精品課件二、長型格式轉(zhuǎn)換為寬型格式:Restructure。選擇DataRestructure,系統(tǒng)就會彈出下圖導(dǎo)向。精品課件精品課件精品課件精品課件精品課件三、數(shù)據(jù)轉(zhuǎn)置Transpose:用于對數(shù)進(jìn)行行列轉(zhuǎn)置,數(shù)據(jù)文件的轉(zhuǎn)置就是將數(shù)據(jù)編輯窗口中數(shù)據(jù)的行列互換,即將記錄轉(zhuǎn)為變量,將變量轉(zhuǎn)為記錄后,重新顯示在數(shù)據(jù)編輯窗口中。精品課件Variable(s):放入將要行列轉(zhuǎn)置的變量名。在數(shù)據(jù)文件中,未放入欄中的變量會遺失。字符串變量不能轉(zhuǎn)換,如強(qiáng)迫轉(zhuǎn)換,變量值轉(zhuǎn)變?yōu)橄到y(tǒng)缺失值。Namevariable:變量命名欄,在左側(cè)源變量欄中選擇一個(gè)變量,放入namevariable欄,技改變量的數(shù)據(jù)作為轉(zhuǎn)置后的變量名。精品課件3.3.4多個(gè)數(shù)據(jù)文件的合并縱向連接:幾個(gè)數(shù)據(jù)集中的數(shù)據(jù)相加,組成一個(gè)新的數(shù)據(jù)集,新數(shù)據(jù)集中的記錄是原來幾個(gè)數(shù)據(jù)集中記錄數(shù)的總和。橫向連接:指的是按照記錄的次序,或者某個(gè)關(guān)鍵變量的數(shù)值,將不同數(shù)據(jù)集中的不同變量合并為一個(gè)數(shù)據(jù)集,新數(shù)據(jù)集中的變量數(shù)是所有原數(shù)據(jù)集中不重名變量的總和。一、數(shù)據(jù)文件的縱向連接縱向合并實(shí)質(zhì)就是將兩個(gè)數(shù)據(jù)文件的變量列,按照各個(gè)變量名的含義,一一對應(yīng)的進(jìn)行首尾相接??v向合并必須遵循兩個(gè)條件:第一,兩個(gè)合并的spss數(shù)據(jù)文件,其內(nèi)容合并是有實(shí)際意義的。第二,為方便spss數(shù)據(jù)文件的合并,在不同的數(shù)據(jù)文件中,最好起相同的名字,變量類型和變量長度也要盡量相同。精品課件精品課件精品課件精品課件Unpairedvariable:不匹配變量欄。指變量名相同而變量定義不同的變量,或變量名不同的變量。Variableinnewworkingdata:新工作數(shù)據(jù)變量欄。Indicatecasesourceasvariable:指示記錄來源的變量選項(xiàng)/精品課件精品課件二、數(shù)據(jù)文件的橫向合并橫向合并的實(shí)質(zhì)是將兩個(gè)數(shù)據(jù)文件的記錄,按照記錄對應(yīng),一一進(jìn)行左右對接。橫向合并遵循三個(gè)條件:第一,如果不是按照記錄號對應(yīng)的規(guī)律進(jìn)行合并,則兩個(gè)數(shù)據(jù)文件必須至少有一個(gè)變量名相同的公共變量,這個(gè)變量是兩個(gè)數(shù)據(jù)文件橫向合并的依據(jù),成為關(guān)鍵變量。第二,如果是使用關(guān)鍵變量進(jìn)行合并的對應(yīng),則兩個(gè)數(shù)據(jù)文件都必須事先按關(guān)鍵變量進(jìn)行升序排列。第三,為方便SPSS文件的合并,在不同的數(shù)據(jù)文件中,數(shù)據(jù)含義不相同的列,變量名不應(yīng)取相同的名稱。精品課件精品課件ExcludedVariables:拒絕變量名。外部文件與當(dāng)前數(shù)據(jù)的同變量,拒絕加到新工作區(qū)中。NewWorkingData:新工作數(shù)據(jù)變量欄。MatchCaseonKeyVariableinsort:排序文件中按關(guān)鍵變量匹配記錄選項(xiàng)。Bothfilesprovidecase:由外部文件和當(dāng)前數(shù)據(jù)量兩者提供記錄。Externalkeyedtable:外部文件為關(guān)鍵表,以當(dāng)前數(shù)據(jù)為基準(zhǔn),外部文件匹配當(dāng)前數(shù)據(jù)的關(guān)鍵變量值,如匹配成功,外部文件的新變量值加入到當(dāng)前數(shù)據(jù)的新變量中,匹配不成功則不加入。WorkingDatakeyedtable:當(dāng)前數(shù)據(jù)為關(guān)鍵表。KeyVariables:關(guān)鍵變量欄,在拒絕變量選擇某變量作為關(guān)鍵變量。Indicatecasesourceasvariable:指示記錄來源的變量選項(xiàng)。精品課件精品課件第4章連續(xù)性變量的統(tǒng)計(jì)描述與參數(shù)估計(jì)4.1連續(xù)變量的統(tǒng)計(jì)描述概述4.1.1統(tǒng)計(jì)描述中的可用工具(1)各種初步匯總描述方法頻數(shù)、百分位數(shù)。(2)各種統(tǒng)計(jì)描述指標(biāo)均值、標(biāo)準(zhǔn)差、四分位數(shù)間距。(3)統(tǒng)計(jì)表(4)統(tǒng)計(jì)圖精品課件4.1.2連續(xù)變量的統(tǒng)計(jì)描述指標(biāo)體系(1)集中趨勢(CentralTrend):均數(shù)(Mean)中位數(shù)(Median)眾數(shù)(Mode)總合(Sum)精品課件(4)其他趨勢百分位數(shù)指標(biāo)(Percentile)、M統(tǒng)計(jì)量(M-Estimators)、極端值(Outlier)。(2)離散趨勢(DispersionTrend)標(biāo)準(zhǔn)差(Std.Deviation)、方差(Variance)、全距(Range)、最小值(Minimum)、最大值(Maximum)、標(biāo)準(zhǔn)誤(S.E.Mean)(3)分布特征(DistributionTendency)偏度系數(shù)(Skewness)和峰度系數(shù)(Kurtosis)精品課件精品課件4.1.3spss中的相應(yīng)功能1、Spss的用于連續(xù)變量統(tǒng)計(jì)描述的過程,均集中在DescriptiveStatistics子菜單中。(1)Frequencies:產(chǎn)生原始數(shù)據(jù)的頻數(shù)表,并能計(jì)算各種百分位數(shù)。精品課件控制頻數(shù)表輸出范圍類型的最大數(shù)目精品課件(2)Descriptive過程該過程用于一般性的統(tǒng)計(jì)描述,相對于Frequencies過程而言,它不能繪制統(tǒng)計(jì)圖。精品課件(3)Explore過程該過程用于對連續(xù)性資料分布狀況不清楚時(shí)的探索性分析,它可以計(jì)算許多描述統(tǒng)計(jì)量,給出各種統(tǒng)計(jì)圖,并進(jìn)行簡單的參數(shù)估計(jì)。精品課件精品課件(4)Ratio過程用于對兩個(gè)連續(xù)性變量計(jì)算相對比指標(biāo)。精品課件精品課件2、Comparesmeans均值比較精品課件means過程:means過程的優(yōu)勢在于各組的描述指標(biāo)被放在一起便于相互比較,并且如果需要,可以直接輸出結(jié)果,無須再次調(diào)用其它過程。精品課件4.2集中趨勢的的描述指標(biāo)4.2.1算術(shù)平均算術(shù)平均(ArithmeticMean)是最常用的描述輸送距分布的集中趨勢的統(tǒng)計(jì)良。總體均數(shù)(PopulationMean)用希臘字母表示,樣本均數(shù)常用表示。一、算術(shù)平均數(shù)的定義和性質(zhì)精品課件二、均數(shù)的意義任何一個(gè)平均數(shù)值首先是同類現(xiàn)象的平均數(shù)。任何一個(gè)平均數(shù)總是一個(gè)平衡點(diǎn)。但平均數(shù)在高度概括觀測數(shù)據(jù)從而使問題簡化的同時(shí),卻丟失了某些有用的信息,一方面它把各個(gè)觀測數(shù)據(jù)之間的差異性掩蓋了起來,另一方面由于平均數(shù)對于個(gè)別極端值反應(yīng)比較靈敏,因而平均數(shù)在某些情況下可能具有一定的欺騙性。三、均數(shù)的適用范圍嚴(yán)格的講平均數(shù)指示用于定距變量。但有時(shí)對于定序變量,求平均等級也可以使用平均數(shù)。精品課件4.2.2中位數(shù)中位數(shù)(Median)是將總體各單位的標(biāo)志值按大小順序排列,處于中間位置的那個(gè)標(biāo)志。一、中位數(shù)的定義對于未分組的原始資料,首先必須將標(biāo)志值按大小順序。設(shè)排序結(jié)果為:則中位數(shù)就可以按下列方式確定:二、中位數(shù)的適用范圍精品課件4.2.3其他集中趨勢指標(biāo)一、截尾均數(shù)由于均數(shù)較易受極端之的影響,因此可以考慮將數(shù)據(jù)排序后,按照一定的比例去掉最兩端的數(shù)據(jù),只是用中部的數(shù)據(jù)來求均數(shù)。如果截尾均數(shù)河源均數(shù)相差不大,則說明數(shù)據(jù)不存在極端值,或者兩側(cè)極端值的影響正好抵消;反之,則說明數(shù)據(jù)中有極端值,此時(shí)截為均數(shù)更好地反映數(shù)據(jù)的集中趨勢。常用的截尾均數(shù)有5%截尾均數(shù),即兩端各去掉5%的數(shù)據(jù)。精品課件二、幾何均數(shù)幾何均數(shù)適用于原始數(shù)據(jù)分布不對稱,但經(jīng)過對數(shù)轉(zhuǎn)換后稱對稱分布的資料。幾何均數(shù)世紀(jì)上就是對數(shù)轉(zhuǎn)換后的數(shù)據(jù)lgX的算術(shù)平均數(shù)的反對數(shù)。精品課件四、調(diào)和均數(shù)它實(shí)際上是觀察值X倒數(shù)之均數(shù)的倒數(shù)。三、眾數(shù)(Mode)眾數(shù)指的是樣本數(shù)據(jù)中出現(xiàn)頻次最多的那個(gè)數(shù)。眾數(shù)適用于任何層次的變量,特別適用于單峰對稱的情況,是比較兩個(gè)分布是否接近首先要考慮的參數(shù)。在SPSS中,眾數(shù)可以在Report子菜單和Tables子菜單的全部報(bào)表過程和制表過程中計(jì)算出來。在SPSS中,調(diào)和均數(shù)可以在Report子菜單的4個(gè)報(bào)表過程過程中計(jì)算出來。精品課件4.3離散趨勢的描述指標(biāo)4.3.1全距(Range)又稱為極差,是一組數(shù)據(jù)中最大值(Maximun)與最小值(Minimum)之差。極差反映的是變量分布的差異范圍或離散程度,在總體中,任何兩個(gè)標(biāo)志值之差都不可能超過極差。極差存在兩點(diǎn)不足:一是它僅僅取決于兩個(gè)極端之的水平,不能反映其間的變量分布情況,提供的信息太少。二是它容易受個(gè)別極端值的影響,不符合穩(wěn)健型的要求。精品課件4.3.2方差和標(biāo)準(zhǔn)差一、方差(Variance)和標(biāo)準(zhǔn)差(StandardDeviation)的定義將離均差平方和(SumofSquaresofDeviationfromMean,SS)除以觀察例數(shù)N,就得到方差:方差越大,數(shù)據(jù)分布離散程度越大。對于樣本數(shù)據(jù)而言,方差的計(jì)算公式為:將方差開方,就得到標(biāo)準(zhǔn)差。對于同性質(zhì)的數(shù)據(jù)來說,標(biāo)準(zhǔn)差越小,表明數(shù)據(jù)的變異程度越小,即數(shù)據(jù)越整齊,數(shù)據(jù)的分布范圍越集中;標(biāo)準(zhǔn)差越大,表明數(shù)據(jù)的變異程度越大,即數(shù)據(jù)越參差不齊,分布越分散。二、方差和標(biāo)準(zhǔn)差的適用范圍:方差和標(biāo)準(zhǔn)差的適用范圍應(yīng)當(dāng)是正態(tài)分布。精品課件4.3.3百分位數(shù)、四分位數(shù)與四分位數(shù)間距分位差是對極差指標(biāo)的一種改進(jìn),是從變量數(shù)列中剔除了一部分極端值后重新計(jì)算的類似于極差的指標(biāo)。常用的分位差有四分位差、十分位差、百分位差。一、分位數(shù)分位數(shù):是一種位置指標(biāo),用PX表示。一個(gè)百分位數(shù)PX將一組觀測之分為兩部分,理論上有x%的觀測值比它小,(100-x)%的觀測值比它大。四分位數(shù)(quartile)、十分位數(shù)(decile)、百分位數(shù)(percentile),他們分別是用3個(gè)點(diǎn)、9個(gè)點(diǎn)、99個(gè)點(diǎn)將數(shù)據(jù)4等分、10等分和100等分后各分位點(diǎn)上的值。精品課件二、四分位數(shù)四分位數(shù):實(shí)際上是三個(gè)數(shù)值的總稱,分別是P25、P50、P75分位數(shù)。很顯然,中間的分位數(shù)是中位數(shù),因此通常所說的四分位數(shù)是指第一個(gè)四分位數(shù)(下四分位數(shù))和第三個(gè)四分位數(shù)(上四分位數(shù))。上下四分位數(shù)的差值稱為四分位數(shù)間距:QR=Q3-Q1精品課件4.3.4變異系數(shù)當(dāng)需要比較兩組數(shù)據(jù)離散程度大小的時(shí)候,往往直接使用標(biāo)準(zhǔn)差來進(jìn)行比較并不合適。這可以被分為兩種情況:(1)測量尺度相差太大;(2)數(shù)據(jù)量綱不同。在以上情形中,就應(yīng)當(dāng)消除測量尺度和量綱的影響,而變異系數(shù)(CoefficientofVariance),它是標(biāo)準(zhǔn)差和其平均數(shù)的比率。精品課件4.4連續(xù)變量統(tǒng)計(jì)描述實(shí)例4.4.1數(shù)據(jù)背景介紹4.4.2使用Explore過程進(jìn)行分析探索分析是對數(shù)據(jù)進(jìn)行初步的觀察分析,主要的分析項(xiàng)目有:觀察數(shù)據(jù)的分布特征:可通過繪制箱圖和莖葉圖等圖形直觀地反映數(shù)據(jù)的分布形式和數(shù)據(jù)的一些規(guī)律性,包括考察數(shù)據(jù)中是否存在異常值等。正態(tài)分布檢驗(yàn):檢驗(yàn)數(shù)據(jù)是否服從正態(tài)分布。方差齊性的檢驗(yàn):用Levene檢驗(yàn)比較各組的方差是否相等。精品課件1、單擊Analyze->Descriptivestatistics->Explore,打開Explore主對話框:一、分析操作(3)在Display欄中選擇輸出項(xiàng),依次是Both選擇項(xiàng),輸出圖形與描述統(tǒng)計(jì)量(系統(tǒng)默認(rèn)),只輸出描述統(tǒng)計(jì)量和只輸出圖形。本例中選擇默認(rèn)項(xiàng)。(1)從左側(cè)的變量列表中選出變量”身高”,送入DependentList欄。(2)選擇”性別”作為因子變量,送入FactorList欄。有了因子變量,SPSS會把所有的觀測個(gè)體按照因子變量的取值分成若干各組,再分組考察DependentList中的各個(gè)變量,如果不選擇因子變量,SPSS會對全部觀測來做探索分析。精品課件2、單擊Statistics統(tǒng)計(jì)量按鈕,打開Statistics對話框,選擇統(tǒng)計(jì)輸出量。(1)Descriptives基本統(tǒng)計(jì)描述。同時(shí)指定均值的置信區(qū)間的置信度,系統(tǒng)默認(rèn)為95%。(2)M-估計(jì)(M估計(jì)在計(jì)算時(shí)對所有觀測量賦予權(quán)重,隨觀測量距分布中心的遠(yuǎn)近而變化)。(3)Outliers輸出分析數(shù)據(jù)中五個(gè)最大值和五個(gè)最小值。(4)Percentiles輸出百分?jǐn)?shù)。精品課件3、單擊Plots圖形按鈕,打開Plots對話框。(1)Boxplot箱圖選擇欄Factorlevelstogether因變量按因素水平分組(系統(tǒng)默認(rèn));Dependentstogether所有因變量生成一個(gè)并列箱圖(本例中選擇項(xiàng));None不顯示箱圖。(2)Descriptive描述圖形欄Stem-and-leaf莖葉圖Histogram直方圖(3)Normalityplotswithtest(復(fù)選項(xiàng)),正態(tài)分布檢驗(yàn)并輸出Q-Q圖。None:不產(chǎn)生回歸直線的斜率和方差齊性檢驗(yàn);PowerEstimation轉(zhuǎn)換冪值估計(jì)(對每組數(shù)據(jù)產(chǎn)生一個(gè)中位數(shù)自然對數(shù)及四個(gè)分位數(shù)的自然對數(shù)的散點(diǎn)圖)選項(xiàng);Transformed變換原始數(shù)據(jù)選擇項(xiàng);Untransformed不變換變換原始數(shù)據(jù)選擇項(xiàng)。(4)SpreadvslevelwithLeveneTest欄,對所有的散布—層次圖,同時(shí)輸出回歸直線的斜率以及方差齊性的Levenes檢驗(yàn)。精品課件4、單擊Option按紐,打開Option對話框如圖所示??蛇x擇缺失值的處理方式,SPSS提供三種處理方式:(1)Excludecaseslistwies剔除帶缺失值的觀測量(系統(tǒng)默認(rèn))。(2)Excludecasespairwise剔除帶缺失值的觀測量時(shí)還一并剔除與缺失值有成對關(guān)系的觀測量。(3)Reportvalues輸出頻數(shù)表時(shí)同時(shí)輸出缺失值。5、單擊OK,得到相應(yīng)的輸出結(jié)果如表所示。精品課件二、基本的分析結(jié)果精品課件精品課件三、輸出百分位數(shù)和極端值列表精品課件精品課件身高Stem-and-LeafPlotforsex=男

FrequencyStem&Leaf1.0015.9.0016.9.0016.55577899920.0017.11233444424.0017.55555555555667777778888912.0018.43.0018.668Stemwidth:10Eachleaf:1case(s)精品課件箱圖中,最底部的水平線段是數(shù)據(jù)的最小值(奇異點(diǎn)除外),頂部的水平線段是數(shù)據(jù)的最大值(奇異點(diǎn)除外),中間矩形箱子的底所在位置是數(shù)據(jù)的第一個(gè)四分位數(shù)(即25%分位數(shù)),箱子頂部所在位置是數(shù)據(jù)的第三個(gè)四分位數(shù)據(jù)(即75%分位數(shù))。箱子中間的水平線段刻畫的是數(shù)據(jù)的中位數(shù)(即50%分位數(shù))。精品課件4.4.3使用其他過程過程進(jìn)行分析一、Descriptive過程的結(jié)果二、Frequencies過程的結(jié)果精品課件精品課件4.5連續(xù)性變量的參數(shù)估計(jì)根據(jù)樣本數(shù)據(jù)對總體的客觀規(guī)律性作出合理估計(jì)的過程被稱為統(tǒng)計(jì)推斷(StatisticalInference),它可以被分為參數(shù)估計(jì)和假設(shè)檢驗(yàn)兩大類。4.5.1正態(tài)分布一、正態(tài)分布的定義若連續(xù)性隨即變量X的概率分布密度函數(shù)為則稱隨機(jī)變量X服從正態(tài)分布(NormalDistribution)精品課件二、正態(tài)分布的特征(1)正態(tài)分布是一條對稱曲線,關(guān)于均數(shù)對稱,因此均數(shù)被稱為正態(tài)分布的位置參數(shù)。(2)曲線是單峰,在均值出達(dá)到最高點(diǎn)。(3)正態(tài)分布曲線的尖削與標(biāo)準(zhǔn)差有關(guān)。因此標(biāo)準(zhǔn)差被稱為正態(tài)分布曲線的尺度參數(shù)。(4)曲線無論向左或向右延伸,都越來越接近橫軸,但不會與橫軸相交,以橫軸為漸近線。(5)約68%的個(gè)體的取值與平均數(shù)在距離一個(gè)標(biāo)準(zhǔn)差之內(nèi)。(6)約95%的個(gè)體取值與平均數(shù)的距離在1.96個(gè)標(biāo)準(zhǔn)差之內(nèi)。(7)99%個(gè)體的取值與平均數(shù)的距離在2.58個(gè)標(biāo)準(zhǔn)差。精品課件三、標(biāo)準(zhǔn)正態(tài)分布(StandardNormalDistribution)將原來的正態(tài)分布轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)分布。在SPSS中的Descriptive過程可以將原變量轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)分布的得分,只需要選中主對話框左下角的Savestandardizedvaluesasvariables復(fù)選框即可。精品課件四、偏度和峰度(1)偏度(Skewness):偏度是用來描述變量取值分布形態(tài)的統(tǒng)計(jì)量,只分布不對稱的方向和程度。樣本偏度系數(shù):偏態(tài)的方向指的應(yīng)當(dāng)是長尾的方向,而不是高峰的位置。精品課件(2)峰度(Kurtosis):峰度用來描述變量取值分布形態(tài)陡緩的統(tǒng)計(jì)量,是指分布圖形的的尖削程度或峰凸程度。樣本的峰度系數(shù):精品課件4.5.2參數(shù)的點(diǎn)估計(jì)參數(shù)的點(diǎn)估計(jì)就是選定一個(gè)適當(dāng)?shù)臉颖窘y(tǒng)計(jì)量作為參數(shù)的估計(jì)量,并計(jì)算出估計(jì)值。對于所選統(tǒng)計(jì)量是否適于作參數(shù)估計(jì)量,有無偏性、一致性和有效性三個(gè)評選標(biāo)準(zhǔn)。無偏性是指雖然估計(jì)量的值不全等于參數(shù),但應(yīng)在真實(shí)值附近擺動(dòng)。一致性是指樣本容量越大,估計(jì)值離真實(shí)值的差異應(yīng)當(dāng)越小。有效性是指如果兩個(gè)統(tǒng)計(jì)量都符合上述要求,則應(yīng)當(dāng)選取誤差更小的一個(gè)作為估計(jì)值。在許多種情況下,樣本統(tǒng)計(jì)量本身往往就是相應(yīng)的總體參數(shù)的最佳估計(jì),此時(shí)就可以直接取相應(yīng)的樣本統(tǒng)計(jì)量作為總體參數(shù)的點(diǎn)估計(jì)。一、矩法精品課件二、極大似然估計(jì)法該方法的原理是在已知總體的分布,但未知其參數(shù)值時(shí),在待估參數(shù)的可能取值范圍內(nèi)進(jìn)行搜索,使似然函數(shù)值最大的那個(gè)數(shù)值為極大似然估計(jì)值。三、穩(wěn)健估計(jì)值穩(wěn)健估計(jì)值的是該統(tǒng)計(jì)量具有穩(wěn)健性,當(dāng)數(shù)據(jù)存在異常值時(shí)受影響較小,而且對大部分的分布而言都很好。精品課件文件估計(jì)有M估計(jì)、R估計(jì)等不同方法。SPSS中數(shù)出的M估計(jì)量有4種,它們分別是Huber、Andrews、Hampel和Tukey所提出的,實(shí)際上就是所用的函數(shù)不同。一般而言,Huber適用于數(shù)據(jù)接近正態(tài)分布的情況,另外三種則適用于數(shù)據(jù)中許多異常值的情況。如果M估計(jì)量里平均數(shù)和中位數(shù)較遠(yuǎn),則數(shù)據(jù)中可能存在異常值。此時(shí),應(yīng)該用M估計(jì)量替代平均數(shù)以反映集中趨勢。。精品課件4.5.3參數(shù)的區(qū)間估計(jì)一、標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤就是用來描述參數(shù)估計(jì)值可能離真實(shí)值究竟有多遠(yuǎn)的統(tǒng)計(jì)量。二、區(qū)間估計(jì)的計(jì)算結(jié)合樣本統(tǒng)計(jì)量和標(biāo)準(zhǔn)誤可以確定一個(gè)具有較大的可信度包含總體參數(shù)的區(qū)間,該區(qū)間稱為總體參數(shù)的1-a可信區(qū)間或置信區(qū)間(ConfidenceInterval)。對于任意可信度的區(qū)間情況,總體均值在100(1-a)%可信區(qū)間為:精品課件精品課件第5章分類變量的統(tǒng)計(jì)描述與參數(shù)估計(jì)5.1分類變量的統(tǒng)計(jì)描述概述5.1.1分類變量的統(tǒng)計(jì)描述指標(biāo)體系一、頻數(shù)分布情況描述各個(gè)類別的樣本數(shù)和所占比例分別稱為頻數(shù)(絕對頻數(shù))和百分比(構(gòu)成比)。累計(jì)頻數(shù)是指本類別及較低類別出現(xiàn)的次數(shù)之和,累計(jì)百分比則是指本類別及較低類別出現(xiàn)的次數(shù)之和占總次數(shù)的百分比。根據(jù)類別的有序性,分類變量可以分為有序分類變量(OrdinalVariable)和無序分類變量(NominalVariable)。精品課件當(dāng)集中趨勢顯著時(shí),用眾數(shù)(Mode)作為總體的代表值。二、集中趨勢的描述所謂眾數(shù),使之出現(xiàn)次數(shù)最多的那個(gè)數(shù)。如果只有一個(gè)眾數(shù)稱為單眾數(shù),多于一個(gè)的稱為復(fù)眾數(shù)。(1)比(Ratio):比指的是兩個(gè)有關(guān)指標(biāo)之比A/B,用于反映兩個(gè)指標(biāo)在數(shù)量/頻數(shù)上的大小關(guān)系。三、使用相對數(shù)進(jìn)行深入描述精品課件(2)構(gòu)成比(Proportion)率是一個(gè)時(shí)間概念,或者說具有速度、強(qiáng)度含義的指標(biāo),用于說明某個(gè)時(shí)間發(fā)生的頻率或強(qiáng)度。分觀察對象為K部分(A1、A2、……Ak),其中某一個(gè)/多個(gè)部分的例數(shù)占總例的比例未構(gòu)成比,它描述某個(gè)事物內(nèi)部各構(gòu)成部分所占的比重。(3)率(Rate)精品課件5.1.2分類變量的聯(lián)合描述當(dāng)一共有兩個(gè)分類變量時(shí),這匯總因分類變量的各類別交叉而成的復(fù)合頻數(shù)表被稱為行*列表,也稱列聯(lián)表。當(dāng)觀察的現(xiàn)象與兩個(gè)因素有關(guān)時(shí),如某種服裝的銷量受價(jià)格和居民收入影響;某種產(chǎn)品的生產(chǎn)成本受原材料價(jià)格和產(chǎn)量的影響等等,交叉列聯(lián)表分析可以比較好的反映出兩個(gè)因素之間有無關(guān)聯(lián)性,兩因素與現(xiàn)象之間的相關(guān)關(guān)系。因此,數(shù)據(jù)交叉列聯(lián)表分析主要包括兩個(gè)基本任務(wù):1、根據(jù)收集的樣本數(shù)據(jù),產(chǎn)生二維或多維交叉列聯(lián)表;2、在交叉列聯(lián)表的基礎(chǔ)上,對兩兩變量間是否存在關(guān)聯(lián)性進(jìn)行檢驗(yàn)。精品課件精品課件5.2分類變量的統(tǒng)計(jì)描述實(shí)例5.2.1使用Frequencies過程輸出頻數(shù)表具體操作:AnalysisDescriptiveStatisticsFrequencies精品課件精品課件1、打開數(shù)據(jù),單擊AnalyzeDescriptiveStatisticsCrosstabs對話框。2、如果是二維列聯(lián)表分析,可以將行變量選擇進(jìn)入Row(s)中,將列變量選擇進(jìn)入Column(s)框中。如進(jìn)行三維以上的列聯(lián)表,可以將其它變量作為控制變量選到Layer框中。多控制變量可以是同層次的也可以是逐層疊加的。5.2.2使用Crosstabs過程輸出列聯(lián)表精品課件3、Displayclusteredbarchart選擇項(xiàng),可以指定繪制各變量交叉頻數(shù)分布柱形圖。Suppresstable表示不輸出列聯(lián)表,只有在分析行列變量間關(guān)系時(shí)選擇此項(xiàng)。此例中不選擇這一項(xiàng)。4、單擊Cell按紐,打開Crosstabs:CellDisplay對話框,如圖所示。從對話框中指定列聯(lián)表單元格中的輸出內(nèi)容。在Counts框中選擇Observed觀察值(系統(tǒng)默認(rèn))或Expected期望頻數(shù)。在Percentages框內(nèi)選擇Row行百分比、Column列百分比及Total總百分比。在Residuals框中選擇輸出殘差。其中Standardize為標(biāo)準(zhǔn)化殘差。Adj.standardize為修正的標(biāo)準(zhǔn)化殘差。精品課件精品課件5.3多選題的統(tǒng)計(jì)描述5.3.1多選題的描述指標(biāo)體系在多選題分析中比較特別的描述指標(biāo)有:(1)應(yīng)答人數(shù):是指選擇了本項(xiàng)人數(shù)。(2)應(yīng)答人數(shù)百分比(PercentofCases):選擇該項(xiàng)的人占總?cè)藬?shù)的比例。(3)應(yīng)答人次:選擇本選項(xiàng)的人次。(4)應(yīng)答次數(shù)百分比(PercentofResponses):在作出的選擇中,選擇該項(xiàng)的人數(shù)占總次數(shù)的比例。精品課件5.3.2分析實(shí)例操作步驟:AnalyzeMultipleResponseFrequencies1、DefineSets過程該過程指定變量組成一個(gè)多重響應(yīng)或多重兩分?jǐn)?shù)集,并應(yīng)用于頻數(shù)表和交叉列表。2、Frequencies過程該過程對定義的多重響應(yīng)或多重兩分?jǐn)?shù)提供一個(gè)頻數(shù)表。3、Crosstabs過程該過程提供帶有另一種變量的,已定義的多重或多重兩分?jǐn)?shù)據(jù)集交叉表。精品課件5.4分類變量的參數(shù)估計(jì)5.4.1二項(xiàng)分布的參數(shù)估計(jì)一、二項(xiàng)分布二項(xiàng)分布又稱為貝努里(Bernoulli)分布,是一種具有廣泛應(yīng)用的離散型隨機(jī)變量的概率分布。二項(xiàng)分布研究的是試驗(yàn)僅有兩種結(jié)果的分布(這種試驗(yàn)稱為貝努里試驗(yàn)),如某產(chǎn)品質(zhì)量合格與不合格等。其定義為:設(shè)有n次試驗(yàn),各次試驗(yàn)是相互獨(dú)立的,每次試驗(yàn)?zāi)呈录霈F(xiàn)的概率都是p,某事件不出現(xiàn)的概率都是1-p,記為q,則對于某事件出現(xiàn)k(k=0,1,2,?,n)次的概率分布為:精品課件二、二項(xiàng)分布檢驗(yàn)(BinomialTest)當(dāng)研究對象屬于二項(xiàng)總體時(shí),可以用二項(xiàng)分布來檢驗(yàn)假設(shè),判斷所抽取的樣本是否來自具有既定值的總體。其檢驗(yàn)步驟如下:1、提出假設(shè)2、計(jì)算統(tǒng)計(jì)量值和p值3、根據(jù)p值作出統(tǒng)計(jì)判斷。[例]擲一枚球類比賽用的挑邊器40次,出現(xiàn)A面和B面在上的次數(shù)。如表所示,試問這枚挑邊器是否均勻?精品課件解:(1)在SPSS中輸入表中的數(shù)據(jù)(變量名為Y)。選擇主菜單的[Analyze]=>[NonparametricTests]=>[BinomialTest]。(2)顯示如圖所示的[BinomialTest(二項(xiàng)檢驗(yàn))]主對話框,把Y選入[TestVariable],其它選項(xiàng)采用默認(rèn)值。(3)單擊主對話框中的[OK]按鈕,輸出結(jié)果如下:從結(jié)果可以看出,p=0.017<α=0.05,認(rèn)為該挑邊器不是均勻的。精品課件第6章數(shù)據(jù)報(bào)表的呈現(xiàn)6.1spss報(bào)表概述6.1.1spss中的報(bào)表功能1、base模塊2、original模塊3、CustomTables模塊6.1.2報(bào)表的基本繪制步驟精品課件6.2表格入門6.2.1表格基本框架行(Row)指的是形成表格的橫行元素;列(Column)指的是形成表格縱列的元素;行、列元素相交就會形成一個(gè)最簡單的二維表,行、列元素不同取值的組合就確定了一個(gè)單元格(Cell)。層(Layer)指的是表格中的第三個(gè)維度。精品課件精品課件6.2.3單元格的數(shù)據(jù)類型1、分類變量.包括了名義型和有序尺度兩大類。2、連續(xù)變量包括間距尺度和比率尺度兩大類。(1)集中趨勢指標(biāo):均數(shù)、中位數(shù)、眾數(shù)、最大值、最小值。(2)離散趨勢指標(biāo):全距、標(biāo)準(zhǔn)誤、標(biāo)準(zhǔn)差、方差。(3)百分位數(shù):第5、25、75、95、99百分位數(shù)其任一指定的百分位數(shù)。(4)百分比:按相應(yīng)合計(jì)方向當(dāng)前變量的行、列、層、表格合計(jì)百分比。(5)其他:例數(shù)、有效例數(shù)、綜合等。3、匯總項(xiàng)精品課件6.2.4集中基本表格類型1、疊加表(Stacking)疊加表指的是在同一張表格中對兩個(gè)變量進(jìn)行描述,或者說表格中有一個(gè)維度的元素是由兩個(gè)以上的變量構(gòu)成。2、交叉表(Crosstabulation)它的兩個(gè)維度都是由兩個(gè)分類變量的各類別構(gòu)成。3、嵌套表(Nesting)兩個(gè)變量被放置在同一個(gè)表格維度中,即該維度是由兩個(gè)變量的各種類別組合而成。4、多層表(Layers)如果制定了層元素,表格就由二維擴(kuò)展到三維,即多層表。5、復(fù)合表格精品課件6.3用OriginalTables模塊制表6.3.1功能簡介(1)MultipleResponseSets(2)BasicTables(3)GeneralTables(4)MultipleResponseTables(5)TablesofFrequencies精品課件6.3.2BasicTables過程例2:請將數(shù)據(jù)文件Cars.sav中的汽車數(shù)據(jù)分為不同的產(chǎn)地和氣缸數(shù)計(jì)算其引擎功率、引擎重量的頻數(shù)和均數(shù),用適當(dāng)?shù)膱?bào)表形式給出,并要求給出類別合計(jì)。精品課件1、表格框架的設(shè)定精品課件精品課件2、統(tǒng)計(jì)量的添加與格式的設(shè)置精品課件精品課件3、添加匯總項(xiàng)精品課件4、空單元格的設(shè)置精品課件5、添加標(biāo)題與說明文字精品課件6、標(biāo)簽排列格式的調(diào)整精品課件7、最終完成表格繪制精品課件6.3.3GeneralTables過程1、表格框架的設(shè)定精品課件精品課件2、添加匯總項(xiàng)精品課件6.4用CustomTables模塊自由制作6.4.1操作主界面精品課件6.4.2簡單實(shí)例分析1、表格框架的繪制:選中左側(cè)列表中變量的圖標(biāo),按下左鍵不放,移動(dòng)鼠標(biāo),此時(shí)鼠標(biāo)攜帶著變量圖標(biāo)一起移動(dòng)。將其拖入畫布內(nèi),當(dāng)鼠標(biāo)接近行/列邊框時(shí),相應(yīng)地邊框會變紅,表明該變量已經(jīng)找到位置。精品課件2、連續(xù)變量統(tǒng)計(jì)量的設(shè)置(1)選中畫布上的Horsepower圖標(biāo),此時(shí)界面左下方Define框組中的SummaryStatistics浮動(dòng)鈕已經(jīng)可以用,單擊該鈕后即彈出連續(xù)變量匯總統(tǒng)計(jì)量設(shè)定的對話框圖。(2)如果計(jì)算某一個(gè)統(tǒng)計(jì)量,使用連接兩框的統(tǒng)計(jì)按鈕將其移入右側(cè)。例如如果希望先計(jì)算頻數(shù),則在用最右側(cè)的上下移動(dòng)鈕將其移動(dòng)到均數(shù)上方即可。精品課件3、分類變量匯總項(xiàng)的設(shè)置選擇分類變量Cylinder,則Define框組中的該浮動(dòng)按鈕可用,單擊后彈出如下界面:精品課件TotalsandSubtotalsAppear框組:用于設(shè)定匯總和子項(xiàng)匯總的標(biāo)簽是在左上部顯示還是在右下部顯示。Show框組:用于設(shè)定某項(xiàng)是否顯示,Ttotal選項(xiàng)用于要求計(jì)算匯總欄,Missing選項(xiàng)要求將用戶定義的的缺失值按缺失值處理方式處理,該選擇不影響系統(tǒng)缺失。Empty選項(xiàng)用于控制是否在表格中輸出無案例的類別。而最右側(cè)的Other選項(xiàng)則控制是否顯示未提供值標(biāo)簽的類別。Exclude框:用于指定部顯示某些類別。Display框組:直觀的顯示該分類變量各類的顯示方式、順序、匯總等。精品課件4、顯示標(biāo)簽的調(diào)整將表格畫布切換為正常視圖,然后在Cylingder的變量名標(biāo)簽出單擊右鍵,則彈出相應(yīng)的右鍵菜單。精品課件6.4.3其他選項(xiàng)卡功能1、TestStatistics功能精品課件2、Titles選項(xiàng)卡精品課件3、Options選項(xiàng)卡精品課件6.5表格的編輯6.5.1基本編輯操作1、兩種不同的編輯窗口(1)嵌套窗口編輯模式選中相應(yīng)表格使用右鍵菜單上的SPSSPivottableObjectEdit,或者雙擊鼠標(biāo)左鍵。(2)單獨(dú)窗口編輯模式選中相應(yīng)表格使用右鍵菜單上的SPSSPivottableObjectOpe。,精品課件2、表格元素的選擇方式精品課件3、單元格內(nèi)容編輯精品課件6.5.2主要編輯菜單功能介紹1、Edit菜單精品課件2、format菜單對單元格的字體、陰影、顏色等屬性修改對表格進(jìn)行各個(gè)選項(xiàng)的精細(xì)設(shè)置對單元格的字體、陰影、顏色等屬性修改對表格進(jìn)行各個(gè)選項(xiàng)的精細(xì)設(shè)置選用新的表格模版表格的行、列自動(dòng)按內(nèi)容多少調(diào)整為最小。將列標(biāo)題縱向顯示精品課件3、View菜單和Insert菜單精品課件4、Pivot菜單精品課件6.5.3表格屬性的詳細(xì)設(shè)置單擊菜單Format到TableProperties即可彈出表格屬性對話框。(1)general選項(xiàng)卡精品課件(2)Footnotes選項(xiàng)卡精品課件(3)CellFormats選項(xiàng)卡精品課件(4)Borders選項(xiàng)卡精品課件6.6參數(shù)估計(jì)精品課件6.6.1參數(shù)估計(jì)的一般問題一、估計(jì)量與估計(jì)值所謂參數(shù)估計(jì)(Parameterestimation)就是用樣本統(tǒng)計(jì)量去估計(jì)總體的參數(shù)。如果我們將總體參數(shù)籠統(tǒng)地用一個(gè)符號來表示,參數(shù)估計(jì)也就是如何用樣本統(tǒng)計(jì)量來估計(jì)總體參數(shù)。用于估計(jì)的樣本統(tǒng)計(jì)量用符號表示,我們把稱為統(tǒng)計(jì)量(estimator)。估計(jì)值(estimatedvalue)就是用來估計(jì)總體參數(shù)時(shí)計(jì)算出來的估計(jì)量的具體數(shù)值。精品課件二、點(diǎn)估計(jì)與區(qū)間估計(jì)參數(shù)的估計(jì)方法有點(diǎn)估計(jì)(pointestimate)和區(qū)間估計(jì)(intervalestimate)兩種。(一)點(diǎn)估計(jì)所謂點(diǎn)估計(jì)就是由樣本x1,x2,…xn確定一個(gè)統(tǒng)計(jì)量

用它來估計(jì)總體的未知參數(shù),稱為總體參數(shù)的估計(jì)量。當(dāng)具體的樣本抽出后,可求出樣本統(tǒng)計(jì)量的值。用它作為總體參數(shù)的估計(jì)值,稱作總體參數(shù)的點(diǎn)估計(jì)。精品課件

某連續(xù)生產(chǎn)線上生產(chǎn)的燈泡的使用壽命X服從正態(tài)分布N(μ,δ2),其中μ和δ2是未知總體參數(shù)。從中隨機(jī)抽取5只燈泡,測得使用壽命分別為1529小時(shí)、1513小時(shí)、1600小時(shí)、1527小時(shí)、1111小時(shí)。試估計(jì)μ和δ2。從總體中抽取一個(gè)樣本,構(gòu)造適當(dāng)?shù)慕y(tǒng)計(jì)量,來估計(jì)對應(yīng)的總體參數(shù)。精品課件評價(jià)點(diǎn)估計(jì)量優(yōu)劣的標(biāo)準(zhǔn):1、無偏性(unbiasedness)無偏性是指估計(jì)量的抽樣分布的數(shù)學(xué)期望等于被估計(jì)的總體參數(shù)。參數(shù)θ不等于抽樣分布的均值(有偏估計(jì)量)參數(shù)θ等于抽樣分布的均值(無偏估計(jì)量)偏差精品課件2、有效性(Efficiency)精品課件參數(shù)的抽樣分布的抽樣分布精品課件精品課件

自正態(tài)總體抽樣時(shí),總體均值與總體中位數(shù)相同,而中位數(shù)的標(biāo)準(zhǔn)誤差大約比均值的標(biāo)準(zhǔn)誤差大25%。因此,樣本均值更有效。的抽樣分布的抽樣分布精品課件3、一致性(consistency)兩個(gè)不同容量樣本的點(diǎn)估計(jì)量的抽樣分布精品課件(二)區(qū)間估計(jì)的樣本使得置信度1-α區(qū)間估計(jì)是在點(diǎn)估計(jì)的基礎(chǔ)上,給出總體參數(shù)估計(jì)的一個(gè)區(qū)間范圍,該區(qū)間通常是由樣本統(tǒng)計(jì)量加減抽樣誤差得到的。精品課件6.6.2一個(gè)總體參數(shù)的區(qū)間估計(jì)(一)總體方差已知時(shí)總體均值的區(qū)間估計(jì)一、總體均值的區(qū)間估計(jì)當(dāng)總體服從正態(tài)分布且方差已知時(shí),或者總體不是正態(tài)分布但大樣本時(shí),樣本均值的抽樣分布均為正態(tài)分布,期數(shù)學(xué)期望為總體均值,方差為。而樣本均值經(jīng)過標(biāo)準(zhǔn)化以后的隨機(jī)變量則服從標(biāo)準(zhǔn)正態(tài)分布。精品課件顯著性水平置信度顯著性水平α下,μ在1-α置信水平下的置信區(qū)間:精品課件例題:一批零件的長度服從正態(tài)分布,從中隨機(jī)抽取9件,測得其平均長度為21.4毫米。已知該批零件長度的標(biāo)準(zhǔn)差為0.15毫米,試以95%的把握程度,估計(jì)該批零件平均長度的存在區(qū)間。精品課件例題:某大學(xué)從該校學(xué)生中隨機(jī)抽取100人,調(diào)查到他們平均每天參加體育鍛煉為26分鐘。試以95%的置信水平估計(jì)該大學(xué)全體學(xué)生平均每天參加體育鍛煉的時(shí)間(已知總體方差為36)。精品課件例題:一家保險(xiǎn)公司收集到36個(gè)投保人組成的隨機(jī)樣本,得到每個(gè)投保人的年齡如表:試建立投保人年齡的90%置信區(qū)間。精品課件(二)總體方差未知時(shí)總體均值的區(qū)間估計(jì)如果總體服從正態(tài)分布,則無論樣本容量如何,樣本均值的抽樣分布都服從正態(tài)分布。這時(shí),只要總體方差已知,即使在小樣本的情況下,也可以建立總體均值的置信區(qū)間。但是,如果總體方差未知,而且是在小樣本的情況下,則需要用樣本方差替代總體方差,這時(shí)樣本均值經(jīng)過標(biāo)準(zhǔn)化以后的隨機(jī)變量則服從自由度為(n-1)的t分布。精品課件-3-2-101230.00.10.20.30.4標(biāo)準(zhǔn)正態(tài)分布自由度為20的t-分布自由度為10的t-分布顯著性水平α下,μ的1-α置信區(qū)間:精品課件例題:已知某燈泡的壽命副總正態(tài)分布,現(xiàn)從一批燈泡中隨機(jī)抽取16只,測得其壽命如下:試建立該批燈泡使用壽命95%的置信區(qū)間。精品課件是否為大樣本n≥30σ值是否已知σ值是否已知總體是否近似正態(tài)分布用樣本標(biāo)準(zhǔn)差s估計(jì)δ用樣本標(biāo)準(zhǔn)差s估計(jì)δ將樣本容量增加到n≥30以便進(jìn)行區(qū)間估計(jì)是是是是否否否否總體均值區(qū)間估計(jì)程序精品課件二、總體比例的區(qū)間估計(jì)精品課件顯著性水平α下,P在1-α置信水平下的置信區(qū)間:精品課件

某企業(yè)在一項(xiàng)關(guān)于職工流動(dòng)原因的研究中,從企業(yè)前職工的總體中隨機(jī)抽選了200人組成一個(gè)樣本。在對其進(jìn)行訪問時(shí),有140說他們離開該企業(yè)是由于同管理人員不能融洽相處。試對由于這種原因而離開企業(yè)的人員的真正比率構(gòu)造95%的置信區(qū)間。精品課件三、總體方差的區(qū)間估計(jì)自由度為50自由度為2自由度為10顯著性水平α下,σ2的置信區(qū)間精品課件0=2.7044=19.02280.0250.025自由度為9的χ2分布

對某種金屬的10個(gè)樣品所組成的一個(gè)隨機(jī)樣本作抗拉強(qiáng)度試驗(yàn)。從試驗(yàn)數(shù)據(jù)算出的方差為4,試求σ2的95%值信區(qū)間。精品課件四、樣本容量的確定允許誤差(permissible)

用歷史數(shù)據(jù)代替。若有若干個(gè)歷史數(shù)據(jù),應(yīng)以較大者代替。

一家廣告公司想估計(jì)某類商店去年所花的平均廣告費(fèi)有多少。經(jīng)驗(yàn)表明,總體方差為。如置信度取95%,并要使估計(jì)值處在總體平均值附近500元的范圍內(nèi),這家廣告公司應(yīng)取多大的樣本?

一家市場調(diào)研公司想估計(jì)某地區(qū)有彩色電視機(jī)的家庭所占的比率。該公司希望對P的估計(jì)誤差不超過0.05,要求可靠程度為95%,應(yīng)取多大容量的樣本?總體方差最大值為0.5×0.5=0.25精品課件關(guān)鍵術(shù)語無放回抽樣(samplingwithoutreplacement)一個(gè)元素一旦選入樣本,就從總體中剔除,不能再次被選入放回抽抽樣(samplingwithreplacement)一個(gè)元素一旦被選入樣本,仍被放回總體中。先前被選入的元素可能再次被抽到,并且在本樣中可能出現(xiàn)多次抽樣分布(samplingdistribution)樣本統(tǒng)計(jì)量所有可能值構(gòu)成的概率分布點(diǎn)估計(jì)(

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論