《統(tǒng)計分析與SPSS的應(yīng)用(第7版)》課件 第1-6章 SPSS統(tǒng)計分析軟件概述 -SPSS的方差分析_第1頁
《統(tǒng)計分析與SPSS的應(yīng)用(第7版)》課件 第1-6章 SPSS統(tǒng)計分析軟件概述 -SPSS的方差分析_第2頁
《統(tǒng)計分析與SPSS的應(yīng)用(第7版)》課件 第1-6章 SPSS統(tǒng)計分析軟件概述 -SPSS的方差分析_第3頁
《統(tǒng)計分析與SPSS的應(yīng)用(第7版)》課件 第1-6章 SPSS統(tǒng)計分析軟件概述 -SPSS的方差分析_第4頁
《統(tǒng)計分析與SPSS的應(yīng)用(第7版)》課件 第1-6章 SPSS統(tǒng)計分析軟件概述 -SPSS的方差分析_第5頁
已閱讀5頁,還剩90頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第1章SPSS統(tǒng)計分析軟件概述SPSS使用基礎(chǔ)SPSS的基本運行方式利用SPSS進行數(shù)據(jù)分析的基本步驟引言SPSS的英文縮寫

StatisticalPackageforSocialScience:社會科學統(tǒng)計軟件包StatisticalProductandServiceSolutions:統(tǒng)計產(chǎn)品與服務(wù)解決方案SPSS的應(yīng)用:當今世界上公認和流行的綜合統(tǒng)計分析軟件包SPSS以其強大的統(tǒng)計分析功能、方便的用戶操作界面、靈活的表格式分析報告及其精美的圖形展現(xiàn),受到了社會各界統(tǒng)計分析人員的喜愛目前,SPSS軟件使用已經(jīng)成為許多大專院校統(tǒng)計學專業(yè)和財經(jīng)類、管理類專業(yè)本科學生的必修課程引言SPSS的特點操作簡便。絕大多數(shù)操作是通過菜單、按鈕、對話框完成的無需計算機編程、需記憶大量命令和參數(shù)分析方法豐富、分析結(jié)果清晰、直觀可以直接讀取其他常用軟件格式的數(shù)據(jù)文件,如:Excle、SAS等SPSS可在Windows、Linux、MacOS操作系統(tǒng)上運行,支持多種語言環(huán)境。SPSS提供了與R語言和Python語言的集成插件,用戶可在SPSS中方便地進行R和Python的編程,不僅有效提升了SPSS靈活處理數(shù)據(jù)的能力,也大大拓展了SPSS數(shù)據(jù)可視化和數(shù)據(jù)建模的功能不方便與一般的辦公軟件直接兼容SPSS使用基礎(chǔ)SPSS的基本窗口:數(shù)據(jù)編輯器窗口數(shù)據(jù)編輯窗口是對分析對象---SPSS數(shù)據(jù)文件進行錄入、修改、管理等基本操作的窗口SPSS數(shù)據(jù)文件均以.sav作為文件擴展名存儲在磁盤上數(shù)據(jù)視圖:顯示SPSS數(shù)據(jù)的內(nèi)容變量視圖:顯示SPSS數(shù)據(jù)的結(jié)構(gòu)組成:窗口主菜單、工具欄、數(shù)據(jù)編輯區(qū)、狀態(tài)區(qū)SPSS使用基礎(chǔ)SPSS的基本窗口:查看器窗口數(shù)據(jù)查看器窗口是顯示和管理SPSS統(tǒng)計分析結(jié)果、報表及圖形的窗口SPSS統(tǒng)計分析結(jié)果以.spv作為文件擴展名存儲在磁盤上兩個部分:目錄和內(nèi)容組成:窗口主菜單、工具欄、結(jié)果顯示區(qū)、狀態(tài)區(qū)SPSS的基本運行方式完全窗口菜單方式所有分析操作過程都是通過菜單和按鈕及對話框方式進行的是經(jīng)常使用的一種運行方式,適用于一般分析和SPSS的初學者SPSS的基本運行方式完全窗口菜單方式將待分析的變量從左邊的列表框選擇到右邊的列表框中變量是統(tǒng)計學中的基本概念。它指代的是現(xiàn)象的某種特征,如商品銷售額、受教育程度、產(chǎn)品的質(zhì)量等級等都可以看做變量。變量的具體取值稱為變量值,即數(shù)據(jù)。變量一般以列的形式展現(xiàn),是數(shù)據(jù)分析的基本單元。SPSS的基本運行方式程序運行方式:手工編寫SPSS命令程序一次性提交計算機運行適用于大規(guī)模的分析工作和熟練的SPSS程序員實現(xiàn)方法:打開語法窗口并編寫和修改SPSS程序點擊語法窗口中的運行菜單項,選擇運行方式運行SPSS的基本運行方式混合運行方式:先通過菜單選擇分析過程和參數(shù),不立即提交(確定)執(zhí)行,而是按粘貼按鈕計算機自動將用戶剛定義的分析過程和參數(shù)轉(zhuǎn)換成SPSS的命令,并顯示到語法窗口中用戶可對其進行必要的修改后再提交給計算機執(zhí)行一般適用于熟練的SPSS程序員利用SPSS進行數(shù)據(jù)分析的基本步驟數(shù)據(jù)分析的一般步驟明確數(shù)據(jù)分析目標正確收集數(shù)據(jù)加工和整理數(shù)據(jù)選擇恰當?shù)慕y(tǒng)計分析方法進行探索分析讀懂統(tǒng)計分析結(jié)果利用SPSS進行數(shù)據(jù)分析的一般步驟SPSS數(shù)據(jù)的準備SPSS數(shù)據(jù)的加工SPSS數(shù)據(jù)的分析SPSS分析結(jié)果的閱讀和解釋第2章SPSS數(shù)據(jù)文件的建立和管理SPSS數(shù)據(jù)文件SPSS數(shù)據(jù)的結(jié)構(gòu)和定義方法SPSS數(shù)據(jù)的錄入與編輯讀取其他格式的數(shù)據(jù)文件SPSS數(shù)據(jù)文件合并SPSS數(shù)據(jù)文件SPSS數(shù)據(jù)文件是一種有結(jié)構(gòu)的數(shù)據(jù)文件擴展名是.sav建立SPSS數(shù)據(jù)文件的兩項任務(wù)描述SPSS數(shù)據(jù)的結(jié)構(gòu)錄入編輯SPSS的數(shù)據(jù)內(nèi)容這兩部分工作分別在SPSS數(shù)據(jù)編輯器窗口的變量視圖和數(shù)據(jù)視圖中完成SPSS數(shù)據(jù)文件SPSS數(shù)據(jù)的基本組織方式原始數(shù)據(jù)的組織方式數(shù)據(jù)編輯器窗口中的一行稱為一個個案(case)或觀測,所有個案組成完整的SPSS數(shù)據(jù)數(shù)據(jù)編輯器窗口中的一列稱為一個變量。每個變量都有一個名字,稱為變量名,是訪問和分析SPSS變量的唯一標識示例:當代大學生的職業(yè)生涯規(guī)劃現(xiàn)狀和愿望的問卷調(diào)查SPSS數(shù)據(jù)文件SPSS數(shù)據(jù)的基本組織方式計數(shù)數(shù)據(jù)的組織方式:數(shù)據(jù)編輯器窗口中的一行為變量的一個分組(或多變量交叉分組下的一個分組)。所有行囊括了該變量的所有分組情況(或多變量交叉下的所有分組情況)。數(shù)據(jù)編輯器窗口中的一列仍為一個變量,代表某個問題(或某個方面的特征)以及相應(yīng)的計數(shù)結(jié)果示例:SPSS數(shù)據(jù)的結(jié)構(gòu)和定義方法SPSS數(shù)據(jù)的結(jié)構(gòu)是對SPSS每列變量及其相關(guān)屬性的描述在數(shù)據(jù)編輯器窗口的變量視圖中進行定義示例:變量名變量類型、列寬、小數(shù)位變量名標簽變量值標簽缺失值計量尺度變量角色SPSS數(shù)據(jù)的結(jié)構(gòu)和定義方法SPSS數(shù)據(jù)的結(jié)構(gòu)是對SPSS每列變量及其相關(guān)屬性的描述強調(diào)1:缺失數(shù)據(jù)數(shù)據(jù)中明顯錯誤或明顯不合理的數(shù)據(jù)以及漏填的數(shù)據(jù)都可看做缺失數(shù)據(jù)用戶缺失示例SPSS數(shù)據(jù)的結(jié)構(gòu)和定義方法SPSS數(shù)據(jù)的結(jié)構(gòu)是對SPSS每列變量及其相關(guān)屬性的描述強調(diào)2:計量尺度,統(tǒng)計學依據(jù)變量的計量尺度將變量分為三大類數(shù)值型變量:指諸如身高、體重、血壓等連續(xù)數(shù)值型變量定序型變量:具有內(nèi)在固有大小或高低順序,但它又不同于數(shù)值型變量,一般可以用數(shù)值或字符表示定類型變量:是指沒有內(nèi)在固有大小或高低順序,一般以數(shù)值或字符表示的各個類別SPSS數(shù)據(jù)的錄入與編輯SPSS數(shù)據(jù)的錄入帶變量值標簽的數(shù)據(jù)錄入SPSS數(shù)據(jù)的編輯SPSS數(shù)據(jù)的定位插入和刪除一個個案插入和刪除一個變量數(shù)據(jù)的移動復制和刪除SPSS數(shù)據(jù)的保存SPSS支持的數(shù)據(jù)格式SPSS格式EXCEL格式文本格式讀取其他格式的數(shù)據(jù)文件直接讀取其他格式的數(shù)據(jù)文件使用向?qū)肫渌袷降臄?shù)據(jù)示例SPSS數(shù)據(jù)文件的合并SPSS中合并數(shù)據(jù)文件:是指將一個(或多個)已存儲在磁盤上的SPSS數(shù)據(jù)文件或其他數(shù)據(jù)集中的數(shù)據(jù)文件分別依次與SPSS當前數(shù)據(jù)編輯器窗口中的數(shù)據(jù)合并SPSS提供了兩種合并數(shù)據(jù)文件的方式縱向合并橫向合并SPSS數(shù)據(jù)文件的合并縱向合并:是將當前數(shù)據(jù)編輯器窗口中的數(shù)據(jù)與另一個SPSS數(shù)據(jù)文件中的數(shù)據(jù)進行首尾對接,即將一個SPSS數(shù)據(jù)文件的內(nèi)容追加到當前數(shù)據(jù)編輯器窗口中數(shù)據(jù)的后面,依據(jù)兩份數(shù)據(jù)文件中的變量名進行數(shù)據(jù)對接示例和操作職工和追加職工數(shù)據(jù)的合并SPSS數(shù)據(jù)文件的合并橫向合并:將數(shù)據(jù)編輯器窗口中的數(shù)據(jù)與另一個SPSS數(shù)據(jù)文件中的數(shù)據(jù)進行左右對接,即將一個SPSS數(shù)據(jù)文件的內(nèi)容拼到數(shù)據(jù)編輯器窗口中當前數(shù)據(jù)的右邊,依據(jù)兩個數(shù)據(jù)文件中的個案進行數(shù)據(jù)對接示例和操作職工數(shù)據(jù)和獎金數(shù)據(jù)的橫向合并第3章SPSS數(shù)據(jù)的預(yù)處理數(shù)據(jù)的排序查找重復個案變量計算數(shù)據(jù)選取計數(shù)分類匯總其他數(shù)據(jù)的排序數(shù)據(jù)排序的作用便于數(shù)據(jù)的瀏覽快捷地找到數(shù)據(jù)的最大值和最小值,進而可以計算出數(shù)據(jù)的全距,初步把握和比較數(shù)據(jù)的離散程度發(fā)現(xiàn)數(shù)據(jù)中可能異常的值,為進一步明確它們是否對分析產(chǎn)生重要影響等提供幫助SPSS的數(shù)據(jù)排序?qū)?shù)據(jù)編輯器窗口中的數(shù)據(jù)按照某個或多個指定變量的變量值升序或降序重新排列。這里的變量也稱為排序變量。排序變量只有一個時,稱為單變量排序。排序變量有多個時,稱為多重排序。多重排序中,第一個指定的排序變量稱為主排序變量,其他依次指定的變量分別稱為第二排序變量、第三排序變量等數(shù)據(jù)的排序示例與操作大學生職業(yè)生涯規(guī)劃問卷調(diào)查數(shù)據(jù),按專業(yè)分類和畢業(yè)后意向進行多重排序查找重復個案查找重復個案的方法:排序示例和操作對2.6.1節(jié)數(shù)據(jù)縱向合并后的數(shù)據(jù),找到其中的重復個案變量計算變量計算的目的派生新變量變換數(shù)據(jù)的原有分布SPSS變量計算是在原有數(shù)據(jù)的基礎(chǔ)上,根據(jù)用戶給出的SPSS算術(shù)表達式以及函數(shù),對所有個案或滿足條件的部分個案,計算產(chǎn)生變量變量計算過程中涉及幾個概念SPSS算術(shù)表達式SPSS條件表達式SPSS函數(shù)變量計算SPSS算術(shù)表達式:是由常量、變量、算術(shù)運算符、圓括號、函數(shù)等組成的式子變量是指那些已存在于數(shù)據(jù)編輯器窗口中的已有變量算術(shù)運算符主要包括:+(加)、-(減)、?(乘)、/(除)、??(乘方)操作對象的數(shù)據(jù)類型為數(shù)值型運算的先后次序是:先計算乘方,再計算乘除,最后計算加減。在同級運算中,按從左往右的順序進行計算。通過圓括號改變原有的計算順序在同一算術(shù)表達式中的常量及變量,數(shù)據(jù)類型應(yīng)該一致,否則無法計算變量計算SPSS條件表達式簡單條件表達式:由關(guān)系運算符、常量、變量以及算術(shù)表達式等組成的式子。其中,關(guān)系運算符包括>(大于)、=(大于等于)、<=(小于等于)復合條件表達式:又稱邏輯表達式,是由邏輯運算符、圓括號和簡單條件表達式等組成的式子。其中,邏輯運算符包括&或AND(并且)、|或OR(或者)、~或NOT(非)。NOT的運算最優(yōu)先,其次是AND,最后是OR??梢酝ㄟ^圓括號改變這種運算次序變量計算SPSS函數(shù)函數(shù)是事先編好并存儲在SPSS軟件中,能夠?qū)崿F(xiàn)某些特定計算任務(wù)的一段計算機程序。這些程序段都有各自的名字,稱為函數(shù)名,執(zhí)行這些程序段得到的計算結(jié)果稱為函數(shù)值用戶在使用這些函數(shù)時,只需通過書寫相應(yīng)的函數(shù)名,并給出必要的計算參數(shù),SPSS便會自動計算函數(shù)值幾類SPSS函數(shù)算術(shù)函數(shù)、統(tǒng)計函數(shù)、與分布相關(guān)的函數(shù)查找函數(shù)、字符串函數(shù)日期函數(shù)、缺失值函數(shù)、其他函數(shù)變量計算示例與操作數(shù)據(jù)選取數(shù)據(jù)選?。菏歉鶕?jù)分析的需要,從已收集到的大批量數(shù)據(jù)(總體)中按照一定的規(guī)則抽取部分數(shù)據(jù)(樣本)參與分析數(shù)據(jù)選取方法按指定條件選取隨機選取隨機數(shù)的生成選取某一區(qū)域內(nèi)的樣本通過篩選器變量選取數(shù)據(jù)選取示例與操作數(shù)據(jù)計數(shù)數(shù)據(jù)計數(shù)SPSS實現(xiàn)的計數(shù)是對所有個案或滿足某條件的部分個案,計算若干個變量中有幾個變量的值落在指定的區(qū)間內(nèi),并將計數(shù)結(jié)果存入一個新變量的過程步驟:指定哪些變量參與計數(shù),計數(shù)的結(jié)果存入哪個新變量中指定計數(shù)區(qū)間區(qū)間:單個變量值;系統(tǒng)缺失值;系統(tǒng)或用戶缺失值;給定最大值和最小值的區(qū)間;小于等于某指定值的區(qū)間;大于等于某指定值的區(qū)間數(shù)據(jù)計數(shù)示例與操作分類匯總分類匯總:按照某分類變量進行分類計算SPSS實現(xiàn)分類匯總涉及按照哪個變量進行分類對哪個變量進行匯總,并指定對匯總變量計算哪些統(tǒng)計量(如平均工資、平均消費金額和標準差)分類匯總示例與操作數(shù)據(jù)分組數(shù)據(jù)分組:對數(shù)值型數(shù)據(jù)進行整理和粗略把握數(shù)據(jù)分布的重要工具組距分組:將全部變量值依次劃分為若干個區(qū)間,并將同一區(qū)間的變量值作為一組組距分組中的兩個關(guān)鍵問題分組數(shù)目的確定組距的確定數(shù)據(jù)分組示例與操作數(shù)據(jù)預(yù)處理的其他數(shù)據(jù)加權(quán)和數(shù)據(jù)拆分示例和操作第4章SPSS基本統(tǒng)計分析頻數(shù)分析計算基本描述統(tǒng)計量交叉分組下的頻數(shù)分析多選項分析比率分析頻數(shù)分析通過頻數(shù)分析了解變量取值的狀況頻數(shù)分析的基本任務(wù)編制頻數(shù)分布表SPSS中的頻數(shù)分布表包括:頻數(shù)、百分比、有效百分比、累計百分比繪制統(tǒng)計圖統(tǒng)計圖是一種最為直接的數(shù)據(jù)刻畫方式柱形圖、餅圖、直方圖頻數(shù)分析示例與操作擴展功能、示例和操作:計算分位數(shù)分位數(shù)是變量在不同分位點上的取值分位點在0~100之間。一般使用較多的是四分位點,即將所有數(shù)據(jù)按升序排序后平均等分成四份,各分位點依次是25%,50%,75%。于是,四分位數(shù)分別是25%,50%,75%分位點對應(yīng)的變量值,依次稱為下四分位數(shù)、中位數(shù)和上四分位數(shù)計算基本描述統(tǒng)計量常見的基本描述統(tǒng)計量大致刻畫集中趨勢的描述統(tǒng)計量刻畫離散程度的描述統(tǒng)計量刻畫分布形態(tài)的描述統(tǒng)計量以上三類統(tǒng)計量能夠極為準確和清晰地刻畫數(shù)據(jù)的分布特點刻畫集中趨勢的描述統(tǒng)計量均值、中位數(shù)、眾數(shù)均值標準誤計算基本描述統(tǒng)計量刻畫離散程度的描述統(tǒng)計量樣本標準差:是對變量取值距均值的平均離散程度的估計樣本標準差值越大,說明變量值之間的差異越大,距均值這個中心值的離散趨勢越明顯。樣本標準差是有計量單位的方差:樣本方差值越大,說明變量值之間的差異越大。樣本方差沒有計量單位全距:是數(shù)據(jù)的最大值與最小值之間的絕對差計算基本描述統(tǒng)計量刻畫分布形態(tài)的描述統(tǒng)計量偏度系數(shù):是描述變量取值分布形態(tài)對稱性的統(tǒng)計量時,偏度值等于0;分布是不對稱分布時,偏度值大于0表示正偏或稱右偏,直方圖中有一條長尾拖在右邊;偏度值小于0表示負偏或稱左偏,直方圖中有一條長尾拖在左邊偏度絕對值越大,表示數(shù)據(jù)分布形態(tài)的偏斜程度越大計算基本描述統(tǒng)計量刻畫分布形態(tài)的描述統(tǒng)計量峰度系數(shù):描述變量取值分布形態(tài)陡緩程度的統(tǒng)計量數(shù)據(jù)分布與標準正態(tài)分布的陡緩程度相同時,峰度值等于0峰度值大于0表示數(shù)據(jù)的分布比標準正態(tài)分布更陡峭,稱為尖峰分布峰度值小于0表示數(shù)據(jù)的分布比標準正態(tài)分布更平緩,稱為平峰分布計算基本描述統(tǒng)計量示例與操作計算基本描述統(tǒng)計量示例與操作數(shù)據(jù)標準化處理后(標準化值或z分數(shù))更利于對異常值的判斷假設(shè)認知得分的總體分布為正態(tài)分布,根據(jù)統(tǒng)計學中經(jīng)典的3σ準則,異常值通常為3個標準差之外的變量值z分數(shù)的絕對值大于3,則為異常值交叉分組下的頻數(shù)分析交叉分組下的頻數(shù)分析的目的和基本任務(wù)根據(jù)收集到的樣本數(shù)據(jù)編制交叉列聯(lián)表在交叉列聯(lián)表的基礎(chǔ)上,對兩變量間是否存在一定的相關(guān)性進行分析交叉列聯(lián)表的主要內(nèi)容行變量列變量邊緣分布條件分布交叉分組下的頻數(shù)分析交叉列聯(lián)表行列變量間關(guān)系的分析兩個特例的列聯(lián)表正相關(guān)負相關(guān)交叉分組下的頻數(shù)分析交叉列聯(lián)表的卡方檢第一步,提出原假設(shè)行變量與列變量獨立第二步,計算檢驗統(tǒng)計量期望頻數(shù)的計算方法交叉分組下的頻數(shù)分析交叉列聯(lián)表的卡方檢第三步,確定顯著性水平和臨界值顯著性水平α是指原假設(shè)為真卻將其拒絕的風險,即棄真的概率。通常設(shè)為0.05或0.01第四步,得出結(jié)論和決策第一,根據(jù)統(tǒng)計量觀測值和臨界值比較的結(jié)果進行決策第二,根據(jù)統(tǒng)計量觀測值的概率P-值和顯著性水平α比較的結(jié)果進行決策交叉列聯(lián)表卡方檢驗的說明列聯(lián)表各單元格中期望頻數(shù)的大小對卡方檢驗統(tǒng)計量的影響樣本量的大小對卡方檢驗統(tǒng)計量的影響交叉分組下的頻數(shù)分析示例與操作多選項分析多選項分析的目的和思路SPSS中的多選項分析是針對問卷調(diào)查中的多選項問題的多選項問題:要求被調(diào)查者從問卷給出的若干個可選答案中選擇兩個及以上的答案多選項問題的回答方式大致分為兩類第一類,選擇的答案有一定的先后順序第二類,選擇的答案沒有一定的先后順序?qū)Χ噙x項問題分析的一般步驟第一,將多選項問題分解第二,利用頻數(shù)分析或交叉分組下的頻數(shù)分析等方法進行分析多選項分析多選項問題的分解將問卷中的一個多選項問題分解成若干個問題,對應(yīng)設(shè)置若干個SPSS變量,分別存放描述這些問題的幾個選擇答案對一個多選項問題的分析就可以轉(zhuǎn)化成對多個問題的分析,也即對多個SPSS變量的分析多選項問題的分解通常有兩種方法:第一,多選項二分法將多選項問題中的每個備選答案設(shè)為一個SPSS變量,每個變量只有0和1兩個取值,分別表示選擇該答案和不選擇該答案第二,多選項分類法首先估計多選項問題最多可能出現(xiàn)的答案個數(shù);然后,為每個答案設(shè)置一個SPSS變量,變量取值為多選項問題中的備選答案多選項分析多選項問題的分解示例示例多選項分析SPSS的多選項分析:用于處理多選項問題,基本思路:第一,按多選項二分法或多選項分類法將多選項問題分解成若干個問題,并設(shè)置若干個SPSS變量第二,采用多選項頻數(shù)分析或多選項交叉分組下的頻數(shù)分析示例和操作多選項分析示例和操作比率分析比率分析的目的和主要指標比率分析用于對兩變量間變量值比率變化的描述分析,適用于數(shù)值型變量主要指標加權(quán)比率均值平局絕對離差離散系數(shù)變異系數(shù)比率分析示例與操作第5章SPSS的參數(shù)檢驗參數(shù)檢驗概述單樣本t檢驗兩獨立樣本t檢驗兩配對樣本t檢驗參數(shù)檢驗概述推斷統(tǒng)計與參數(shù)檢驗參數(shù)檢驗是推斷統(tǒng)計的重要組成部分推斷統(tǒng)計方法是根據(jù)樣本數(shù)據(jù)推斷總體特征的方法它在對樣本數(shù)據(jù)描述的基礎(chǔ)上,以概率的形式對統(tǒng)計總體的未知數(shù)量特征(如均值、方差等)進行表述利用樣本數(shù)據(jù)對總體特征的推斷通常在以下兩種情況下進行第一,總體分布已知(如總體為正態(tài)分布)的情況下,根據(jù)樣本數(shù)據(jù)對總體分布的統(tǒng)計參數(shù)(如均值、方差等)進行推斷--參數(shù)檢驗第二,總體分布未知的情況下,根據(jù)樣本數(shù)據(jù)對總體的分布形式或特征進行推斷—非參數(shù)檢驗對總體特征的推斷一般采用參數(shù)估計(點估計和區(qū)間估計)和假設(shè)檢驗兩類方式實現(xiàn)參數(shù)檢驗概述假設(shè)檢驗的基本思想首先,對總體參數(shù)值提出假設(shè)然后,利用樣本告知的信息去驗證先前提出的假設(shè)是否成立如果樣本數(shù)據(jù)不能夠充分證明和支持假設(shè),則在一定的概率條件下,應(yīng)拒絕該假設(shè)如果樣本數(shù)據(jù)不能夠充分證明和支持假設(shè)是不成立的,則不能推翻假設(shè)成立的合理性和真實性假設(shè)檢驗推斷過程所依據(jù)的原理:小概率原理即發(fā)生概率很小的隨機事件在某一次特定的實驗中是幾乎不可能發(fā)生的參數(shù)檢驗概述假設(shè)檢驗的基本步驟第一,提出原假設(shè)(記為H0)和備擇假設(shè)(記為H1)根據(jù)推斷檢驗的目標,對待推斷的總體參數(shù)或分布提出一個基本假設(shè),即原假設(shè)第二,選擇檢驗統(tǒng)計量在原假設(shè)成立的條件下,樣本值(或更極端值)發(fā)生的概率,是通過計算檢驗統(tǒng)計量觀測值發(fā)生的概率而間接得到第三,計算檢驗統(tǒng)計量觀測值發(fā)生的概率在認為原假設(shè)成立的條件下,利用樣本數(shù)據(jù)計算檢驗統(tǒng)計量觀測值發(fā)生的概率,即概率P-值或稱為相伴,該概率值間接地給出了樣本值(或更極端值)在原假設(shè)成立條件下發(fā)生的概率第四,給定顯著性水平α,并作出統(tǒng)計決策若概率P-值小于α,拒絕原假設(shè);否則,不能拒絕原假設(shè)單樣本t檢驗單樣本t檢驗的目的:利用來自某總體的樣本數(shù)據(jù),推斷該總體的均值是否與指定的檢驗值存在顯著差異,是對總體均值的假設(shè)檢驗單樣本t檢驗中僅涉及一個總體,且將采用t檢驗的方法進行分析單樣本t檢驗的前提是樣本來自的總體應(yīng)服從或近似服從正態(tài)分布示例單樣本t檢驗單樣本t檢驗的基本步驟提出原假設(shè)(H0):總體均值與檢驗值之間不存在顯著差異,備擇假設(shè)為它們之間存在差異選擇檢驗統(tǒng)計量計算檢驗統(tǒng)計量的觀測值和概率P-值給定顯著性水平α,并作出決策t統(tǒng)計量服從有n-1個自由度的t分布單樣本t檢驗示例與操作原假設(shè):兩獨立樣本t檢驗兩獨立樣本t檢驗的目的:利用來自兩個總體的獨立樣本,推斷兩個總體的均值是否存在顯著差異兩獨立樣本t檢驗的前提:樣本來自的總體應(yīng)服從或近似服從正態(tài)分布兩樣本相互獨立,即從一總體中抽取一個樣本對從另一總體中抽取一個樣本沒有任何影響,兩個樣本的樣本量可以不等示例兩獨立樣本t檢驗兩獨立樣本t檢驗的基本步驟提出原假設(shè)(H0):兩總體均值無顯著差異選擇檢驗統(tǒng)計量兩總體分布分別為:兩樣本均值差的抽樣分布仍為正態(tài)分布,均值為:方差為:方差估計:方差未知且相等;方差未知且不相等兩獨立樣本t檢驗兩獨立樣本t檢驗的基本步驟選擇檢驗統(tǒng)計量兩總體方差是否相等是決定如何估計抽樣分布方差的關(guān)鍵兩總體方差是否相等的檢驗:原假設(shè):兩總體方差無顯著差異SPSS中通過LeveneF方法采用F統(tǒng)計量進行檢驗計算檢驗統(tǒng)計量的觀測值和概率P-值兩獨立樣本t檢驗兩獨立樣本t檢驗的基本步驟給定顯著性水平α,并作出決策:兩步?jīng)Q策第一步,利用F檢驗判斷兩總體的方差是否相等第二步,利用t檢驗判斷兩總體均值是否存在顯著差異兩獨立樣本t檢驗示例與操作研究男生與女生的專業(yè)和職業(yè)認知得分的平均值是否存在顯著差異研究長期吸煙是否為導致膽固醇升高的直接原因?qū)⑦^度吸煙組與短期吸煙組的煙齡和膽固醇數(shù)據(jù),看做來自兩個近似服從正態(tài)分布的總體的隨機獨立樣本。采用兩獨立樣本t檢驗進行分析兩配對樣本t檢驗兩配對樣本t檢驗的目的:利用來自兩個總體的配對樣本,推斷兩個總體的均值是否存在顯著差異配對樣本可以是個案在“前”、后”兩種狀態(tài)下某屬性的兩種不同特征,也可以是對某事物兩個不同側(cè)面的描述配對樣本通常具有兩個特征兩個樣本的樣本量相同兩個樣本觀測值的先后順序是一一對應(yīng)的,不能隨意更改示例:研究減肥茶是否有顯著的減肥效果兩配對樣本t檢驗兩配對樣本t檢驗的基本步驟兩配對樣本t檢驗的原假設(shè):兩總體均值無顯著差異選擇檢驗統(tǒng)計量,思路:首先,對兩個樣本分別計算出每對觀測值的差值得到差值樣本然后,利用差值樣本,通過對其總體均值是否與0有顯著差異的檢驗,推斷兩總體均值的差是否顯著為0如果差值樣本的總體均值與0有顯著差異,則可以認為兩總體的均值有顯著差異如果差值樣本的總體均值與0無顯著差異,則可以認為兩總體的均值不存在顯著差異兩配對樣本t檢驗兩配對樣本t檢驗的基本步驟計算檢驗統(tǒng)計量的觀測值和概率P-值給定顯著性水平α,并作出決策示例與操作第6章SPSS的方差分析方差分析概述單因素方差分析多因素方差分析協(xié)方差分析方差分析概述方差分析:從觀測變量的方差入手,研究諸多控制變量中哪些變量是對觀測變量有顯著影響的變量,對觀測變量有顯著影響的各個控制變量其不同水平以及各水平的交互搭配是如何影響觀測變量方差分析認為觀測變量值的變化受兩類因素的影響控制因素(控制變量)不同水平所產(chǎn)生的影響隨機因素(隨機變量)所產(chǎn)生的影響若觀測變量值在某控制變量的各個水平中出現(xiàn)了明顯波動,則認為該控制變量是影響觀測變量的主要因素若觀測變量值在某控制變量的各個水平中沒有出現(xiàn)明顯波動,則認為該控制變量沒有對觀測變量產(chǎn)生重要影響,觀測變量的數(shù)據(jù)波動是由抽樣誤差造成的方差分析概述判斷依據(jù):控制變量各水平下的觀測變量總體的分布是否出現(xiàn)顯著差異兩個基本假設(shè)前提:觀測變量各總體應(yīng)服從正態(tài)分布觀測變量各總體的方差應(yīng)相同基于上述兩個基本假設(shè),方差分析對各總體分布是否有顯著差異的推斷就轉(zhuǎn)化成對各總體均值是否存在顯著差異的推斷根據(jù)控制變量個數(shù)和類型,方差分析分成單因素方差分析多因素方差分析協(xié)方差分析單因素方差分析單因素方差分析:研究一個控制變量的不同水平是否對觀測變量產(chǎn)生了顯著影響觀測變量方差的分解比較觀測變量總離差平方和各部分的比例若組間離差平方和所占比例較大,則說明觀測變量的變動主要是由控制變量引起的若組間離差平方和所占比例較小,則說明控制變量的不同水平?jīng)]有給觀測變量帶來顯著影響,觀測變量的變動是由隨機變量因素引起的單因素方差分析單因素方差分析的數(shù)學模型如果控制變量A對觀測變量沒有影響,則各水平的效應(yīng)ai應(yīng)全部為0;否則應(yīng)不全為0稱為水平Ai對觀

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論