




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、第七章:統(tǒng)計分析方法與SPSS應(yīng)用探討如何運用統(tǒng)計分析軟件探討如何運用統(tǒng)計分析軟件SPSS對你的數(shù)據(jù)進行描述分析對你的數(shù)據(jù)進行描述分析.本部分主要內(nèi)容 Spss簡介簡介 問卷編碼問卷編碼 單變量描述性統(tǒng)計單變量描述性統(tǒng)計 假設(shè)檢驗假設(shè)檢驗 雙變量統(tǒng)計分析雙變量統(tǒng)計分析-相關(guān)與回歸分析相關(guān)與回歸分析第一講 Spss概覽-SPSS是軟件英文名稱的首字母縮寫,原意為Statistical Package for the Social Sciences,即“社會科學(xué)統(tǒng)計軟件包”。但是隨著SPSS產(chǎn)品服務(wù)領(lǐng)域的擴大和服務(wù)深度的增加,SPSS公司已于2000年正式將英文全稱更改為Statistical P
2、roduct and Service Solutions,意為,標(biāo)志著SPSS的戰(zhàn)略方向正在做出重大調(diào)整。功能強大、實用與美觀統(tǒng)一的視窗風(fēng)格 SPSS最突出的特點就是操作界面極為友好,它使最突出的特點就是操作界面極為友好,它使用用Windows的窗口方式展示各種管理和分析數(shù)據(jù)的窗口方式展示各種管理和分析數(shù)據(jù)方法的功能,使用對話框展示出各種功能選擇項,方法的功能,使用對話框展示出各種功能選擇項,只要掌握一定的只要掌握一定的Windows操作技能,粗通統(tǒng)計分操作技能,粗通統(tǒng)計分析原理,就可以使用該軟件為特定的科研工作服析原理,就可以使用該軟件為特定的科研工作服務(wù)。務(wù)。 非專業(yè)統(tǒng)計人員的首選統(tǒng)計軟件
3、!非專業(yè)統(tǒng)計人員的首選統(tǒng)計軟件!界界 面面 概概 覽覽菜單欄工具欄變量欄數(shù)據(jù)區(qū)數(shù)據(jù)變量切換變量工作區(qū)變量工作區(qū) SPSS for Windows 的界面的界面一一.SPSS 的主窗口的主窗口 v啟動啟動SPSS后,彈出對話框選項如下:后,彈出對話框選項如下:1.Run the tutorial-瀏覽操作指導(dǎo)瀏覽操作指導(dǎo)2.Type in data-顯示數(shù)據(jù)編輯窗口建立新數(shù)據(jù)文件顯示數(shù)據(jù)編輯窗口建立新數(shù)據(jù)文件3.Run an existing query-運行一個已存在的文件運行一個已存在的文件4.Creat new query using Database Wizard-使用數(shù)據(jù)庫向?qū)Ы⑹褂?/p>
4、數(shù)據(jù)庫向?qū)Ы⒁粋€新的文件一個新的文件5.Open an existing data source-打開一個已存在的數(shù)據(jù)文件,打開一個已存在的數(shù)據(jù)文件,可可選擇選擇“.sav”文件文件6.Open another type of file-打開一個已存在的其它類型的文件7.Dont show this dialog in the future-再運行SPSS系統(tǒng)時不顯示該對話框,直接進入數(shù)據(jù)編輯窗口v數(shù)據(jù)編輯窗口(數(shù)據(jù)編輯窗口(SPSS Data EditorSPSS Data Editor)或稱數(shù)據(jù)編)或稱數(shù)據(jù)編輯器的左下角包括輯器的左下角包括“Data View”Data View”和和“
5、Variable Variable View”View”兩個視區(qū),分別定義變量的值(即數(shù)據(jù))和兩個視區(qū),分別定義變量的值(即數(shù)據(jù))和變量(名稱、類型等)。變量(名稱、類型等)。二二.數(shù)據(jù)編輯窗口的主菜單數(shù)據(jù)編輯窗口的主菜單Edit:文件編輯:文件編輯。vView:瀏覽編輯:瀏覽編輯。vFile:文件操作:文件操作。vData:數(shù)據(jù)管理:數(shù)據(jù)管理。vTransform:數(shù)據(jù)轉(zhuǎn)換:數(shù)據(jù)轉(zhuǎn)換。vAnalyze:統(tǒng)計分析:統(tǒng)計分析。vGraphs:統(tǒng)計圖表:統(tǒng)計圖表。vUtilities:實用程序:實用程序。vHelp:幫助:幫助。vWindows:窗口控制:窗口控制。 選擇“Variable Vie
6、w”項,定義變量(不要忘了保不要忘了保存)存)q Name:變量名。:變量名。不能超過不能超過8個字符個字符q Type:變量類型。:變量類型。共共8種類型,分別為:種類型,分別為:三、三、 建立數(shù)據(jù)文件建立數(shù)據(jù)文件(一)定義變量(一)定義變量數(shù)值型變量(數(shù)值型變量(Numeric)Numeric為為標(biāo)準(zhǔn)數(shù)值型變量:默認(rèn)總長度為8位,小數(shù)是2位。Comma為逗號型變量為逗號型變量:位數(shù)同上。整數(shù)部分,從右向左,每3位一個逗號。Dot為句號型變量為句號型變量:位數(shù)同上。整數(shù)部分,從右向左,每3位一個圓點,但對小數(shù)位的分割,應(yīng)用逗號表示。字符串型變量(字符串型變量( String) 變量的長度是任
7、意的。 Scientific notation為科學(xué)計數(shù)型變量。為科學(xué)計數(shù)型變量。如原始數(shù)據(jù)1231.3表示成科學(xué)計數(shù)型為12.313E2;Dollar為美元型變量。為美元型變量。在Comma型的基礎(chǔ)上,增加一個美圓符號。Custom Currency自定義型變量。自定義型變量。機器自動提示選擇方法。日期型變量(日期型變量(Date)dd-mm-yy(日-月-年) 如06-05-04mm-dd-yy(月-日-年) 如05-06-04dd-mmmm(英文)-yyyy 如06-May-2004 當(dāng)你選擇當(dāng)你選擇Data類型后,系統(tǒng)會自動顯示類型后,系統(tǒng)會自動顯示日期類型,供你選擇。日期類型,供你選
8、擇。q Width:數(shù)據(jù)或字符串的寬度。:數(shù)據(jù)或字符串的寬度。默認(rèn)值為默認(rèn)值為8個字符。個字符。qDecimal:小數(shù)位數(shù)。:小數(shù)位數(shù)。q Label:變量標(biāo)簽。:變量標(biāo)簽。用來說明變量所代表的用來說明變量所代表的意義。意義。qValue:對變量值的進一步說明。:對變量值的進一步說明。如:如:1=男,男,2=女女qMissing:定義缺失值類型。:定義缺失值類型。系統(tǒng)遺漏值:系統(tǒng)遺漏值:數(shù)值變項讀入了空白值或非數(shù)值數(shù)據(jù),數(shù)值變項讀入了空白值或非數(shù)值數(shù)據(jù),SPSSSPSS的的數(shù)據(jù)表上顯示數(shù)據(jù)表上顯示“.”.”。自定義遺漏值:自定義遺漏值:特殊的數(shù)據(jù),自己指定一個值,計算機會作特殊的數(shù)據(jù),自己指定
9、一個值,計算機會作為特殊值,計算時跳過。為特殊值,計算時跳過。Columns:定義數(shù)據(jù)在屏幕上該變量對應(yīng)列的顯示列寬:定義數(shù)據(jù)在屏幕上該變量對應(yīng)列的顯示列寬。默。默認(rèn)值為認(rèn)值為8個字符,范圍是個字符,范圍是1-255。qAlign:定義數(shù)據(jù)在單元中的對齊方式。:定義數(shù)據(jù)在單元中的對齊方式。qMeasure:定義:定義度量變量類型度量變量類型??捎锌捎蠸cale、Ordinal和和Nominal。Scale:可以是:可以是數(shù)值型、日期型和貨幣型變量數(shù)值型、日期型和貨幣型變量,但不能是字符,但不能是字符串型變量串型變量 Ordinal:可以是數(shù)值型和字符串型變量,一般要求:可以是數(shù)值型和字符串型變
10、量,一般要求變量有變量有較明顯的次序較明顯的次序Nominal:與:與Ordinal一樣,只是不要求變量有次序關(guān)系,但一樣,只是不要求變量有次序關(guān)系,但要要有較明顯的類別有較明顯的類別 定義變量屬性,建立數(shù)據(jù)庫文件定義變量屬性,建立數(shù)據(jù)庫文件 注意:變量名字母為首,后面可以跟字母和數(shù)字,注意:變量名字母為首,后面可以跟字母和數(shù)字,不超過不超過8位,不能跟其他字符,關(guān)鍵詞不能做變位,不能跟其他字符,關(guān)鍵詞不能做變量名量名 最好不用中文作變量名,兼容性不好最好不用中文作變量名,兼容性不好 注意寬度注意寬度 標(biāo)簽標(biāo)簽 數(shù)值標(biāo)簽數(shù)值標(biāo)簽 缺失值缺失值(二)輸入數(shù)據(jù)(二)輸入數(shù)據(jù) 選擇選擇“Data V
11、iew”項,輸入變量數(shù)據(jù)項,輸入變量數(shù)據(jù)l l 直接從數(shù)據(jù)編輯器中輸入。直接從數(shù)據(jù)編輯器中輸入。l l 用用“Open File”選擇已存在的數(shù)據(jù)文件讀入數(shù)據(jù)。選擇已存在的數(shù)據(jù)文件讀入數(shù)據(jù)。l l 用用“Open Database”讀入數(shù)據(jù)。讀入數(shù)據(jù)。 用用“Open File”讀入數(shù)據(jù)操作步驟如下讀入數(shù)據(jù)操作步驟如下: 在 S P S S 數(shù) 據(jù) 編 輯 器 中 按 照“FileOpenData”可打開“Open File”對話框; 在“Open File”對話框中打開“文件類型”下拉列表框,選中所要讀入數(shù)據(jù)的類型,根據(jù)路徑找到要讀入的文件雙擊文件名即可。常用的是讀入常用的是讀入Excel數(shù)
12、據(jù)。數(shù)據(jù)。例例1 請將下面表格內(nèi)容在請將下面表格內(nèi)容在SPSS數(shù)據(jù)編輯器中輸入。數(shù)據(jù)編輯器中輸入。 表1藥品名藥品名產(chǎn)地產(chǎn)地生產(chǎn)時間生產(chǎn)時間價格價格規(guī)格規(guī)格滴眼液A中國2003/4/14日2.5元8毫升滴眼液A日本2002/12/2日2.7元8毫升滴眼液A美國2002/8/29日2.85元8毫升滴眼液B美國2003/2/18日3.2元5毫升(三)編輯數(shù)據(jù)(三)編輯數(shù)據(jù)1.修改數(shù)據(jù)修改數(shù)據(jù)找到所要修改的數(shù)據(jù),激活(雙擊),修改即可。2.插入或刪除一行數(shù)據(jù)插入或刪除一行數(shù)據(jù)插入行:點擊所要插入的行號,點擊工具欄(或擊右鍵)的“插入行Insert case”的圖標(biāo)(望遠鏡圖標(biāo)的后面),就在此行增加一
13、空行。刪除行:找到所要刪除的行,選中,按Delete鍵。3.插入或刪除一列(一個變量)插入或刪除一列(一個變量)插入列:點擊所要插入的列號,點擊工具欄的“插入列Insert case”的圖標(biāo)(望遠鏡圖標(biāo)的后面第2個),就在此列增加一空列。刪除列:找到所要刪除的列,選中,按Delete鍵。例例2.在例在例1的數(shù)據(jù)文件中完成插入與刪除的功能的數(shù)據(jù)文件中完成插入與刪除的功能.(四)保存分析結(jié)果(四)保存分析結(jié)果保存結(jié)果文件保存結(jié)果文件 在結(jié)果瀏覽窗口中選擇菜單File=Save,在文件名框中鍵入“文件名”并回車即可.Export:選擇輸出的內(nèi)容選擇輸出的內(nèi)容Exprot File:填入輸出的目標(biāo)文件
14、名填入輸出的目標(biāo)文件名Export What:選擇輸出結(jié)果的哪些部分選擇輸出結(jié)果的哪些部分File:選擇網(wǎng)頁格式和純文本格式選擇網(wǎng)頁格式和純文本格式例例5.將例將例1中保存的數(shù)據(jù)文件導(dǎo)出為文本文件中保存的數(shù)據(jù)文件導(dǎo)出為文本文件.第二講第二講 問卷和編碼問卷和編碼 對單選:對單選: 順序編碼,順序編碼,1,2,3,4。 對多選:對多選: 01編碼,幾個選項幾個變量編碼,幾個選項幾個變量 有限制數(shù)而多選了的,任意處理有限制數(shù)而多選了的,任意處理一、問卷調(diào)查表的編碼一、問卷調(diào)查表的編碼(一)單選題問卷調(diào)查表的編碼一)單選題問卷調(diào)查表的編碼1.題號代號不能重復(fù),變量名稱最好以英文字母為開頭,字題號代號
15、不能重復(fù),變量名稱最好以英文字母為開頭,字母大小寫均可。如母大小寫均可。如A1,A2;B1,B2。2.同一量表的題號最好有相同的識別碼。如表同一量表的題號最好有相同的識別碼。如表1都用都用a1,a2;表表2都用都用b1,b2。3.名義或類別變量的變量代碼最好與其意義內(nèi)涵有關(guān)。如年名義或類別變量的變量代碼最好與其意義內(nèi)涵有關(guān)。如年齡為齡為AGE,年級為,年級為YEAR,工作類別為,工作類別為JOB等。等。4.變量代碼不要用中文字,如要加注部分變量的中文說明,變量代碼不要用中文字,如要加注部分變量的中文說明,可于可于SPSS操作中修改。操作中修改。(二)復(fù)選題問卷調(diào)查表的編碼(二)復(fù)選題問卷調(diào)查表
16、的編碼 問卷調(diào)查表問卷調(diào)查表您的性別:您的性別:1男生 2女生您的職務(wù):您的職務(wù):1主任 2組長 3教師一一.您認(rèn)為目前教改阻力來自哪些單位?(可復(fù)選)您認(rèn)為目前教改阻力來自哪些單位?(可復(fù)選)1教育行政單位 2學(xué)校行政人員 3家長團體4教師本身 5其他團體二二.您認(rèn)為目前教改對哪些人會有影響?(可復(fù)選)您認(rèn)為目前教改對哪些人會有影響?(可復(fù)選)1教師 2行政人員 3學(xué)生 4其他NUMsexjobA11 A12 A13 A14 A15 A21 A22 A23 A24001 11101101101002 12001111000 變量編碼表變量編碼表NUM-編碼編碼(問卷編號)(問卷編號)Sex-
17、性別性別 job-職務(wù)職務(wù) ( 單選)單選)A11-A15代表第一題代表第一題5個選項,選中者輸入個選項,選中者輸入1,未選中,未選中者輸入者輸入0注意: 1、排序題:、排序題: 如:您一般在什么情況下送禮(選擇最經(jīng)常送禮如:您一般在什么情況下送禮(選擇最經(jīng)常送禮的的兩個兩個場合)?場合)? (1)婚嫁 (2)生日 (3)搬遷新居 (4)探親 (5)探病 (6)生子 (7)中國傳統(tǒng)節(jié)日 (7) 西方傳統(tǒng)節(jié)日 (8)其他 第一經(jīng)常場合第一經(jīng)常場合_ 第二經(jīng)常場合第二經(jīng)常場合_ 對這樣的排序題,可以按照要求,設(shè)計對這樣的排序題,可以按照要求,設(shè)計2個變量,個變量,“第一經(jīng)常場合第一經(jīng)常場合”和和“
18、第二經(jīng)常場合第二經(jīng)常場合” 2、選多了、選多了 單選選了多項,或者限制多選超額單選選了多項,或者限制多選超額 兩種處理辦法:兩種處理辦法: 無效處理 隨機處理,如:您的經(jīng)濟狀況在學(xué)校屬于的經(jīng)濟狀況在學(xué)校屬于 (1)上層 (2)中上層 (3)中層 (4)中下層 (5)下層 同事選中同事選中1和和2,那么,第一次遇到這種情況,我,那么,第一次遇到這種情況,我就取第一個被選項,第二次遇到則取后一個被選就取第一個被選項,第二次遇到則取后一個被選中項,減少數(shù)據(jù)的缺失和誤差中項,減少數(shù)據(jù)的缺失和誤差 3、沒選(缺失值)、沒選(缺失值) 用戶缺失值(非系統(tǒng)缺失值),用用戶缺失值(非系統(tǒng)缺失值),用0或者或者
19、9編碼編碼 比如:您的年齡是_歲。 沒填則為99 您的性別: 男 女 沒填則為0 注意與欄位有關(guān)注意與欄位有關(guān) 4、不適用情況、不適用情況 當(dāng)碰到被調(diào)查者不適用的情況時,被調(diào)查者不需要對這些問題進行作答,研究者可以用8,98等來賦值,如果答案有8,可以用0代替。 5、最好有一個問卷編號,便于出錯之后的、最好有一個問卷編號,便于出錯之后的修正修正 請大家來看一份問卷,并試圖進行編碼請大家來看一份問卷,并試圖進行編碼編碼二、調(diào)查數(shù)據(jù)錄入二、調(diào)查數(shù)據(jù)錄入 在spss中直接錄入數(shù)據(jù)窗口輸入命令行輸入 從foxpro數(shù)據(jù)庫dbf文件中讀取*注意降低版本 從excel文檔中讀取30名被訪者的資料:名被訪者
20、的資料:(續(xù))(續(xù))30名被訪者的資料:名被訪者的資料:(續(xù))(續(xù))30名被訪者的資料:名被訪者的資料: 數(shù)據(jù)錄入之后的校驗數(shù)據(jù)錄入之后的校驗 先用頻數(shù)統(tǒng)計命令進行先用頻數(shù)統(tǒng)計命令進行簡單頻數(shù)分布統(tǒng)計簡單頻數(shù)分布統(tǒng)計 其他方法:其他方法:if命令命令第三講第三講用用SPSSSPSS進行基本統(tǒng)計分析進行基本統(tǒng)計分析例如:數(shù)據(jù)排序例如:數(shù)據(jù)排序l選擇采單DataSort Casesl將主排序變量從左面的列表框中選到Sort by框中,并在Sort by框中選擇按該變量的升序還是降序排序Ascending-升序,Descending-降序例:某班級男生的身高數(shù)據(jù)(單位:厘米)171 182 175
21、177 178 181 185 168 170 175 177180 176 172 165 160 178 186 190 176 163 183受教育程度16.36.36.3212.512.518.8212.512.531.3956.356.387.5212.512.5100.016100.0100.0小學(xué)初中高中大學(xué)碩士TotalValidFrequencyPercentValid PercentCumulativePercentSPSS輸出的頻數(shù)分布表輸出的頻數(shù)分布表分類數(shù)據(jù)的眾數(shù)分類數(shù)據(jù)的眾數(shù)(算例)某城市居民關(guān)注廣告類型的頻數(shù)分布廣告類型人數(shù)比例頻率(%)商品廣告服務(wù)廣告金融廣告房
22、地產(chǎn)廣告招生招聘廣告其它廣告112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合計2001100數(shù)據(jù):分類數(shù)據(jù)0商品廣告商品廣告順序數(shù)據(jù)的眾數(shù)(順序數(shù)據(jù)的眾數(shù)(算例算例)甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù)(戶)百分比()非常不滿意不滿意一般滿意非常滿意24108934530836311510合計300100數(shù)據(jù):順序數(shù)據(jù)數(shù)據(jù):順序數(shù)據(jù)0不滿意不滿意 SPSS的單變量描述統(tǒng)計命令的單變量描述統(tǒng)計命令 一、一、 Frequencies: 頻數(shù)分析頻數(shù)分析AnalyzeDescriptive Statistic
23、sFrequencies示例:美國汽車家庭保有量示例:美國汽車家庭保有量婚姻狀況14911.911.911.9102681.881.893.7151.21.294.94.3.395.2544.34.399.56.5.5100.01254100.0100.0未婚已婚離婚后未再婚離婚后再婚喪偶后未再婚喪偶后再婚TotalFrequency PercentValidPercentCumulativePercent變量值頻數(shù)百分比有效百分比累計百分比二、平均數(shù)分析二、平均數(shù)分析AnalyzeCompare MeansMeans示例:美國汽車家庭保有量示例:美國汽車家庭保有量 統(tǒng)計假設(shè)和檢驗統(tǒng)計量統(tǒng)計假
24、設(shè)和檢驗統(tǒng)計量 所謂統(tǒng)計假設(shè),就是關(guān)于總體分布特征的某種論斷。所謂統(tǒng)計假設(shè),就是關(guān)于總體分布特征的某種論斷。記總體參數(shù)為記總體參數(shù)為,若要判斷,若要判斷是否等于某已知數(shù)值是否等于某已知數(shù)值0,則該參數(shù)假設(shè)可表示為:則該參數(shù)假設(shè)可表示為: H0:= 0 , H1: 0 其中,假設(shè)H0:= 0就是所要檢驗的假設(shè),稱為原假設(shè)或零假設(shè);而假設(shè)H1: 0則稱為對立假設(shè)或備擇假設(shè)。 要檢驗?zāi)硞€假設(shè)是否正確,需根據(jù)樣本所提供的要檢驗?zāi)硞€假設(shè)是否正確,需根據(jù)樣本所提供的信息來進行。信息來進行。假設(shè)檢驗假設(shè)檢驗:先假定總體參數(shù)為:先假定總體參數(shù)為 ,用一個隨機樣本的,用一個隨機樣本的統(tǒng)計量統(tǒng)計量 來檢驗總體參數(shù)
25、為來檢驗總體參數(shù)為的假設(shè)是否成立。的假設(shè)是否成立??傮w總體=38%樣本樣本 32%xx? ? (或者說)假設(shè)檢驗:是建立在樣本信息基礎(chǔ)上,假設(shè)檢驗:是建立在樣本信息基礎(chǔ)上,“接受接受”或或“拒絕拒絕”假設(shè)的統(tǒng)計過程。(又稱假設(shè)的統(tǒng)計過程。(又稱“顯著性檢驗顯著性檢驗”) 所有這些聽起來非常專業(yè)的技術(shù),都是我們每天所有這些聽起來非常專業(yè)的技術(shù),都是我們每天在做的推理形式,只不過沒有用在做的推理形式,只不過沒有用“假設(shè)假設(shè)”或或“參參數(shù)數(shù)”這些術(shù)語罷了。這些術(shù)語罷了。 例如:比爾為什么開始系安全帶了?例如:比爾為什么開始系安全帶了? 直覺假設(shè)檢驗直覺假設(shè)檢驗假設(shè)檢驗的五個基本步驟假設(shè)檢驗的五個基本
26、步驟 1、開始陳述你相信存在于總體的事實,即總體均、開始陳述你相信存在于總體的事實,即總體均值和百分率值和百分率。(如,比爾相信只有。(如,比爾相信只有10%的司機系的司機系安全帶。)安全帶。) 2、抽取一個隨機樣本,然后測定樣本統(tǒng)計量、抽取一個隨機樣本,然后測定樣本統(tǒng)計量。(比爾發(fā)現(xiàn)他的朋友中有(比爾發(fā)現(xiàn)他的朋友中有80%的人系安全帶。)的人系安全帶。) 3將統(tǒng)計量與假設(shè)的參數(shù)進行比較將統(tǒng)計量與假設(shè)的參數(shù)進行比較。(比爾注意到。(比爾注意到80%和和10%有很大區(qū)別。)有很大區(qū)別。) 4、決定樣本是否支持最初的假設(shè)、決定樣本是否支持最初的假設(shè)。(觀察到。(觀察到80%的司機系安全帶的事實并不
27、支持只有的司機系安全帶的事實并不支持只有10%的人系的人系安全帶的假設(shè)。)安全帶的假設(shè)。) 5、如果樣本不支持假設(shè),修正假設(shè)使得他與樣本、如果樣本不支持假設(shè),修正假設(shè)使得他與樣本統(tǒng)計量一致統(tǒng)計量一致。(駕駛員系安全帶的事實事件發(fā)生。(駕駛員系安全帶的事實事件發(fā)生率約為率約為80%。)。) Compare Means 過程可計算對已知原始數(shù)據(jù)資料情況下的單樣本T檢驗(One-Sample T Test)、獨立樣本T檢驗(Independent-Samples T Test)和配對樣本T檢驗(Paired-Samples T Test) 獨立樣本獨立樣本T檢驗:即用兩個獨立樣本的原始檢驗:即用兩個
28、獨立樣本的原始資料對兩個總體均值之差進行比較資料對兩個總體均值之差進行比較 獨立樣本獨立樣本T檢驗舉例:檢驗舉例: 例例1:由以往資料知道,甲、乙兩個煤礦蘊藏的煤:由以往資料知道,甲、乙兩個煤礦蘊藏的煤含灰量都服從正態(tài)分布并且有公共方差。現(xiàn)從兩礦含灰量都服從正態(tài)分布并且有公共方差?,F(xiàn)從兩礦各抽幾個試樣,分析其含灰率得(各抽幾個試樣,分析其含灰率得(%):): 甲礦甲礦:24.5、21.3、23.5、22.4、27.1、18.6、19.8、20.7、21.2、16.9 乙礦乙礦:15.7、24.9、25.1、23.2、18.8、19.0、19.9、26.1、16.8、17.5、22.4、20.6
29、問兩礦所采煤的平均含灰率有無顯著差異問兩礦所采煤的平均含灰率有無顯著差異(=0.05)?)?解:依題意,設(shè)解:依題意,設(shè)H0:u= u1 , H1: u u1(1)定義變量)定義變量X(含灰量)和分類變量含灰量)和分類變量g(1,甲礦;,甲礦;2,乙礦),乙礦)(2) AnalyzeCompare Means Independent-Samples T Test非參數(shù)檢驗非參數(shù)檢驗(Anayze Nonparametric Tests) 參數(shù)檢驗參數(shù)檢驗(如上例,利用樣本統(tǒng)計量去測試總體如上例,利用樣本統(tǒng)計量去測試總體參數(shù)所做的假設(shè)參數(shù)所做的假設(shè))通常適用于一些特定的、嚴(yán)格的條件環(huán)境之下,其中
30、一個典型的條件就是樣本樣本資料必須來自于正態(tài)分布的總體資料必須來自于正態(tài)分布的總體;當(dāng)必要條件無當(dāng)必要條件無法滿足時,我們可以采用法滿足時,我們可以采用非參數(shù)統(tǒng)計方法非參數(shù)統(tǒng)計方法。 其中的樣本一致性檢驗和獨立性檢驗則是其中的樣本一致性檢驗和獨立性檢驗則是使用使用Descriptive Statistics 中的中的Crosstabs 過過程完成的。(程完成的。(舉例:)舉例:)例例2:兩種產(chǎn)品購買者所喜歡收看的電視節(jié)目:兩種產(chǎn)品購買者所喜歡收看的電視節(jié)目有無差異?有無差異? 某市場研究進行了一次調(diào)查,藉以找出兩產(chǎn)品的購買某市場研究進行了一次調(diào)查,藉以找出兩產(chǎn)品的購買者所喜愛收看的電視節(jié)目,從
31、而為有關(guān)產(chǎn)品公司作廣者所喜愛收看的電視節(jié)目,從而為有關(guān)產(chǎn)品公司作廣告提供參考資料。兩產(chǎn)品購買者最喜歡收看電視節(jié)目告提供參考資料。兩產(chǎn)品購買者最喜歡收看電視節(jié)目的人數(shù)調(diào)查結(jié)果如下:根據(jù)以上資料判斷兩種產(chǎn)品的的人數(shù)調(diào)查結(jié)果如下:根據(jù)以上資料判斷兩種產(chǎn)品的購買者所喜歡收看的電視節(jié)目有無差異(購買者所喜歡收看的電視節(jié)目有無差異(=0.05 )?)?電視節(jié)目電視節(jié)目甲產(chǎn)品甲產(chǎn)品乙產(chǎn)品乙產(chǎn)品總計總計新聞新聞電視劇場電視劇場體育體育實事論壇實事論壇音樂欣賞音樂欣賞娛樂游戲娛樂游戲戲劇園地戲劇園地150120100140100150901101708010013013011026029018024023028
32、0200總計總計8508301680解:解:列聯(lián)表,需要判斷列聯(lián)表,需要判斷A產(chǎn)品和產(chǎn)品和B產(chǎn)品購買者所喜歡收看的產(chǎn)品購買者所喜歡收看的電視節(jié)目是否一致,可采用電視節(jié)目是否一致,可采用Chi-Square一致性檢驗方法。一致性檢驗方法。(1)依題意,設(shè))依題意,設(shè) H0:兩種產(chǎn)品購買者所喜歡的電視節(jié)目無差兩種產(chǎn)品購買者所喜歡的電視節(jié)目無差異。異。 H1:兩種產(chǎn)品購買者所喜歡的電視節(jié)目有顯著差異。兩種產(chǎn)品購買者所喜歡的電視節(jié)目有顯著差異。(2)Spss過程過程: Data weight cases,對對f進行加權(quán)進行加權(quán):(選擇選擇weight cases by-將將f放入放入frequency
33、) analyze descriptive statistics crosstabs 將將y鍵入鍵入row(s)欄,將欄,將x鍵入鍵入column(s)欄欄 選擇統(tǒng)計量,選擇統(tǒng)計量,chi-square 單擊單擊cells鍵,選擇鍵,選擇observed何何expected兩個統(tǒng)計量兩個統(tǒng)計量 ok結(jié)果說明:結(jié)果說明:C Ca as se e P Pr ro oc ce es ss si in ng g S Su um mm ma ar ry y1680100.0%0.0%1680100.0%電視節(jié)目 * 1,甲產(chǎn)品;2,乙產(chǎn)品NPercentNPercentNPercentValidMiss
34、ingTotalCases表表1:數(shù)據(jù)綜述表數(shù)據(jù)綜述表。表明有效數(shù)據(jù)。表明有效數(shù)據(jù)N=168040,所占百分比為,所占百分比為100%,沒有缺失值。沒有缺失值。表表2:列聯(lián)表。列聯(lián)表。詳細列出了兩種產(chǎn)品購買者對詳細列出了兩種產(chǎn)品購買者對7個電視節(jié)目喜歡人數(shù)的實個電視節(jié)目喜歡人數(shù)的實際頻數(shù)和理論頻數(shù),即期望值。際頻數(shù)和理論頻數(shù),即期望值。電電 視視 節(jié)節(jié) 目目 * * 1 1, 甲甲 產(chǎn)產(chǎn) 品品 ; 2 2, 乙乙 產(chǎn)產(chǎn) 品品 C Cr ro os ss st ta ab bu ul la at ti io on n150110260131.5128.5260.0120170290146.714
35、3.3290.01008018091.188.9180.0140100240121.4118.6240.0100130230116.4113.6230.0150130280141.7138.3280.090110200101.298.8200.08508301680850.0830.01680.0CountExpected CountCountExpected CountCountExpected CountCountExpected CountCountExpected CountCountExpected CountCountExpected CountCountExpected Coun
36、t1234567電視節(jié)目Total121,甲產(chǎn)品;2,乙產(chǎn)品Total表表3:卡方檢驗??ǚ綑z驗。用卡方分布進行一致性或獨立性檢驗時,當(dāng)用卡方分布進行一致性或獨立性檢驗時,當(dāng)最小期望頻數(shù)最小期望頻數(shù)1,少于,少于1/5格子的期望頻數(shù)格子的期望頻數(shù)40時,一時,一般較多使用皮爾遜卡方值。般較多使用皮爾遜卡方值。 由表3可看出,最小期望頻數(shù)=88.91,少于少于1/5格子的期望格子的期望頻數(shù)頻數(shù)40,表中看出皮爾遜卡方值,表中看出皮爾遜卡方值x2 =30.771,自由度自由度df=6,漸進雙側(cè)概率,漸進雙側(cè)概率p=00.05,故拒絕故拒絕H0,接受,接受H1,即,即兩種產(chǎn)品購買者所喜歡收看的電視節(jié)
37、目不一致,有顯著差異。兩種產(chǎn)品購買者所喜歡收看的電視節(jié)目不一致,有顯著差異。Chi-Square TestsChi-Square Tests30.771a6.00030.8866.0001680Pearson Chi-SquareLikelihood RatioN of Valid CasesValuedfAsymp. Sig.(2-sided)0 cells (.0%) have expected count less than 5. Theminimum expected count is 88.93.a. 注意:注意:Chi-square:卡方值。用于行和列變量是:卡方值。用于行和列變量
38、是否獨立的卡方檢驗,如果列聯(lián)表中某一單元格中否獨立的卡方檢驗,如果列聯(lián)表中某一單元格中的期望值小于的期望值小于1或者或者20%以上的單元格期望值小于以上的單元格期望值小于5,那么就不能選擇此項,那么就不能選擇此項。運用剖面變量分析評估細分市場的經(jīng)營價值運用剖面變量分析評估細分市場的經(jīng)營價值 所謂剖面分析(所謂剖面分析(profiling analysis)就是選擇剖)就是選擇剖面變量,對已經(jīng)劃分好的細分市場進行交叉表分面變量,對已經(jīng)劃分好的細分市場進行交叉表分析,以發(fā)現(xiàn)細分市場在哪些剖面變量上有差異。析,以發(fā)現(xiàn)細分市場在哪些剖面變量上有差異。 常用的剖面變量有下面幾類:常用的剖面變量有下面幾類
39、: 人口統(tǒng)計變量人口統(tǒng)計變量:包括:包括U&A研究問卷中所有背景資研究問卷中所有背景資料的問題,例如:料的問題,例如: 年齡:年齡:小于小于25歲,歲,25-39歲,歲,40-49歲,歲,50歲以上歲以上 性別:性別:男,女男,女 收入:收入:高,中,低高,中,低 家庭人數(shù):家庭人數(shù):1人、人、2人、人、3人、人、4人及以上人及以上 U&A變量:變量:包括研究問卷中所有關(guān)于產(chǎn)品使用和購包括研究問卷中所有關(guān)于產(chǎn)品使用和購買習(xí)慣中的問題,買習(xí)慣中的問題,例如:例如: 是否使用產(chǎn)品:是否使用產(chǎn)品:用,不用用,不用 使用的包裝規(guī)格:使用的包裝規(guī)格:75ml瓶裝、瓶裝、125ml瓶裝、瓶
40、裝、200-300ml瓶裝瓶裝 使用的品牌:使用的品牌:A、B、C及其他,或本國品牌、外國、合資品牌及其他,或本國品牌、外國、合資品牌 購買場所:購買場所:超市、糖煙酒商店、雜貨店、鄰近的士多超市、糖煙酒商店、雜貨店、鄰近的士多 媒體習(xí)慣變量:媒體習(xí)慣變量:包括研究問卷中所有關(guān)于媒體使用包括研究問卷中所有關(guān)于媒體使用習(xí)慣中的問題,習(xí)慣中的問題,例如:例如: 讀報時間讀報時間 通??措娨暤臅r間通常看電視的時間 聽收音機的頻道聽收音機的頻道 通常收看的電視節(jié)目通常收看的電視節(jié)目 看雜志的種類看雜志的種類 看電影的類別:本地、外國、港澳臺看電影的類別:本地、外國、港澳臺案例:案例:沐浴露沐浴露U&a
41、mp;A研究中的剖面分析研究中的剖面分析(部分)(部分)剖面變量剖面變量收入類別收入類別高(高(%)中(中(%)低(低(%)(1)使用者)使用者998368(2)現(xiàn)在使用的包裝規(guī)格)現(xiàn)在使用的包裝規(guī)格400ml以下以下122038400-599ml424035600mi以上以上464027(5)購買地點)購買地點超市超市817772百貨商店百貨商店121417士多士多7911(9)年齡)年齡18-2426242525-3444282135-4922282550-6582029 其中其中:第第(1)、(、(9)的列百分比以全部被訪者分)的列百分比以全部被訪者分別在三個細分市場上的人數(shù)為基數(shù);別在
42、三個細分市場上的人數(shù)為基數(shù); 第(第(2)項以三個細分市場中過去六個月)項以三個細分市場中過去六個月使用使用過過產(chǎn)品的人數(shù)為基數(shù);產(chǎn)品的人數(shù)為基數(shù); 第(第(5)項以三個細分市場中過去六個月)項以三個細分市場中過去六個月購買過購買過產(chǎn)品的人數(shù)為基數(shù)。產(chǎn)品的人數(shù)為基數(shù)。 從上表可以看出,在高、中、低三個細分從上表可以看出,在高、中、低三個細分市場上許多剖面變量有顯著差異。但比較市場上許多剖面變量有顯著差異。但比較列百分比時,除了直觀看外,通常要進行列百分比時,除了直觀看外,通常要進行統(tǒng)計檢驗統(tǒng)計檢驗或用或用剖面指數(shù)剖面指數(shù)來說明。來說明。 那么什么是那么什么是剖面指數(shù)剖面指數(shù)呢?呢? 在判別細分
43、市場在剖面變量上的差異時,除直觀或用統(tǒng)計在判別細分市場在剖面變量上的差異時,除直觀或用統(tǒng)計檢驗外,一個很有用的工具就是所謂的剖面指數(shù)。檢驗外,一個很有用的工具就是所謂的剖面指數(shù)。例如:例如:高收入細分市場高收入細分市場某年齡段的剖面指數(shù)某年齡段的剖面指數(shù) = 高收入細分市場該年齡段的列百分比高收入細分市場該年齡段的列百分比/總體市場該年齡段的列百分比總體市場該年齡段的列百分比年齡段年齡段樣本數(shù)樣本數(shù)收入類別收入類別高高中中低低18-65歲50015015020018-24歲125(25%)393650(25%)(26%)(24%)25-34歲150(30%)644242(21%)(44%)(2
44、8%)35-49歲125(25%)334250(25%)(22%)(28%)50-65歲100(20%)123058(29%)(8%)(20%) 高收入細分市場在某年齡段的高收入細分市場在某年齡段的剖面指數(shù),剖面指數(shù),反映了高收入細反映了高收入細分市場在某年齡段的人數(shù)比例是高于還是低于總體市場在分市場在某年齡段的人數(shù)比例是高于還是低于總體市場在相應(yīng)年齡段的比例。相應(yīng)年齡段的比例。 通常的標(biāo)準(zhǔn)是:通常的標(biāo)準(zhǔn)是:指數(shù)指數(shù)=100%是等于總體市場;是等于總體市場; 指數(shù)指數(shù)=120%,則認(rèn)為顯著高于總體市場;,則認(rèn)為顯著高于總體市場; 指數(shù)指數(shù)=80%,則認(rèn)為顯著低于總體市場。,則認(rèn)為顯著低于總體市
45、場。 在本例中,在本例中,18-24歲的剖面指數(shù)歲的剖面指數(shù)=26/25*100%=104% 25-34歲的剖面指數(shù)歲的剖面指數(shù)=44/30*100%=147% 35-49歲的剖面指數(shù)歲的剖面指數(shù)=22/25*100%=88% 50-65歲的剖面指數(shù)歲的剖面指數(shù)=8/20*100%=40% 因此,對于高收入細分市場,年齡段因此,對于高收入細分市場,年齡段25-34歲的人數(shù)比例歲的人數(shù)比例顯著高于總體水平,而年齡段顯著高于總體水平,而年齡段50-65歲的人數(shù)比例,則顯歲的人數(shù)比例,則顯著低于總體水平,(其他年齡段的剖面指數(shù)可以同樣計著低于總體水平,(其他年齡段的剖面指數(shù)可以同樣計算)。有了這方面
46、的信息,管理部門就可以有針對性地制算)。有了這方面的信息,管理部門就可以有針對性地制定營銷組和策略。定營銷組和策略。1 定距定距定距尺度定距尺度 (Pearson Cor.)1)相關(guān)的含義)相關(guān)的含義: 相關(guān)相關(guān)(Correlation)是用來作兩個定距變量關(guān)系是用來作兩個定距變量關(guān)系的統(tǒng)計分析,考察兩變量是否存在共同變化的趨的統(tǒng)計分析,考察兩變量是否存在共同變化的趨勢。如年齡與收入。勢。如年齡與收入。 當(dāng)兩變量在同一方向上變化,稱為有當(dāng)兩變量在同一方向上變化,稱為有正相關(guān)正相關(guān);相;相反方向變化,稱為反方向變化,稱為負相關(guān)負相關(guān);無變化即;無變化即無相關(guān)無相關(guān)。相關(guān)系數(shù)相關(guān)系數(shù)即用來表示相關(guān)
47、的程度。即用來表示相關(guān)的程度。丈夫收入妻子收入600580750600770620810750810650如:2)相關(guān)系數(shù)的計算公式:)相關(guān)系數(shù)的計算公式:22)()()( )(yyxxyyxxriiii由此公式可看出:由此公式可看出:1 相關(guān)就是共變異數(shù)的標(biāo)準(zhǔn)化。相關(guān)就是共變異數(shù)的標(biāo)準(zhǔn)化。2 相關(guān)系數(shù)相關(guān)系數(shù)r的取值范圍在的取值范圍在(-1,+1)之間。之間。 +1代表完全正相關(guān);代表完全正相關(guān);-1表示完全負相關(guān);表示完全負相關(guān);0 表示無相關(guān)。表示無相關(guān)。示例:通過此題來演算相關(guān)系數(shù)示例:通過此題來演算相關(guān)系數(shù)。2 定序定序定序尺度定序尺度 (Spearman Cor.)積差相關(guān)的公式:
48、積差相關(guān)的公式:積差相關(guān)又稱積差相關(guān)又稱等級相關(guān)等級相關(guān),用來考察兩個,用來考察兩個定序變量間定序變量間的相關(guān)關(guān)系。的相關(guān)關(guān)系。它的公式是由積矩相關(guān)轉(zhuǎn)變而來,它的公式是由積矩相關(guān)轉(zhuǎn)變而來,) 1(6122NNDr其中,D是每一對因變量和自變量的序數(shù)的差值;N是總的排序的序數(shù)。3. SPSS中的相關(guān)統(tǒng)計命令中的相關(guān)統(tǒng)計命令Statistics-CorrelateBivariate(雙變量相關(guān)分析)(雙變量相關(guān)分析)4 相關(guān)統(tǒng)計的輸出格式相關(guān)統(tǒng)計的輸出格式Correlations1.000-.079*.0201254861-.079*1.000.020.861861PearsonCorrelati
49、onSig. (2-tailed)NPearsonCorrelationSig. (2-tailed)NAGE現(xiàn)在每月工資AGE現(xiàn)在每月工資Correlation is significant at the 0.05 level (2-tailed).*. 相關(guān)系數(shù)人數(shù)1 、回歸的含義:回歸的含義:回歸(回歸(Regression,或,或Linear Regression)和)和相關(guān)同樣都用來分析兩個定距變量間的關(guān)系,但相關(guān)同樣都用來分析兩個定距變量間的關(guān)系,但回歸有明確的因果關(guān)系假設(shè)。即要假設(shè)一個變量回歸有明確的因果關(guān)系假設(shè)。即要假設(shè)一個變量為自變量,一個為因變量,自變量對因變量的影為自變量
50、,一個為因變量,自變量對因變量的影響就用回歸表示。如年齡對收入的影響。響就用回歸表示。如年齡對收入的影響。由于回歸構(gòu)建了變量間因果關(guān)系的數(shù)學(xué)表達,由于回歸構(gòu)建了變量間因果關(guān)系的數(shù)學(xué)表達,它具它具有統(tǒng)計預(yù)測功能。有統(tǒng)計預(yù)測功能。2 、回歸的統(tǒng)計原理:、回歸的統(tǒng)計原理:兩個定距變量的回歸是用函數(shù)兩個定距變量的回歸是用函數(shù)y= f(x)來分析的。我們最常用的是一元回歸方程來分析的。我們最常用的是一元回歸方程bxay其中其中x為自變量;為自變量;y為因變量;為因變量;a為截距,即常量;為截距,即常量;b為回歸系數(shù),表明自變量對因變量的影響程度。為回歸系數(shù),表明自變量對因變量的影響程度。360370380390400410420430440012345工齡工資Y=350+20 x在統(tǒng)計學(xué)中,這一方程中的系數(shù)是靠在統(tǒng)計學(xué)中,這一方程中的系
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 益陽醫(yī)學(xué)高等??茖W(xué)?!度瞬潘刭|(zhì)測評與選拔》2023-2024學(xué)年第二學(xué)期期末試卷
- 做賬實操-機械制造公司的賬務(wù)處理分錄
- 鄭州經(jīng)貿(mào)學(xué)院《網(wǎng)路原理與技術(shù)》2023-2024學(xué)年第二學(xué)期期末試卷
- 陜西服裝工程學(xué)院《專業(yè)課程綜合2(酒店)》2023-2024學(xué)年第二學(xué)期期末試卷
- 貴陽人文科技學(xué)院《環(huán)境與食品安全》2023-2024學(xué)年第二學(xué)期期末試卷
- 2025山西省建筑安全員-C證考試題庫
- 廣西財經(jīng)學(xué)院《老年社會工作》2023-2024學(xué)年第二學(xué)期期末試卷
- 大連理工大學(xué)城市學(xué)院《地理空間數(shù)據(jù)庫》2023-2024學(xué)年第二學(xué)期期末試卷
- 常德職業(yè)技術(shù)學(xué)院《藥劑學(xué)A》2023-2024學(xué)年第二學(xué)期期末試卷
- 山西金融職業(yè)學(xué)院《公共危機治理》2023-2024學(xué)年第二學(xué)期期末試卷
- 《消防檢查指導(dǎo)手冊》(2024版)
- 2024年萍鄉(xiāng)衛(wèi)生職業(yè)學(xué)院單招職業(yè)技能測試題庫標(biāo)準(zhǔn)卷
- 2025年重慶三峰環(huán)境集團招聘筆試參考題庫含答案解析
- 育嬰培訓(xùn)課件
- 《管理品牌資產(chǎn)》戴維·阿克著
- 藥品網(wǎng)絡(luò)交易服務(wù)三方平臺質(zhì)量管理體系文件-B2B平臺(完整版)
- 粵教粵科版三年級下冊科學(xué)全冊課時練(同步練習(xí))
- 電網(wǎng)數(shù)字化項目工作量度量規(guī)范應(yīng)用指南(2020版)
- 小學(xué)開學(xué)第一課禁毒安全
- 2025年砌筑工職業(yè)技能(中級)知識考試題庫及答案
- 開題報告:適應(yīng)人口發(fā)展趨勢的區(qū)域教育結(jié)構(gòu)優(yōu)化與政策調(diào)整研究
評論
0/150
提交評論