《統(tǒng)計(jì)分析與SPSS的應(yīng)用(第五版)》課后練習(xí)答案.doc_第1頁
《統(tǒng)計(jì)分析與SPSS的應(yīng)用(第五版)》課后練習(xí)答案.doc_第2頁
《統(tǒng)計(jì)分析與SPSS的應(yīng)用(第五版)》課后練習(xí)答案.doc_第3頁
《統(tǒng)計(jì)分析與SPSS的應(yīng)用(第五版)》課后練習(xí)答案.doc_第4頁
《統(tǒng)計(jì)分析與SPSS的應(yīng)用(第五版)》課后練習(xí)答案.doc_第5頁
已閱讀5頁,還剩30頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、統(tǒng)計(jì)分析與SPSS的應(yīng)用(第五版)課后練習(xí)答案第一章練習(xí)題答案1、SPSS的中文全名是:社會(huì)科學(xué)統(tǒng)計(jì)軟件包(后改名為:統(tǒng)計(jì)產(chǎn)品與服務(wù)解決方案) 英文全名是:Statistical Package for the Social Science.(Statistical Product and Service Solutions)2、 SPSS的兩個(gè)主要窗口是數(shù)據(jù)編輯器窗口和結(jié)果查看器窗口。l 數(shù)據(jù)編輯器窗口的主要功能是定義SPSS數(shù)據(jù)的結(jié)構(gòu)、錄入編輯和管理待分析的數(shù)據(jù);l 結(jié)果查看器窗口的主要功能是現(xiàn)實(shí)管理SPSS統(tǒng)計(jì)分析結(jié)果、報(bào)表及圖形。3、SPSS的數(shù)據(jù)集:l SPSS運(yùn)行時(shí)可同時(shí)打開多個(gè)數(shù)

2、據(jù)編輯器窗口。每個(gè)數(shù)據(jù)編輯器窗口分別顯示不同的數(shù)據(jù)集合(簡(jiǎn)稱數(shù)據(jù)集)。l 活動(dòng)數(shù)據(jù)集:其中只有一個(gè)數(shù)據(jù)集為當(dāng)前數(shù)據(jù)集。SPSS只對(duì)某時(shí)刻的當(dāng)前數(shù)據(jù)集中的數(shù)據(jù)進(jìn)行分析。4、SPSS的三種基本運(yùn)行方式:l 完全窗口菜單方式、程序運(yùn)行方式、混合運(yùn)行方式。l 完全窗口菜單方式:是指在使用SPSS的過程中,所有的分析操作都通過菜單、按鈕、輸入對(duì)話框等方式來完成,是一種最常見和最普遍的使用方式,最大優(yōu)點(diǎn)是簡(jiǎn)潔和直觀。l 程序運(yùn)行方式:是指在使用SPSS的過程中,統(tǒng)計(jì)分析人員根據(jù)自己的需要,手工編寫SPSS命令程序,然后將編寫好的程序一次性提交給計(jì)算機(jī)執(zhí)行。該方式適用于大規(guī)模的統(tǒng)計(jì)分析工作。l 混合運(yùn)行方式

3、:是前兩者的綜合。5、.sav是數(shù)據(jù)編輯器窗口中的SPSS數(shù)據(jù)文件的擴(kuò)展名 .spv是結(jié)果查看器窗口中的SPSS分析結(jié)果文件的擴(kuò)展名 .sps是語法窗口中的SPSS程序6、SPSS的數(shù)據(jù)加工和管理功能主要集中在 編輯、數(shù)據(jù)等菜單中;統(tǒng)計(jì)分析和繪圖功能主要集中在 分析、圖形等菜單中。7、 概率抽樣(probability sampling):也稱隨機(jī)抽樣,是指按一定的概率以隨機(jī)原則抽取樣本,抽取樣本時(shí)每個(gè)單位都有一定的機(jī)會(huì)被抽中,每個(gè)單位被抽中的概率是已知的,或是可以計(jì)算出來的。概率抽樣包括簡(jiǎn)單隨機(jī)抽樣、系統(tǒng)抽樣(等距抽樣)、分層抽樣(類型抽樣)、整群抽樣、多階段抽樣等。l 簡(jiǎn)單隨機(jī)抽樣(sim

4、ple random sampling):從包括總體N個(gè)單位的抽樣框中隨機(jī)地抽取n個(gè)單位作為樣本,每個(gè)單位抽入樣本的概率是相等的。是最基本的抽樣方法,是其它抽樣方法的基礎(chǔ)。優(yōu)點(diǎn):簡(jiǎn)單、直觀,在抽樣框完整時(shí),可直接從中抽取樣本,用樣本統(tǒng)計(jì)量對(duì)總體參數(shù)進(jìn)行估計(jì)比較方便。局限性:當(dāng)N很大時(shí),不易構(gòu)造抽樣框,抽出的單位很分散,給實(shí)施調(diào)查增加了困難。l 分層抽樣(stratified sampling):將抽樣單位按某種特征或某種規(guī)則劃分為不同的層,然后從不同的層中獨(dú)立、隨機(jī)地抽取樣本。優(yōu)點(diǎn):保證樣本的結(jié)構(gòu)與總體的結(jié)構(gòu)比較相近,從而提高估計(jì)的精度,組織實(shí)施調(diào)查方便(當(dāng)層是以行業(yè)或行政區(qū)劃分時(shí)),既可以對(duì)

5、總體參數(shù)進(jìn)行估計(jì),也可以對(duì)各層的參數(shù)進(jìn)行估計(jì)。l 整群抽樣(cluster sampling):將總體中若干個(gè)單位合并為組(群),抽樣時(shí)直接抽取群,然后對(duì)選中群中的所有單位全部實(shí)施調(diào)查。優(yōu)點(diǎn):抽樣時(shí)只需群的抽樣框,可簡(jiǎn)化工作量;調(diào)查的地點(diǎn)相對(duì)集中,節(jié)省調(diào)查費(fèi)用,方便調(diào)查的實(shí)施。缺點(diǎn):估計(jì)的精度較差。l 系統(tǒng)抽樣(systematic sampling):將總體中的所有單位(抽樣單位)按一定順序排列,在規(guī)定的范圍內(nèi)隨機(jī)地抽取一個(gè)單位作為初始單位,然后按事先規(guī)定好的規(guī)則確定其它樣本單位,先從數(shù)字1到k之間隨機(jī)抽取一個(gè)數(shù)字r作為初始單位,以后依次取r+k,r+2k等單位。優(yōu)點(diǎn):操作簡(jiǎn)便,可提高估計(jì)的

6、精度。缺點(diǎn):對(duì)估計(jì)量方差的估計(jì)較困難。l 多階段抽樣(multi-stage sampling):先抽取群,但并不是調(diào)查群內(nèi)的所有單位,而是再進(jìn)行一步抽樣,從選中的群中抽取出若干個(gè)單位進(jìn)行調(diào)查。群是初級(jí)抽樣單位,第二階段抽取的是最終抽樣單位。將該方法推廣,使抽樣的段數(shù)增多,就稱為多階段抽樣。優(yōu)點(diǎn):具有整群抽樣的優(yōu)點(diǎn),保證樣本相對(duì)集中,節(jié)約調(diào)查費(fèi)用。在大規(guī)模的抽樣調(diào)查中,經(jīng)常被采用的方法。非概率抽樣是指抽取樣本時(shí)不是依據(jù)隨機(jī)原則,而是根據(jù)研究目的對(duì)數(shù)據(jù)的要求,采用某種方式從總體中抽出部分單位對(duì)其實(shí)施調(diào)查,包括方便抽樣、自愿抽樣、配額抽樣、判斷抽樣和滾雪球抽樣等。l 方便抽樣:樣本限于總體中易于抽

7、到的一部分。最常見的方便抽樣是偶遇抽樣,即研究者將在某一時(shí)間和環(huán)境中所遇到的每一總體單位均作為樣本成員。“街頭攔人法”就是一種偶遇抽樣。方便抽樣是非隨機(jī)抽樣中最簡(jiǎn)單的方法,省時(shí)省錢,但樣本代表性因受偶然因素的影響太大而得不到保證。l 自愿抽樣:某些調(diào)查對(duì)被調(diào)查者來說是不愉快的、麻煩的,這時(shí)為方便起見就采用以自愿被調(diào)查者為調(diào)查樣本的方法。l 判斷抽樣:研究人員從總體中選擇那些被判斷為最能代表總體的單位作樣本的抽樣方法。當(dāng)研究者對(duì)自己的研究領(lǐng)域十分熟悉,對(duì)研究總體比較了解時(shí)采用這種抽樣方法,可獲代表性較高的樣本。這種抽樣方法多應(yīng)用于總體小而內(nèi)部差異大的情況,以及在總體邊界無法確定或因研究者的時(shí)間與

8、人力、物力有限時(shí)采用。l 滾雪球抽樣:以若干個(gè)具有所需特征的人為最初的調(diào)查對(duì)象,然后依靠他們提供認(rèn)識(shí)的合格的調(diào)查對(duì)象,再由這些人提供第三批調(diào)查對(duì)象,依次類推,樣本如同滾雪球般由小變大。滾雪球抽樣多用于總體單位的信息不足或觀察性研究的情況。這種抽樣中有些分子最后仍無法找到,有些分子被提供者漏而不提,兩者都可能造成誤差。l 配額抽樣也稱定額抽樣,是將總體依某種標(biāo)準(zhǔn)分層(群);然后按照各層樣本數(shù)與該層總體數(shù)成比例的原則主觀抽取樣本。配額抽樣與分層概率抽樣很接近,最大的不同是分層概率抽樣的各層樣本是隨機(jī)抽取的,而配額抽樣的各層樣本是非隨機(jī)的??傮w也可按照多種標(biāo)準(zhǔn)的組合分層(群),例如,在研究自殺問題時(shí)

9、,考慮到婚姻與性別都可能對(duì)自殺有影響,可將研究對(duì)象分為未婚男性、已婚男性、未婚女性和已婚女性四個(gè)組,然后從各群非隨機(jī)地抽樣。配額抽樣是通常使用的非概率抽樣方法,樣本除所選標(biāo)識(shí)外無法保證代表性。8、 利用SPSS進(jìn)行數(shù)據(jù)分析的一般步驟:數(shù)據(jù)的準(zhǔn)備-數(shù)據(jù)的加工處理-數(shù)據(jù)的分析-分析結(jié)果的閱讀和解釋。第二章練習(xí)題答案1、SPSS中兩個(gè)基本的數(shù)據(jù)組織方式:原始數(shù)據(jù)的組織方式和計(jì)數(shù)數(shù)據(jù)的組織方式。l 原始數(shù)據(jù)的組織方式:待分析的數(shù)據(jù)是一些原始的調(diào)查問卷數(shù)據(jù),或是一些基本的統(tǒng)計(jì)指標(biāo)。l 計(jì)數(shù)數(shù)據(jù)的組織方式:所采集的數(shù)據(jù)不是原始的調(diào)查問卷數(shù)據(jù),而是經(jīng)過分組匯總后的數(shù)據(jù)。2、 個(gè)案:在原始數(shù)據(jù)的組織方式中,數(shù)

10、據(jù)編輯器窗口中的一行稱為一個(gè)個(gè)案或觀測(cè)。 變量:數(shù)據(jù)編輯器窗口中的一列。3、默認(rèn)的變量名:VAR-;默認(rèn)的變量類型:數(shù)值型。 變量名標(biāo)簽和變量值標(biāo)簽可增強(qiáng)統(tǒng)計(jì)分析結(jié)果的可讀性。4、數(shù)據(jù)文件如圖所示:5、缺失值分為用戶缺失值(User Missing Value)和系統(tǒng)缺失值(System Missing Value)。用戶缺失值指在問卷調(diào)查中,將無回答的一些數(shù)據(jù)以及明顯失真的數(shù)據(jù)當(dāng)作缺失值來處理。用戶缺失值的編碼一般用研究者自己能夠識(shí)別的數(shù)字來表示,如“0”、“9”、“99”等。系統(tǒng)缺失值主要指計(jì)算機(jī)默認(rèn)的缺失方式,如果在輸入數(shù)據(jù)時(shí)空缺了某些數(shù)據(jù)或輸入了非法的字符,計(jì)算機(jī)就把其界定為缺失值,這

11、時(shí)的數(shù)據(jù)標(biāo)記為一個(gè)圓點(diǎn)“”。在變量視圖中定義。6、 變量類型包括:數(shù)值型(身高)、定序型(受教育程度)以及定類型(性別)。在變量視圖中定義。79題 軟件操作,答案略第三章練習(xí)題答案18題 軟件操作,答案略9、SPSS排序功能僅實(shí)現(xiàn)將觀測(cè)按用戶指定順序重新排列;拆分功能在按序排列的基礎(chǔ)上,能夠?qū)崿F(xiàn)對(duì)數(shù)據(jù)按排序變量進(jìn)行分組,并分組進(jìn)行后續(xù)的統(tǒng)計(jì)分析。第四章練習(xí)題答案1、Statistics戶口所在地職業(yè)年齡NValid282282282Missing000戶口所在地FrequencyPercentValid PercentCumulative PercentValid中心城市20070.970.9

12、70.9邊遠(yuǎn)郊區(qū)8229.129.1100.0Total282100.0100.0職業(yè)FrequencyPercentValid PercentCumulative PercentValid國(guó)家機(jī)關(guān)248.58.58.5商業(yè)服務(wù)業(yè)5419.119.127.7文教衛(wèi)生186.46.434.0公交建筑業(yè)155.35.339.4經(jīng)營(yíng)性公司186.46.445.7學(xué)校155.35.351.1一般農(nóng)戶3512.412.463.5種糧棉專業(yè)戶41.41.464.9種果菜專業(yè)戶103.53.568.4工商運(yùn)專業(yè)戶3412.112.180.5退役人員176.06.086.5金融機(jī)構(gòu)3512.412.498.9

13、現(xiàn)役軍人31.11.1100.0Total282100.0100.0年齡FrequencyPercentValid PercentCumulative PercentValid20歲以下41.41.41.42035歲14651.851.853.23550歲9132.332.385.550歲以上4114.514.5100.0Total282100.0100.0分析:本次調(diào)查的有效樣本為282份。常住地的分布狀況是:在中心城市的人最多,有200人,而在邊遠(yuǎn)郊區(qū)只有82人;職業(yè)的分布狀況是:在商業(yè)服務(wù)業(yè)的人最多,其次是一般農(nóng)戶和金融機(jī)構(gòu);年齡方面:在35-50歲的人最多。由于變量中無缺失數(shù)據(jù),因此頻

14、數(shù)分布表中的百分比相同。 2、分析:由表中可以看出,有效樣本為282份,存(取)款金額的均值是4738.09,標(biāo)準(zhǔn)差為10945.09,峰度系數(shù)為33.656,偏度系數(shù)為5.234。 與標(biāo)準(zhǔn)正態(tài)分布曲線進(jìn)行對(duì)比,由峰度系數(shù)可以看出,此表的存款金額的數(shù)據(jù)分布比標(biāo)準(zhǔn)正態(tài)分布更陡峭;由偏度系數(shù)可以看出,此表的存款金額的數(shù)據(jù)為右偏分布,表明此表的存款金額均值對(duì)平均水平的測(cè)度偏大。 分析:由表中可以看出,中心城市有200人,邊遠(yuǎn)郊區(qū)為82人。兩部分樣本存取款金額均呈右偏尖峰分布,且邊遠(yuǎn)郊區(qū)更明顯。3、利用描述菜單下窗口對(duì)話框中的“將標(biāo)準(zhǔn)得分另存為變量”功能實(shí)現(xiàn)。對(duì)標(biāo)準(zhǔn)分?jǐn)?shù)變量按降序排列,絕對(duì)值大于3的可

15、視為“與眾不同”的樣本。理由:標(biāo)準(zhǔn)化值反映的是樣本值與樣本均值的差是幾個(gè)標(biāo)準(zhǔn)差單位。如果標(biāo)準(zhǔn)化值等于0,則表示該樣本值等于樣本均值;如果標(biāo)準(zhǔn)化值大于0,則表示該樣本值大于樣本均值;如果標(biāo)準(zhǔn)化值小于0,則表示該樣本值小于樣本均值。如果標(biāo)準(zhǔn)化值的絕對(duì)值大于3,則可認(rèn)為是異常值。4、利用列聯(lián)分析實(shí)現(xiàn)。首先編制列聯(lián)表,然后進(jìn)行卡方檢驗(yàn)。以戶口和收入的列聯(lián)分析為例:表中,卡方統(tǒng)計(jì)量的觀測(cè)值等于32.064,概率-P值等于0.001。若顯著性水平設(shè)為0.05,由于0.0010.05,拒絕原假設(shè),表明戶口地與收入水平不獨(dú)立。5、多選項(xiàng)分類法;存款的最主要目的是正常生活零用6、計(jì)算結(jié)果:卡方統(tǒng)計(jì)量:,用于測(cè)度

16、各個(gè)單元格的觀測(cè)頻數(shù)與期望頻數(shù)的差異,并依卡方理論分布判斷差異是否統(tǒng)計(jì)顯著。由于期望頻數(shù)代表的是行列變量獨(dú)立下的分布,所以卡方值越大表明實(shí)際分布與期望分布差異越明顯。本例中,由于概率P值小于顯著性水平,應(yīng)拒絕原假設(shè),婆媳關(guān)系與住房條件有關(guān)系。7、 將計(jì)數(shù)數(shù)據(jù)還原為原始數(shù)據(jù),采用交叉分組下的頻數(shù)分析,并進(jìn)行卡方檢驗(yàn)。表中,卡方統(tǒng)計(jì)量觀測(cè)值為4.339,對(duì)應(yīng)的概率P-值為0.037,小于顯著性水平0.05,應(yīng)拒絕原假設(shè),說明減肥效果并不一致。8、多選項(xiàng)二分法;102(794份)、101(514份)、401(400份)賺錢比例:30.3%,賠錢比例38%主要依據(jù):基本因素法;最少依據(jù):更跟方法采用列

17、聯(lián)分析??ǚ綑z驗(yàn)結(jié)果表明:專職和業(yè)余投資者在投資結(jié)果上存在顯著差異。9、(1)變量:汽車價(jià)格、居住地區(qū);類型:定序型變量、定類型變量 (2)上述是計(jì)數(shù)數(shù)據(jù)的組織方式,應(yīng)首先組織到SPSS的數(shù)據(jù)編輯器窗口中,再利用交叉分組下的頻數(shù)分析方法。列聯(lián)分析。原假設(shè):不同居住區(qū)的私家車主接受的汽車價(jià)格具有一致性的。上表可知,如果顯著性水平為0.05,由于卡方檢驗(yàn)的概率P-值小于顯著性水平,因此應(yīng)拒絕原假設(shè)。第五章練習(xí)題答案1、采用單樣本T檢驗(yàn)(原假設(shè)H0:u=u0=75,總體均值與檢驗(yàn)值之間不存在顯著差異);One-Sample StatisticsNMeanStd. DeviationStd. Erro

18、r MeanVAR000011173.72739.550822.87968One-Sample TestTest Value = 75tdfSig. (2-tailed)Mean Difference95% Confidence Interval of the DifferenceLowerUpperVAR00001-.44210.668-1.27273-7.68915.1436分析:N=11人的平均值(mean)為73.7,標(biāo)準(zhǔn)差(std.deviation)為9.55,均值標(biāo)準(zhǔn)誤差(std error mean)為2.87。t統(tǒng)計(jì)量的觀測(cè)值為-4.22,t統(tǒng)計(jì)量觀測(cè)值的雙尾概率P-值(si

19、g.(2-tailed))為0.668;六七列是總體均值與原假設(shè)值差的95%的置信區(qū)間:(-7.68,5.14)。采用雙尾檢驗(yàn)比較a和p。T統(tǒng)計(jì)量觀測(cè)值的雙尾概率p-值(sig.(2-tailed))為0.668a=0.05所以不能拒絕原設(shè);且總體均值的95%的置信區(qū)間為(67.31,80.14),檢驗(yàn)值75包括在置信區(qū)間內(nèi),所以經(jīng)理的話是可信的。2、每周上網(wǎng)時(shí)間的樣本平均值為27.5,標(biāo)準(zhǔn)差為10.7,總體均值95%的置信區(qū)間為23.8-31.2.3、利用兩獨(dú)立樣本的T檢驗(yàn)實(shí)現(xiàn),本質(zhì)為兩個(gè)總體比例差的檢驗(yàn)。首先將計(jì)數(shù)數(shù)據(jù)通過加權(quán)功能還原為原始數(shù)據(jù),然后,采用兩獨(dú)立樣本T檢驗(yàn)實(shí)現(xiàn)。檢驗(yàn)變量為行

20、為,分組變量為方式。Group Statistics方式NMeanStd. DeviationStd. Error Meana2方式一200.4600.49965.03533方式二183.8798.32611.02411分析:從上表可以看出票丟仍買的人數(shù)比例為46%,錢丟仍買的人數(shù)比例為88%,兩種方式的樣本比例有較大差距。1.兩總體方差是否相等F檢驗(yàn):F的統(tǒng)計(jì)量的觀察值為257.98,對(duì)應(yīng)的P值為0.00,;如果顯著性水平為0.05,由于概率P值小于0.05,兩種方式的方差有顯著差異??醇僭O(shè)方差不相等行的結(jié)果。2.兩總體均值(比例)差的檢驗(yàn):.T統(tǒng)計(jì)量的觀測(cè)值為-9.815,對(duì)應(yīng)的雙尾概率為

21、0.00,T統(tǒng)計(jì)量對(duì)應(yīng)的概率P值0.05,故推翻原假設(shè),表明兩總體比例有顯著差異.更傾向心理學(xué)家的說法。4、本題是單個(gè)總體的比例檢驗(yàn)問題。首先將數(shù)據(jù)組織成計(jì)數(shù)方式,并以數(shù)量為加權(quán)變量還原為原始數(shù)據(jù)。然后,采用獨(dú)立樣本的T檢驗(yàn)實(shí)現(xiàn)。檢驗(yàn)變量為是否開蘭花,檢驗(yàn)值為0.75。分析:由表知:樣本中200棵開蘭花的比例為71%。如果總體比例的原假設(shè)為0.75,由于T統(tǒng)計(jì)量的概率P值大于顯著性水平(0.05),不能拒絕原假設(shè),不能說與遺傳模型不一致。5、 方式一:采用兩配對(duì)樣本t檢驗(yàn)Paired Samples StatisticsMeanNStd. DeviationStd. Error MeanPai

22、r 1飼料132.57893.81081.2703飼料234.26795.59931.8664Paired Samples CorrelationsNCorrelationSig.Pair 1飼料1 & 飼料29.571.108Paired Samples TestPaired DifferencestdfSig. (2-tailed)MeanStd. DeviationStd. Error Mean95% Confidence Interval of the DifferenceLowerUpperPair 1飼料1 - 飼料2-1.68894.63671.5456-5.25291.8752

23、-1.0938.306由上表可知,t統(tǒng)計(jì)量觀測(cè)值為-1.093,概率P-值為0.306,大于顯著性水平0.05,不應(yīng)拒絕原假設(shè),不能認(rèn)為不同飼料使幼鼠體內(nèi)鈣的留存量出現(xiàn)了顯著不同。方式二:采用兩獨(dú)立樣本t檢驗(yàn)由上面的表可知,兩組殘留的樣本平均值差異不大。由下表可知,該檢驗(yàn)的F統(tǒng)計(jì)量的觀測(cè)值為0.059,對(duì)應(yīng)的概率P-值為0.811。如果顯著性水平為0.05,則可以認(rèn)為兩總體的方差無顯著差異。兩總體均值的檢驗(yàn)應(yīng)看第一行。T統(tǒng)計(jì)量的觀測(cè)值為-0.584,P-值為0.566,。如果顯著性水平為0.05,則不應(yīng)拒絕原假設(shè),不能認(rèn)為兩飼料殘留有顯著差異。6、兩獨(dú)立樣本T檢驗(yàn)分析:1.兩總體方差是否相等用

24、F檢驗(yàn):F的統(tǒng)計(jì)量的觀察值為0.257,對(duì)應(yīng)的P值為0.614,;如果顯著性水平為0.05,由于概率P值大于0.05,兩種方式的方差無顯著差異.看假設(shè)方差相等行。2.兩總體均值的檢驗(yàn):T統(tǒng)計(jì)量的觀測(cè)值為-0.573,對(duì)應(yīng)的雙尾概率為0.569,T統(tǒng)計(jì)量對(duì)應(yīng)的P值顯著水平0.05,故不能拒絕原假設(shè),不能認(rèn)為女生男生的課程平均分有顯著差異。7、利用配對(duì)樣本T檢驗(yàn),逐對(duì)檢驗(yàn)8、由第一個(gè)表知,培訓(xùn)前和培訓(xùn)后樣本的平均值(mean)有一定差異,培訓(xùn)后平均值較大;表二表明,在顯著性水平為0.05時(shí),培訓(xùn)前后的銷售量有一定的線性關(guān)系;由表三知,t檢驗(yàn)統(tǒng)計(jì)量的觀測(cè)值為-2.3,對(duì)應(yīng)的雙尾概率p-值為0.04,

25、小于顯著水平a=0.05 ,應(yīng)拒絕原假設(shè),培訓(xùn)前后的銷售平均值存在顯著差異。 第六章練習(xí)題答案1、(1)ANOVAVAR00002Sum of SquaresdfMean SquareFSig.Between Groups405.5344101.38411.276.000Within Groups269.737308.991Total675.27134概率P-值接近于0,應(yīng)拒絕原假設(shè),認(rèn)為5種推銷方法有顯著差異。(2)均值圖:Multiple ComparisonsDependent Variable: VAR00002 LSD(I) VAR00001(J) VAR00001Mean Diff

26、erence (I-J)Std. ErrorSig.95% Confidence IntervalLower BoundUpper Bound12-3.3000*1.6028.048-6.573-.0273.72861.6028.653-2.5454.00243.05711.6028.066-.2166.3305-6.7000*1.6028.000-9.973-3.427213.3000*1.6028.048.0276.57334.0286*1.6028.018.7557.30246.3571*1.6028.0003.0849.6305-3.4000*1.6028.042-6.673-.127

27、31-.72861.6028.653-4.0022.5452-4.0286*1.6028.018-7.302-.75542.32861.6028.157-.9455.6025-7.4286*1.6028.000-10.702-4.15541-3.05711.6028.066-6.330.2162-6.3571*1.6028.000-9.630-3.0843-2.32861.6028.157-5.602.9455-9.7571*1.6028.000-13.030-6.484516.7000*1.6028.0003.4279.97323.4000*1.6028.042.1276.67337.428

28、6*1.6028.0004.15510.70249.7571*1.6028.0006.48413.030*. The mean difference is significant at the 0.05 level.可知,1和2、1和5、2和3,2和4,2和5,3和5,4和5有顯著差異。2、2.4;3.1;3、因F檢驗(yàn)的概率P值小于顯著性水平(0.05),拒絕原假設(shè),方差不齊,不滿足方差分析的前提假設(shè)。1104.128;2629.118;67;24.206各組均值存在顯著差異。更適合第三組4、Between-Subjects FactorsValue LabelN地區(qū)1.00地區(qū)一92.00地

29、區(qū)二93.00地區(qū)三9日期1.00周一至周三92.00周四至周五93.00周末9Tests of Between-Subjects EffectsDependent Variable: 銷售量SourceType III Sum of SquaresdfMean SquareFSig.Corrected Model.852a8.4818.350.000.4811.481912.040.000a1.2962.1481.240.313a2.7412.3701.480.254a1 * a2.8154.70415.340.000Error.66718.926Total.00027Corrected T

30、otal.51926a. R Squared = .788 (Adjusted R Squared = .693)分析:(2) 由上表可知,F(xiàn)a1、Fa2的概率P-值為0.313和0.254,大于顯著性水平(0.05),所以不應(yīng)拒絕原假設(shè),可以認(rèn)為不同地區(qū)和日期下的銷售額總體均值不存在顯著差異,不同地區(qū)和不同日期對(duì)該商品的銷售沒有產(chǎn)生顯著影響。(3) 產(chǎn)生了交互影響。因?yàn)楦怕蔖-值接近于0,拒絕原假設(shè),認(rèn)為不同地區(qū)和日期對(duì)銷售額產(chǎn)生了顯著的交互作用。5、Between-Subjects FactorsValue LabelN性別1.00女122.00男12手機(jī)1.00使用122.00不使用12

31、Tests of Between-Subjects EffectsDependent Variable: 得分SourceType III Sum of SquaresdfMean SquareFSig.Corrected Model1028.125a3342.70821.101.00034732.042134732.0422138.453.000性別5.04215.042.310.584手機(jī)1001.04211001.04261.634.000性別 * 手機(jī)22.042122.0421.357.258Error324.8332016.242Total36085.00024Corrected

32、Total1352.95823a. R Squared = .760 (Adjusted R Squared = .724)分析:就性別而言,因?yàn)楦怕蔖-值=0.584,大于顯著性水平0.05,所以不應(yīng)拒絕原假設(shè),認(rèn)為性別對(duì)駕駛狀態(tài)無顯著影響;就手機(jī)使用情況而言,因?yàn)楦怕蔖-值接近0,應(yīng)拒絕原假設(shè),認(rèn)為手機(jī)使用情況對(duì)駕駛狀態(tài)存在顯著影響。6、在剔除加盟時(shí)間的影響下,因P-值小于0.05,應(yīng)拒絕原假設(shè),兩種培訓(xùn)方式效果有顯著差異。第七章練習(xí)題答案1、卡方檢驗(yàn)因概率P值小于顯著性水平(0.05),拒絕原假設(shè),不同年齡度對(duì)該商品滿意程度不一致。2、單樣本K-S檢驗(yàn)因概率P值小于顯著性水平(0.05)

33、,拒絕原假設(shè),與正態(tài)分布存在顯著差異。3、單樣本游程檢驗(yàn)因概率P值小于顯著性水平(0.05),拒絕原假設(shè),認(rèn)為成品尺寸的變化是由生產(chǎn)線工作不穩(wěn)定導(dǎo)致的。4、兩獨(dú)立樣本的K-S檢驗(yàn)因概率P值大于顯著性水平(0.05),不應(yīng)拒絕原假設(shè),認(rèn)為不同地區(qū)本次存取款金額的分布不存在顯著差異。5、兩獨(dú)立樣本的曼-惠特尼檢驗(yàn)因概率P值小于顯著性水平(0.05),應(yīng)拒絕原假設(shè),兩品牌白糖實(shí)際重量的分布存在顯著差異6、(略)7、兩配對(duì)樣本的秩檢驗(yàn)因概率P值小于顯著性水平(0.05),應(yīng)拒絕原假設(shè),喝酒前后剎車反映時(shí)間存在顯著差異8、多配對(duì)樣本的friedman檢驗(yàn)因概率P值大于顯著性水平(0.05),不應(yīng)拒絕原假

34、設(shè),三個(gè)品牌牛奶的日銷售數(shù)據(jù)不存在顯著差異。第八章練習(xí)題答案1、 能。Correlations客戶滿意度綜合競(jìng)爭(zhēng)力客戶滿意度Pearson Correlation1.864*Sig. (2-tailed).000N1515綜合競(jìng)爭(zhēng)力Pearson Correlation.864*1Sig. (2-tailed).000N1515*. Correlation is significant at the 0.01 level (2-tailed).兩者的簡(jiǎn)單相關(guān)系數(shù)為0.864,說明存在正的強(qiáng)相關(guān)性。2、香煙消耗量與肺癌死亡率的散點(diǎn)圖相關(guān)系數(shù)為0.737。因概率P值小于顯著性水平(0.05),拒絕

35、原假設(shè),認(rèn)為兩者存在顯著關(guān)系。3.(1) 如果所繪制的圖形不能較清晰地展示變量之間的關(guān)系,應(yīng)對(duì)散點(diǎn)圖進(jìn)行調(diào)整。在SPSS查看器窗口中選中相應(yīng)的散點(diǎn)圖雙擊鼠標(biāo),進(jìn)入SPSS圖形編輯器窗口。選中【選項(xiàng)】菜單下的【塊元素】子菜單進(jìn)行數(shù)據(jù)合并。(2)CorrelationsControl Variables銷售額銷售價(jià)格家庭收入銷售額Correlation1.000-.728Significance (2-tailed).026df07銷售價(jià)格Correlation-.7281.000Significance (2-tailed).026.df70 如表所示,在家庭收入作為控制變量的條件下,銷售額和價(jià)

36、格的偏相關(guān)系數(shù)為-0.728,呈一定的負(fù)相關(guān)關(guān)系,且統(tǒng)計(jì)顯著。第九章練習(xí)題答案1、2、相關(guān)分析是回歸分析的基礎(chǔ)和前提,回歸分析則是相關(guān)分析的深入和繼續(xù)。相關(guān)分析需要依靠回歸分析來表現(xiàn)變量之間數(shù)量相關(guān)的具體形式,而回歸分析則需要依靠相關(guān)分析來表現(xiàn)變量之間數(shù)量變化的相關(guān)程度。只有當(dāng)變量之間存在高度相關(guān)時(shí),進(jìn)行回歸分析尋求其相關(guān)的具體形式才有意義。如果在沒有對(duì)變量之間是否相關(guān)以及相關(guān)方向和程度做出正確判斷之前,就進(jìn)行回歸分析,很容易造成“虛假回歸”。與此同時(shí),相關(guān)分析只研究變量之間相關(guān)的方向和程度,不能推斷變量之間相互關(guān)系的具體形式,也無法從一個(gè)變量的變化來推測(cè)另一個(gè)變量的變化情況,因此,在具體應(yīng)用

37、過程中,只有把相關(guān)分析和回歸分析結(jié)合起來,才能達(dá)到研究和分析的目的。3、 檢驗(yàn)其可信程度并找出哪些變量的影響顯著、哪些不顯著。主要包括回歸方程的擬合優(yōu)度檢驗(yàn)、顯著性檢驗(yàn)、回歸系數(shù)的顯著性檢驗(yàn)、殘差分析等。4、 向前、向后、逐步。5、方法:采用逐步回歸策略。結(jié)論:糧食總產(chǎn)量的主要因素有施用化肥量(kg/公頃), 農(nóng)業(yè)勞動(dòng)者人數(shù)(百萬人), 總播種面積(萬公頃), 風(fēng)災(zāi)面積比例(%)。6、.1;.6;3;26;55069.7154;72.8Y=7589.1X1-117.886X2+80.6X3+0.5X4回歸方程顯著性檢驗(yàn):整體線性關(guān)系顯著回歸系數(shù)顯著性檢驗(yàn):各個(gè)回歸系數(shù)檢驗(yàn)均顯著7、因概率P值小

38、于顯著性水平(0.05),所以表明在控制了性別之后,閱讀成績(jī)對(duì)數(shù)學(xué)成績(jī)有顯著的線性影響。8、采用二次曲線第十章練習(xí)題答案1、采用歐氏距離,組間平均鏈鎖法利用凝聚狀態(tài)表中的組間距離和對(duì)應(yīng)的組數(shù),回歸散點(diǎn)圖,得到碎石圖。大約聚成4類由圖可知,北京自成一類,江蘇、廣東、上海、湖南、湖北聚成一類。其他略。均值對(duì)比,依據(jù)聚類解,利用分類匯總,計(jì)算各個(gè)聚類變量的均值方差分析結(jié)果:不同組在各個(gè)聚類變量上的均值均存在顯著差異。2、數(shù)量級(jí)將對(duì)距離產(chǎn)生較大影響,并影響最終聚類結(jié)果。3、 會(huì)。如果所選變量之間存在較強(qiáng)的線性關(guān)系,能夠相互替代,在計(jì)算距離時(shí)同類變量將重復(fù)“貢獻(xiàn)”,占有較高權(quán)重,而使最終的聚類結(jié)果偏向該

39、類變量。4、 K-Means聚類分析步驟:確定聚類數(shù)目K-確定K個(gè)初始類中心點(diǎn)-根據(jù)距離最近原則進(jìn)行分類-重新確定K個(gè)類中心點(diǎn)-判斷是否已經(jīng)滿足終止條件。是一個(gè)反復(fù)迭代的分類過程。在聚類過程中,樣本所屬的類會(huì)不斷調(diào)整,直至達(dá)到最終穩(wěn)定為止。5、聚成3類較為恰當(dāng)。第十一章練習(xí)題答案1、因子分析的主要步驟: 一、前提條件:要求原有變量之間存在較強(qiáng)的相關(guān)關(guān)系。二、因子提取。三、使因子具有命名解釋性:使提取出的因子實(shí)際含義清晰。四、計(jì)算樣本的因子得分。2、“基本建設(shè)投資分析”因子分析(1)Correlation Matrix國(guó)家預(yù)算內(nèi)資金國(guó)內(nèi)貸款利用外資自籌資金其他投資Correlation國(guó)家預(yù)算內(nèi)

40、資金1.000.458.229.331.211國(guó)內(nèi)貸款.4581.000.746.744.686利用外資.229.7461.000.864.776自籌資金.331.744.8641.000.928其他投資.211.686.776.9281.000表一是原有變量的相關(guān)系數(shù)矩陣。由表可知,一些變量的相關(guān)系數(shù)都較高,呈較強(qiáng)的線性關(guān)系,能夠從中提取公共因子,適合進(jìn)行因子分析。KMO and Bartletts TestKaiser-Meyer-Olkin Measure of Sampling Adequacy.706Bartletts Test of SphericityApprox. Chi-Sq

41、uare119.614df10Sig.000由表二可知,巴特利特球度檢驗(yàn)統(tǒng)計(jì)量的觀測(cè)值為119.614,相應(yīng)的概率P-值接近0.如果顯著性水平為0.05,由于概率P-值小于顯著性水平,則應(yīng)拒絕原假設(shè),認(rèn)為相關(guān)系數(shù)矩陣與單位陣有顯著差異,原有變量適合做因子分析。同時(shí),KMO值為0.706,根據(jù)KMO度量標(biāo)準(zhǔn)可知原有變量可以進(jìn)行因子分析。CommunalitiesInitialExtraction國(guó)家預(yù)算內(nèi)資金1.000.196國(guó)內(nèi)貸款1.000.769利用外資1.000.820自籌資金1.000.920其他投資1.000.821Extraction Method: Principal Compo

42、nent Analysis.由表三可知,利用外資、自籌資金、其他投資等變量的絕大部分信息(大于80%)可被因子解釋,這些變量的信息丟失較少。但國(guó)家預(yù)算內(nèi)資金這個(gè)變量的信息丟失較為嚴(yán)重(近80%)。總的來說,本次因子提取的總體效果還不錯(cuò)。為了達(dá)到更好的效果,可以重新指定提取特征值的標(biāo)準(zhǔn),指定提取2個(gè)因子。補(bǔ)充說明如下:故由表四可知,第1個(gè)因子的特征值很高,對(duì)解釋原有變量的貢獻(xiàn)最大;第三個(gè)以后的因子特征值都較小,對(duì)解釋原有變量的貢獻(xiàn)很小,可以忽略,因此選取兩個(gè)因子是合適的。表五:重新提取因子后的公因子方差表CommunalitiesInitialExtraction國(guó)家預(yù)算內(nèi)資金1.000.975

43、國(guó)內(nèi)貸款1.000.795利用外資1.000.860自籌資金1.000.937其他投資1.000.882Extraction Method: Principal Component Analysis. 表五是指定提取2個(gè)特征值下的變量共同度數(shù)據(jù)。由第二列數(shù)據(jù)可知,此時(shí)所有變量的共同度均較高,各個(gè)變量的信息丟失都較少。因此,本次因子提取的總體效果比較理想。Total Variance ExplainedComponentInitial EigenvaluesExtraction Sums of Squared LoadingsTotal% of VarianceCumulative %Total% of VarianceCumulative %13.52670.51870.5183.52670.51870.5182.92318.45288.9703.3066.11295.0824.2003.99399.0755.046.925100.000Extraction Method: Principal Component Analysis.Total Variance ExplainedComponentInitial EigenvaluesExtraction Sums of Squared LoadingsRotation Sums of Squared LoadingsTotal

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論