數(shù)學(xué)建模培訓(xùn)講座之_第1頁
數(shù)學(xué)建模培訓(xùn)講座之_第2頁
數(shù)學(xué)建模培訓(xùn)講座之_第3頁
數(shù)學(xué)建模培訓(xùn)講座之_第4頁
數(shù)學(xué)建模培訓(xùn)講座之_第5頁
已閱讀5頁,還剩163頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

數(shù)學(xué)建模培訓(xùn)講座之第一頁,共一百六十八頁,2022年,8月28日峰度(Kurtosis)3.8偏度(Skewness)3.9標(biāo)準(zhǔn)化Z分?jǐn)?shù)及其線性轉(zhuǎn)換3.10探索分析3.11交叉列聯(lián)表分析3.12多選項(xiàng)分析3.13基本統(tǒng)計(jì)分析的報(bào)表制作3.14第二頁,共一百六十八頁,2022年,8月28日SPSS基本統(tǒng)計(jì)分析是進(jìn)行其他統(tǒng)計(jì)分析的基礎(chǔ)和前提。通過基本統(tǒng)計(jì)方法的學(xué)習(xí),可以對要分析數(shù)據(jù)的總體特征有比較準(zhǔn)確的把握,從而有助于選擇其他更為深入的統(tǒng)計(jì)分析方法。本章主要介紹如何在SPSS中進(jìn)行平均數(shù)、中位數(shù)、眾數(shù)、方差、百分位、頻數(shù)、峰度、偏度、探索分析、交叉聯(lián)列表分析、多選項(xiàng)分析、基本統(tǒng)計(jì)報(bào)表制作等的操作。第三頁,共一百六十八頁,2022年,8月28日3.1均值(Mean)和均值標(biāo)準(zhǔn)誤差(S.E.mean)3.1.1統(tǒng)計(jì)學(xué)上的定義和計(jì)算公式定義:均值(平均值、平均數(shù))表示的是某變量所有取值的集中趨勢或平均水平。例如,學(xué)生某門學(xué)科的平均成績、公司員工的平均收入、某班級學(xué)生的平均身高等。計(jì)算公式如下??傮w平均數(shù):若一組數(shù)據(jù)X1,X2,…,XN,代表一個(gè)大小為N的有限總體,則其總體平均數(shù)為第四頁,共一百六十八頁,2022年,8月28日樣本平均數(shù):若一組數(shù)據(jù)x1,x2,…,xn,代表一個(gè)大小為n的有限樣本,則其樣本平均數(shù)為第五頁,共一百六十八頁,2022年,8月28日樣本數(shù)據(jù)來自總體。樣本的統(tǒng)計(jì)描述量可以反映總體數(shù)據(jù)的特征,但由于抽樣等原因,使得樣本數(shù)據(jù)不一定能夠完全準(zhǔn)確地反映總體,它可能與總體的真實(shí)值之間存在一定的差異。進(jìn)行不同次抽樣,會得到若干個(gè)不同的樣本均值,它們與總體均值存在著不同的差異。均值標(biāo)準(zhǔn)誤差(StandardErrorofMean,S.E.mean)就是描述這些樣本均值與總體均值之間平均差異程度的統(tǒng)計(jì)量。第六頁,共一百六十八頁,2022年,8月28日3.1.2SPSS中實(shí)現(xiàn)過程研究問題求某班級學(xué)生在一次數(shù)學(xué)測驗(yàn)中的平均成績,數(shù)據(jù)如表3-1所示。數(shù)學(xué)成績998879595489795689992389705067788956表3-1 某班級的數(shù)學(xué)成績第七頁,共一百六十八頁,2022年,8月28日實(shí)現(xiàn)步驟圖3-1在菜單中選擇“Frequencies”命令第八頁,共一百六十八頁,2022年,8月28日圖3-2“Frequencies”對話框(一)第九頁,共一百六十八頁,2022年,8月28日圖3-3“Frequencies:Statistics”對話框(一)第十頁,共一百六十八頁,2022年,8月28日3.1.3結(jié)果和討論第十一頁,共一百六十八頁,2022年,8月28日3.2中位數(shù)(Median)3.2.1統(tǒng)計(jì)學(xué)上的定義和計(jì)算公式定義:把一組數(shù)據(jù)按遞增或遞減的順序排列,處于中間位置上的變量值就是中位數(shù)。它是一種位置代表值,所以不會受到極端數(shù)值的影響,具有較高的穩(wěn)健性。第十二頁,共一百六十八頁,2022年,8月28日計(jì)算公式:一個(gè)大小為的數(shù)列,要求其中位數(shù),首先應(yīng)把該數(shù)列按大小順序排列好,如果為奇數(shù),那么該數(shù)列的中位數(shù)就是位置上的數(shù);如果N為偶數(shù),中位數(shù)則是該數(shù)列中第與第+1位置上兩個(gè)數(shù)值的平均數(shù)。第十三頁,共一百六十八頁,2022年,8月28日3.2.2SPSS中實(shí)現(xiàn)過程研究問題求某班級學(xué)生身高的中位數(shù),數(shù)據(jù)如表3-2所示。表3-2 某班級學(xué)生的身高身高(cm)174168164174176150183162171146189167第十四頁,共一百六十八頁,2022年,8月28日實(shí)現(xiàn)步驟圖3-4“Frequencies:Statistics”對話框(二)第十五頁,共一百六十八頁,2022年,8月28日3.2.3結(jié)果和討論第十六頁,共一百六十八頁,2022年,8月28日3.3眾數(shù)(Mode)3.3.1統(tǒng)計(jì)學(xué)上的定義和計(jì)算公式定義:眾數(shù)是指一組數(shù)據(jù)中,出現(xiàn)次數(shù)最多的那個(gè)變量值。眾數(shù)在描述數(shù)據(jù)集中趨勢方面有一定的意義。例如,制鞋廠可以根據(jù)消費(fèi)者所需鞋的尺碼的眾數(shù)來安排生產(chǎn)。計(jì)算公式:手工計(jì)算眾數(shù)比較麻煩,需要統(tǒng)計(jì)數(shù)據(jù)的次數(shù)分布。第十七頁,共一百六十八頁,2022年,8月28日3.3.2SPSS中實(shí)現(xiàn)過程研究問題求某醫(yī)院當(dāng)天出生新生兒的體重的眾數(shù),數(shù)據(jù)如表3-3所示。表3-3 新生兒的體重體重(斤)8767545687564765.574第十八頁,共一百六十八頁,2022年,8月28日實(shí)現(xiàn)步驟圖3-5“Frequencies:Statistics”對話框(三)第十九頁,共一百六十八頁,2022年,8月28日3.3.3結(jié)果和討論第二十頁,共一百六十八頁,2022年,8月28日3.4.1統(tǒng)計(jì)學(xué)上的定義和計(jì)算公式3.4全距(Range)定義:全距也稱為極差,是數(shù)據(jù)的最大值與最小值之間的絕對差。在相同樣本容量情況下的兩組數(shù)據(jù),全距大的一組數(shù)據(jù)要比全距小的一組數(shù)據(jù)更為分散。計(jì)算公式:最大值-最小值。第二十一頁,共一百六十八頁,2022年,8月28日3.4.2SPSS中實(shí)現(xiàn)過程研究問題求某班級學(xué)生數(shù)學(xué)成績的全距,數(shù)據(jù)如表3-4所示。表3-4 某班級的數(shù)學(xué)成績數(shù)學(xué)成績998879595489795689992389705067788956第二十二頁,共一百六十八頁,2022年,8月28日實(shí)現(xiàn)步驟圖3-6“Frequencies:Statistics”對話框(四)第二十三頁,共一百六十八頁,2022年,8月28日3.4.3結(jié)果和討論第二十四頁,共一百六十八頁,2022年,8月28日3.5.1統(tǒng)計(jì)學(xué)上的定義和計(jì)算公式3.5

方差(Variance)和標(biāo)準(zhǔn)差(StandardDeviation)定義:方差是所有變量值與平均數(shù)偏差平方的平均值,它表示了一組數(shù)據(jù)分布的離散程度的平均值。標(biāo)準(zhǔn)差是方差的平方根,它表示了一組數(shù)據(jù)關(guān)于平均數(shù)的平均離散程度。方差和標(biāo)準(zhǔn)差越大,說明變量值之間的差異越大,距離平均數(shù)這個(gè)“中心”的離散趨勢越大。第二十五頁,共一百六十八頁,2022年,8月28日第二十六頁,共一百六十八頁,2022年,8月28日3.5.2SPSS中實(shí)現(xiàn)過程研究問題求某班級學(xué)生數(shù)學(xué)成績的方差和標(biāo)準(zhǔn)差,數(shù)據(jù)如表3-1所示。第二十七頁,共一百六十八頁,2022年,8月28日實(shí)現(xiàn)步驟圖3-7在菜單中選擇“Descriptives”命令第二十八頁,共一百六十八頁,2022年,8月28日圖3-8“Descriptives”對話框(一)第二十九頁,共一百六十八頁,2022年,8月28日圖3-9“Descriptives:Options”對話框(一)第三十頁,共一百六十八頁,2022年,8月28日3.5.3結(jié)果和討論第三十一頁,共一百六十八頁,2022年,8月28日3.6四分位數(shù)(Quartiles)、十分位數(shù)(Deciles)和百分位數(shù)(Percentiles)3.6.1統(tǒng)計(jì)學(xué)上的定義定義:四分位數(shù)是將一組個(gè)案由小到大(或由大到小)排序后,用3個(gè)點(diǎn)將全部數(shù)據(jù)分為四等份,與3個(gè)點(diǎn)上相對應(yīng)的變量稱為四分位數(shù),分別記為Q1(第一四分位數(shù))、Q2(第二四分位數(shù))、Q3(第三四分位數(shù))。其中,Q3到Q1之間的距離的一半又稱為四分位差,記為Q。四分位差越小,說明中間的數(shù)據(jù)越集中;四分位數(shù)越大,則意味著中間部分的數(shù)據(jù)越分散。第三十二頁,共一百六十八頁,2022年,8月28日十分位數(shù)是將一組數(shù)據(jù)由小到大(或由大到?。┡判蚝螅?個(gè)點(diǎn)將全部數(shù)據(jù)分為十等份,與9個(gè)點(diǎn)位置上相對應(yīng)的變量稱為十分位數(shù),分別記為D1,D2,…,D9,表示10%的數(shù)據(jù)落在D1下,20%的數(shù)據(jù)落在D2下,…,90%落在D9下。百分位數(shù)是將一組數(shù)據(jù)由小到大(或由大到?。┡判蚝蠓指顬?00等份,與99個(gè)分割點(diǎn)位置上相對應(yīng)的變量稱為百分位數(shù),分別記為P1,P2,…,P99,表示1%的數(shù)據(jù)落在P1下,2%的數(shù)據(jù)落在P2下,…,99%落在P99下。第三十三頁,共一百六十八頁,2022年,8月28日3.6.2SPSS中實(shí)現(xiàn)過程研究問題1求某班級學(xué)生數(shù)學(xué)成績的四分位數(shù),數(shù)據(jù)如表3-1所示。第三十四頁,共一百六十八頁,2022年,8月28日實(shí)現(xiàn)步驟圖3-10“Frequencies:Statistics”對話框(五)第三十五頁,共一百六十八頁,2022年,8月28日研究問題2測量54個(gè)某種機(jī)械零件的重量(克),求零件重量的D6,數(shù)據(jù)如表3-5所示。表3-5 零件的重量零件重量(克)465159544653375250514944494443465647525250475549475252424540606354405550564649534655444557525049554858425259第三十六頁,共一百六十八頁,2022年,8月28日實(shí)現(xiàn)步驟圖3-11“Frequencies:Statistics”對話框(六)第三十七頁,共一百六十八頁,2022年,8月28日圖3-12“Frequencies:Statistics”對話框(七)第三十八頁,共一百六十八頁,2022年,8月28日研究問題3測量出54個(gè)某種機(jī)械零件的重量(克),求零件重量的P37,數(shù)據(jù)如表3-5所示。第三十九頁,共一百六十八頁,2022年,8月28日實(shí)現(xiàn)步驟圖3-12“Frequencies:Statistics”對話框(七)第四十頁,共一百六十八頁,2022年,8月28日3.6.3結(jié)果和討論研究問題1的程序運(yùn)行結(jié)果如下表所示。第四十一頁,共一百六十八頁,2022年,8月28日研究問題2的程序運(yùn)行結(jié)果如下表所示。第四十二頁,共一百六十八頁,2022年,8月28日研究問題3的程序運(yùn)行結(jié)果如下表所示。第四十三頁,共一百六十八頁,2022年,8月28日3.7頻數(shù)(Frequency)3.7.1統(tǒng)計(jì)學(xué)上的定義和計(jì)算公式定義:頻數(shù)就是一個(gè)變量在各個(gè)變量值上取值的個(gè)案數(shù)。如要了解學(xué)生某次考試的成績情況,需要計(jì)算出學(xué)生所有分?jǐn)?shù)取值,以及每個(gè)分?jǐn)?shù)取值有多少個(gè)人,這就需要用到頻數(shù)分析。變量的頻數(shù)分析正是實(shí)現(xiàn)上述分析的最好手段,它可以使人們非常清楚地了解變量取值的分布情況。第四十四頁,共一百六十八頁,2022年,8月28日3.7.2SPSS中實(shí)現(xiàn)過程研究問題10個(gè)學(xué)生在某次數(shù)學(xué)、語文、化學(xué)考試中成績?nèi)绫?-6所示,試求學(xué)生在3門課程上的頻數(shù)分布。第四十五頁,共一百六十八頁,2022年,8月28日表3-6 學(xué)生成績姓名數(shù)學(xué)語文化學(xué)hxh99.0098.00100.00yaju88.0089.0045.00yu99.0080.0056.00shizg89.0078.0067.00hah94.0078.0078.00lisa90.0089.0087.00watet79.0087.0089.00jess75.0076.0097.00wish89.0056.0076.00iiakii80.0076.00100.00第四十六頁,共一百六十八頁,2022年,8月28日實(shí)現(xiàn)步驟圖3-13“Frequencies”對話框(二)第四十七頁,共一百六十八頁,2022年,8月28日3.7.3結(jié)果和討論程序運(yùn)行結(jié)果如下表所示。第四十八頁,共一百六十八頁,2022年,8月28日3.8峰度(Kurtosis)3.8.1統(tǒng)計(jì)學(xué)上的定義和計(jì)算公式定義:峰度是描述某變量所有取值分布形態(tài)陡緩程度的統(tǒng)計(jì)量。這個(gè)統(tǒng)計(jì)量是與正態(tài)分布相比較的量,峰度為0表示其數(shù)據(jù)分布與正態(tài)分布的陡緩程度相同;峰度大于0表示比正態(tài)分布高峰要更加陡峭,為尖頂峰;峰度小于0表示比正態(tài)分布的高峰要平坦,為平頂峰。具體的計(jì)算公式為第四十九頁,共一百六十八頁,2022年,8月28日3.8.2SPSS中實(shí)現(xiàn)過程研究問題某班級40個(gè)學(xué)生的年齡分布如表3-7所示,試求學(xué)生年齡峰度。表3-7 學(xué)生年齡年齡人數(shù)1811972022218222第五十頁,共一百六十八頁,2022年,8月28日實(shí)現(xiàn)步驟圖3-14在Data菜單中選擇“WeightCases”命令第五十一頁,共一百六十八頁,2022年,8月28日3.8.3結(jié)果和討論第五十二頁,共一百六十八頁,2022年,8月28日3.9偏度(Skewness)3.9.1統(tǒng)計(jì)學(xué)上的定義和計(jì)算公式定義:偏度也是描述數(shù)據(jù)分布形態(tài)的,它是描述某變量取值分布對稱性的統(tǒng)計(jì)量。具體的計(jì)算公式為第五十三頁,共一百六十八頁,2022年,8月28日這個(gè)統(tǒng)計(jì)量是與正態(tài)分布相比較的量,偏度為0表示其數(shù)據(jù)分布形態(tài)與正態(tài)分布偏度x相同;偏度大于0表示正偏差數(shù)值較大,為正偏或右偏,即有一條長尾巴拖在右邊;偏度小于0表示負(fù)偏差數(shù)值大,為負(fù)偏或左偏,有一條長尾拖在左邊。而偏度的絕對值數(shù)值越大表示分布形態(tài)的偏斜程度越大。第五十四頁,共一百六十八頁,2022年,8月28日3.9.2SPSS中實(shí)現(xiàn)過程研究問題某班級41個(gè)學(xué)生的身高分布如表3-8所示,試求學(xué)生身高分布偏度。表3-8 學(xué)生身高身高(cm)人數(shù)1651168717022173817521801第五十五頁,共一百六十八頁,2022年,8月28日實(shí)現(xiàn)步驟圖3-17“Frequencies:Statistics”對話框(九)第五十六頁,共一百六十八頁,2022年,8月28日3.9.3結(jié)果和討論第五十七頁,共一百六十八頁,2022年,8月28日3.10標(biāo)準(zhǔn)化Z分?jǐn)?shù)及其線性轉(zhuǎn)換3.10.1統(tǒng)計(jì)學(xué)上的定義和計(jì)算公式第五十八頁,共一百六十八頁,2022年,8月28日第五十九頁,共一百六十八頁,2022年,8月28日3.10.2SPSS中實(shí)現(xiàn)過程研究問題1求某班級學(xué)生數(shù)學(xué)成績的Z分?jǐn)?shù),數(shù)據(jù)如表3-1所示。第六十頁,共一百六十八頁,2022年,8月28日實(shí)現(xiàn)步驟圖3-18“Descriptives”對話框(二)第六十一頁,共一百六十八頁,2022年,8月28日圖3-19“Descriptives:Options”對話框(二)第六十二頁,共一百六十八頁,2022年,8月28日圖3-20數(shù)據(jù)編輯窗口第六十三頁,共一百六十八頁,2022年,8月28日研究問題2從圖3-20中可以看到學(xué)生數(shù)學(xué)成績的Z分?jǐn)?shù)有正有負(fù),而且小數(shù)點(diǎn)位數(shù)較多,因此可以把它線性轉(zhuǎn)換為T分?jǐn)?shù)。第六十四頁,共一百六十八頁,2022年,8月28日實(shí)現(xiàn)步驟圖3-21在菜單中選擇“ComputeVariable”命令第六十五頁,共一百六十八頁,2022年,8月28日圖3-22“ComputeVariable”對話框第六十六頁,共一百六十八頁,2022年,8月28日

圖3-23“ComputeVariable:Type”對話框第六十七頁,共一百六十八頁,2022年,8月28日圖3-24數(shù)據(jù)編輯窗口第六十八頁,共一百六十八頁,2022年,8月28日3.10.3結(jié)果和討論從Z分?jǐn)?shù)(圖3-20)和T分?jǐn)?shù)(圖3-24)的結(jié)果中可以看出此班級學(xué)生數(shù)學(xué)成績的T分?jǐn)?shù)比之前的Z分?jǐn)?shù)簡潔多了,比較起來一目了然。第六十九頁,共一百六十八頁,2022年,8月28日3.11探索分析3.11.1統(tǒng)計(jì)學(xué)上的定義和計(jì)算公式定義:調(diào)用此過程可對變量進(jìn)行更為深入詳盡的描述性統(tǒng)計(jì)分析,故稱之為探索分析。它在一般描述性統(tǒng)計(jì)指標(biāo)的基礎(chǔ)上,增加有關(guān)數(shù)據(jù)其他特征的文字與圖形描述,顯得更加細(xì)致與全面,有助于用戶思考對數(shù)據(jù)進(jìn)行進(jìn)一步分析的方案。第七十頁,共一百六十八頁,2022年,8月28日1.探索分析的內(nèi)容包括下面幾個(gè)方面檢查數(shù)據(jù)是否有錯誤:過大或過小的數(shù)據(jù)均有可能是奇異值、影響點(diǎn)或錯誤數(shù)據(jù)。要找出這樣的數(shù)據(jù),并分析原因,然后決定是否從分析中刪除這些數(shù)據(jù)。因?yàn)槠娈愔岛陀绊扅c(diǎn)往往對分析的影響較大,不能真實(shí)反映數(shù)據(jù)的總體特征。對數(shù)據(jù)規(guī)律的初步觀察:通過初步觀察獲得數(shù)據(jù)的一些內(nèi)部規(guī)律,例如,兩個(gè)變量間是否線性相關(guān)。第七十一頁,共一百六十八頁,2022年,8月28日2.探索分析的考察方法探索分析一般通過數(shù)據(jù)文件在分組與不分組的情況下,獲得常用統(tǒng)計(jì)量和圖形。一般以圖形方式輸出,直觀幫助用戶確定奇異值、影響點(diǎn)、進(jìn)行假設(shè)檢驗(yàn),以及確定用戶要使用的某種統(tǒng)計(jì)方式是否合適。第七十二頁,共一百六十八頁,2022年,8月28日3.正態(tài)分布檢驗(yàn)常用的正態(tài)分布檢驗(yàn)是Q-Q圖。本例中進(jìn)行了正態(tài)分布檢驗(yàn)。第七十三頁,共一百六十八頁,2022年,8月28日4.方差齊次性檢驗(yàn)對數(shù)據(jù)分析不僅需要進(jìn)行正態(tài)分布檢驗(yàn),有時(shí)候還需要比較各個(gè)分組的方差是否相同,這就要進(jìn)行方差齊次性檢驗(yàn)。例如,在進(jìn)行獨(dú)立右邊的T檢驗(yàn)之前,就需要事先確定兩個(gè)數(shù)據(jù)的方差是否相同。如果通過分析發(fā)現(xiàn)各個(gè)方差不同,還需要對數(shù)據(jù)進(jìn)行方差分析,那么就需要對數(shù)據(jù)進(jìn)行轉(zhuǎn)換使得方差盡可能相同。在探索分析中可以使用Levene檢驗(yàn)。第七十四頁,共一百六十八頁,2022年,8月28日Levene檢驗(yàn)對數(shù)據(jù)進(jìn)行方差齊次性檢驗(yàn)時(shí),不強(qiáng)求數(shù)據(jù)必須服從正態(tài)分布,它先計(jì)算出各個(gè)觀測值減去組內(nèi)均值的差,然后再通過這些差值的絕對值進(jìn)行單因素方差分析。如果得到顯著性水平小于0.05,那么就可以拒絕方差相同的假設(shè)。第七十五頁,共一百六十八頁,2022年,8月28日3.11.2SPSS中實(shí)現(xiàn)過程研究問題20名10歲少兒的身高(cm)資料,數(shù)據(jù)如表3-9所示,試作探索性分析。第七十六頁,共一百六十八頁,2022年,8月28日表3-9 身高數(shù)據(jù)Id男孩身高(cm)女孩身高(cm)1123.00126.002125.00121.003127.00120.004130.00125.005134.10139.706135.80133.007140.40140.308136.00124.009128.20125.4010137.40137.5011135.50120.9012129.00138.8013132.20138.6014140.90141.4015129.30137.5016130.00137.0017121.40133.4018131.50132.7019132.60130.1020129.20136.70第七十七頁,共一百六十八頁,2022年,8月28日實(shí)現(xiàn)步驟圖3-25在菜單中選擇“Explore”命令第七十八頁,共一百六十八頁,2022年,8月28日圖3-26“Explore”對話框第七十九頁,共一百六十八頁,2022年,8月28日圖3-27“Explore:Statistics”對話框第八十頁,共一百六十八頁,2022年,8月28日圖3-28“Explore:Plots”對話框第八十一頁,共一百六十八頁,2022年,8月28日圖3-29“Explore:Options”對話框第八十二頁,共一百六十八頁,2022年,8月28日3.11.3結(jié)果和討論在結(jié)果輸出窗口中將看到如下統(tǒng)計(jì)數(shù)據(jù)。(1)首先輸出如下個(gè)案觀察量摘要表,如下表所示。第八十三頁,共一百六十八頁,2022年,8月28日(2)然后輸出如下表格。第八十四頁,共一百六十八頁,2022年,8月28日(3)接著輸出如下4個(gè)不同權(quán)重下作中心趨勢的粗略最大似然確定數(shù),第八十五頁,共一百六十八頁,2022年,8月28日(4)再接著輸出百分位數(shù),也是分組后的百分位數(shù),如下表所示。第八十六頁,共一百六十八頁,2022年,8月28日(5)分別輸出兩個(gè)組中的最大5個(gè)數(shù)和最小5個(gè)數(shù),并且包括這些值對應(yīng)的ID,如下表所示。第八十七頁,共一百六十八頁,2022年,8月28日(6)輸出方差齊次性檢驗(yàn)結(jié)果。第八十八頁,共一百六十八頁,2022年,8月28日(7)系統(tǒng)還進(jìn)行數(shù)據(jù)的莖葉情形描述。圖3-30男孩身高的莖葉圖第八十九頁,共一百六十八頁,2022年,8月28日圖3-31女孩身高的莖葉圖第九十頁,共一百六十八頁,2022年,8月28日(8)系統(tǒng)輸出箱圖,如圖3-32所示。圖3-32箱圖第九十一頁,共一百六十八頁,2022年,8月28日(9)輸出Spreadvs.Level圖,如圖3-33所示。圖3-33Spreadvs.Level圖第九十二頁,共一百六十八頁,2022年,8月28日(10)輸出身高正態(tài)概率圖(NormalQ-QPlotof身高),如圖3-34所示。圖3-34男孩身高變量的正態(tài)概率圖第九十三頁,共一百六十八頁,2022年,8月28日圖3-35女孩身高變量的正態(tài)概率圖第九十四頁,共一百六十八頁,2022年,8月28日(11)輸出離散正態(tài)概率圖(DetrendedNormalQ-QPlotof身高),男孩身高如圖3-36所示,女孩身高如圖3-37所示。橫坐標(biāo)是身高,縱坐標(biāo)是和正態(tài)分布的偏離。第九十五頁,共一百六十八頁,2022年,8月28日圖3-36男孩身高離散正態(tài)概率圖第九十六頁,共一百六十八頁,2022年,8月28日圖3-37女孩身高離散正態(tài)概率圖第九十七頁,共一百六十八頁,2022年,8月28日3.12交叉列聯(lián)表分析3.12.1統(tǒng)計(jì)學(xué)上的定義和計(jì)算公式定義:前面的分析都是對單個(gè)變量的數(shù)據(jù)分布情況進(jìn)行分析。但在實(shí)際分析中,還需要掌握多個(gè)變量在不同取值情況下的數(shù)據(jù)分布情況,從而進(jìn)一步深入分析變量之間的相互影響和關(guān)系,這種分析就稱為交叉列聯(lián)表分析。第九十八頁,共一百六十八頁,2022年,8月28日交叉列聯(lián)表分析除了列出交叉分組下的頻數(shù)分布外,還需要分析兩個(gè)變量之間是否具有獨(dú)立性或一定的相關(guān)性。要獲得變量之間的相關(guān)性,僅僅靠頻數(shù)分布的數(shù)據(jù)是不夠的,還需要借助一些變量間相關(guān)程度的統(tǒng)計(jì)量和一些非參數(shù)檢驗(yàn)的方法。第九十九頁,共一百六十八頁,2022年,8月28日常用的衡量變量間相關(guān)程度的統(tǒng)計(jì)量是簡單相關(guān)系數(shù)(參見本書有關(guān)章節(jié)),但在交叉列聯(lián)表分析中,由于行列變量往往不是連續(xù)變量,不符合計(jì)算簡單相關(guān)系數(shù)的前提條件。因此需要根據(jù)變量的性質(zhì),選擇其他的相關(guān)系數(shù),如Kendall等級相關(guān)系數(shù)、Eta值等。第一百頁,共一百六十八頁,2022年,8月28日SPSS提供了多種適用于不同相關(guān)系數(shù)的相關(guān)關(guān)系,這些檢驗(yàn)的零假設(shè)是:行和列變量之間彼此獨(dú)立,不存在顯著的相關(guān)關(guān)系。SPSS將自動給出檢驗(yàn)的相伴概率,如果相伴概率小于顯著性水平0.05,那么應(yīng)拒絕零假設(shè),認(rèn)為行列變量之間彼此相關(guān)。第一百零一頁,共一百六十八頁,2022年,8月28日計(jì)算公式如下。(1)卡方統(tǒng)計(jì)量檢驗(yàn)是常用的檢驗(yàn)行列變量之間是否相關(guān)的方法。交叉列聯(lián)表的卡方檢驗(yàn)零假設(shè)是:行列變量之間獨(dú)立,計(jì)算公式為第一百零二頁,共一百六十八頁,2022年,8月28日卡方統(tǒng)計(jì)量服從(行數(shù)?1)×(列數(shù)?1)個(gè)自由度的卡方統(tǒng)計(jì),SPSS在自動計(jì)算卡方統(tǒng)計(jì)量后,還會給出相應(yīng)的相關(guān)概率。第一百零三頁,共一百六十八頁,2022年,8月28日(2)Contingencycoefficient:列聯(lián)系數(shù)。用于名義變量之間的相關(guān)系數(shù)計(jì)算。計(jì)算公式由卡方統(tǒng)計(jì)量修改而得,公式為其中,N為樣本系數(shù)第一百零四頁,共一百六十八頁,2022年,8月28日(3)PhiandCramer‘sV:ψ系數(shù)。用于名義變量之間的相關(guān)系數(shù)計(jì)算。計(jì)算公式由卡方統(tǒng)計(jì)量修改而得,公式為數(shù)值界于0~1之間,其中K為行數(shù)和列數(shù)較小的實(shí)際數(shù)。第一百零五頁,共一百六十八頁,2022年,8月28日3.12.2SPSS中實(shí)現(xiàn)過程研究問題用兩個(gè)班級學(xué)生進(jìn)行兩個(gè)感冒疫苗的試驗(yàn),兩個(gè)班級學(xué)生患感冒結(jié)果如表3-10所示,問兩個(gè)班級學(xué)生的患病比例有無差別。表3-10 兩班級學(xué)生的患病情況班級患病不患病153202404第一百零六頁,共一百六十八頁,2022年,8月28日實(shí)現(xiàn)步驟圖3-38“WeightCases”對話框第一百零七頁,共一百六十八頁,2022年,8月28日圖3-39在菜單中選擇“Crosstabs”命令第一百零八頁,共一百六十八頁,2022年,8月28日圖3-40“Crosstabs”對話框第一百零九頁,共一百六十八頁,2022年,8月28日圖3-41“Crosstabs:Statistics”對話框第一百一十頁,共一百六十八頁,2022年,8月28日圖3-42“Crosstabs:CellDisplay”對話框第一百一十一頁,共一百六十八頁,2022年,8月28日圖3-43“Crosstabs:TableFormat”對話框第一百一十二頁,共一百六十八頁,2022年,8月28日3.12.3結(jié)果和討論(1)先輸出如下個(gè)案處理摘要表。第一百一十三頁,共一百六十八頁,2022年,8月28日(2)下面所示表格是“班級”變量和“患病”變量的交叉列聯(lián)表結(jié)果表格。第一百一十四頁,共一百六十八頁,2022年,8月28日(3)交叉分組下頻數(shù)分布圖形,如圖3-44所示。第一百一十五頁,共一百六十八頁,2022年,8月28日(4)輸出卡方統(tǒng)計(jì)結(jié)果表。第一百一十六頁,共一百六十八頁,2022年,8月28日(5)輸出相對危險(xiǎn)度表格如下所示。 第一百一十七頁,共一百六十八頁,2022年,8月28日3.13多選項(xiàng)分析3.13.1統(tǒng)計(jì)學(xué)上的定義和計(jì)算公式定義:多選項(xiàng)分析是對多選項(xiàng)問題的分析方法。所謂多選項(xiàng)問題,就是一個(gè)問題的答案都是順序變量或名義變量,并且允許選擇的答案可以有多種組合。對于多選項(xiàng)問題,分解(編碼方案)的方法有兩種。第一百一十八頁,共一百六十八頁,2022年,8月28日1.多選項(xiàng)二分法(MultipleDichotomiesMethod)這種方法將每個(gè)可能的答案設(shè)置為一個(gè)SPSS變量,變量的取值有兩個(gè),分別表示選中或沒選中。這種方法的缺點(diǎn)是需要的變量數(shù)比較多。比如一道題目有6個(gè)選項(xiàng),則一道多選題目就需要用6個(gè)變量來表示。好處是比較簡單。第一百一十九頁,共一百六十八頁,2022年,8月28日2.多選項(xiàng)分類法(MultipleCategoryMethod)多選項(xiàng)分類法首先估計(jì)多選項(xiàng)問題可能出現(xiàn)的答案個(gè)數(shù)。比如一個(gè)多選題,如果最多有3個(gè)答案,那么就設(shè)置3個(gè)SPSS變量,分別用來存放3個(gè)可能的答案。如果某個(gè)案的答案只有兩個(gè),那么第3個(gè)SPSS變量取值為缺失值。第一百二十頁,共一百六十八頁,2022年,8月28日采用多選項(xiàng)分類法,進(jìn)行普通的頻數(shù)分析或交叉列聯(lián)表分析有時(shí)候不能達(dá)到我們的要求。比如,我們要了解某選項(xiàng)的選中次數(shù),就需要將3個(gè)變量中該選項(xiàng)的次數(shù)都累加起來,而不僅僅是一個(gè)變量中該選項(xiàng)的累加。針對這種情況,SPSS提供了多選項(xiàng)分析方法,專門針對多選項(xiàng)問題。SPSS在處理的過程中會自動地將3個(gè)變量中相同答案的頻率累加起來。第一百二十一頁,共一百六十八頁,2022年,8月28日3.13.2SPSS中實(shí)現(xiàn)過程研究問題1某商場對6種品牌的電視機(jī)進(jìn)行消費(fèi)者滿意度調(diào)查,隨機(jī)調(diào)查了20位消費(fèi)者,讓他們選出最滿意的3個(gè)電視機(jī)品牌,收集到相應(yīng)的數(shù)據(jù),如表3-11所示。試用多選項(xiàng)二分法利用SPSS對該問題進(jìn)行分析,包括頻數(shù)分析和交叉列聯(lián)表分析。第一百二十二頁,共一百六十八頁,2022年,8月28日表3-11 20名消費(fèi)者調(diào)查情況ID康佳長虹西湖TCL東芝創(chuàng)維性別110101012101100030001110410110005100101060011101701110018100011190011100100111000111110000121010011130111001141011000150011010161110000171110000180110011190111001201101001第一百二十三頁,共一百六十八頁,2022年,8月28日實(shí)現(xiàn)步驟圖3-45在菜單中選擇“DefineVariableSets”命令第一百二十四頁,共一百六十八頁,2022年,8月28日圖3-46“DefineMultipleResponseSets”對話框(一)第一百二十五頁,共一百六十八頁,2022年,8月28日圖3-47在菜單中選擇“Frequencies”命令第一百二十六頁,共一百六十八頁,2022年,8月28日圖3-48“MultipleResponseFrequencies”對話框(一)第一百二十七頁,共一百六十八頁,2022年,8月28日圖3-49“MultipleResponseCrosstabs”對話框(一)第一百二十八頁,共一百六十八頁,2022年,8月28日圖3-50“MultipleResponseCrosstabs:DefineVariable”對話框第一百二十九頁,共一百六十八頁,2022年,8月28日圖3-51“MultipleResponseCrosstabs:Options”對話框(一)第一百三十頁,共一百六十八頁,2022年,8月28日研究問題2上面實(shí)現(xiàn)過程是采用多選項(xiàng)二分法,本例采用多選項(xiàng)分類法對該問題進(jìn)行分析。在本次調(diào)查中,每個(gè)被調(diào)查人最多選擇3個(gè)品牌,因此有3個(gè)變量,用來保存每個(gè)被調(diào)查人的選擇,數(shù)據(jù)表格如3-12所示。第一百三十一頁,共一百六十八頁,2022年,8月28日表3-12 20名消費(fèi)者調(diào)查情況ID答案1答案2答案3性別115312134034560414305146063451723418561195340104230113120123611133241144310156340162310172130182631193241202141第一百三十二頁,共一百六十八頁,2022年,8月28日圖3-52“DefineMultipleResponseSets”對話框(二)實(shí)現(xiàn)步驟第一百三十三頁,共一百六十八頁,2022年,8月28日圖3-53“MultipleResponseFrequencies”對話框(二)第一百三十四頁,共一百六十八頁,2022年,8月28日圖3-54“MultipleResponseCrosstabs”對話框(二)第一百三十五頁,共一百六十八頁,2022年,8月28日圖3-55“MultipleResponseCrosstabs:options”對話框(二)第一百三十六頁,共一百六十八頁,2022年,8月28日3.13.3結(jié)果和討論上面分別采用了多選項(xiàng)二分法(研究問題1)和多選項(xiàng)分類法(研究問題2)對問題進(jìn)行分析。第一百三十七頁,共一百六十八頁,2022年,8月28日(1)多選項(xiàng)二分法頻數(shù)分析結(jié)果如下表所示。第一百三十八頁,共一百六十八頁,2022年,8月28日(2)下面所示結(jié)果表格是多選項(xiàng)二分法的交叉列聯(lián)表結(jié)果表格。第一百三十九頁,共一百六十八頁,2022年,8月28日下面說明研究問題2的結(jié)果。(1)多選項(xiàng)分類法頻數(shù)分析結(jié)果如下表所示。第一百四十頁,共一百六十八頁,2022年,8月28日(2)多選項(xiàng)分類法的交叉列聯(lián)表結(jié)果表格如下表所示。第一百四十一頁,共一百六十八頁,2022年,8月28日1.4.2SPSS的數(shù)據(jù)編輯窗口SPSS主界面主要有兩個(gè),一個(gè)是SPSS數(shù)據(jù)編輯窗口,另一個(gè)是SPSS輸出窗口。數(shù)據(jù)編輯窗口由標(biāo)題欄、菜單欄、工具欄、編輯欄、變量名欄、內(nèi)容區(qū)、窗口切換標(biāo)簽頁和狀態(tài)欄組成,如圖1-2所示。第一百四十二頁,共一百六十八頁,2022年,8月28日3.14基本統(tǒng)計(jì)分析的報(bào)表制作3.14.1報(bào)表分類本章上面各節(jié)討論了SPSS的一些基本統(tǒng)計(jì)功能。SPSS還提供了這些基本統(tǒng)計(jì)分析的報(bào)表制作功能,根據(jù)報(bào)表制作的側(cè)重點(diǎn)不同,可以分為以下3種。1.個(gè)案簡明統(tǒng)計(jì)報(bào)表(CasesSummary)2.行形式報(bào)表(ReportSummariesinRows)3.列形式報(bào)表(ReportSummariesinColumns)第一百四十三頁,共一百六十八頁,2022年,8月28日3.14.2SPSS中實(shí)現(xiàn)過程研究問題1—個(gè)案簡明統(tǒng)計(jì)報(bào)表某公司兩個(gè)部門共有20名員工,收集到員工的基本工資、獎金和分紅信息,生成個(gè)案簡明統(tǒng)計(jì)報(bào)表。數(shù)據(jù)如表3-13所示。第一百四十四頁,共一百六十八頁,2022年,8月28日表3-13 20名員工的收入部門基本工資獎金分紅0100015008000800130050008001300500080010004000800100040008001300500080010008000900100050009001300500080010004000800100040019001300500190010008001900100050019001300500190010004001900100040011100

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論