SPSS相關(guān)分析案例講解要點(diǎn)_第1頁
SPSS相關(guān)分析案例講解要點(diǎn)_第2頁
SPSS相關(guān)分析案例講解要點(diǎn)_第3頁
SPSS相關(guān)分析案例講解要點(diǎn)_第4頁
SPSS相關(guān)分析案例講解要點(diǎn)_第5頁
已閱讀5頁,還剩10頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、15相關(guān)分析、兩個(gè)變量的相關(guān)分析:Bivariate1 .相關(guān)系數(shù)的含義相關(guān)分析是研究變量間密切程度的一種常用統(tǒng)計(jì)方法。相關(guān)系數(shù)是描述相關(guān)關(guān)系強(qiáng)弱程度和方向的統(tǒng)計(jì)量,通常用 r表示。相關(guān)系數(shù)的取值范圍在-1和+1之間,即:-1<r< 1。計(jì)算結(jié)果,若r為正,則表明兩變量為正相關(guān);若 r為負(fù),則表明兩變量 為負(fù)相關(guān)。相關(guān)系數(shù)r的數(shù)值越接近于1 (-1或+1),表示相關(guān)系數(shù)越強(qiáng);越接近于 0,表示相關(guān)系數(shù)越弱。如果r=1或T,則表示兩個(gè)現(xiàn)象完全直線性相關(guān)。如果 =0,則表示兩個(gè)現(xiàn)象完全不相關(guān)(不是直線相關(guān))。r <0.3 ,稱為微弱相關(guān)、0.3 M r <0.5,稱為低度相

2、關(guān)、0.5 W r <0.8,稱為顯著(中度)相關(guān)、0.8 M r <1 ,稱為高度相關(guān)r值很小,說明X與Y之間沒有線性相關(guān)關(guān)系,但并不意味著 X與Y之 間沒有其它關(guān)系,如很強(qiáng)的非線性關(guān)系。直線相關(guān)系數(shù)一般只適用與測定變量間的線性相關(guān)關(guān)系,若要衡量非線性相關(guān)時(shí),一般應(yīng)采用相關(guān)指數(shù)Ro2 .常用的簡單相關(guān)系數(shù)1890年由英國統(tǒng)計(jì)學(xué)家卡爾?皮爾遜Pearson系數(shù)法。計(jì)算公式如下:(1)(1)皮爾遜(Pearson)相關(guān)系數(shù) 皮爾遜相關(guān)系數(shù)亦稱積矩相關(guān)系數(shù), 提出。定距變量之間的相關(guān)關(guān)系測量常用nx (Xi -X)(yi -y) i3r = nn'、(為-x)2x (yi -y

3、)2 i Wi 衽(1)式是樣本的相關(guān)系數(shù)。計(jì)算皮爾遜相關(guān)系數(shù)的數(shù)據(jù)要求:變量都是服從正態(tài)分布,相互獨(dú)立的連續(xù)數(shù)據(jù);兩個(gè)變量在散點(diǎn)圖上有線性相關(guān)趨勢;樣本容量n >300(2)斯皮爾曼(Spearman )等級相關(guān)系數(shù)Spearman相關(guān)系數(shù)又稱秩相關(guān)系數(shù),是用來測度兩個(gè)定序數(shù)據(jù)之間的線性 相關(guān)程度的指標(biāo)。當(dāng)兩組變量值以等級次序表示時(shí),可以用斯皮爾曼等級相關(guān)系數(shù)反映變量問 的關(guān)系密切程度。它是根據(jù)數(shù)據(jù)的秩而不是原始數(shù)據(jù)來計(jì)算相關(guān)系數(shù)的,其計(jì)算 過程包括:對連續(xù)數(shù)據(jù)的排秩、對離散數(shù)據(jù)的排序,利用每對數(shù)據(jù)等級的差額及 差額平方,通過公式計(jì)算得到相關(guān)系數(shù)。其計(jì)算公式為:(2)6% d2R =1

4、 一 '2n n -1(2)式中,為等級相關(guān)系數(shù);d為每對數(shù)據(jù)等級之差;n為樣本容量。斯皮爾曼等級相關(guān)對數(shù)據(jù)條件的要求沒有積差相關(guān)系數(shù)嚴(yán)格,只要兩個(gè)變量的觀測值是成對的等級評定資料,或者是由連續(xù)變量觀測資料轉(zhuǎn)化得到的等級資 料,不論兩個(gè)變量的總體分布形態(tài)、樣本容量的大小如何,都可以用斯皮爾曼等 級相關(guān)來進(jìn)行研究。(3)肯德爾(Kendall)等級相關(guān)系數(shù)肯德爾(Kendall)等級相關(guān)系數(shù)是在考慮了結(jié)點(diǎn)(秩次相同)的條件下,測 度兩組定序數(shù)據(jù)或等級數(shù)據(jù)線性相關(guān)程度的指標(biāo)。它利用排序數(shù)據(jù)的秩,通過計(jì) 算不一致數(shù)據(jù)對在總數(shù)據(jù)對中的比例, 來反映變量間的線性關(guān)系的。其計(jì)算公式 如下:(3)4

5、% iK = 1 - n n -1(3)式中,也是肯德爾等級相關(guān)系數(shù);i是不一致數(shù)據(jù)對數(shù);n為樣本容量。計(jì)算肯德爾等級相關(guān)系數(shù)的數(shù)據(jù)要求與計(jì)算斯皮爾曼等級相關(guān)系數(shù)的數(shù)據(jù) 要求相同。3 .相關(guān)系數(shù)的顯著性檢驗(yàn)通常,我們用樣本相關(guān)系數(shù)r作為總體相關(guān)系數(shù)p的估計(jì)值,而r僅說明樣 本數(shù)據(jù)的X與Y的相關(guān)程度。有時(shí)候,由于樣本數(shù)據(jù)太少或其它偶然因素,使 得樣本相關(guān)系數(shù)r值很大,而總體的X與Y并不存在真正的線性關(guān)系。因而有 必要通過樣本資料來對 X與Y之間是否存在真正的線性相關(guān)進(jìn)行檢驗(yàn),即檢驗(yàn) 總體相關(guān)系數(shù)p是否為零(即原假設(shè)是:總體中兩個(gè)變量間的相關(guān)系數(shù)為0)。SPSS的相關(guān)分析過程給出了該假設(shè)成立的概率

6、(輸出結(jié)果中的Sig.)樣本簡單相關(guān)系數(shù)的檢驗(yàn)方法為:當(dāng)原假設(shè)H。: P = 0, n250時(shí),檢驗(yàn)統(tǒng)計(jì)量為:(4)當(dāng)原假設(shè)H0: P = 0, n < 50時(shí),檢驗(yàn)統(tǒng)計(jì)量為:式中,r為簡單相關(guān)系數(shù);n為觀測值個(gè)數(shù)(或樣本容量)。4 .背景材料設(shè)有10個(gè)廠家,序號為1, 2,,10,各廠的投入成本記為x,所得產(chǎn)出記為y。各廠家的投入和產(chǎn)出如表7-18-1所示,根據(jù)這些數(shù)據(jù),可以認(rèn)為投入和產(chǎn)出之間存在相關(guān)性嗎?廠家12345678910投入20402030101020202030產(chǎn)出30604060304040503070表110個(gè)廠家的投入產(chǎn)出單位:萬元5 .操作步驟5-1繪制散點(diǎn)圖的步

7、驟(1)選擇菜單命令 " Graphs” 一 “Legacy Dialogs” 一 “ Scatter/Dot”,打開 Scatter/Dot對話框,如圖1所示。圖1選擇散點(diǎn)圖窗口(2)選擇散點(diǎn)圖類型。SPSS提供了五種類型的散點(diǎn)圖(3)根據(jù)所選擇的散點(diǎn)圖類型,單擊“ Define”按鈕設(shè)置散點(diǎn)圖。不同類型 的散點(diǎn)圖的設(shè)置略有差別。簡單散點(diǎn)圖(Simple Scatter)簡單散點(diǎn)圖的設(shè)置窗口如圖2所示。圖2簡單散點(diǎn)圖的設(shè)置窗口從對話框左側(cè)的變量列表中指定某個(gè)變量為散點(diǎn)圖的縱坐標(biāo)和橫坐標(biāo),分別選入Y-Axis和X-Axis框中。這兩項(xiàng)是必選項(xiàng)??梢园炎鳛榉纸M的變量指定到 Set Ma

8、rkers by框中,根據(jù)該變量取值的不同 對同一個(gè)散點(diǎn)圖中的各點(diǎn)標(biāo)以不同的顏色(或形狀)。該項(xiàng)可以省略。把標(biāo)記變量指定到Label Cases by框中,表示將標(biāo)記變量的各變量值標(biāo)記在 散點(diǎn)圖的旁邊。該項(xiàng)可以省略。從左側(cè)變量列表框中選擇變量到 Panel by框中作為分類變量,可以使該變量 作為行(Rows)或列(Columns)將數(shù)據(jù)分成不同的組,便于比較。該項(xiàng)可以省 略。選才U Use Chart Specifications From圖項(xiàng),可以選擇散點(diǎn)圖的文件模板,單擊“File”可以選擇指定的文件。單擊“Title”按鈕可以對散點(diǎn)圖的標(biāo)題進(jìn)行設(shè)置,單擊“ Options”按鈕可以 對

9、缺失值以及是否顯示數(shù)據(jù)的標(biāo)注進(jìn)行設(shè)置。重疊散點(diǎn)圖(Overlay Scatter)重疊散點(diǎn)圖能同時(shí)生成多對相關(guān)變量間統(tǒng)計(jì)關(guān)系的散點(diǎn)圖,首先根據(jù)分類變量的不同取值對原始數(shù)據(jù)進(jìn)行分類, 然后對各分類數(shù)據(jù)做簡單散點(diǎn)圖。重疊散點(diǎn) 圖的設(shè)置窗口如圖7-18-3所示。圖3重疊散點(diǎn)圖的設(shè)置窗口從左側(cè)框中選擇一對變量進(jìn)入Pairs框中,其中前一個(gè)為圖的縱坐標(biāo)變量(Y-Variable),后一個(gè)作為圖的橫軸變量(X-Variable),可以通過點(diǎn)擊匚至二按鈕進(jìn)行橫縱軸變量的調(diào)換。其他設(shè)置與同簡單散點(diǎn)圖都相同。矩陣散點(diǎn)圖(Matrix Scatter)矩陣散點(diǎn)圖以方形矩陣的形式在多個(gè)坐標(biāo)軸上分別顯示多對變量間的統(tǒng)

10、計(jì)關(guān)系。矩陣散點(diǎn)圖的關(guān)鍵是弄清各矩陣單元中的橫縱變量。矩陣散點(diǎn)圖的設(shè)置窗口如圖4所示。圖4矩陣散點(diǎn)圖的設(shè)置窗口把參與繪圖的若干變量指定到 Matrix Variables框中。選擇變量的先后順序決 定了矩陣對角線上變量的排列順序。其他設(shè)置也與簡單散點(diǎn)圖相同。三維散點(diǎn)圖(3-D Scatter-)三維散點(diǎn)圖生成三個(gè)相關(guān)變量的三維散點(diǎn)圖,由三個(gè)坐標(biāo)軸對應(yīng)變量的數(shù)據(jù)決定,它以立體圖的形式展現(xiàn)三對變量間的統(tǒng)計(jì)關(guān)系。設(shè)置窗口如圖 5所示。圖5三維散點(diǎn)圖設(shè)置窗口從左側(cè)的變量列表中指定三個(gè)變量分別選入Y-Axis、X-Axis、Z-Axis框中。其他設(shè)置均與簡單散點(diǎn)圖相同。單點(diǎn)散點(diǎn)圖(Sample Dot)

11、單點(diǎn)散點(diǎn)圖生成單個(gè)變量的散點(diǎn)圖,顯示數(shù)值型變量的每一個(gè)觀測值,這些 值都堆積在X軸附近,由于沒有指定Y軸,所以數(shù)據(jù)點(diǎn)的Y坐標(biāo)沒有特殊的含 義。設(shè)置窗口如圖6所示。圖6單點(diǎn)散點(diǎn)圖設(shè)置窗口從左側(cè)變量列表中選擇一個(gè)變量選入 X-Axis Variable框中。其他設(shè)置與簡單 散點(diǎn)圖相同。5-2計(jì)算簡單相關(guān)系數(shù)的操作步驟通過散點(diǎn)圖可以初步判斷變量是否具有線性趨勢。對具有線性趨勢的變量計(jì) 算相應(yīng)的簡單相關(guān)系數(shù)的步驟如下:(1)選擇菜單命令 " Analyze” 一 “Correlate” 一 “Bivariate”,打開兩變量 相關(guān)分析的對話框,如圖7所示。圖7兩變量相關(guān)分析窗口(1) 選入需

12、要進(jìn)行相關(guān)分析的變量進(jìn)入 Variables框,至少需要選入兩個(gè), 如選入“投入”、“產(chǎn)出”變量。(2) 在Correlation Coefficients復(fù)選框中選擇需要計(jì)算的相關(guān)系數(shù)。主要有:Pearson復(fù)選框:選擇進(jìn)行積距相關(guān)分析,即最常用的參數(shù)相關(guān)分析;Kendall'stau-b復(fù)選框:計(jì)算 Kendall's等級相關(guān)系數(shù);Spearman復(fù)選框:計(jì)算 Spearman 相關(guān)系數(shù),即最常用的非參數(shù)相關(guān)分析(秩相關(guān))。(4) Test of Significance單選框用于確定是進(jìn)行相關(guān)系數(shù)的單側(cè) (One-tailed) 或雙側(cè)(Two-tailed)檢驗(yàn),系統(tǒng)默

13、認(rèn)雙側(cè)檢驗(yàn)。(5) Flag significant correlations用于確定是否在結(jié)果中用星號標(biāo)記有統(tǒng)計(jì)學(xué) 意義的相關(guān)系數(shù),一般選中。此時(shí) P<0.05的系數(shù)值旁會標(biāo)記一個(gè)星號,P<0.01 的則標(biāo)記兩個(gè)星號。(6)單擊Options按鈕,彈出Options對話框,選擇需要計(jì)算的描述統(tǒng)計(jì)量 和統(tǒng)計(jì)分析,如圖8所示。圖8兩變量相關(guān)分析的Options子對話框在 Statistics復(fù)選框中定義各變量輸出的描述統(tǒng)計(jì)量。Means and standarddeviations選項(xiàng)表示每個(gè)變量的樣本均值和標(biāo)準(zhǔn)差;Cross-product deviations andcovari

14、ances選項(xiàng)表示各對變量的離差平方和、樣本方差、兩變量的叉積離差以及 協(xié)方差陣。叉積離差為Pearso林目關(guān)系數(shù)公式中的分子部分;協(xié)方差為叉積離差 / (n-1)0在Missing Values單選框中定義分析中對缺失值的處理方法,可以是具體分 析用到的兩個(gè)變量有缺失值才去除該記錄(Exclude cases pairwise,或只要該記 錄中進(jìn)行相關(guān)分析的變量有缺失值(無論具體分析的兩個(gè)變量是否缺失),則在所有分析中均將該記錄去除(Excludes cases listwise。(7)單擊“OK”按鈕完成設(shè)置,提交運(yùn)行。6.結(jié)果解析根據(jù)背景資料,利用表1中的數(shù)據(jù),建立SPSS數(shù)據(jù)文件,分別

15、將變量投入、 產(chǎn)出選入Variables框中 ,并在 Options子對話框選中 Means and standard deviations 選項(xiàng)和Cross-product deviations and covariance蜒項(xiàng),其他選擇默認(rèn)。結(jié)果如表2、 表3所示。6-1表2為描述統(tǒng)計(jì)量,表3為相關(guān)分析結(jié)果。從表3中可以看出皮爾遜相 關(guān)系數(shù)為0.759,即投入與產(chǎn)出的相關(guān)系數(shù)為 0.759,雙側(cè)才驗(yàn)的P值為0.011, 明顯小于0.05,拒絕二者不相關(guān)的原假設(shè)。因此,我們可以得出結(jié)論:可以認(rèn)為 投入與產(chǎn)出之間存在正相關(guān),當(dāng)投入增加時(shí),產(chǎn)出也會相應(yīng)增加。表2描述統(tǒng)計(jì)量Descriptive

16、Statistics投入22.009.18910產(chǎn)出45.0014.33710MeanStd. DeviationN表3簡單相關(guān)系數(shù)分析結(jié)果Correlations投入產(chǎn)出投入Pearson Correlation1*.759Sig. (2-tailed).011Sum of Squares and760.000900.000Cross-productsCovariance84.444100.000N1010產(chǎn)出Pearson Correlation*.7591Sig. (2-tailed).011Sum of Squares and900.0001850.000Cross-productsC

17、ovariance100.000205.556N1010*. Correlation is significant at the 0.05 level (2-tailed).6-2調(diào)用Bivariate過程命令時(shí)允許同時(shí)輸入兩個(gè)變量或兩個(gè)以上變量,但系 統(tǒng)輸出的是變量間兩兩相關(guān)的相關(guān)系數(shù)。二、偏相關(guān)分析:Partial1 .偏相關(guān)分析的含義在實(shí)際問題中,兩變量的相關(guān)關(guān)系往往還要受到其他因素的影響,這些影響 有時(shí)候會使相關(guān)分析的結(jié)果變得不那么可靠。因此,引入了偏相關(guān)分析的方法。 偏相關(guān)分析,也稱凈相關(guān)分析,是指在研究兩個(gè)變量之間的線性相關(guān)關(guān)系時(shí),將與這兩個(gè)變量有聯(lián)系的其他變量控制不變的統(tǒng)計(jì)方法。

18、根據(jù)控制變量的個(gè)數(shù),偏 相關(guān)分析分為零階偏相關(guān)分析、一階偏相關(guān)分析、二階偏相關(guān)分析等等。其中, 零階偏相關(guān)分析是指沒有控制變量的相關(guān)分析,即一般的相關(guān)分析。一階偏相關(guān) 分析是指有一個(gè)控制變量的相關(guān)分析,二階偏相關(guān)分析是指有兩個(gè)控制變量的偏 相關(guān)分析,其他高階偏相關(guān)分析以此類推。2 .偏相關(guān)系數(shù)進(jìn)行偏相關(guān)分析時(shí)要用到偏相關(guān)系數(shù)。偏相關(guān)系數(shù)是在多元相關(guān)分析中說明 當(dāng)某個(gè)自變量在其他自變量固定不變時(shí), 分別同因變量線性相關(guān)程度的指標(biāo)。偏 相關(guān)系數(shù)的取值范圍亦在-1+1之間,其計(jì)算公式分別為:當(dāng)有一個(gè)控制變量為X2時(shí),變量X1和y之間的一階偏相關(guān)系數(shù)為:r . r r1 yxi 1 yx21X1X2/

19、 巾ryxi 的=i 2(6)(1 - ryx2 )(1 一1X2 )3 .對偏相關(guān)系數(shù)的檢驗(yàn)方法在偏相關(guān)分析中,由于兩個(gè)變量之間的相關(guān)系數(shù)是在固定(控制)了一個(gè)或 幾個(gè)變量后進(jìn)行的,考慮到這種因素及抽樣誤差的影響,其檢驗(yàn)統(tǒng)計(jì)量為:式中,r是特定的偏相關(guān)系數(shù);n為觀測值個(gè)數(shù);k為控制變量個(gè)數(shù);n-k-2 為自由度。4 .背景材料某汽車制造商從某月中隨機(jī)抽出 10天的電力消耗量、溫度、日產(chǎn)量等有關(guān) 資料,數(shù)據(jù)如表4所示。結(jié)合多年管理經(jīng)驗(yàn),對電力消耗量、溫度、日產(chǎn)量的關(guān) 系做出相關(guān)分析。表4某汽車制造商的電力消耗量、溫度、日產(chǎn)量等數(shù)據(jù)表電力消耗(千瓦)溫度(華氏)日r#12831201179110

20、13851289751011487105108110812841101177107148511211841195 .操作步驟5-1選擇菜單命令" Analyze” 一 “Correlate” 一 “Partial”,打開偏相關(guān)分析 的對話框,如圖9所示。圖9偏相關(guān)分析窗口5-2選入需要進(jìn)行偏相關(guān)分析的變量進(jìn)入 Variables框中,至少需要選入兩個(gè)。5-3選擇需要在偏相關(guān)分析時(shí)進(jìn)行控制的協(xié)變量進(jìn)入Controlling for框中,如果不選入,則進(jìn)行的就是普通的相關(guān)分析。5-4在Test of Significance單選框中確定是進(jìn)行相關(guān)系數(shù)的單側(cè)(One-tailed)或雙側(cè)(

21、Two-tailed)檢驗(yàn),一般選雙側(cè)檢驗(yàn)。5-5 Display actual significance level復(fù)選框用于表示在結(jié)果中給出確切的P值,一般選中。5-6單擊Options按鈕,彈出Options對話框,選擇需要計(jì)算的描述統(tǒng)計(jì)量和 統(tǒng)計(jì)分析。如圖10所示。圜 Partial Correfations: Options 4 6一St ali sli csIiii函_ Zero-order correlationsI Missing Values I* Exclude cases lisiwiserExclude cases gairwiseContinue Cancel Hel

22、p圖10偏相關(guān)分析的Options子對話框(1) Statistics復(fù)選框用于定義可選的描述統(tǒng)計(jì)量。其中,Means and standarddeviations表示每個(gè)變量的樣本均值和標(biāo)準(zhǔn)差;Zero-order correlations表示輸出包 括控制變量在內(nèi)所有變量的相關(guān)矩陣。(2) Missing Values單選框用于定義分析中對缺失值的處理方法,可以是具 體分析用到的兩個(gè)變量有缺失值才去除該記錄(Exclude cases pairwise ,或只要 該記錄中進(jìn)行相關(guān)分析的變量有缺失值(無論具體分析的兩個(gè)變量是否缺失),則在所有分析中均將該記錄去除(Excludes cases

23、 listwise)系統(tǒng)默認(rèn)為前者,以充 分利用數(shù)據(jù)。6.結(jié)果解析這里我們選擇電力消耗、溫度作為待分析變量,把日產(chǎn)量作為控制變量,在 Options子對話框中選中 Means and standard deviation選項(xiàng),其他選擇系統(tǒng)默認(rèn)。 具體分析結(jié)果見表4、表5所示。6-1表5偏相關(guān)系數(shù)表中的結(jié)果表明,在控制了日產(chǎn)量變量后,電力消耗與 溫度之間的偏相關(guān)系數(shù)為0.815,概率P值為0.007<0.05,從而表明兩者之間有 高度的相關(guān)關(guān)系。表4偏相關(guān)分析描述統(tǒng)計(jì)量DescriptiveStatisticsMeanStd. DeviationN電力消耗11.701.63610溫度82.003.88710日產(chǎn)量112.00

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論