SPSS統(tǒng)計分析第7章 相關(guān)分析(教學課件)_第1頁
SPSS統(tǒng)計分析第7章 相關(guān)分析(教學課件)_第2頁
SPSS統(tǒng)計分析第7章 相關(guān)分析(教學課件)_第3頁
SPSS統(tǒng)計分析第7章 相關(guān)分析(教學課件)_第4頁
SPSS統(tǒng)計分析第7章 相關(guān)分析(教學課件)_第5頁
已閱讀5頁,還剩23頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第七章相關(guān)分析2021/8/231精品PPT模板主要內(nèi)容7.1相關(guān)分析簡介7.2兩變量相關(guān)分析7.3偏相關(guān)分析7.4距離分析2021/8/232精品PPT模板7.1相關(guān)分析簡介(1)函數(shù)關(guān)系與相關(guān)關(guān)系

變量之間的關(guān)系可以分為兩種:一種是函數(shù)關(guān)系,另一種是相關(guān)關(guān)系。函數(shù)關(guān)系是一一對應(yīng)的確定性關(guān)系,比較容易分析和測度??墒窃诂F(xiàn)實世界中,變量間的關(guān)系往往并不是簡單的確定性關(guān)系,也就是說,變量之間有著密切的關(guān)系,但又不能由一個或幾個變量的值確定另一個變量的值,即當自變量x取某一值時,因變量y的值可能會有多個。這種變量之間的非一一對應(yīng)的、不確定性的關(guān)系,稱之為相關(guān)關(guān)系。

(2)相關(guān)分析基本概念衡量事物之間,或稱變量之間線性相關(guān)程度的強弱并用適當?shù)慕y(tǒng)計指標表示出來,這個過程就是相關(guān)分析。相關(guān)系數(shù)是衡量變量之間相關(guān)程度的一個指標,總體的相關(guān)系數(shù)用ρ表示,樣本的相關(guān)系數(shù)用r表示。

2021/8/233精品PPT模板

相關(guān)關(guān)系的種類1按涉及的變量分:簡單相關(guān)和復(fù)相關(guān)2按表現(xiàn)形式分:線性相關(guān)和非線性相關(guān)3按變化方向分:正相關(guān)和負相關(guān)4按相關(guān)程度分:不相關(guān)、低度相關(guān)、顯著相關(guān)、高度相關(guān)和完全相關(guān)2021/8/234精品PPT模板主要內(nèi)容7.1相關(guān)分析簡介7.2兩變量相關(guān)分析7.3偏相關(guān)分析7.4距離分析2021/8/235精品PPT模板7.1二元變量相關(guān)分析(1)基本概念

二元變量的相關(guān)分析是指通過計算變量間兩兩相關(guān)的相關(guān)系數(shù),對兩個或兩個以上變量之間兩兩相關(guān)的程度進行分析。根據(jù)所研究的變量類型不同,又可以分為二元定距變量的相關(guān)分析和二元定序變量的相關(guān)分析。

(2)統(tǒng)計原理二元定距變量的相關(guān)分析:定距變量又稱為間隔(interval)變量(即連續(xù)屬性變量),變量值之間可以比較大小,可以用加減法計算出差異的大小。

Pearson簡單相關(guān)系數(shù)及t統(tǒng)計量

2021/8/236精品PPT模板7.1二元變量相關(guān)分析定序變量的相關(guān)性分析:定序變量又稱為有序(ordinal)變量、順序變量、等級變量,它取值的大小能夠表示觀測對象的某種順序關(guān)系(等級、方位或大小等)。定序變量的相關(guān)系數(shù)用斯皮爾曼(Spearman)相關(guān)系數(shù)和肯德爾(Kendall’s)相關(guān)系數(shù)來衡量。

Spearman相關(guān)系數(shù)及Z統(tǒng)計量Kendall’s等級相關(guān)系數(shù)及Z統(tǒng)計量2021/8/237精品PPT模板7.2二元變量相關(guān)分析(3)分析步驟第1步計算相關(guān)系數(shù)r:利用樣本數(shù)據(jù)計算樣本相關(guān)系數(shù),樣本相關(guān)系數(shù)反映了兩變量間線性相關(guān)程度的強弱。相關(guān)系數(shù)的取值范圍界于-1與1之間,即-1≤r≤1當0<r≤

1,表明變量之間存在正相關(guān)關(guān)系;當-1≤

r<0,表明變量之間存在負相關(guān)關(guān)系;當|r|=1時,表示其中一個變量的取值完全取決于另一個變量,二者即為函數(shù)關(guān)系;當r=0時,說明變量之間不存在線性相關(guān)關(guān)系,但這并不排除變量之間存在其它非線性相關(guān)的可能。

根據(jù)經(jīng)驗可將其相關(guān)程度分為幾種:當|r|≥0.8時視為高度相關(guān);當0.5≤|r|<0.8時視為中度相關(guān);當0.3≤|r|<0.5時視為低度相關(guān);當|r|<0.3時說明變量之間的相關(guān)性很弱。2021/8/238精品PPT模板第2步對樣本來自的兩總體是否存在顯著的線性關(guān)系進行推斷:由于存在抽樣的隨機性和樣本數(shù)量較少等原因,通常樣本相關(guān)系數(shù)不能直接用來說明樣本來自的兩總體是否具有顯著的線性相關(guān)性,需要通過假設(shè)檢驗的方式對樣本的總體進行統(tǒng)計推斷。提出零假設(shè)H0:即兩總體無顯著的線性關(guān)系;構(gòu)造檢驗統(tǒng)計量:由于不同的相關(guān)系數(shù)采用不同的檢驗統(tǒng)計量,因此在相關(guān)分析時,不同的過程需要構(gòu)造不同的檢驗統(tǒng)計量;計算檢驗統(tǒng)計量的觀測值及對應(yīng)的概率p值;對兩總體的相關(guān)性進行推斷:如果檢驗統(tǒng)計量的概率p值小于給定的顯著性水平,應(yīng)拒絕零假設(shè),即認為兩總體之間存在顯著性線性關(guān)系;反之,應(yīng)接受零假設(shè)。7.2二元變量相關(guān)分析2021/8/239精品PPT模板(4)SPSS實現(xiàn)舉例【例7-1】為了分析父親與兒子身高之間的相關(guān)性,現(xiàn)抽樣了12對父子的身高,數(shù)據(jù)如下表。請對其進行相關(guān)性分析(顯著性水平取α=0.05)。

7.2二元變量相關(guān)分析父親身高656367646862706668676971兒子身高686668656966686571676870第1步分析:身高是定距變量,考慮用Pearson相關(guān)系數(shù)來衡量。第2步數(shù)據(jù)的組織:分成兩列,一列是父親的身高,另一列是兒子的身高。

2021/8/2310精品PPT模板7.2二元變量相關(guān)分析第3步選擇菜單“分析→相關(guān)→雙變量”,打開如圖7-1所示的對話框,將“father”和“son”兩變量移入“變量”框中;“相關(guān)系數(shù)”選擇Pearson;在“顯著性檢驗”中選擇“雙側(cè)檢驗”;2021/8/2311精品PPT模板7.2二元變量相關(guān)分析第4步主要結(jié)果及分析。其中包括了叉積離差矩陣、協(xié)方差矩陣、Pearson相關(guān)系數(shù)及相伴概率p值。從表中可看出,相關(guān)系數(shù)為0.703>0,說明呈正相關(guān),而相伴概率值Sig.=0.005<0.05,因此應(yīng)拒絕零假設(shè)(H0:兩變量之間不具相關(guān)性),即說明兒子身高是受父親身高顯著性正影響的。

父親身高兒子身高父親身高Pearson相關(guān)性1.703*顯著性(雙側(cè))

.011平方與叉積的和84.66740.333協(xié)方差7.6973.667N1212兒子身高Pearson相關(guān)性.703*1顯著性(雙側(cè)).011

平方與叉積的和40.33338.917協(xié)方差3.6673.538N1212*.在

0.05水平(雙側(cè))上顯著相關(guān)。2021/8/2312精品PPT模板主要內(nèi)容7.1相關(guān)分析簡介7.2兩變量相關(guān)分析7.3偏相關(guān)分析7.4距離分析2021/8/2313精品PPT模板(1)基本概念

偏相關(guān)分析的任務(wù)就是在研究兩個變量之間的線性相關(guān)關(guān)系時控制可能對其產(chǎn)生影響的變量,這種相關(guān)系數(shù)稱為偏相關(guān)系數(shù)。偏相關(guān)系數(shù)的數(shù)值和簡單相關(guān)系數(shù)的數(shù)值常常是不同的,在計算簡單相關(guān)系數(shù)時,所有其他自變量不予考慮。

(2)統(tǒng)計原理控制一個變量和控制兩個變量的偏相關(guān)系數(shù)分別為:7.3偏相關(guān)分析2021/8/2314精品PPT模板檢驗的統(tǒng)計量為:(3)統(tǒng)計分析步驟第1步根據(jù)公式計算偏相關(guān)系數(shù);第2步對樣本來自的兩總體是否存在顯著性相關(guān)進行推斷。提出零假設(shè)H0:即兩總體的偏相關(guān)系數(shù)與零無顯著性差異;選擇檢驗統(tǒng)計量:偏相關(guān)分析選擇的是t統(tǒng)計量;計算t值及對應(yīng)的概率p值;決策:如果相伴概率p值小于給定的顯著性水平,則應(yīng)拒絕零假設(shè),認為兩總體的偏相關(guān)系數(shù)與零有顯著性差異;否則,接受原假設(shè)。

7.3偏相關(guān)分析2021/8/2315精品PPT模板(4)SPSS實現(xiàn)舉例【例7-3】下表是四川綿陽地區(qū)3年生中山柏的數(shù)據(jù),分析月生長量與月平均氣溫、月降雨量、月平均日照時數(shù)、月平均濕度4個氣候因素中哪些因素有關(guān)。

7.3偏相關(guān)分析月份月生長量月平均氣溫月降雨量月平均日照時數(shù)月平均濕度月份月生長量月平均氣溫月降雨量月平均日照時數(shù)月平均濕度10.014.21754.58171824.796.9101.68320.57.410.873.879819.324.5269.5164.68631.51017.484.775914.822194.881.683410.816.119.7137751010.31858.1848251321.1248.7149.67711813.14.979.381616.323.972.2109.5791216.812.666.5822021/8/2316精品PPT模板7.3偏相關(guān)分析第1步分析:這4個氣候因素彼此均有影響,分析時應(yīng)對生長量與4個氣候因素分別求偏相關(guān),如在求生長量與氣候因素的相關(guān)時控制其他因素的影響。所以需進行偏相關(guān)分析;第2步數(shù)據(jù)組織:如上表定義4個變量,輸入數(shù)據(jù)即可;第3步進行偏相關(guān)分析:選擇菜單“分析→相關(guān)→雙變量”,指定分析變量和控制變量,分析變量“hgrow”和“temp”的偏相關(guān)系數(shù),并將“rain”、“hsun”、“humi”設(shè)為控制變量。如下圖所示設(shè)置。2021/8/2317精品PPT模板第4步主要結(jié)果及分析。7.3偏相關(guān)分析從中可以看出,月降雨量、月平均日照時數(shù)和月平均濕度為控制變量,生長量與月平均氣溫關(guān)系密切,偏相關(guān)系數(shù)為0.977,雙尾檢測的相伴概率為0.000(表示趨近于0的正數(shù)),明顯小于顯著性水平0.05。故應(yīng)拒絕原假設(shè),說明中山柏的生長量與氣溫間存在顯著的相關(guān)性??刂谱兞可L量月平均氣溫月降雨量

&月平均日照時數(shù)

&月平均濕度生長量相關(guān)性1.000.977顯著性(雙側(cè))..000df07月平均氣溫相關(guān)性.9771.000顯著性(雙側(cè)).000.df702021/8/2318精品PPT模板主要內(nèi)容7.1相關(guān)分析簡介7.2兩變量相關(guān)分析7.3偏相關(guān)分析7.4距離分析2021/8/2319精品PPT模板(1)基本概念距離分析是對觀測量之間相似或不相似程度的一種測度,是計算一對觀測量之間的廣義距離。這些相似性或距離測度可以用于其他分析過程,例如因子分析、聚類分析或多維定標分析,有助于分析復(fù)雜的數(shù)據(jù)集。

(2)統(tǒng)計原理不相似性測度對定距數(shù)據(jù)的不相似性(距離)測度可以使用的統(tǒng)計量有:歐幾里得距離、平方歐氏距離、切比雪夫距離、Block距離、明可斯基距離等。對定序數(shù)據(jù),主要使用卡方不相似測度和斐方測度。對二值(只有兩種取值)數(shù)據(jù)變量之間的距離描述,使用歐氏距離、平方歐氏距離、尺寸差異、模式差異、方差、形或蘭斯和威廉斯等距離統(tǒng)計量。7.4距離分析2021/8/2320精品PPT模板相似性測度對于定距數(shù)據(jù)主要使用皮爾遜相關(guān)系數(shù)和夾角余弦距離;對于二值數(shù)據(jù)的相似性測度主要包括簡單匹配系數(shù)、Jaccard相似性指數(shù)、Hamann相似性測度等20余種。7.4距離分析其中的距離又分為個案(觀測記錄)之間的距離和變量之間的距離兩種。(3)分析步驟

距離分析中不存在假設(shè)檢驗問題,主要是通過SPSS自動計算變量或個案之間的相似性或不相似性距離,根據(jù)其計算距離值的大小來確定變量或個案之間的相似性或不相似性的強弱。2021/8/2321精品PPT模板(4)SPSS實現(xiàn)舉例【例7-4】已知我國四城市2004年各月的日照時數(shù)如下表所示,請分析各城市日照數(shù)是否近似。7.4距離分析月份北京天津石家莊大連月份北京天津石家莊大連1194.7161.7193.8163.57203.2179.5185.4228.52213.5185.2219.2195.38187.4149.8152.11743243.6166.8220.9223.19198.9178.7203.4202.74248.2214.3240.9276.910225.2194.7220.7228.45253.3221277.9243.411201.4172.8197.5172.96202182.5213.419012144119.197.91672021/8/2322精品PPT模板第1步分析:這是考查4個城市的日照時數(shù)是否相似的問題,可用距離分析實現(xiàn)。既可以計算其相似性測度,亦可計算其不相似性測度;第2步數(shù)據(jù)組織:分別定義的變量:month”(月份)(用字符型變量)、“Beijing”(北京)、“Tianjin”(天津)、“ShiJZ”(石家莊)、“Dalian”(大連)。7.4距離分析2021/8/2323精品PPT模板7.4距離分析第3步進行距離分析:選擇菜單“分析→相關(guān)→距離”,彈出下圖所示的“距離”對話框,將4個變量(“北京”、“天津”、“石家莊”、“大連”)移入“變量”框中進行相似性度量計算;在“計算距離”組中選中“個案間”單選框,進行變量間的距離分析;在“度量標準”單選框組中選中不相似性,求解其不相似性度量。

2021/8/2324精品PPT模板第4步主要結(jié)果及分析。7.4距離分析表格的第一行(Euclidean距離)說明采用的是歐氏距離。這是一個對稱矩陣,當兩變量的歐氏距離越大,說明其差別越大,反之越小。從表中可看出“北京”和“大連”的日照數(shù)最接近,而“北京”和“天津”的日照數(shù)相差最大。

Euclidean距離北京天津石家莊大連北京.000122.93371.28070.542天津122.933.000111.350121.427石家莊71.280111.350.000110.928大連70.542121.427110.928.000這是一個不相似性矩陣。2021/8/2325精品PPT模板TheEnd2021/8/2326精品PPT模板9、人的價值,在招收誘惑的一瞬間被決定。03-2月-2303-2月-23Friday,February3,202310、低頭要有勇氣,抬頭要有低氣。***2/3/20234:38:43PM11、人總是珍惜為得到。03-2月-23**Feb-2303-Feb-2312、人亂于心,不寬余請。***Friday,Februar

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論