![衛(wèi)生統(tǒng)計(jì)學(xué)-09-關(guān)聯(lián)性分析_第1頁(yè)](http://file4.renrendoc.com/view/4cf9f2779a247821795b316f1345c4d9/4cf9f2779a247821795b316f1345c4d91.gif)
![衛(wèi)生統(tǒng)計(jì)學(xué)-09-關(guān)聯(lián)性分析_第2頁(yè)](http://file4.renrendoc.com/view/4cf9f2779a247821795b316f1345c4d9/4cf9f2779a247821795b316f1345c4d92.gif)
![衛(wèi)生統(tǒng)計(jì)學(xué)-09-關(guān)聯(lián)性分析_第3頁(yè)](http://file4.renrendoc.com/view/4cf9f2779a247821795b316f1345c4d9/4cf9f2779a247821795b316f1345c4d93.gif)
![衛(wèi)生統(tǒng)計(jì)學(xué)-09-關(guān)聯(lián)性分析_第4頁(yè)](http://file4.renrendoc.com/view/4cf9f2779a247821795b316f1345c4d9/4cf9f2779a247821795b316f1345c4d94.gif)
![衛(wèi)生統(tǒng)計(jì)學(xué)-09-關(guān)聯(lián)性分析_第5頁(yè)](http://file4.renrendoc.com/view/4cf9f2779a247821795b316f1345c4d9/4cf9f2779a247821795b316f1345c4d95.gif)
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
9
關(guān)聯(lián)性分析分析目的各種分布的點(diǎn)與區(qū)間的參數(shù)生存率、
表的分布擬合單果變量估計(jì)性分析隨機(jī)區(qū)組/析因/交叉/重復(fù)測(cè)量/正交及其它設(shè)計(jì)的協(xié)方差分析Ho ling
T2檢驗(yàn)定量:t
/Z檢驗(yàn)、方差分析、秩和檢驗(yàn)定性:
檢驗(yàn)、秩和檢驗(yàn)、對(duì)比性分析多因單果單因多果單因單果簡(jiǎn)單線性相關(guān)/回歸、秩相關(guān)、列聯(lián)相關(guān)曲線相關(guān)(曲線擬和)??歸??典型相關(guān)、因子分析、復(fù)相關(guān)、偏相關(guān)相關(guān)回歸分析趨勢(shì)性分析多因單果單因多果單因單果多果聚積性分析聚類分析、主成分分析、通徑分析多元參考值評(píng)分、指數(shù)秩和比、層次模型、Topsis法Meta分析綜合評(píng)價(jià)分析單果或多果Kappa分析、協(xié)調(diào)系數(shù)協(xié)調(diào)性分析影響因素分析有兩個(gè)獨(dú)立的隨量:例如:父子的身高(X)、兒子的身高(Y)X1
Y1
、X2
Y2
、
X3
Y3
、
…、
Xn
Yn特點(diǎn):它們?cè)诳陀^上是有一定聯(lián)系的;在觀察時(shí)是獨(dú)立地去測(cè)量的;這兩個(gè)隨
量都服從正態(tài)分布;相關(guān)分析和回歸分析是否有聯(lián)系,聯(lián)系的方向、程度如何?相關(guān)或關(guān)聯(lián)定量指示相關(guān)或關(guān)聯(lián)的指標(biāo):如相關(guān)系數(shù)定量描述其依存關(guān)系回歸分析依存性(relationship)數(shù)學(xué)模型:如Y=f
(x)抽樣研究隨機(jī)抽樣保證樣本的合格性保證樣本間相互獨(dú)立如何保證一份作關(guān)聯(lián)性研究的樣本合格?關(guān)聯(lián)性分析概述兩個(gè)連續(xù)型隨
量的相關(guān)分析兩個(gè)分類變量間的關(guān)聯(lián)分析9.1
概述例9-1:下表為一項(xiàng)關(guān)于兒童健康和發(fā)展的研究中10名學(xué)齡兒童的身高和體重資料,試對(duì)學(xué)齡兒童的身高(cm)和體重(kg)進(jìn)行相關(guān)分析。表9-1 10名學(xué)齡兒童的身高和體重1
2
3
4
5
6
7
8
9
10身高
X
149.4 167.6
146.3
170.7
161.5
164.6
155.5 158.5
149.4
152.4體重
Y
30.8
42.6
33.1
44.0
36.3
40.8
32.7
35.4
33.1
31.8圖9-1 10名學(xué)齡兒童的身高和體重的散點(diǎn)圖1.散點(diǎn)圖Scatterplot363432303846444240145150155160身高/cm165170175體重/kg(158.5,35.4)(h)(f)(d)(b)(a)(c)(e)(g)ZeroCorrelationPositiveCorrelationNegativeCorrelationPositive
LinearNegative
LinearZeroCorrelationZeroCorrelationCurvilinearrelationship散點(diǎn)圖能直觀地看出兩變量是否存在相關(guān)關(guān)系,故研究?jī)勺兞筷P(guān)系應(yīng)先繪散點(diǎn)圖,再量化兩者的關(guān)系。(h)(f)(d)(b)(a)
(c)(e)(g)ZeroCorrelationPositiveCorrelationNegativeCorrelationPositive
Linear Negative
LinearZeroCorrelationZeroCorrelationCurvilinearrelationship散點(diǎn)圖能直觀地看出兩變量是否存在相關(guān)關(guān)系。故研究?jī)勺兞筷P(guān)系應(yīng)先繪散點(diǎn)圖,再量化兩者的關(guān)系。LinearRelationship線性相關(guān)(linearcorrelation):若兩個(gè)連續(xù)的隨
量間存
性聯(lián)系,則稱為~,也稱為簡(jiǎn)單相關(guān)(simple
correlation)。關(guān)聯(lián)(association):兩個(gè)分類變量間的聯(lián)系,則稱為~。兩個(gè)基本概念:相關(guān)的種類⑴正相關(guān)(positive
correlation):在圖中若Y有隨X增大而線性上升的趨勢(shì),則稱為正相關(guān)。⑵負(fù)相關(guān)(negative
correlation):在圖中若Y有隨X增大而線性下降的趨勢(shì),則稱為負(fù)相關(guān)。⑶零相關(guān)(zerocorrelation):在圖中若Y或X不隨另一變量的改變而改變,則稱為零相關(guān)。⑷非線性相關(guān)(
nonlinear
correlation
):散點(diǎn)圖呈曲線形狀,表明變量間呈曲線相關(guān),不是呈線性相關(guān)關(guān)系,也不宜作線性相關(guān)分析。線性相關(guān)系數(shù)
(linearcorrelation
coefficient):是定量描述兩個(gè)變量間線性聯(lián)系的強(qiáng)度和相關(guān)方向的統(tǒng)計(jì)學(xué)指標(biāo);又稱Pearson積矩相關(guān)系數(shù)(
Pearson
productmoment
coefficient
),總體相關(guān)系數(shù)用ρ表示表示方法樣本相關(guān)系數(shù)用r
表示2.
關(guān)聯(lián)強(qiáng)度的指標(biāo)323034424038364446175身高/cm體重/kg⑴Pearson積矩相關(guān)系數(shù)的計(jì)算lXX
lYYlXYr
(X
X
)2
(Y
Y
)2(
X
X
)(Y
Y
)即:離均差的乘積YX(
xi
x)(
yi
y)
0XY(
xi
x)(
yi
y)
0XYPearson積矩相關(guān)系數(shù)指示相關(guān)的方向:r=0:X和Y無(wú)線性相關(guān)或零相關(guān)(null
correlation)r
>0:正相關(guān)r≠0:則X和Y線性相關(guān)r<0:負(fù)相關(guān)r=1或r=-1:完全相關(guān)(罕見)Y(a)YX
X
X(b) (
c
)YPearson積矩相關(guān)系數(shù)
(Pearson
product
moment
coefficient)weak0-11STRONGNegativeSTRONGPositiveCorrelation
Coefficient總體相關(guān)系數(shù)用ρ表示;樣本相關(guān)系數(shù)用r
表示;取值-1<ρ<1;ρ>0為正相關(guān),ρ<0為負(fù)相關(guān);ρ
越接近于1,相關(guān)性越強(qiáng);越接近于0,相關(guān)性越差相關(guān)系數(shù)反應(yīng)線性相關(guān)性:X3.43.23.02.82.62.42.22.01.8Y7.57.06.56.05.55.04.5X3.43.23.02.82.62.42.22.01.8Y2.22.01.81.61.41.21.0.8.6X4.03.02.01.0Y6543210X5.04.52.5
3.0
3.5
4.01.0
1.5
2.0Y5.04.54.03.53.02.52.01.51.0(1)
r
1(3)r
1(5)r
0(7)r
0X3.43.23.02.82.62.42.22.01.8Y7.57.06.56.05.55.04.5X3.43.23.02.82.62.42.22.01.8Y2.62.42.22.01.81.61.41.21.0.86543210Y4.03.02.01.03.23.02.82.62.42.22.01.8Y.7.6.5.4.3(6)r
0(2)0
r
1正相關(guān)(4)1
r
0負(fù)相關(guān)X
X(8)r
0(非線性相關(guān)非線性相關(guān)例9-1:計(jì)算學(xué)齡兒童的身高和體重的樣本相關(guān)系數(shù)。
0.93(X
X
)(Y
Y
)(X
X
)2
(Y
Y
)2r
答:身高X表9-1
10名學(xué)齡兒童的身高和體重1
2
3
4
5
6
7
8
9
10149.4 167.6
146.3
170.7
161.5
164.6
155.5 158.5
149.4
152.4體重
Y
30.8
42.6
33.1
44.0
36.3
40.8
32.7
35.4
33.1
31.83.
Pearson積矩相關(guān)系數(shù)的假設(shè)檢驗(yàn)—
t
檢驗(yàn)法H1:ρ
≠
0H0:ρ=0
=0.05②計(jì)算統(tǒng)計(jì)量t
值③確定P
值,作出推斷結(jié)論ν=n-2,查t界值表得t
0.05,v,確定P
值大小。若P≤α,則ρ≠0,說(shuō)明X
與Y
之間有線性關(guān)系。若P
>α,則ρ=0,說(shuō)明X與Y之間無(wú)線性關(guān)系,但也可能存在其它相關(guān)關(guān)系。St
r
0
r1
r
2n
2rr,
n
2步驟:①建立檢驗(yàn)假設(shè),確立檢驗(yàn)水準(zhǔn)Pearson積矩相關(guān)系數(shù)的假設(shè)檢驗(yàn)—查表法(假定系獨(dú)立、隨機(jī)的雙正態(tài)樣本)直接查r
臨界值表(P581)以
度v=n-2查出r
臨界值,比較檢驗(yàn)統(tǒng)計(jì)量r值與r臨界值,后確定P值,作統(tǒng)計(jì)推斷。統(tǒng)計(jì)量
r
越大,概率
P
越小;統(tǒng)計(jì)量
r
越小,概率
P
越大。4.Pearson積矩相關(guān)系數(shù)的區(qū)間估計(jì)即:以樣本相關(guān)系數(shù)r以一定的概率估計(jì)總體相關(guān)系數(shù)ρ
的置信區(qū)間。步驟:①對(duì)相關(guān)系數(shù)r進(jìn)行反雙曲正切變換或?qū)?shù)變換,得相應(yīng)的z
值(-∞,+∞),近似地服從正態(tài)分布;③
再將所得上、下限作反變換,即得總體相關(guān)系數(shù)ρ的置信區(qū)間。ρ
tanh
zz
tanh
1
r或:z
1
ln
1
r2
1
r②
按正態(tài)近似原理確定
z
的
1-
α置信區(qū)間;z
Z
/
2
/
n
3,z
Z
/
2
/
n
311或:ρ
e2
ze2
z線性相關(guān)分析的步驟:繪制散點(diǎn)圖:1.相關(guān)趨勢(shì)?2.線性的還是曲線的?3.異常值或強(qiáng)影響點(diǎn)?估計(jì)Pearson樣本相關(guān)系數(shù)r對(duì)相關(guān)系數(shù)的假設(shè)檢驗(yàn),即回答在總體中該相關(guān)關(guān)系是否存在的問(wèn)題參數(shù)估計(jì):以一定的概率估計(jì)總體相關(guān)系數(shù)所在的置信區(qū)間t
檢驗(yàn)法lXX
lYYlXYr
(X
X
)2
(Y
Y
)2(
X
X
)(Y
Y
)9.2
兩個(gè)連續(xù)隨量的相關(guān)分析一、Pearson積矩僅適用于兩個(gè)變量都是隨 量,并呈現(xiàn)線性趨勢(shì)的情形。要求x、y服從聯(lián)合的雙變量正態(tài)分布。注意樣本中的
值,必要時(shí)可剔除或進(jìn)行變量變換。適用條件簡(jiǎn)單線性相關(guān)(simple
linar
correlation)例9-1:下表為一項(xiàng)關(guān)于兒童健康和發(fā)展的研究中10名學(xué)齡兒童的身高和體重資料,試對(duì)學(xué)齡兒童的身高(cm)和體重(kg)進(jìn)行相關(guān)分析。解:(1)繪制散點(diǎn)圖(2)計(jì)算相關(guān)系數(shù)r從整體趨勢(shì)而言,隨著身高的增加,體重呈增加的趨勢(shì),二者之間可能存性相關(guān)關(guān)系。
0.93ni1nnx
x
2
y
y2i1x
x
y
yi1xylxxlyylr
464442403836343230140150170180160身高/cm體重/kg圖9-1
10名學(xué)齡兒童的身高和體重的散點(diǎn)圖(3)假設(shè)檢驗(yàn):作總體相關(guān)系數(shù)ρ=0的檢驗(yàn)H0
:
0;H1
:
0
0.05法一:t
檢驗(yàn)法查t
分布表,t(0.05/2,8)=2.306,故P
<0.05,H1,可認(rèn)為學(xué)齡兒童的身高與體重之間存H0
,接受性相關(guān)。法二:查表法由v
=10-2=8,查r界值表得r(0.05/2,8)=0.632;因統(tǒng)計(jì)量r=0.93,故P<0.05,接受H1,相關(guān)有統(tǒng)計(jì)學(xué)意義,可認(rèn)為學(xué)齡兒童身高與體重之間存
性相關(guān)。=7.10,
10
8
0.913210
21
r
2n
2=
r
0
r
0.93Strr(3)區(qū)間估計(jì):計(jì)算95%置信區(qū)間①經(jīng)反雙曲正切變換,得z的95%置信區(qū)間為:(0.91,2.39)。②反變換得相關(guān)系數(shù)ρ的95%置信區(qū)間為:(0.72,0.98)【電腦實(shí)現(xiàn)】—SPSS線性相關(guān)分析:1.
數(shù)據(jù)錄入:2.
作散點(diǎn)圖:3.
讀散點(diǎn)圖,作線性趨勢(shì)判斷:4.
作線性相關(guān)分析:De
scriptive
Statis
ticsMeanStd.
DeviationN身高157.5908.368310體重36.0604.754010Correlations身高體重身高Pearson
Correlation1.930**Sig.
(2-tailed).000N1010體重Pearson
Correlation.930**1Sig.
(2-tailed).000N1010**.
Correlation
is
signif
icant
at
the
0.01
level5.
結(jié)果及結(jié)果輸出:相關(guān)系數(shù)及假設(shè)檢驗(yàn)為探討學(xué)齡兒童身高與體重的關(guān)系,搜集了10名學(xué)齡兒童的相關(guān)數(shù)據(jù),經(jīng)分析得以下結(jié)論:10名兒童身高的均值為157.6cm,標(biāo)準(zhǔn)差為8.4cm;體重的均值為36.1kg,標(biāo)準(zhǔn)差為4.8kg;從散點(diǎn)圖可見,其身高與體重有線性趨勢(shì),Pearson相關(guān)系數(shù)r
=0.93(t=7.10,
P<0.001),總體相關(guān)系數(shù)的區(qū)間為(0.72,0.98),結(jié)果表明:學(xué)齡兒童的身高和體重之間呈線性正相關(guān)。⑴統(tǒng)計(jì)描述X和Y
間是否有聯(lián)系,是線性還是非線性聯(lián)系?正向的還是負(fù)向的?聯(lián)系的程度?⑵統(tǒng)計(jì)推斷X和Y間的線性聯(lián)系是否有統(tǒng)計(jì)學(xué)意義?就總體而言,聯(lián)系的程度如何?⑶統(tǒng)計(jì)應(yīng)用結(jié)合專業(yè)知識(shí),如何對(duì)X和Y間的聯(lián)系進(jìn)行解釋?二、Spearman秩相關(guān)適用條件從雙變量正態(tài)分布的資料總體分布類型未知,數(shù)據(jù)本身有不確定值或等級(jí)資料秩相關(guān)(rank
correlation)例9-2:10名患者參加家庭計(jì)劃的長(zhǎng)度(天)和每名患者每天的費(fèi)用(元)見下表示,問(wèn)參加的時(shí)間長(zhǎng)度和費(fèi)用是否相關(guān)。12345678910時(shí)間10651181297092費(fèi)用51612282262203134表9-2
10名患者參加家庭計(jì)劃的時(shí)間/d和每名患者每天的費(fèi)用/元獨(dú)立隨機(jī)的雙變量資料;目的:
兩變量時(shí)間X和費(fèi)用Y的相關(guān)性
;但該資料的兩變量均
從正態(tài)分布?!景咐馕觥恐认嚓P(guān)獨(dú)立隨機(jī)的雙變量資料;目的:
兩變量時(shí)間X和費(fèi)用Y的相關(guān)性
;但該資料的兩變量均
從正態(tài)分布?!景咐馕觥縎pearman
等級(jí)秩相關(guān)⑵計(jì)算秩相關(guān)系數(shù):將兩變量X
和Y
分別從小到大進(jìn)行編秩:Spearman等級(jí)相關(guān)系數(shù)的計(jì)算公式:類似與pearson相關(guān)系數(shù),不過(guò)在此應(yīng)用的是數(shù)據(jù)的秩次,而不是原始數(shù)據(jù)本身。sr
22(
)(
即:
0.770)2(
p
p)(
)(
p
p)2
(s上例題解:
r
(3)Spearman秩相關(guān)系數(shù)的假設(shè)檢驗(yàn):H0
:
s
0;H1
:
s
0
0.05法一:t
檢驗(yàn)法t(0.05/2,8)=2.306,故P
<0.05,
H0
,接受H1。法二:查表法由v
=10-2=8,查r界值表得r(0.05/2,8)=0.632;因統(tǒng)計(jì)量r=-0.707,故P<0.05,接受H1,相關(guān)有統(tǒng)計(jì)學(xué)意義,可認(rèn)為參加家庭計(jì)劃的時(shí)間長(zhǎng)度和每天的費(fèi)用之間有負(fù)相關(guān)關(guān)系。=3.410
,
10
8
0.7107210
21
r
2n
2=
r
0
r
0.707Strr【電腦實(shí)現(xiàn)】—SPSS線性相關(guān)分析:1.
數(shù)據(jù)錄入:2.
秩轉(zhuǎn)換:3.
作散點(diǎn)圖:4.
讀散點(diǎn)圖,作線性趨勢(shì)判斷:5.
作線性相關(guān)分析:Correlations時(shí)間費(fèi)用Spearman's
rho時(shí)間Correlation
Coef
f
ic
ientSig.
(2-tailed)N1.000-.770**..0091010費(fèi)用Correlation
Coef
f
ic
ientSig.
(2-tailed)N-.770**1.000.009.1010**.
Correlation
is
signif
icant
at
the
0.01
level
(2-tailed).3.
結(jié)果及結(jié)果輸出:Nonparametric
Correlations四、線性相關(guān)分析應(yīng)用中應(yīng)注意的問(wèn)題首先繪制散點(diǎn)圖,觀察判斷兩變量間的關(guān)系。只有當(dāng)兩變量有線性趨勢(shì)時(shí),才能進(jìn)行線性相關(guān)分析。即:根據(jù)變量間可能的關(guān)系,選擇不同的相關(guān)分析方法。發(fā)現(xiàn)和處理異常點(diǎn)2.線性相關(guān)分析要求的兩個(gè)重要條件線性相關(guān)分析僅適用于二元正態(tài)分布資料,否則需進(jìn)行變量變換或采用其它計(jì)算方法,如秩相關(guān)。兩個(gè)變量都是隨
量,當(dāng)一個(gè)變量的數(shù)值人為選定時(shí)不能做相關(guān)分析。例:為研究不同溫度下兔肺動(dòng)脈張力,人為選定四個(gè)溫度,作相關(guān)分析。實(shí)驗(yàn)溫度兔數(shù)(只)肺動(dòng)脈張力(g)37℃80.501±0.00430℃80.490±0.00424℃80.437±0.02016℃80.336±0.0363.出現(xiàn)離群值(異常值)時(shí),慎用相關(guān)。圖
剔除異常值前后的散點(diǎn)圖舉例:兒子身高與樹身高的故事。4.
相關(guān)關(guān)系不一定是因果關(guān)系。兒子身高樹身高時(shí)間間接聯(lián)系注意:1)不要抽任意兩個(gè)變量放在一起算相關(guān)系數(shù)——在專業(yè)上,只有兩者存在直接聯(lián)系的變量可能存在聯(lián)系。2)簡(jiǎn)單相關(guān)=直接聯(lián)系-間接聯(lián)系。對(duì)相關(guān)的解釋一定要結(jié)合專業(yè)知識(shí),切不可把任意兩個(gè)變量拉在一起,盲目下結(jié)論!!!(a)(b)5.分層資料盲目合并容易引起假象。6.“相關(guān)分析”的結(jié)果解釋:如果散點(diǎn)圖可見兩隨
量有線性相關(guān)趨勢(shì),且得到的相關(guān)系數(shù)r
經(jīng)假設(shè)檢驗(yàn)后也得出
H0,即否定總體相關(guān)系數(shù)ρ=0的假設(shè),則:統(tǒng)計(jì)結(jié)論:可推斷兩變量呈“線性相關(guān)”的。專業(yè)結(jié)論:不能因此推斷兩變量在生物學(xué)上有任何聯(lián)系,更不能因?yàn)槌室蚬P(guān)系。(2)
如果兩變量經(jīng)線性相關(guān)分析,及假設(shè)檢驗(yàn)得到
“不能總體相關(guān)系數(shù)ρ=0”的結(jié)論時(shí),不要輕易下“兩變量無(wú)關(guān)”的結(jié)論。2)還要觀察散點(diǎn)圖,看兩變量1)應(yīng)首先看樣本含量是否足夠。即:檢驗(yàn)功效是否足夠大。曲線相關(guān)?如果不能進(jìn)行深入分析,則應(yīng)下結(jié)論:“根據(jù)目前數(shù)據(jù)尚不能認(rèn)為兩變量呈線性相關(guān)”是否應(yīng)進(jìn)行分層分析?9.2
兩個(gè)分類變量間的關(guān)聯(lián)分析對(duì)兩個(gè)反應(yīng)屬性的分類變量,若有一份隨機(jī)樣本,可作交叉分類的頻數(shù)表,利用關(guān)于獨(dú)立性的
2檢驗(yàn)和列聯(lián)系數(shù)表示這兩個(gè)變量之間的關(guān)聯(lián)性(association)。一、交叉分類2×2列聯(lián)表的關(guān)聯(lián)分析例9-3為觀察行為類型與冠心病的關(guān)系,某研究組在當(dāng)?shù)仉S機(jī)了3154名居民,對(duì)象按行為類型分為A型和B型。對(duì)每個(gè)分別觀察是否為冠心病患者和行為類型兩種屬性,試分析兩種屬性的關(guān)聯(lián)性。行為類型(屬性類型A(1類型B(2是關(guān)于兩個(gè)變量的一份隨機(jī)樣本。或說(shuō):一份隨機(jī)樣本,同時(shí)按兩種屬性分類,形成一個(gè)2×2交叉分類表,也稱的2×2列聯(lián)表。目的:冠心病的有無(wú)和行為方式兩個(gè)變量之間的相關(guān)性,即
兩個(gè)屬性概率分布的關(guān)系。如果一種屬性的概率分布與另一種屬性的概率分布無(wú)關(guān),則稱這兩種屬性相互獨(dú)立(independence),否則稱這兩種屬性之間存在關(guān)聯(lián)性(association)。關(guān)于隨
量獨(dú)立性的定理:設(shè)X、Y為二維離散型隨
量,則X、Y相互獨(dú)立的充要條件是:對(duì)于任何i、j=1,2,…,有
X
Xi
,Y
Yj
X
Xi
Y
Yj
i
j即:ij統(tǒng)計(jì)思想:從概率角度出發(fā),獨(dú)立是指交叉分類表的每一個(gè)格子中同時(shí)具有兩種屬性的聯(lián)合概率等于相應(yīng)屬性
的邊計(jì)概率的乘積。即:
ij
ri
ci故,獨(dú)立性檢驗(yàn)實(shí)際上就是
ri
ci
是否成立。
ij(1)欲檢驗(yàn)的假設(shè)為:H0:屬性A
和屬性B
互相獨(dú)立;H1:屬性A
和屬性B
互相關(guān)聯(lián)。
=0.05(2)計(jì)算統(tǒng)計(jì)量
2
值獨(dú)立性檢驗(yàn)就是
ij
ri
ci從
2
分布,仍采用
2
檢驗(yàn)成立與否,H0
成立時(shí),統(tǒng)計(jì)量服理論公式:公式:v=k-1-s
=(行數(shù)-1)×(列數(shù)-1)
=1(3)確定P
值,作出推斷結(jié)論A
T
2
2
ij
ij
i,
jTijnn
n
n
ri
ci
n
ijijT
n
nri
nci
nri
nci(a
b)(c
d
)(a
c)(b
d
)(ad
bc)2
n
2
2.計(jì)算關(guān)聯(lián)系數(shù)(association
coefficient,
r)以表示關(guān)聯(lián)的程度:r
2
2
n對(duì)2×2交叉列聯(lián)表而言,r
介于0和
0.5
之間,其數(shù)值越大,說(shuō)明兩變量的關(guān)聯(lián)程度越高。試區(qū)別:關(guān)于交叉分類資料的獨(dú)立性檢驗(yàn)比較兩獨(dú)立樣本率的假設(shè)檢驗(yàn)必須注意的是:這兩類問(wèn)題的研究目的、設(shè)計(jì)方案、數(shù)據(jù)結(jié)構(gòu)以及最終對(duì)結(jié)果的解釋都是不同的。答:
2ν=(2-1)×準(zhǔn)上,
H0,病 在著關(guān)(4)計(jì)算關(guān)178
1486
79
14112
3154
39.901589
1565
257
2897
239.90
n
39.90
3154
0.112
2
2r
【電腦實(shí)現(xiàn)】—SPSS關(guān)聯(lián)性分析:1.
數(shù)據(jù)錄入:2.:3.關(guān)聯(lián)性分析的步驟:Nominalby
Nominal
CN
of
Valid
CasesNot
assuming
the
nuUsing
the
asymptoticLikelihood
RatioFisher's
Exac
tTestLi r
by-LinearA
sociationN
of
Valid
CasesComputed
only
fo0
cells
(.0%)hav52.4.
結(jié)果及結(jié)果輸出:冠心病有沒(méi)有行為
A類型Total【結(jié)果報(bào)告】行為類型A
B
為探討冠心病患病與行為類型之間的關(guān)聯(lián),對(duì)3154例居民進(jìn)行了分析,結(jié)果如下表示:以Pearson
2獨(dú)立性檢驗(yàn),
2=39.900,P<0.001,
r
=0.112。結(jié)果表明,冠心病患病與行為類型間存在著一定的聯(lián)系。二、
2×2配對(duì)資料的關(guān)聯(lián)分析例9-4
研究者對(duì)103例患者進(jìn)行了影像學(xué)檢驗(yàn)(A)和生化檢驗(yàn)(B),數(shù)據(jù)如下,試分析兩種檢驗(yàn)結(jié)果的關(guān)聯(lián)性。表9-5兩種檢查結(jié)果的比較B
方法A
方法B(+)B(-)合計(jì)A(+)501565A(-)83038合計(jì)5845103【資料特點(diǎn)】是關(guān)于一份隨機(jī)樣本,同時(shí)按兩種屬性分類是2×2配對(duì)資料。目的:了解兩種方法的結(jié)果之間是否有關(guān)聯(lián)。方法:兩種屬性的關(guān)聯(lián)性分析。2(a
b)(c
d
)(a
c)(b
d
)(ad
bc)2
n
檢驗(yàn)統(tǒng)計(jì)量:H0:A、B
兩法的檢驗(yàn)結(jié)果相互獨(dú)立,即沒(méi)有關(guān)聯(lián);H1:A、B
兩法的檢驗(yàn)結(jié)果有關(guān)聯(lián)。
=0.05(2)計(jì)算統(tǒng)計(jì)量
2
值答:(1)建立檢驗(yàn)假設(shè),確立檢驗(yàn)水準(zhǔn)(3)確定P
值,作出推斷結(jié)論ν=
1,查
χ2
=3.84,P<0.05。在α=0.05
水準(zhǔn)上,0.05(2)H0,接受H1,關(guān)聯(lián)有統(tǒng)計(jì)學(xué)意義,說(shuō)明A、B
兩種方法的檢測(cè)結(jié)果之間存在58
45
65
3850
30
1582
103
30.43
230.43
n
30.43
103
0.477著關(guān)聯(lián)性。(4)計(jì)算關(guān)聯(lián)系數(shù)
r
值:
r
2
2三、多分類資料的關(guān)聯(lián)分析例9-5
有人在某地隨機(jī)抽取2500名居民,記錄其民族與血型,資料見下表,試問(wèn)民族和血型是否有關(guān)?【資料特點(diǎn)】多組資料的關(guān)聯(lián)設(shè)計(jì):一份樣本,按兩種屬叉分類,統(tǒng)計(jì)頻數(shù)。目的:了解兩種屬性間是否有關(guān)聯(lián)。方法:多組資料—兩種屬性的關(guān)聯(lián)性分析。:檢驗(yàn)統(tǒng)計(jì)量R
ci j
ij
n
m
i1
j
1A221
n多分類資料的關(guān)聯(lián)系數(shù):r
2
2
n對(duì)多分類資料列聯(lián)表而言,r
介于0和之間,其數(shù)值越大,說(shuō)明兩變量的關(guān)聯(lián)程度越高。1min(
R,C)1答:(1)建立檢驗(yàn)假設(shè),確立檢驗(yàn)水準(zhǔn)H0:民族和血型無(wú)關(guān)聯(lián);
H1:民族和血型有關(guān)聯(lián)。
=0.05(2)計(jì)算統(tǒng)計(jì)量
2
值(3)確定P
值,作出推斷結(jié)論ν=
(3-1)(4-1)=6,查
χ2
=15.59,P<0.05。在α=0.05
水準(zhǔn)0.05(6)上,
H0,接受
H1,關(guān)聯(lián)有統(tǒng)計(jì)學(xué)意義,說(shuō)明血型與民族間存在著關(guān)聯(lián)性。(4)計(jì)算關(guān)聯(lián)系數(shù)r
值:r
332.97
n
332.97
2500
0.343
2
22024902
44022
...
2841.82
9501100
9101100
160470
25001R
ci1
j
1
nimj
n
ij
A2【電腦實(shí)現(xiàn)】—SPSS關(guān)聯(lián)性分析:1.
數(shù)據(jù)錄入:2.:3.關(guān)聯(lián)性分析:4.
結(jié)果及結(jié)果輸出:四、偏相關(guān)在研究?jī)蓚€(gè)事物或現(xiàn)象之間的關(guān)系時(shí),要充分考慮其它事物和現(xiàn)象對(duì)兩者之間的影響;偏相關(guān)的優(yōu)勢(shì)就是在排除混雜因素的作用后,再評(píng)價(jià)兩個(gè)事物或現(xiàn)象之間的聯(lián)系。的相關(guān)性,但考慮家庭例:
消費(fèi)者信心指數(shù)值和月收入對(duì)其有一定的影響。結(jié)果輸出:在控制家庭收入的作用后,消費(fèi)者總信息指數(shù)和年齡之間Pearson相關(guān)系數(shù)r=-0.216,經(jīng)檢驗(yàn)有統(tǒng)計(jì)學(xué)意義(P=0.009),可以認(rèn)為二者之間存在負(fù)相關(guān)關(guān)系。小
結(jié)相關(guān)是測(cè)量變量間的相互聯(lián)系或關(guān)聯(lián)的指標(biāo),要求變量資料滿足獨(dú)立隨機(jī)性。性相關(guān)分析時(shí)必須先作散點(diǎn)圖,發(fā)現(xiàn)有線性趨勢(shì)后,再作進(jìn)一步的分析。依據(jù)不同資料的特點(diǎn)分別采用Pearson相關(guān)分析,
Spearman秩相關(guān)分析,以及分類資料的
2檢驗(yàn)的關(guān)聯(lián)分析方法。相關(guān)和關(guān)聯(lián)是兩變量之間在數(shù)量上的關(guān)聯(lián),不能據(jù)此推論兩變量有生物學(xué)的聯(lián)系,或有因果關(guān)系。相關(guān)有可能只是伴隨關(guān)系。兩樣本資料的關(guān)聯(lián)性分析數(shù)據(jù)類型定量資料定性資料雙變量正
非雙變量態(tài)分布
正態(tài)分布雙變量一定量一有序分類變量資料交叉分類2×2
R×C2×2
配對(duì)
表兩有序分類一致性檢驗(yàn)Pearson積矩相關(guān)Pearson積矩相關(guān)系數(shù)rSpearman秩相關(guān)Spearman秩相關(guān)系數(shù)rsф系數(shù)CramerV系數(shù)Pearson列聯(lián)系數(shù)列聯(lián)相關(guān)Gamma系數(shù)Gamma法Kappa一致性檢驗(yàn)Kappa系數(shù)12SPSS中“相關(guān)”功能:1.
Pearson積矩相關(guān)分析適用條件:兩變量呈獨(dú)立、隨機(jī)及正態(tài)分布的資料。注意事項(xiàng):一定要先繪制散點(diǎn)圖,看出兩變量間有線性趨勢(shì)時(shí),再計(jì)算積差相關(guān)系數(shù)。不可用相
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度5G通信網(wǎng)絡(luò)設(shè)備供應(yīng)合同
- 2025年度建筑工程項(xiàng)目環(huán)境保護(hù)與污染防治合同
- 2025年度新型建筑機(jī)械租賃服務(wù)合同
- 2025年度地下綜合管廊施工建設(shè)合同書
- 2025年度房地產(chǎn)項(xiàng)目營(yíng)銷策劃合同
- 2025年度建筑砌墻工程竣工結(jié)算合同模板
- 2025年度供應(yīng)鏈融資借款合同:民間借貸產(chǎn)業(yè)協(xié)同
- 2025年度地下綜合管廊建設(shè)項(xiàng)目施工合同
- 2025年度新型鋼結(jié)構(gòu)運(yùn)輸合同標(biāo)準(zhǔn)版
- 2025年度基礎(chǔ)設(shè)施建設(shè)項(xiàng)目進(jìn)度款支付合同協(xié)議書
- 2025年紀(jì)檢辦公室工作計(jì)劃范文
- 2024年保險(xiǎn)公司柜員年終工作總結(jié)
- 2025年南瑞集團(tuán)招聘筆試參考題庫(kù)含答案解析
- 七年級(jí)上學(xué)期歷史期末考試模擬卷02(原卷版)
- 橋梁建設(shè)施工組織設(shè)計(jì)方案
- (新版)中國(guó)動(dòng)態(tài)血壓監(jiān)測(cè)基層應(yīng)用指南(2024年)
- 礦物加工工程基礎(chǔ)知識(shí)單選題100道及答案解析
- 2024年同等學(xué)力申碩英語(yǔ)考試真題
- 浙江省杭州市2024年中考語(yǔ)文試卷(含答案)
- 世說(shuō)新語(yǔ)原文及翻譯-副本
- 電力通信光纜檢修標(biāo)準(zhǔn)化作業(yè)指導(dǎo)書
評(píng)論
0/150
提交評(píng)論