關(guān)于身高的回歸分析課件_第1頁(yè)
關(guān)于身高的回歸分析課件_第2頁(yè)
關(guān)于身高的回歸分析課件_第3頁(yè)
關(guān)于身高的回歸分析課件_第4頁(yè)
關(guān)于身高的回歸分析課件_第5頁(yè)
已閱讀5頁(yè),還剩3頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

大學(xué)生統(tǒng)計(jì)報(bào)為什么我們身邊沒有巨人?

――統(tǒng)計(jì)學(xué)的父子身高回歸分析

英國(guó)著名遺傳學(xué)家弗朗西斯·高爾頓爵士(SirFrancisGalton,1822-1911)在子女與父母相像程度遺傳學(xué)研究方面,取得了重要進(jìn)展。高爾頓的學(xué)生卡爾·皮爾遜(KarlPearson,1857-1936)在繼續(xù)這一遺傳學(xué)研究的過程中,測(cè)量了1078個(gè)父親及其成年兒子的身高。他們之間的數(shù)量關(guān)系見圖1(K.PearsonandA.Lee,“Onthelawsofinheritanceinman”Biometrika,partii(1903)pp.357-462)圖中每一個(gè)點(diǎn)代表一對(duì)父子的身高關(guān)系。橫軸的X坐標(biāo)是父親的身高,縱軸的Y坐標(biāo)給出的是兒子的身高。我們看到,多數(shù)點(diǎn)子位于角平分斜線的兩側(cè)橢圓形面積之內(nèi),落在斜線上的點(diǎn)子極少,即兒子與父親身高完全相同的極少。由點(diǎn)子落在斜線周圍還說明,高個(gè)子的父親有著較高身材的兒子,而矮個(gè)子父親的兒子身材也比較矮。同時(shí),我們也看到一些遠(yuǎn)離斜線的點(diǎn)子,這些點(diǎn)子反映的是父親的身高與兒子的身高相差甚遠(yuǎn)的情況。比如高個(gè)子的父親有矮兒子的情況,或者矮父親有高個(gè)兒子的情況。圖1中散點(diǎn)圖給出父子身高的關(guān)系圖,但圖中給出的父親身高和兒子身高兩個(gè)變量的關(guān)系還是比較直觀的相關(guān)系數(shù)r就是對(duì)兩個(gè)變量間線性相關(guān)關(guān)系緊密程度的度量。相關(guān)系數(shù)r的計(jì)算公式為:式中分子部分為X和Y兩具變量的協(xié)方差,分母部分是X和Y兩個(gè)變量標(biāo)準(zhǔn)差的乘積。由于協(xié)方差是X和Y兩個(gè)變量與其均值離差乘積的數(shù)學(xué)期望,它受X和Y兩個(gè)變量度量單位大小的影響,因而在分母上除以X和Y兩個(gè)變量的標(biāo)準(zhǔn)差,就將相關(guān)系數(shù)r轉(zhuǎn)化成從-1到1之間的相對(duì)數(shù)值。實(shí)際數(shù)據(jù)計(jì)算的結(jié)果為r=0.501,表明高個(gè)子的父親會(huì)有較高的兒子,矮身材的父親其兒子身體也不會(huì)很高,但這一正相關(guān)的關(guān)系并不十分明顯。那么,父子身高之間有什么規(guī)律呢?經(jīng)過對(duì)1078對(duì)父子身高數(shù)據(jù)的計(jì)算,得到:父親的平均身高=67.6英寸≈68英寸,標(biāo)準(zhǔn)差SX=2.74≈2.7英寸兒子的平均身高=68.7英寸≈69英寸,標(biāo)準(zhǔn)差SY=2.81≈2.8英寸(1英寸=2.54厘米)我們看到,兒子的平均身高比父親高一英寸,表明下一代的平均身高比上一代要高。這樣,我們會(huì)自然地猜測(cè)72英寸的父親平均會(huì)有73英寸的兒子;64英寸的父親平均會(huì)有65英寸的兒子,等等。那我們看一看圖2中的情況:要對(duì)上式求最小,微積分的知識(shí)告訴我們要求其偏導(dǎo)數(shù)并令其為零。即:整理這一聯(lián)立方程得到

Cov(XY)=r×SX×SY=0.501×2.74×2.81

=3.86父子身高的回歸方程為該回歸方程就是圖2中的回歸線(實(shí)線)。當(dāng)X1=58時(shí),=63.8;當(dāng)X2=64時(shí),=66.86。當(dāng)X3=72時(shí),=70.94。這些回歸方程上的值實(shí)際上是當(dāng)Xi確定后,若干Yi的平均值。這一回歸直線和回歸方程表明,矮個(gè)子父親的兒子們平均身高會(huì)比父輩低一些,高個(gè)子父親的兒子們平均身高會(huì)比父輩低一些,即兒子們的身高會(huì)向平均值回歸。我們的讀者必然會(huì)問,現(xiàn)代人一代比一代高,為什么高個(gè)子父親的兒子們平均身高要比父輩低呢?細(xì)心的讀者不難發(fā)現(xiàn),當(dāng)時(shí)高爾頓和皮爾遜做研究時(shí)只觀察了父親和兒子的身高,并沒有考慮母親的身高。實(shí)際上,高個(gè)子父親的太太可能是較高的女性,也可能是較低的女性。反之,矮個(gè)子父親的太太可能是矮個(gè)子,也可能是較高的身材。而兒子的身高既受父親傳傳的影響,也受母親遺傳的影響,這就是為什么兒子們身高會(huì)發(fā)生“回歸”的原因。類似的回歸現(xiàn)象還有很多,比如我們連續(xù)觀察一群學(xué)生春秋兩季的考試成績(jī),會(huì)發(fā)現(xiàn)春季考試得高分的學(xué)生在秋季考試中雖然平均分還比較高,但平均分會(huì)有所降低。反之,春季考試分?jǐn)?shù)最低的學(xué)生們秋季的平均分會(huì)有所提高。因?yàn)樵诳荚囍谐藢W(xué)生水平的高低這一主要因素影響之外,臨場(chǎng)發(fā)揮等偶然因素也會(huì)起到一定的作用。我們?cè)趹?yīng)用回歸方程時(shí)若能注意回歸效應(yīng)的特點(diǎn),會(huì)幫助我們更好地分析和解決問題。由于已知r=0.501,SX=2.74,SY=2.81,則頻率與頻數(shù)DeweyG.統(tǒng)計(jì)了約438023個(gè)英語(yǔ)單詞中各字母出現(xiàn)的頻率,發(fā)現(xiàn)各字母出現(xiàn)的頻率不同:A:0.0788B:0.0156C:0.0268D:0.0389E:0.1268F:0.0256G:0.0187H:0.0573I:0.0707J:0.0010K:0.0060L:0.0394M:0.0244N:0.0706O:0.0776P:0.0186Q:0.0009R:0.0594S:0.0634T:0.0987U:0.0280V:0.0102W:0.0214X:0.0016Y:0.0202Z:0.0006從中我們看到字母E出現(xiàn)的頻率最大而字母Z出現(xiàn)的頻率最小等等結(jié)果,而且這些字母的頻率可以大致看成它們出現(xiàn)的概率。對(duì)于計(jì)算機(jī)鍵盤的設(shè)計(jì)和文字的研究,這些結(jié)果都有重要意義。編者寄語(yǔ):有很多人說統(tǒng)計(jì)學(xué)枯燥乏味,實(shí)際運(yùn)用得很少,從我們本期報(bào)紙中,我們會(huì)看到不是我

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論