




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、直到現(xiàn)在我們所涉及的僅僅是對(duì)一些互相沒(méi)有關(guān)系的變量直到現(xiàn)在我們所涉及的僅僅是對(duì)一些互相沒(méi)有關(guān)系的變量的描述。但是現(xiàn)實(shí)世界的問(wèn)題都是相互聯(lián)系的。不討論變的描述。但是現(xiàn)實(shí)世界的問(wèn)題都是相互聯(lián)系的。不討論變量之間的關(guān)系,就無(wú)從談起任何有深度的應(yīng)用;而沒(méi)有應(yīng)量之間的關(guān)系,就無(wú)從談起任何有深度的應(yīng)用;而沒(méi)有應(yīng)用,前面講過(guò)的那些基本概念就僅僅是擺設(shè)而已。用,前面講過(guò)的那些基本概念就僅僅是擺設(shè)而已。人們每時(shí)每刻都在關(guān)心事物之間的關(guān)系。人們每時(shí)每刻都在關(guān)心事物之間的關(guān)系。比如,比如,職業(yè)種類和收入之間的關(guān)系、政府投入和職業(yè)種類和收入之間的關(guān)系、政府投入和經(jīng)濟(jì)增長(zhǎng)之間的關(guān)系、廣告投入和經(jīng)濟(jì)效益之間經(jīng)濟(jì)增長(zhǎng)之間的
2、關(guān)系、廣告投入和經(jīng)濟(jì)效益之間的關(guān)系、治療手段和治愈率之間的關(guān)系等等。的關(guān)系、治療手段和治愈率之間的關(guān)系等等。這些都是這些都是二元二元的關(guān)系。的關(guān)系。還有更加復(fù)雜的還有更加復(fù)雜的諸多變量之間的相互關(guān)系諸多變量之間的相互關(guān)系,比如比如企業(yè)的固定資產(chǎn)、流動(dòng)資產(chǎn)、預(yù)算分配、管企業(yè)的固定資產(chǎn)、流動(dòng)資產(chǎn)、預(yù)算分配、管理模式、生產(chǎn)率、債務(wù)和利潤(rùn)等諸因素的關(guān)系是理模式、生產(chǎn)率、債務(wù)和利潤(rùn)等諸因素的關(guān)系是不能用簡(jiǎn)單的一些二元關(guān)系所描述的。不能用簡(jiǎn)單的一些二元關(guān)系所描述的。第九章第九章 相關(guān)與回歸分析相關(guān)與回歸分析 變量之間的數(shù)量關(guān)系變量之間的數(shù)量關(guān)系 9 .1 相關(guān)分析相關(guān)分析一一對(duì)應(yīng)的確定性關(guān)系一一對(duì)應(yīng)的確定
3、性關(guān)系 相關(guān)關(guān)系:相關(guān)關(guān)系:函數(shù)關(guān)系:函數(shù)關(guān)系: 兩變量之間相關(guān),但不能由一個(gè)兩變量之間相關(guān),但不能由一個(gè)完全確定另一個(gè)的取值,只是在完全確定另一個(gè)的取值,只是在一定范圍內(nèi)按某種規(guī)律變化。一定范圍內(nèi)按某種規(guī)律變化。 u 相關(guān)關(guān)系經(jīng)常用一定的函數(shù)形式去近似地描述。相關(guān)關(guān)系經(jīng)常用一定的函數(shù)形式去近似地描述。 1、本來(lái)具有函數(shù)關(guān)系的變量,當(dāng)存在觀測(cè)誤差時(shí),其函數(shù)、本來(lái)具有函數(shù)關(guān)系的變量,當(dāng)存在觀測(cè)誤差時(shí),其函數(shù)關(guān)系往往以相關(guān)的形式表現(xiàn)出來(lái)。關(guān)系往往以相關(guān)的形式表現(xiàn)出來(lái)。 2、如果我們對(duì)所研究對(duì)象有更深入的認(rèn)識(shí),便可以將影響、如果我們對(duì)所研究對(duì)象有更深入的認(rèn)識(shí),便可以將影響因素全部納入方程,使之成為函
4、數(shù)關(guān)系。因素全部納入方程,使之成為函數(shù)關(guān)系。 1、現(xiàn)象之間確實(shí)存在數(shù)量上的依存關(guān)系。、現(xiàn)象之間確實(shí)存在數(shù)量上的依存關(guān)系。 2、現(xiàn)象之間數(shù)量上的依存關(guān)系不是確定的。、現(xiàn)象之間數(shù)量上的依存關(guān)系不是確定的。二、二、 相關(guān)關(guān)系的基本形式相關(guān)關(guān)系的基本形式 1. 1. 以相關(guān)關(guān)系涉及的變量多少劃分:以相關(guān)關(guān)系涉及的變量多少劃分: 單相關(guān);復(fù)相關(guān)單相關(guān);復(fù)相關(guān)2. 2. 以相關(guān)方向劃分:以相關(guān)方向劃分: 正相關(guān);負(fù)相關(guān)正相關(guān);負(fù)相關(guān) 3. 3. 以相關(guān)的形態(tài)劃分:以相關(guān)的形態(tài)劃分: 線性相關(guān);非線性相關(guān)線性相關(guān);非線性相關(guān) 4 4以相關(guān)的程度劃分:以相關(guān)的程度劃分: 完全相關(guān);不相關(guān);不完全相關(guān)完全相關(guān);
5、不相關(guān);不完全相關(guān) 5 5以相關(guān)的性質(zhì)劃分:以相關(guān)的性質(zhì)劃分: 真實(shí)相關(guān)真實(shí)相關(guān) ; 虛假相關(guān)虛假相關(guān) 三、相關(guān)關(guān)系的描述三、相關(guān)關(guān)系的描述 1 1、相關(guān)表、相關(guān)表 Xx1x2xixnYy1y2yiyn 相關(guān)表是一種反映變量之間相關(guān)關(guān)系相關(guān)表是一種反映變量之間相關(guān)關(guān)系的統(tǒng)計(jì)表。將某一變量按其取值的大小排的統(tǒng)計(jì)表。將某一變量按其取值的大小排列,然后再將與其相關(guān)的另一變量的對(duì)應(yīng)列,然后再將與其相關(guān)的另一變量的對(duì)應(yīng)值平行排列,便可得到簡(jiǎn)單的相關(guān)表。值平行排列,便可得到簡(jiǎn)單的相關(guān)表。2 2、相關(guān)圖、相關(guān)圖(散點(diǎn)圖散點(diǎn)圖) 在統(tǒng)計(jì)研究中,對(duì)現(xiàn)象間相關(guān)關(guān)系的在統(tǒng)計(jì)研究中,對(duì)現(xiàn)象間相關(guān)關(guān)系的密切程度可用統(tǒng)計(jì)
6、指標(biāo)相關(guān)系數(shù)密切程度可用統(tǒng)計(jì)指標(biāo)相關(guān)系數(shù)r r來(lái)測(cè)定。來(lái)測(cè)定。 設(shè)計(jì)思路設(shè)計(jì)思路定義公式定義公式計(jì)算公式計(jì)算公式四、相關(guān)關(guān)系的測(cè)度四、相關(guān)關(guān)系的測(cè)度PearsonPearson相關(guān)系數(shù)相關(guān)系數(shù) 22yyx-xyyx-xr1)(S2xnxx1)(S2ynyy1yyx-x2nSxy 設(shè)(設(shè)(xi,yi),是),是x、y 的的n組觀測(cè)值組觀測(cè)值 2222)()(yynxxnyxxynr直線相關(guān)系數(shù)的計(jì)算公式 2222)()(yynxxnyxxynr計(jì)算結(jié)果計(jì)算結(jié)果1001011 正相關(guān)正相關(guān)零相關(guān)零相關(guān)完全負(fù)相關(guān)完全負(fù)相關(guān)負(fù)相關(guān)負(fù)相關(guān)完全正相關(guān)完全正相關(guān)直線相關(guān)系數(shù)的意義直線相關(guān)系數(shù)的意義 :113
7、 . 05 . 03 . 08 . 05 . 08 .0四四級(jí)級(jí)劃劃分分法法 無(wú)直線相關(guān)無(wú)直線相關(guān)顯著相關(guān)顯著相關(guān)低度相關(guān)低度相關(guān)高度相關(guān)高度相關(guān)r值很小,說(shuō)明X與Y之間沒(méi)有線性相關(guān)關(guān)系,但并不意味著X與Y之間沒(méi)有其它關(guān)系,如很強(qiáng)的非線性關(guān)系。直線相關(guān)系數(shù)一般只適用于測(cè)定變量間的線性相關(guān)關(guān)系,若要衡量非線性相關(guān)時(shí),一般應(yīng)采用相關(guān)指數(shù)R。 要用樣本相關(guān)系數(shù)用樣本相關(guān)系數(shù)r r作為總體相關(guān)系數(shù)作為總體相關(guān)系數(shù)的估的估計(jì)值,而計(jì)值,而r r僅說(shuō)明樣本數(shù)據(jù)的僅說(shuō)明樣本數(shù)據(jù)的X X與與Y Y的相關(guān)程度。有的相關(guān)程度。有時(shí)候,由于樣本數(shù)據(jù)太少或其它偶然因素,使得時(shí)候,由于樣本數(shù)據(jù)太少或其它偶然因素,使得樣
8、本相關(guān)系數(shù)樣本相關(guān)系數(shù)r r值很大,而總體的值很大,而總體的X X與與Y Y并不存在真并不存在真正的線性關(guān)系。因而有必要通過(guò)樣本資料來(lái)對(duì)正的線性關(guān)系。因而有必要通過(guò)樣本資料來(lái)對(duì)X X與與y y之間是否存在真正的線性相關(guān)進(jìn)行檢驗(yàn),即檢驗(yàn)之間是否存在真正的線性相關(guān)進(jìn)行檢驗(yàn),即檢驗(yàn)總體相關(guān)系數(shù)總體相關(guān)系數(shù)是否為零。是否為零。相關(guān)系數(shù)的統(tǒng)計(jì)檢驗(yàn)相關(guān)系數(shù)的統(tǒng)計(jì)檢驗(yàn)2ntr12nrt21、提出假設(shè)、提出假設(shè)H0:總體中變量:總體中變量x與變量與變量y相互獨(dú)立,即相互獨(dú)立,即0;H1:總體中變量:總體中變量x與變量與變量y存在線性相關(guān),即存在線性相關(guān),即0 。,拒絕原假設(shè)?;蛉?,接受原假設(shè);若2222-tt
9、ttttt-2t 在美國(guó)中西部的一個(gè)小鎮(zhèn),地方警察局局長(zhǎng)發(fā)現(xiàn)一個(gè)有趣的在美國(guó)中西部的一個(gè)小鎮(zhèn),地方警察局局長(zhǎng)發(fā)現(xiàn)一個(gè)有趣的現(xiàn)象:冰淇淋消費(fèi)量越多,犯罪率就越高。測(cè)量這兩個(gè)變量,顯現(xiàn)象:冰淇淋消費(fèi)量越多,犯罪率就越高。測(cè)量這兩個(gè)變量,顯示他們的相關(guān)關(guān)系是正向的,并且相關(guān)程度頗高。示他們的相關(guān)關(guān)系是正向的,并且相關(guān)程度頗高。 顯然,僅僅因?yàn)楸苛芟M(fèi)量和犯罪率一起增長(zhǎng)(或一起顯然,僅僅因?yàn)楸苛芟M(fèi)量和犯罪率一起增長(zhǎng)(或一起下降)并不意味著一個(gè)變量的變化會(huì)導(dǎo)致另一個(gè)變量的變化。下降)并不意味著一個(gè)變量的變化會(huì)導(dǎo)致另一個(gè)變量的變化。這兩個(gè)變量一定是共享什么,或者說(shuō),一定存在什么變量同時(shí)這兩個(gè)變量一定
10、是共享什么,或者說(shuō),一定存在什么變量同時(shí)和冰淇淋消費(fèi)量以及犯罪率水平相關(guān)。因?yàn)樗鼈兺瑫r(shí)發(fā)生,所和冰淇淋消費(fèi)量以及犯罪率水平相關(guān)。因?yàn)樗鼈兺瑫r(shí)發(fā)生,所以建立了相關(guān)的假象。以建立了相關(guān)的假象。 喬喬. .鮑勃被選舉為城市議員,他知道了這個(gè)發(fā)現(xiàn)并且有了鮑勃被選舉為城市議員,他知道了這個(gè)發(fā)現(xiàn)并且有了一個(gè)很好的想法,或者至少他認(rèn)為他的選民會(huì)喜歡這個(gè)想法:一個(gè)很好的想法,或者至少他認(rèn)為他的選民會(huì)喜歡這個(gè)想法:為什么不在夏天這幾個(gè)月限制冰淇淋的消費(fèi)量,以便使犯罪率為什么不在夏天這幾個(gè)月限制冰淇淋的消費(fèi)量,以便使犯罪率下降?聽(tīng)起來(lái)很合理!下降?聽(tīng)起來(lái)很合理!u 這是計(jì)算、理解和解釋相關(guān)系數(shù)時(shí)需要注意的最重要的
11、事。冰淇淋吃得越多.犯罪率就越高 根據(jù)相關(guān)關(guān)系的具體形態(tài),選擇一個(gè)合適的數(shù)根據(jù)相關(guān)關(guān)系的具體形態(tài),選擇一個(gè)合適的數(shù)學(xué)模型,來(lái)近似地表達(dá)變量間的平均變化規(guī)律。學(xué)模型,來(lái)近似地表達(dá)變量間的平均變化規(guī)律。 用相關(guān)系數(shù)來(lái)表明現(xiàn)象間相互依存關(guān)系的密用相關(guān)系數(shù)來(lái)表明現(xiàn)象間相互依存關(guān)系的密切程度。切程度。相關(guān)分析與回歸分析的比較相關(guān)分析與回歸分析的比較 1、聯(lián)系、聯(lián)系 v 以具有相關(guān)關(guān)系的現(xiàn)象作為共同的研究對(duì)象;以具有相關(guān)關(guān)系的現(xiàn)象作為共同的研究對(duì)象; v 在具體應(yīng)用上,必須相互補(bǔ)充。在具體應(yīng)用上,必須相互補(bǔ)充。 2、區(qū)別、區(qū)別 v 所研究的變量關(guān)系有差異所研究的變量關(guān)系有差異 。v 研究方法和研究目的研究
12、方法和研究目的不同;不同;有時(shí)兩個(gè)變量可以互為因果關(guān)系,比如全社會(huì)的生產(chǎn)有時(shí)兩個(gè)變量可以互為因果關(guān)系,比如全社會(huì)的生產(chǎn)量與消費(fèi)量。這就要根據(jù)研究目的來(lái)確定自變量和因變量與消費(fèi)量。這就要根據(jù)研究目的來(lái)確定自變量和因變量。如果希望研究生產(chǎn)量的變化怎樣影響消費(fèi)量的變化,量。如果希望研究生產(chǎn)量的變化怎樣影響消費(fèi)量的變化,則可將生產(chǎn)量定為自變量,消費(fèi)量定為因變量,反之亦則可將生產(chǎn)量定為自變量,消費(fèi)量定為因變量,反之亦然。然。在工業(yè)企業(yè)經(jīng)濟(jì)統(tǒng)計(jì)分析中,利潤(rùn)額受投資額的大小在工業(yè)企業(yè)經(jīng)濟(jì)統(tǒng)計(jì)分析中,利潤(rùn)額受投資額的大小影響,因而投資額可看作是自變量,利潤(rùn)額可看作是因影響,因而投資額可看作是自變量,利潤(rùn)額可看
13、作是因變量。變量。u 因變量因變量Y Y是一個(gè)隨機(jī)變量。是一個(gè)隨機(jī)變量。 對(duì)于每個(gè)對(duì)于每個(gè)X X,由于,由于Y Y(X X)是一個(gè)隨機(jī)變量。)是一個(gè)隨機(jī)變量。 假設(shè)期望存在,假設(shè)期望存在, E E(Y Y(X X)存在,令)存在,令U U(X X)E E(Y Y(X X)為)為Y Y(X X)對(duì))對(duì)X X的的回歸函數(shù),簡(jiǎn)稱為回歸?;貧w函數(shù),簡(jiǎn)稱為回歸。 “回歸回歸”一詞的由來(lái)一詞的由來(lái)弗朗西斯弗朗西斯高爾頓(高爾頓(Francis Galton,1822-1911)出生于英格蘭伯明)出生于英格蘭伯明翰翰據(jù)皮爾遜不完全統(tǒng)計(jì),著書(shū)據(jù)皮爾遜不完全統(tǒng)計(jì),著書(shū)15種,撰寫(xiě)各種,撰寫(xiě)各種學(xué)術(shù)論文種學(xué)術(shù)論文
14、220篇篇 地理學(xué)家地理學(xué)家遠(yuǎn)征非洲的地理探險(xiǎn)遠(yuǎn)征非洲的地理探險(xiǎn) 氣象學(xué)家氣象學(xué)家觀測(cè)并命名高氣壓觀測(cè)并命名高氣壓 心理學(xué)家心理學(xué)家開(kāi)創(chuàng)了智力測(cè)量等方法開(kāi)創(chuàng)了智力測(cè)量等方法 遺傳學(xué)家遺傳學(xué)家優(yōu)生學(xué)的創(chuàng)始人優(yōu)生學(xué)的創(chuàng)始人 統(tǒng)計(jì)學(xué)家統(tǒng)計(jì)學(xué)家現(xiàn)代回歸與相關(guān)技術(shù)的創(chuàng)始人現(xiàn)代回歸與相關(guān)技術(shù)的創(chuàng)始人“返祖返祖”現(xiàn)象現(xiàn)象向平均回歸向平均回歸回歸分析的類型回歸分析的類型 1 1、根據(jù)所建立的回歸方程劃分:、根據(jù)所建立的回歸方程劃分: 線性回歸(直線回歸)線性回歸(直線回歸)非線性回歸(曲線回歸)非線性回歸(曲線回歸) 2 2、根據(jù)所涉及的變量多少劃分:、根據(jù)所涉及的變量多少劃分: 一元回歸(簡(jiǎn)單回歸)一元回歸
15、(簡(jiǎn)單回歸) 多元回歸(復(fù)回歸)多元回歸(復(fù)回歸) 9.2 一元線性回歸一元線性回歸xy10假設(shè)變量假設(shè)變量X與與Y之間存在線性相關(guān)關(guān)系,一般用以下數(shù)學(xué)模之間存在線性相關(guān)關(guān)系,一般用以下數(shù)學(xué)模型來(lái)進(jìn)一步探討型來(lái)進(jìn)一步探討Y與與X之間的統(tǒng)計(jì)規(guī)律性。之間的統(tǒng)計(jì)規(guī)律性。式中,變量式中,變量Y與與X之間的關(guān)系由兩個(gè)部分描述:之間的關(guān)系由兩個(gè)部分描述: 一部分是由于一部分是由于x的變化引起的變化引起y線性變化的部分,即線性變化的部分,即 x10另一部分是由其他一切隨機(jī)因素引起的,記為另一部分是由其他一切隨機(jī)因素引起的,記為 10和未知參數(shù),或稱回歸系數(shù)未知參數(shù),或稱回歸系數(shù)(Coefficient of
16、 regression) 是不可觀測(cè)的隨機(jī)誤差,它是一個(gè)隨機(jī)變量。是不可觀測(cè)的隨機(jī)誤差,它是一個(gè)隨機(jī)變量。 ),(210 xNy通常假定通常假定), 0 (2Nxy10210)var(,)(yxyE當(dāng)當(dāng) x 已知時(shí),可以精確算出已知時(shí),可以精確算出E ( y )。由于。由于是隨機(jī)因素,是隨機(jī)因素,通常就用通常就用E ( y )作為作為 y 的估計(jì),故得的估計(jì),故得 xy10 y 的回歸估計(jì)值的回歸估計(jì)值 y 一元線性回歸模型一元線性回歸模型 一元線性回歸方程一元線性回歸方程進(jìn)一步有進(jìn)一步有即即xy10 一元線性回歸方程一元線性回歸方程iiyx ,10,回歸分析的主要任務(wù)回歸分析的主要任務(wù)就是就
17、是)i=1,2, ,n對(duì)對(duì)進(jìn)行估計(jì)。進(jìn)行估計(jì)。 通過(guò)通過(guò)n組樣本觀察值(組樣本觀察值(yy關(guān)于關(guān)于x x的一元線性經(jīng)驗(yàn)回歸方程的一元線性經(jīng)驗(yàn)回歸方程 bxay10,a、b分別表示分別表示 的估計(jì)值的估計(jì)值 a 經(jīng)驗(yàn)回歸直線的截距,表示在經(jīng)驗(yàn)回歸直線的截距,表示在X為零時(shí),為零時(shí),Y的估計(jì)值,的估計(jì)值,即即Y的起始估計(jì)值。的起始估計(jì)值。b 經(jīng)驗(yàn)回歸經(jīng)驗(yàn)回歸直線的斜率,直線的斜率,表示表示X每增加一個(gè)單位所引起每增加一個(gè)單位所引起的的Y的平均變化量。的平均變化量。 可以看出,觀測(cè)點(diǎn)的變化趨勢(shì)近似呈直線形式,用一條可以看出,觀測(cè)點(diǎn)的變化趨勢(shì)近似呈直線形式,用一條直線穿過(guò)這些點(diǎn)的中間部分,觀測(cè)點(diǎn)在直線
18、附近波動(dòng),直線穿過(guò)這些點(diǎn)的中間部分,觀測(cè)點(diǎn)在直線附近波動(dòng),因而可以用一條直線較好地代表這些點(diǎn)的平均路徑。由因而可以用一條直線較好地代表這些點(diǎn)的平均路徑。由此而建立的直線方程,又稱之為一元線性經(jīng)驗(yàn)回歸方程,此而建立的直線方程,又稱之為一元線性經(jīng)驗(yàn)回歸方程,簡(jiǎn)稱為回歸方程。簡(jiǎn)稱為回歸方程。最小二乘法的理論基礎(chǔ)是樣本的最小二乘法的理論基礎(chǔ)是樣本的n n個(gè)實(shí)際值個(gè)實(shí)際值y y與其相應(yīng)的回與其相應(yīng)的回歸估計(jì)值歸估計(jì)值 的離差平方和達(dá)到最小,即:的離差平方和達(dá)到最小,即:式中,式中,a a,b b是待定參數(shù),是待定參數(shù),QQ是是a a,b b的函數(shù),要使的函數(shù),要使QQ達(dá)到最小,達(dá)到最小,依據(jù)函數(shù)求極限的
19、原理,則先求依據(jù)函數(shù)求極限的原理,則先求QQ對(duì)對(duì)a a和和b b的偏導(dǎo)數(shù),再令其的偏導(dǎo)數(shù),再令其為為0 0。即:。即:min)()(22bXaYYYQ0)(2bXaYaQ0)( )(2xbXaYbQYxbyaxxnyxxynb 22)(XbnaY2XbXaXY解正規(guī)方程得:解正規(guī)方程得:仍以前題為例,建立直線回歸方程。在計(jì)算相關(guān)系數(shù)時(shí)已求得如下過(guò)程數(shù)據(jù):由最小二乘法標(biāo)準(zhǔn)方程得回歸系數(shù)的計(jì)算值為:得出Y對(duì)X的直線回歸方程為:6029,541250,30800,3392XXYYX82.673396029203080033954125020)(222 XXnYXXYnb45.3902033982.6
20、72030800nXbnYaXbXaY82.6745.390XbXaY82.6745.390在本例中,在本例中,b = 67.82,表明工人日產(chǎn)量,表明工人日產(chǎn)量Y與工人工齡與工人工齡長(zhǎng)度長(zhǎng)度X呈正的線性相關(guān),且工人工齡長(zhǎng)度每增加一呈正的線性相關(guān),且工人工齡長(zhǎng)度每增加一年,工人日產(chǎn)量平均增加年,工人日產(chǎn)量平均增加67.82件。件?;貧w系數(shù)回歸系數(shù)a是直線的截距,是直線的截距, b既是既是直線的斜率,又直線的斜率,又表示表示X每增加每增加一個(gè)單位所引起的一個(gè)單位所引起的Y的平均增加值。的平均增加值。b 0時(shí),說(shuō)明時(shí),說(shuō)明Y 隨隨X的增加而增加,的增加而增加, X 與與Y 呈正的線性相關(guān);呈正的線
21、性相關(guān);b 0時(shí),說(shuō)明時(shí),說(shuō)明Y 隨隨X的增加而減少,的增加而減少, X 與與Y 呈負(fù)的線性相關(guān);呈負(fù)的線性相關(guān);b = 0時(shí),時(shí),Y 不隨不隨X的變動(dòng)而變動(dòng),說(shuō)明兩者不存在線性相關(guān)。的變動(dòng)而變動(dòng),說(shuō)明兩者不存在線性相關(guān)。ybax為為Y對(duì)對(duì)X的回歸方程。的回歸方程。 對(duì)某個(gè)給定的自變量對(duì)某個(gè)給定的自變量X值,可將其代入回歸方程得出值,可將其代入回歸方程得出因變量因變量Y的回歸估計(jì)值。而不能反過(guò)來(lái)由的回歸估計(jì)值。而不能反過(guò)來(lái)由Y去推算去推算X。 如果如果X和和Y兩個(gè)變量可以互為因果關(guān)系,要研究?jī)蓚€(gè)變量可以互為因果關(guān)系,要研究X隨隨Y的的變動(dòng)而發(fā)生變動(dòng)的情況,則需建立變動(dòng)而發(fā)生變動(dòng)的情況,則需建立
22、X對(duì)對(duì)Y的回歸方程。即以的回歸方程。即以Y為自變量,為自變量,X為因變量。為因變量。其中其中ybxayynxyyxnb22)(bxay為為X 對(duì)對(duì)Y的回歸方程。的回歸方程。擬合程度:樣本觀測(cè)值聚集在樣本回歸直線周圍的緊密程度,擬合程度:樣本觀測(cè)值聚集在樣本回歸直線周圍的緊密程度,又稱擬合優(yōu)度又稱擬合優(yōu)度(Goodness of fit)。xyy)(yy bxay)(yy )(yy )() (yyyyyy上式兩邊分別平方,并對(duì)每個(gè)觀測(cè)點(diǎn)進(jìn)行同樣的分解和平方。上式兩邊分別平方,并對(duì)每個(gè)觀測(cè)點(diǎn)進(jìn)行同樣的分解和平方。然后對(duì)然后對(duì)n n個(gè)觀測(cè)點(diǎn)的離差平方求和,則有:個(gè)觀測(cè)點(diǎn)的離差平方求和,則有:)(2)
23、 () ()(222yyyyyyyyyy0)(yyyy可以證明:可以證明:222) () ()(yyyyyy則有:則有:222) () ()(yyyyyy稱為總離差平方和稱為總離差平方和SSTSST(Total Deviation Sum of SquaresTotal Deviation Sum of Squares) 2)(yy2) (yy是是y y的回歸值與平均值的離差平方和,它表示各個(gè)回歸的回歸值與平均值的離差平方和,它表示各個(gè)回歸估計(jì)值的離差程度。是由于估計(jì)值的離差程度。是由于x x與與y y的線性關(guān)系而引起的線性關(guān)系而引起y y變變化的部分,它可以由回歸直線來(lái)解釋,因而也稱為總離化
24、的部分,它可以由回歸直線來(lái)解釋,因而也稱為總離差平方和中可解釋的離差平方和。差平方和中可解釋的離差平方和。稱為回歸平方和稱為回歸平方和SSRSSR(Regression Sum of SquaresRegression Sum of Squares) 2) (yy稱為殘差平方和稱為殘差平方和SSESSE(Residual Sum of SquaresResidual Sum of Squares) 是是y y的各實(shí)際觀測(cè)值與回歸值的離差平方和,它反映的是的各實(shí)際觀測(cè)值與回歸值的離差平方和,它反映的是除了除了x x對(duì)對(duì)y y的線性影響以外的其他因素的影響,是不能由的線性影響以外的其他因素的影響,
25、是不能由回歸直線來(lái)解釋,因而也稱為總離差平方和中不可解釋回歸直線來(lái)解釋,因而也稱為總離差平方和中不可解釋的離差平方和或剩余平方和。的離差平方和或剩余平方和。SST= SSR + SSE 若兩邊同除以若兩邊同除以SST得:得: 1SSTSSESSTSSR 總的離差平方和中,回歸平方和所占的比重越大,則回總的離差平方和中,回歸平方和所占的比重越大,則回歸效果越好,說(shuō)明回歸直線與樣本觀察值擬合得好;如果歸效果越好,說(shuō)明回歸直線與樣本觀察值擬合得好;如果殘差平方和所占的比重大,則回歸直線與樣本觀察值擬合殘差平方和所占的比重大,則回歸直線與樣本觀察值擬合得不理想。把回歸平方和與總離差平方和之比定義為:得
26、不理想。把回歸平方和與總離差平方和之比定義為:2)(2nyySiiy22nxybyaySyySySySyS越小,表明回歸直線對(duì)各實(shí)際觀測(cè)點(diǎn)的代表性就越好。越小,表明回歸直線對(duì)各實(shí)際觀測(cè)點(diǎn)的代表性就越好?;貧w系數(shù)的顯著性檢驗(yàn)回歸系數(shù)的顯著性檢驗(yàn)線性關(guān)系的顯著性檢驗(yàn)線性關(guān)系的顯著性檢驗(yàn) F F檢驗(yàn)檢驗(yàn) t t 檢驗(yàn)檢驗(yàn)1、提出假設(shè):、提出假設(shè): :線性關(guān)系不顯著:線性關(guān)系不顯著2、計(jì)算檢驗(yàn)統(tǒng)計(jì)量:、計(jì)算檢驗(yàn)統(tǒng)計(jì)量: )2(1nSSESSRF3、確定顯著性水平,、確定顯著性水平, 一般一般05. 04、查、查F分布臨界值表,可得分布臨界值表,可得 )2, 1 (nF.,;,00反之接受性關(guān)系是顯著的說(shuō)明兩個(gè)變量之間的線拒絕HFFHFF5、若、若0H1、提出假設(shè):、提出假設(shè): 2、計(jì)算檢驗(yàn)統(tǒng)計(jì)量:、計(jì)算檢驗(yàn)統(tǒng)計(jì)量: 3、確定根據(jù)顯著性水平,查、確定根據(jù)顯著性水平,查 t 分布臨界值表,可得分布臨界值表,可得 4、若、若0:10H0:11H其中其中 回歸系數(shù)回歸系數(shù)b的標(biāo)準(zhǔn)差的標(biāo)準(zhǔn)差2t22)(xxSSybbSbt bSbt bSbt bSbt ,02Htt拒絕接受,02Htt接受2tbSbt 9.4 多元:多元:kkCXbXbXbaY.2211二元:二元:2211XbXbaYC2211XbXbnaY21221111
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 自助餐合同協(xié)議
- 股份入伙合同協(xié)議書(shū)范本
- 美發(fā)合伙人協(xié)議合同
- 羽絨原料購(gòu)銷合同協(xié)議
- 業(yè)務(wù)外包加工合同
- 《功能材料在建筑中的應(yīng)用》課件
- 《阿托伐他汀》課件
- 《電路分析》課件
- 股骨頭壞死診斷要點(diǎn)
- 如何確保施工安全文明
- 2018大截面導(dǎo)線壓接工藝導(dǎo)則
- 量子計(jì)算與量子信息簡(jiǎn)介
- 通達(dá)信筆均量柱狀圖指標(biāo)公式
- 【S】幼兒繪本故事《三只小豬》課件
- 【教師共享】《羽毛球》教學(xué)評(píng)價(jià)及評(píng)價(jià)建議
- 樂(lè)高EV3初級(jí)課程課件 - 仿生蜘蛛
- DB13-T 5742-2023醇基燃料使用安全規(guī)范
- 尾礦庫(kù)安全生產(chǎn)風(fēng)險(xiǎn)監(jiān)測(cè)預(yù)警系統(tǒng)運(yùn)行管理辦法
- 特殊教育:康復(fù)訓(xùn)練課程標(biāo)準(zhǔn)(年版)
- 國(guó)開(kāi)電大《小學(xué)數(shù)學(xué)教學(xué)研究》形考任務(wù)2答案
- 南京秦淮外國(guó)語(yǔ)學(xué)校新初一分班英語(yǔ)試卷含答案
評(píng)論
0/150
提交評(píng)論