雙變量回歸分析ppt課件_第1頁
雙變量回歸分析ppt課件_第2頁
雙變量回歸分析ppt課件_第3頁
雙變量回歸分析ppt課件_第4頁
雙變量回歸分析ppt課件_第5頁
已閱讀5頁,還剩45頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、經(jīng)濟類核心課程計量經(jīng)濟學PowerPoint Presentation by Lu Shiguang 2012 All Right Reserved, Hunan Institute of Engineering第一章 雙變量回歸分析教師:盧光陰1. 回歸分析的性質(zhì)F.加爾頓Francis Galton發(fā)現(xiàn),雖然有一個趨勢:父母高,兒女也高;父母矮,兒女也矮,但給定父母的身高,兒女輩的平均身高卻趨向于或者“回歸到全體人口的平均身高。K.皮爾遜Karl Pearson證明了加爾頓普遍回歸定律。皮爾遜搜集了1000多個家庭的身高記錄。他發(fā)現(xiàn)對于父輩高的群體,兒輩的平均身高低于他們的父輩,而對于父輩

2、矮的群體,兒輩的平均身高那么高于他們的父輩。用加爾頓的話來說,就是“回歸到中等regression to mediocrity。1.2 回歸的現(xiàn)代定義回歸分析是關于研討一個應變量對另一個解釋變量的依賴關系,其意圖在于經(jīng)過后者在反復抽樣中的知或設定值,去估計和或預測前者的總體均值?;氐郊訝栴D的例子:我們關懷給定父輩身高,找出兒輩平均身高的變化。值得留意的是,隨著父輩身高的添加,兒輩平均身高也在添加。 70 80父輩的身高英寸兒輩的身高英寸807060如左圖所示:留意對應任一給定的父輩的身高,都有一個兒輩身高的分布范圍。我們勾畫了一條經(jīng)過這些散點的一條直線,以表示兒輩平均身高如何隨父輩身高的添加而

3、添加的。這條線我們稱為回歸線regression line。1.3 統(tǒng)計關系和確定性關系如上例中,我們不像經(jīng)典物理學中思索的那種變量之間的函數(shù)或確定性依賴關系。在回歸分析中,我們思索的是一類所謂統(tǒng)計依賴關系。在變量之間的統(tǒng)計關系中,我們主要處置是隨機變量,也就是有著概率分布的變量。例如,作物收成對氣溫、降水、陽光及施肥的依賴關系是統(tǒng)計性質(zhì)的。這個性質(zhì)的意義在于:這些解釋變量固然重要,但是并不可以使農(nóng)業(yè)學家準確地預測作物的收成。一那么這些變量的丈量是有誤差的,二那么還有一大堆影響到作物收成的變量,我們無法一一識別出來。1.4 回歸和因果關系雖然回歸分析是研討一個變量對另一些變量的依賴關系,但它并

4、不一定意味著因果關系。用肯達爾和斯圖亞特的話說:“一個統(tǒng)計關系式,無論多強也不論多么有啟發(fā)性,卻永遠不能確立因果方面的聯(lián)絡,對因果關系的理念,必需來自統(tǒng)計學以外,最終來自這種或那種實際。例如在諸多有趣的經(jīng)濟目的中有一個“裙子長短指數(shù)。這個指數(shù)用女性穿著裙子的長短來判別經(jīng)濟的好壞。當經(jīng)濟不好時,失業(yè)率添加,女性就業(yè)更困難,短裙看起來能年輕、活力一些,有利于尋求新的職位。但是我們不能因此得到結論:在座的女生穿著短裙是由于經(jīng)濟不好,或者由于在座的女生穿著短裙所以中國的經(jīng)濟不好。從邏輯上說,統(tǒng)計關系式本身不意味著任何因果關系。1.5 數(shù)據(jù)的性質(zhì)用于經(jīng)濟分析的數(shù)據(jù)有三類:時間序列、橫截面數(shù)據(jù)、和混合數(shù)據(jù)

5、。時間序列:對一個變量在不同時期取值的一組觀測結果。例如隨著年份GDP的變換、上證綜合指數(shù)的每日變換等等?;跁r間序列數(shù)據(jù)的計量分析,大多假定所根據(jù)的時間序列數(shù)據(jù)是平穩(wěn)的stationary。粗略地來說,假設一組時間序列數(shù)據(jù),它們的均值和方差在時間上沒有系統(tǒng)的變化,就是平穩(wěn)的。要記?。好慨斔\用時間序列數(shù)據(jù)時,他都要問一問它的平穩(wěn)性如何。橫截面數(shù)據(jù):對一個或多個變量在同一個時點上搜集的數(shù)據(jù)。例如2019年9月份,全國主要30個省份的生豬的產(chǎn)量和價錢、全國每個高校2019屆大學生的就業(yè)率等等。橫截面數(shù)據(jù)也有其本身的問題,特別是異方差heterogeneity的問題。有的省湖南、江西消費巨量的生豬

6、,而有的省北京和廣東消費量很少。當我們的統(tǒng)計分析中包含有相異的單元時,我們必需思索尺度效應,以防止把蘋果和桔子混同了起來?;旌蠑?shù)據(jù):兼有時間序列和橫截面數(shù)據(jù)。例如人口普查數(shù)據(jù),從1980到2019年中國人口總量變化是時間序列,而2019年不同省市人口的分布那么是橫截面數(shù)據(jù)。2. 雙變量回歸分析2.1 一個例子假定一個國家人口總體由60戶家庭組成,X表示家庭周可支配收入,Y表示家庭周消費支出。X,每周家庭收入(美元)Y,每周家庭消費支出801001201401601802002202402605565798010211012013513715060708493107115136137145152

7、6574909511012014014015517570809410311613014415216517875859810811813514515717518088113125140160189185115191共計32546244570767875068510439661221將這60戶按照收入劃分為10組,分析每一組的家庭消費支出。對應每周收入在80美圓的5戶,每周家庭消費支出在55到75美圓不等。上表中,每一縱列給出的是在給定的收入程度X下的消費支出Y的分布。就是說,它給出了以X為給定值條件下的Y的條件分布。散點圖根據(jù)表格的數(shù)據(jù)制成。如今,對于給定的X,例如X=80美圓,有5個Y值:55

8、、60、65、70和75美圓。因此給定X=80得到這些消費支出中任何一個概率是1/5。用符號來表示:對于Y的每一條件概率分布,我們可以計算出來它的均值,稱為條件均值或條件期望,記做E(Y|X=Xi),并讀作“在X取特定Xi值時Y的期望值。給定X=80,Y的期望或條件均值為:51)80|55(XYp6551755170516551605155回到散點圖中,我們更清楚的發(fā)現(xiàn),雖然,每個家庭的消費支出都不一樣,但隨著收入的添加,消費程度平均地說也在添加。觀測紅色的粗圓點代表的Y的各個條件均值,這種覺察就更加的直觀和籠統(tǒng)。散點圖闡明,這些條件均值都落在一個有正斜率的直線上。這個直線叫做總體回歸線。更簡

9、單地說,它是Y對X的回歸。在幾何意義上,總體回歸線就是當解釋變量取給定值時,應變量的條件均和或期望的軌跡。2.2總回歸函數(shù)PRF從前面的討論中,我們清楚地看到,每一條件均值E(Y|Xi)都是Xi的一個函數(shù),用符號來表示:其中,f(Xi)表示解釋變量Xi的某個函數(shù)在上例中, E(Y|Xi) 是Xi的一個線性函數(shù),我們把 稱為總體回歸函數(shù)PRF或簡稱為總體回歸PR。它闡明在給定的Xi下,Y的分布均值與Xi有函數(shù)關系,或者,它闡明了Y的均值是怎樣隨X而變化的。PRF的函數(shù)方式是一個閱歷方面的問題,例如,經(jīng)濟學家會提出消費和收入有線性關系,這樣PRF經(jīng)常被寫作其中12為不知的參數(shù),稱為回歸系數(shù),也分別

10、被稱為截距和斜率系數(shù)。)()|(iiXfXYE)()|(iiXfXYEiiXXYE21)|(2.3 線性的含義對線性的第一種解釋是,Y的條件期望是Xi的線性函數(shù),從幾何意義上來看,這時回歸曲線是一條直線。按照這種解釋,諸如E(Y|Xi)= 1+2+Xi2回歸函數(shù),變量X以指數(shù)2出現(xiàn),就不是線性的。對線性的第二種解釋是,Y的條件期望E(Y|Xi)是諸參數(shù)的一個線性函數(shù),它可以是也可以不是X的線性函數(shù)。這樣E(Y|Xi)= 1+2Xi2就算一個線性模型,而E(Y|Xi)= 1+22Xi2那么不是。在我們這里,我們以為“線性是對參數(shù)為線性的情形,因此,從如今開場“線性一詞總是指對參數(shù)為線性的一種回歸

11、即參數(shù)總是以它的1次方出現(xiàn);對解釋變量X那么可以是或不是線性的。 E(Y|Xi)= 1+2Xi和E(Y|Xi)= 1+2Xi2都是線性回歸模型LRM。2.4 總回歸方程的隨機設定前面的例子中,隨著家庭收入的添加,家庭消費支出平均的也添加。但是對個單獨某個家庭來說,消費支出程度卻不一定隨收入程度添加而添加。例如,對應于每周100美圓的收入程度,有一家庭的消費支出是65美圓,而對應于收入80美圓的兩戶家庭,消費支出為70和75美圓。那么,在個別家庭的消費支出與給定的收入程度之間存在什么關系呢?我們在前面的分析中看到,給定收入程度Xi的個別家庭的消費支出圍繞在收入為Xi的一切家庭的平均消費支出的周圍

12、,也就是圍繞在它的條件均值。因此我們可以把個別家庭的Yi圍繞在它的期望值的離差deviation表述如下:iiiiiiXYEYXYEY)/()/(或ui被稱為隨機干擾或隨機誤差項。給定X程度,個別家庭的支出可以表示為兩個成分之和1 E(Y|Xi)代表一樣收入程度的一切家庭的平均消費支出,這個成分被稱為系統(tǒng)性或確定性成分,以及2 ui被稱為隨機的或非系統(tǒng)性的成分。也可以了解為ui是一切影響Y的,但是沒能包含到回歸方程中的,被忽略變量的替代變量。方程: 表示一個家庭的消費支出,線性地依賴于它收入加上干擾項。給定X=80,各個家庭的消費支出表達為:iiiiiXXYEY21)/(32132212121

13、1)80(65)80(60)80(55uYuYuY回到剛剛的式子:如今,假設兩邊取期望,那么:式中, E(Y|Xi)是條件期望,是一個常數(shù),故EE(Y|Xi)就是它本身。而E(Yi|Xi)就是E(Y|Xi),故:因此,假定回歸線從Y的條件均值經(jīng)過,就意味著,ui的以給定的Xi為條件的條件均值為零。iiiXYEY)/()|()/()|()/()|(iiiiiiiiXEXYEXEXYEEXYE0)|(iiXE2.5 隨機干擾項的意義干擾項是從模型中沒有包含的而又集體地影響著Y的全部變量的替代物。為什么我們不構造一個包含盡能夠多的變量的復回歸模型?理由如下:1.實際的模糊性;2.數(shù)據(jù)的欠缺;3.中心

14、變量和周邊變量;4.人類行為的內(nèi)在隨機性;5.“不好的替代變量;6.節(jié)省的原那么;7.錯誤的函數(shù)方式。為了一切上述理由,我們在隨后的學習中會發(fā)現(xiàn),隨機干擾項在回歸分析中扮演了極其重要的角色。2.6 樣本回歸函數(shù)SRF留意我們前面的例子中,我們假定一個國家是由60戶家庭組成的,故我們得到的是一個關于這60戶家庭收入和消費支出的完好的總體數(shù)據(jù)。在大多數(shù)實踐情況下,我們僅有對應于某些固定的X的Y值的樣本,這樣我們就必需面對抽樣問題,例如有以下兩組抽樣數(shù)據(jù):Y1Y2X70558065881109090120958014011011816011512018012014520014013522015514

15、5240150175260問題:我們可以從抽樣數(shù)據(jù)中預測整個總體中對應于給定的X的平均每周消費支出Y嗎?將表中的數(shù)據(jù)描畫為散點圖:在散點圖中,我們畫了兩根樣本回歸線以盡量好的擬合這些散點。SRF1是根據(jù)第一個樣本的數(shù)據(jù),而SRF2是根據(jù)第二個樣本的數(shù)據(jù)。那么,兩條回歸線中那一條代表“真實的總體樣本回歸線?現(xiàn)實上,我們不能夠有絕對把握知道哪一條代表了真實的總體回歸線。由于抽樣的動搖,它們最多也不過是真實總體回歸線的一個逼近而已。普通的來說,從N個不同樣本中會得到N個不同的樣本回歸函數(shù),并且這些樣本回歸函數(shù)不大會一樣。類比總體回歸函數(shù),我們可以寫出一個代表樣本回歸線的樣本回歸函數(shù)SRF:這里 分別

16、是Y,1和2的估計量。iiiXXfY21)(21,和Y我們還能把SRF表達為它的隨機方式:其中,除了定義過的符號外, 表示樣本殘差項。概念上, 類似于ui,并且可把它當做是ui的估計量,把它引入到SRF中的理由和把ui引入PRF中來,是出于同一個理由。至此,總的來說,回歸分析僅僅是根據(jù)某總體的一個樣本的時候比不是這樣的時候多。我們的主要目的是根據(jù)樣本回歸函數(shù)SRF:來估計總體樣本函數(shù)PRF:iiiiuXXfY)(21iu iu iiiuXY21iiiXY21對于X=Xi,我們有一個觀測值Y=Yi。我們可以根據(jù)SRF將所觀測的Yi表達為:也可以根據(jù)PRF,表達為:如今,對于圖中所示的Xi, 明顯

17、過高的估計了那里的真實的E(Y|Xi),類似的對于A點左側,SRF低估了真實的PRF,而右側那么恰好相反。iiiuYYiiiuXYEY)|(iY如今,重要的問題:既然認識到了樣本回歸函數(shù)不過是總體回歸函數(shù)的一個近似,能不能設計一種規(guī)那么或方法,使得這種近似是一種盡能夠“接近的近似?雖然真實的總體回歸函數(shù)永遠不得而知。3. 雙變量回歸模型:估計問題3.1 普通最小二乘法原理回想雙變量總體回歸函數(shù)PRF:這個PRF不是直接可以觀測的。我們經(jīng)過樣本回歸函數(shù)SRF去估計它:這里, 是Y的估計值條件均值。iiiXY21iiiiiuYuXY21iY我們把式子改寫為:這樣殘差 不過是實踐Y值與估計值 之間的

18、差。對于給定的Y和X,我們希望樣本回歸函數(shù)SRF可以盡能夠的接近實踐的Y,這樣我們采用如下原那么:選擇這樣的SRF,使得盡能夠的小。 iiiiiXYYYu21iu iY)(iiiYYu上述規(guī)范似乎很給力,但卻存在缺陷。由于在總和:中, 得到的權重和 一樣多,而顯然后兩者離樣本回歸線間隔要遠得多。這樣能夠一切的 都分布的很遠,但是 代數(shù)和卻很小甚至為零。為了防止這樣的問題,最小二乘準那么要給出樣本回歸函數(shù)SRF,使得:盡能夠小,其中 是殘差平方和。我們即將看到,它得出來的估計量有很好的統(tǒng)計性質(zhì)。很明顯,殘差平方和是關于估計量 的某個函數(shù):)(4321uuuu1 u2 u3 u4 uiu iu 2

19、2122)()(iiiiiXYYYu2iu),(212fui21和 的最小二乘估計其中,n是樣本大小。這組聯(lián)立方程被稱為正那么方程。21和)()(整理后得到求偏導數(shù),并令為零和最小,對上式分別對為求由方程:210)(2)(0)(2)()()(221212122211221222122iiiiiiiiiiiiiiiiiiiXXXYXnYXXYuXYuuXYYYu解上述方程組:XYXnYnxnyxnxnXXnyxnYXYXnYYyXXxYYXXnYXnXYYXYXnYXnYXnYXnYXnYXnYXnYXYXnYnYXnXXXnYXYXnXXYXiiiiiiiiiiiiiiiiiiiiiiiiii

20、iiiiiiiiiiiiiiiiii22122222222222111)()(),()( )()()(1,1)() 1 ()2(故:同理:定義離差:注意:得到:帶入到可得:由最小二乘OLS估計量的性質(zhì)OLS估計量是純粹由可觀測值樣本值表達的,因此這些量是容易計算的;這些量是點估計量,對于給定的樣本,每一估計量僅提供有關總體參數(shù)的一個值;從樣本數(shù)據(jù)得到OLS估計值,很容易畫出樣本回歸線,這樣得到的樣本回歸線有如下性質(zhì)不證明:1.它經(jīng)過X和Y的樣本均值;2.估計的Y均值等于實測的Y的均值;3.殘差 的均值為零;4.殘差 和預測的Yi值不相關;5.殘差 和Xi值不相關。iu iu iu 3.2經(jīng)典線

21、性回歸模型:最小二乘模型的根本假定假設我們的目的僅僅是估計 ,那么上節(jié)討論的OLS就足夠了?,F(xiàn)實上,我們不僅僅是要估算出 的值,而且要對真實的 推斷,我們想知道 離它的真期望值 有多近。為此,我們要對Yi的產(chǎn)生方式作出某些假設。而 闡明,Yi是依賴于Xi和ui。因此除非我們明確Xi和ui是怎樣產(chǎn)生的,我們將無法對Yi作出任何統(tǒng)計推斷,也就無法對 作出統(tǒng)計推斷。就是說,為了回歸估計的有效解釋,我們對變量Xi和誤差項ui作出假定是極其重要的。21和iYiiiXY21)|(iXYE21和21和21和我們在前面討論過線性的定義,在我們這里我們將一直堅持這一定義。假定假定1:線性回歸模型?;貧w模型對參數(shù)

22、而言是線性:線性回歸模型?;貧w模型對參數(shù)而言是線性的。的。iiiXY21我們關于總體樣本函數(shù)PRF的討論中,隱含著這樣一個假定“反復抽樣中的固定值。對它的了解很重要?;氐轿覀冏畛醯睦由希何覀兗俣ㄒ粋€由60戶家庭組成,我們統(tǒng)計了這60戶家庭的收入X和家庭消費支出Y的數(shù)據(jù)。這樣我們把收入值固定在80美圓/周,隨機的抽取一個家庭,并觀測它的周家庭消費支出,例如說60美圓;接著我們依然把收入X固定在80美圓/周,再隨機的抽取令一個家庭,觀測它的周家庭消費支出為75美圓。在每次抽取反復抽樣中,我們都把X值固定在80美圓上,直到一切周收入為80美圓的家庭統(tǒng)計終了?,F(xiàn)實上我們例子中的數(shù)據(jù)就是這樣產(chǎn)生的。一

23、切的這些意味著,我們的回歸分析是條件回歸分析,就是以X給定值為條件的。假定假定2:在反復抽樣中:在反復抽樣中X值是固定的。值是固定的。假定假定3:干擾項:干擾項ui的均值為零。對于給定的的均值為零。對于給定的X值,值,ui的的條件期望均值為零,用公式來表達:條件期望均值為零,用公式來表達:其實,這個假定無非是通知我們,凡是模型中沒有包含的,沒有被作為解釋變量的其他而被歸結為ui的要素,都不應該對Y的均值產(chǎn)生系統(tǒng)性的影響?;蛘哒f,正的ui和負的ui相互抵消了,以致于它們對Y的平均影響為零。0)|(iiXuE對于每個ui的方差,都是某個等于2的正常數(shù)。意味著,對應于不同的X值的Y總體均有一樣的方差

24、。圖3.4和3.5都闡明了隨收入添加,平均消費程度添加。3.4中消費支出方差在一切的收入程度下堅持不變,而3.5那么變大。當X=X1時,消費程度平均地離PRF更近,而X=X3時,消費程度圍繞PRF分布更遠,顯然X=X1時的數(shù)據(jù)Y對我們來說更可靠一些。假定假定4:同方差性或:同方差性或ui的方的方差相等。對于給定的差相等。對于給定的X值,值,對一切的觀測,對一切的觀測,ui的方差的方差是恒定的。用公式來表達:是恒定的。用公式來表達:2)|var(iiXu假定假定5:各個干擾項之間無自相關。給定恣意兩個:各個干擾項之間無自相關。給定恣意兩個X值:值:Xi和和Xjij,ui和和uj之間的相關為零。用

25、符號來表之間的相關為零。用符號來表示:示:用專業(yè)的術語來說,就是無序列相關或無自相關。假設上述假定不成立,ut和ut-1存在相關關系,那么Yt不僅僅取決Xt而且還取決于ut,由于ut-1在一定程度上決議了ut。我們利用假定5,就是只思索Xt對Yt的影響,而不去擔憂u之間的能夠到相關關系而對Y產(chǎn)生的影響。00|(0|(),|)(|(| )(| )(),|,cov();)因為jjiijjiijjjiiijijiXuEXuEXuXuEXuEuXuEuEXXuu干擾u和解釋變量X之間是不相關的。假設X和u是相關的,例如X和u正相關,那么當u添加的時候X也添加。類似的,假設X和u負相關,那么當u添加時X

26、減少。我們將無法準確地域分X和u各自對Y產(chǎn)生了什么樣的影響。假定假定6:ui和和Xi的協(xié)方差為零。用符號來表示:的協(xié)方差為零。用符號來表示:00)(),()(),()()(0)(),()()(),cov(iiiiiiiiiiiiiiiiiiuEXuEXEuEXEXuEuEXEXuEXEXuEuEXu因非隨機因因對于前例,假設我們只需一組X和Y的觀測值,我們將無法從這一次觀測中去估計參數(shù) ,對于兩個參數(shù)估計,我們至少需求兩組數(shù)據(jù)。假定假定7:觀測次數(shù):觀測次數(shù)n必需大于待估計的參數(shù)個數(shù)。必需大于待估計的參數(shù)個數(shù)。21和回到前面的公式中:假設全部的X值都相等,那么Xi= ,那么上式中的分母就為零,

27、從而我們無法估計2,也就無法估計1。要把回歸當做一種工具來運用,Y和X兩者均有變化是前提,換句話說,變量必需在變。22)()( )(XXYYXXiii假定假定8:X值要有變異性。在一個給定的樣本中,值要有變異性。在一個給定的樣本中,X值值不可以完全是一樣的。不可以完全是一樣的。X假設模型中漏掉了一些重要的變量,或者選擇了錯誤的函數(shù)方式,或者對所含變量作出了錯誤的隨機假定,那么我們就要質(zhì)疑回歸的有效性。假定假定9:正確地設定了回歸模型。另外一個說法是,:正確地設定了回歸模型。另外一個說法是,在閱歷分析中所用的模型沒有設定偏誤。在閱歷分析中所用的模型沒有設定偏誤。這一假設,我們將在后續(xù)的學習中加以

28、解釋它的重要性。假定假定10:沒有完全的多重共線性。就是說,解釋變量:沒有完全的多重共線性。就是說,解釋變量之間沒有完全的線性關系。之間沒有完全的線性關系。3.3最小二乘估計的精度或規(guī)范誤差我們估算出來的 的“可靠性或者精細度如何呢?在統(tǒng)計學上一個估計量的精細度是由它的規(guī)范誤se來衡量的。var方差,se規(guī)范誤,2是假定4中的ui的共同方差。21和221222122222)()var()()var(iiiiiixnXsexnXxsex附 方差的推導21和2222222222221121212222222121222222222222221212222221)(,)var(0)(,)()22(,

29、)()(,)()()var(10,)(00,0, )()(iiiiiijiinnnnnniiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiixxxxkkuuEjiuEiuukkuukkukukukEukEEEEExxXkkukukXkkuXkYkxxxxkxxkxYxYxXnXXnXYYxxYYxYYxyx因且對于,根據(jù)假設,對于每一個利用上式的結果因方差的定義且因為已知,且對于給定樣本且令因除了2以外,上述方程中的一切變量均可以從數(shù)據(jù)中估計出來,2由下面公式估算: 是真正的但未知的2的OLS估計量,n-2被稱為自在度df的個數(shù), 那么表示殘差平方的總和或者剩

30、余平方和RSS。222nui22iu22222222222)(iiiiiiiiiiixyxyuxyxxyu留意 的方差,有如下特點: 的方差和2成正比,而與 成反比。就是說,給定的2,X值變化越大, 方差越小,從而2的估計精度越高。此外,隨樣本容量n的添加, 中的項數(shù)將添加, 2的估計精度隨n的添加而添加。 的方差與2和 成正比,而與 和樣本大小n成反比。最后,由于 是估計量,對于給定的樣本,它們還能夠是相互影響的。這種依賴性由它們之間的協(xié)方差來衡量。221222122222)()var()()var(iiiiiixnXsexnXxsex21和22ix22ix12iX2ix21和3.5 斷定系

31、數(shù)r2:“擬合優(yōu)度的一個度量假設一切的觀測點都落在樣本回歸線上,我們就得到了一個“完美的擬合。但是這種情況很少發(fā)生。普通的是情形下,總有一些正的 和負的 。我們所能希望的僅僅是圍繞著回歸線的殘差盡能夠的小。斷定系數(shù)r2雙變量情形和R2多變量的情況就是通知人們這條樣本回歸線對數(shù)據(jù)的擬合程度有多么好的一個總度量。iu iu 22222222220,2iiiiiiiiiiiiiiiiiiiuxxyuyuyuyuyyuyyuYY且因兩邊平方并對樣本求和寫成離差的形式RSSESSTSSRSSYESSY)(TSSY)(22222222這樣:);方和(值的變異,稱為殘差平回歸線的殘差或未被解釋的圍繞);平方和(稱為回歸平方和或解釋值圍

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論