新編-概率論與數(shù)理統(tǒng)計(jì)第九章方差分析與回歸分析課件_第1頁
新編-概率論與數(shù)理統(tǒng)計(jì)第九章方差分析與回歸分析課件_第2頁
新編-概率論與數(shù)理統(tǒng)計(jì)第九章方差分析與回歸分析課件_第3頁
新編-概率論與數(shù)理統(tǒng)計(jì)第九章方差分析與回歸分析課件_第4頁
新編-概率論與數(shù)理統(tǒng)計(jì)第九章方差分析與回歸分析課件_第5頁
已閱讀5頁,還剩147頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

2022/12/19版權(quán)所有BY張學(xué)毅1第九章第一節(jié)單因素試驗(yàn)的方差分析2022/12/17版權(quán)所有BY張學(xué)毅1第九章第12022/12/19版權(quán)所有BY張學(xué)毅2一、方差分析的有關(guān)概念1.方差分析(AnalysisofVariance,ANOVA)是一種檢驗(yàn)多

個(gè)正態(tài)總體均值是否相等的統(tǒng)計(jì)方法。

2.因素的水平:指試驗(yàn)因素的某種特定狀態(tài)或數(shù)量等級(jí),簡(jiǎn)

稱水平。3.試驗(yàn)指標(biāo):衡量實(shí)驗(yàn)結(jié)果好壞程度的試驗(yàn)數(shù)據(jù)。在單因素方差分析中,將因素的任何一個(gè)水平看作是一個(gè)總體,該水平下試驗(yàn)得到的數(shù)據(jù)可看成是從總體中抽出的一個(gè)樣本。若方差分析中考察的因素只有一個(gè)時(shí),稱為單因素方差分析;若同時(shí)研究?jī)蓚€(gè)因素對(duì)試驗(yàn)指標(biāo)的影響時(shí),則稱為兩因素試驗(yàn)。同時(shí)針對(duì)兩個(gè)因素進(jìn)行,則稱為雙因素方差分析。

2022/12/17版權(quán)所有BY張學(xué)毅2一、方差分析的有22022/12/19版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組3二、單因素方差分析的數(shù)據(jù)結(jié)構(gòu)

2022/12/17版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組3二、單因素32022/12/19版權(quán)所有BY張學(xué)毅4因素A水平A1水平A2…水平As12:2022/12/17版權(quán)所有BY張學(xué)毅4因素A水平A142022/12/19版權(quán)所有BY張學(xué)毅5表中:為第i個(gè)水平的第j個(gè)觀測(cè)值。記第j個(gè)水平觀測(cè)值的均值為,則有記所有觀測(cè)值的均值為,則有2022/12/17版權(quán)所有BY張學(xué)毅552022/12/19版權(quán)所有BY張學(xué)毅6三、方差分析中的三個(gè)基本假設(shè)(1)各個(gè)總體都服從正態(tài)分布;(2)各個(gè)總體的方差都相等;(3)各個(gè)觀測(cè)值之間是相互獨(dú)立的。2022/12/17版權(quán)所有BY張學(xué)毅6三、方差分析中的62022/12/19版權(quán)所有BY張學(xué)毅7四、單因素方差分析的數(shù)學(xué)模型由于則有單因素方差分析的數(shù)學(xué)模型1:2022/12/17版權(quán)所有BY張學(xué)毅7四、單因素方差分72022/12/19版權(quán)所有BY張學(xué)毅8四、單因素方差分析的數(shù)學(xué)模型記,為Aj的效應(yīng)。

則有單因素方差分析的數(shù)學(xué)模型2:2022/12/17版權(quán)所有BY張學(xué)毅8四、單因素方差分82022/12/19版權(quán)所有BY張學(xué)毅9從散點(diǎn)圖上可以看出:不同的水平的數(shù)據(jù)是有明顯差異的;同一個(gè)水平的數(shù)據(jù)也明顯不同;不同水平的觀察值與試驗(yàn)指標(biāo)值之間可能有一定的關(guān)系。3.僅從散點(diǎn)圖上觀察還不能提供充分的證據(jù)證明不同水平與試驗(yàn)指標(biāo)值之間有顯著差異。這種差異可能是由于抽樣的隨機(jī)性所造成的,也有可能是系統(tǒng)性影響因素造成的。五、方差分析的基本思想2022/12/17版權(quán)所有BY張學(xué)毅9從散點(diǎn)圖上可以看92022/12/19版權(quán)所有BY張學(xué)毅104.需要有更準(zhǔn)確的方法來檢驗(yàn)這種差異是否顯著,也就是進(jìn)行方差分析。5.隨機(jī)誤差

因素的同一水平(總體)下,樣本各觀察值之間的差異,可以看成是隨機(jī)因素的影響,稱為隨機(jī)誤差;6.系統(tǒng)誤差

因素的不同水平(不同總體)下,各觀察值之間的差異可能是由于抽樣的隨機(jī)性所造成的,也可能是由于水平本身所造成的,后者所形成的誤差是由系統(tǒng)性因素造成的,稱為系統(tǒng)誤差。2022/12/17版權(quán)所有BY張學(xué)毅104.需要有更準(zhǔn)102022/12/19版權(quán)所有BY張學(xué)毅11方差分析的基本思想7.若不同水平對(duì)試驗(yàn)指標(biāo)值沒有影響,則組間誤差中只包含隨機(jī)誤差,沒有系統(tǒng)誤差。這時(shí),組間誤差與組內(nèi)誤差經(jīng)過平均后的數(shù)值就應(yīng)該很接近,它們的比值就會(huì)接近1;8.若不同水平對(duì)試驗(yàn)指標(biāo)值有影響,則在組間誤差中除了包含隨機(jī)誤差外,還會(huì)包含有系統(tǒng)誤差,這時(shí)組間誤差平均后的數(shù)值就會(huì)大于組內(nèi)誤差平均后的數(shù)值,它們之間的比值就會(huì)大于1;9.當(dāng)這個(gè)比值大到某種程度時(shí),就可以說不同水平之間存在著顯著差異,也就是自變量對(duì)因變量有影響。

2022/12/17版權(quán)所有BY張學(xué)毅11方差分析的基本11總離差平方和(

sumofsquaresfortotal)1)全部觀察值與總均值的離差平方和;2)反映全部觀察值的離散狀況。其計(jì)算公式為:六、離差平方和與自由度的分解總離差平方和1)全部觀察值與總均值12效應(yīng)平方和(組間平方和):SumofsquaresforfactorA1)各組平均值與總平均值的離差平方和;2)反映各總體的樣本均值之間的差異程度,又稱組間平方和;3)該平方和既包括隨機(jī)誤差,也包括系統(tǒng)誤差。計(jì)算公式為:

效應(yīng)平方和(組間平方和)1)各組平均值13誤差平方和(組內(nèi)平方和):Sumofsquaresforerror1)每個(gè)水平或組的各樣本數(shù)據(jù)與其組平均值的離差平方和;2)反映每個(gè)樣本各觀察值的離散狀況,又稱組內(nèi)離差平方和;3)該平方和反映的是隨機(jī)誤差的大小。計(jì)算公式為:誤差平方和(組內(nèi)平方和)1)每個(gè)水平或組的各樣本數(shù)據(jù)與其組14三個(gè)離差平方和的關(guān)系總離差平方和=組間平方和+組內(nèi)平方和

三個(gè)離差平方和的關(guān)系總離差平方和=組間平方和+組內(nèi)平方和15三個(gè)離差平方和的自由度之間的關(guān)系:均方三個(gè)離差平方和的自由度之間的關(guān)系:162022/12/19版權(quán)所有BY張學(xué)毅17七、的統(tǒng)計(jì)特征P228根據(jù)概率論與數(shù)理統(tǒng)計(jì)學(xué)知識(shí):1)是總體方差的無偏估計(jì)量,且與原假設(shè)成立與否無關(guān)。即2)是否是總體方差的無偏估計(jì)量,與原假設(shè)成立與否有關(guān)。當(dāng)且僅當(dāng)原假設(shè)成立時(shí),才是總體方差的無偏估計(jì)量。2022/12/17版權(quán)所有BY張學(xué)毅17七、17八、方差分析表通常將上述計(jì)算過程列成一張表格,稱為方差分析表。變差源平方和自由度均方F比因素A(組間)s-1誤差(組內(nèi))n-s-總和n-1-

-

八、方差分析表通常將上述計(jì)算過程列成一張表格,稱為方差分析表182022/12/19版權(quán)所有BY張學(xué)毅19例9.1熱帶雨林一份研究伐木業(yè)對(duì)熱帶雨林影響的統(tǒng)計(jì)研究報(bào)告指出,“環(huán)保主義者對(duì)于林木采伐、開墾和焚燒導(dǎo)致的熱帶雨林的破壞幾近絕望”。這項(xiàng)研究比較了類似地塊上樹木的數(shù)量,這些地塊有的從未采伐過,有的1年前采伐過,有的8年前采伐過。根據(jù)數(shù)據(jù),采伐對(duì)樹木數(shù)量有顯著影響嗎?顯著性水平α=0.05。

2022/12/17版權(quán)所有BY張學(xué)毅19例9.1熱192022/12/19202、提出零假設(shè)和備擇假設(shè)H0:u1=u2=u3H1:u1,u2,u3不全相等。從未采伐過1年前采伐過8年前采伐過2712182212429152221915192018331819161722201412241412272281719192022/12/17202、提出零假設(shè)和備擇假設(shè)從未采伐過1202022/12/19版權(quán)所有BY張學(xué)毅21方差分析表結(jié)論:F值=11.43>3.32,p-值=0.0002<0.05,因此檢驗(yàn)的結(jié)論是采伐對(duì)林木數(shù)量有顯著影響。變差源SSdfMSFP-valueFcrit組間625.162312.5811.430.00023.32組內(nèi)820.723027.36總計(jì)1445.8832

2022/12/17版權(quán)所有BY張學(xué)毅21方差分析表變差212022/12/19版權(quán)所有BY張學(xué)毅22【例9.2】某市消費(fèi)者協(xié)會(huì)為了評(píng)價(jià)該地旅游業(yè)、居民服務(wù)業(yè)、公路客運(yùn)業(yè)和保險(xiǎn)業(yè)的服務(wù)質(zhì)量,從這4個(gè)行業(yè)中分別抽取了不同數(shù)量的企業(yè)。經(jīng)統(tǒng)計(jì),最近一年消費(fèi)者對(duì)這23家企業(yè)投訴的次數(shù)資料如下表所示。這4個(gè)行業(yè)之間服務(wù)質(zhì)量是否有顯著差異?如果有,究竟是在哪些行業(yè)之間?2022/12/17版權(quán)所有BY張學(xué)毅22【例9.2】22解(1)建立假設(shè)

(2)列方差分析表(3)統(tǒng)計(jì)決策因?yàn)椋跃芙^。即有99%的把握認(rèn)為不同行業(yè)之間的服務(wù)質(zhì)量有高度顯著的差異。解(1)建立假設(shè)232022/12/19版權(quán)所有BY張學(xué)毅24第二節(jié)兩因素試驗(yàn)數(shù)據(jù)的方差分析一、無交互作用的雙因素方差分析

若記一因素為因素A,另一因素為因素B,對(duì)A與B同時(shí)進(jìn)行分析,就屬于雙因素方差分,即判斷是否有某一個(gè)或兩個(gè)因素對(duì)試驗(yàn)指標(biāo)有顯著影響,兩個(gè)因素結(jié)合后是否有新效應(yīng)。在統(tǒng)計(jì)學(xué)中將各個(gè)因素的不同水平的搭配所產(chǎn)生的新的影響稱為交互作用。我們先討論無交互作用的雙因素方差分析問題,對(duì)于有交互作用的雙因素方差分析問題稍后再討論。2022/12/17版權(quán)所有BY張學(xué)毅24第二節(jié)兩因242022/12/19版權(quán)所有BY張學(xué)毅25無交互作用的雙因素方差分析數(shù)據(jù)結(jié)構(gòu)2022/12/17版權(quán)所有BY張學(xué)毅25無交互作用的雙252022/12/19版權(quán)所有BY張學(xué)毅26雙因素?zé)o交互作用的方差分析,又稱為雙因素?zé)o重復(fù)試驗(yàn)的方差分析;雙因素有交互作用的方差分析,又稱為雙因素等重復(fù)試驗(yàn)的方差分析;判斷因素A的影響是否顯著等價(jià)于檢驗(yàn)假設(shè):判斷因素B的影響是否顯著等價(jià)于檢驗(yàn)假設(shè):其中,表示A的第i個(gè)水平所構(gòu)成的總體均值,表示的B第j個(gè)水平所構(gòu)成的總體均值。2022/12/17版權(quán)所有BY張學(xué)毅26雙因素?zé)o交互作26

對(duì)離差總平方和進(jìn)行分解。與單因素情況類似,能夠證明下列公式成立:總離差平方和的自由度分解為:F統(tǒng)計(jì)量:

對(duì)離差總平方和進(jìn)行分解。與單因素情況類似,能夠272022/12/19版權(quán)所有BY張學(xué)毅282022/12/17版權(quán)所有BY張學(xué)毅2828

例9.3為提高某種產(chǎn)品的合格率,考察原料來源地和用量對(duì)其是否有影響。原料來源地有三個(gè):甲、乙、丙;原料用量有三種:現(xiàn)有量、增加5%、增加8%。每個(gè)水平組合各作一次試驗(yàn),得到的數(shù)據(jù)如下表所示。試分析原料來源地和用量對(duì)產(chǎn)品合格率的影響是否顯著?例9.3為提高某種產(chǎn)品的合格率,考察原料來292022/12/19版權(quán)所有BY張學(xué)毅30【例題】解:(1)建立假設(shè)(2)列方差分析表2022/12/17版權(quán)所有BY張學(xué)毅30【例題】解:(302022/12/19版權(quán)所有BY張學(xué)毅31(3)統(tǒng)計(jì)決策對(duì)于顯著性水平0.05,查表得臨界值因?yàn)?,,故不拒絕,拒絕。即根據(jù)現(xiàn)有數(shù)據(jù),有95%的把握可以推斷原料來源地對(duì)產(chǎn)品合格率的影響不大,而原料用量對(duì)合格率有顯著影響。由于為最優(yōu)水平。既然原料來源地對(duì)產(chǎn)品合格率的影響不顯著,在保證質(zhì)量的前提下,可以選擇運(yùn)費(fèi)最省的地方作為原料來源地選擇時(shí)的首選。如果丙地的運(yùn)費(fèi)最省,則最優(yōu)方案為。

2022/12/17版權(quán)所有BY張學(xué)毅31312022/12/19版權(quán)所有BY張學(xué)毅32【例9.4】某種火箭使用了四種燃料,三種推進(jìn)器做試驗(yàn)。每種燃料和每種推進(jìn)器的組合各做一次試驗(yàn),得火箭射程數(shù)據(jù)如下表所示。試問不同的燃料、不同的推進(jìn)器分別對(duì)火箭射程有無顯著影響?2022/12/17版權(quán)所有BY張學(xué)毅32【例9.4】322022/12/19版權(quán)所有BY張學(xué)毅33列方差分析表:2022/12/17版權(quán)所有BY張學(xué)毅33332022/12/19版權(quán)所有BY張學(xué)毅342022/12/17版權(quán)所有BY張學(xué)毅34342022/12/19版權(quán)所有BY張學(xué)毅352022/12/17版權(quán)所有BY張學(xué)毅35352022/12/19版權(quán)所有BY張學(xué)毅36二、有交互作用的雙因素方差分析

所謂交互作用,簡(jiǎn)單來說就是不同因素對(duì)試驗(yàn)指標(biāo)的復(fù)合作用,因素A和B的綜合效應(yīng)不是二因素效應(yīng)的簡(jiǎn)單相加。為了能分辨出兩個(gè)因素的交互作用,一般每組試驗(yàn)至少作兩次。2022/12/17版權(quán)所有BY張學(xué)毅36二、有交互作用362022/12/19版權(quán)所有BY張學(xué)毅37

有交互作用的雙因素方差分析數(shù)據(jù)結(jié)構(gòu)2022/12/17版權(quán)所有BY張學(xué)毅37有交互372022/12/19版權(quán)所有BY張學(xué)毅382.建立假設(shè)2022/12/17版權(quán)所有BY張學(xué)毅382.建立假設(shè)382022/12/19版權(quán)所有BY張學(xué)毅39這就是有交互作用的雙因素方差分析的數(shù)學(xué)模型。2022/12/17版權(quán)所有BY張學(xué)毅39392022/12/19版權(quán)所有BY張學(xué)毅40對(duì)這一模型可設(shè)如下三個(gè)假設(shè):2022/12/17版權(quán)所有BY張學(xué)毅40對(duì)這一模型可設(shè)402022/12/19版權(quán)所有BY張學(xué)毅413.方差分析與單因素方差分析的平方和分解類似,有2022/12/17版權(quán)所有BY張學(xué)毅413.方差分析與412022/12/19版權(quán)所有BY張學(xué)毅422022/12/17版權(quán)所有BY張學(xué)毅42422022/12/19版權(quán)所有BY張學(xué)毅43雙因素(有交互作用)方差分析表2022/12/17版權(quán)所有BY張學(xué)毅43雙因素(有交互432022/12/19版權(quán)所有BY張學(xué)毅44

例9.5某公司想將橡膠、塑料和軟木的板材沖壓成密封墊片出售。市場(chǎng)上有兩種不同型號(hào)的沖壓機(jī)可供選擇。為了能對(duì)沖壓機(jī)每小時(shí)所生產(chǎn)的墊片數(shù)進(jìn)行比較,并確定哪種機(jī)器使用何種材料生產(chǎn)墊片的能力更強(qiáng),該公司使用每臺(tái)機(jī)器對(duì)每一種材料分別運(yùn)行三段時(shí)間,得到的試驗(yàn)數(shù)據(jù)(每小時(shí)生產(chǎn)的墊片數(shù))如下表所示,試運(yùn)用方差分析確定最優(yōu)方案。2022/12/17版權(quán)所有BY張學(xué)毅44442022/12/19版權(quán)所有BY張學(xué)毅452022/12/17版權(quán)所有BY張學(xué)毅45452022/12/19版權(quán)所有BY張學(xué)毅46解(1)建立假設(shè):(2)計(jì)算相應(yīng)的均值和平方和:2022/12/17版權(quán)所有BY張學(xué)毅46解462022/12/19版權(quán)所有BY張學(xué)毅472022/12/17版權(quán)所有BY張學(xué)毅47472022/12/19版權(quán)所有BY張學(xué)毅48(3)列方差分析表2022/12/17版權(quán)所有BY張學(xué)毅48(3)列方差482022/12/19版權(quán)所有BY張學(xué)毅49(4)統(tǒng)計(jì)決策由于

,說明不僅沖壓機(jī)的型號(hào)和墊片材料對(duì)墊片數(shù)量有顯著影響,而且其交互作用也是顯著的。由結(jié)構(gòu)均值表可知,在沖壓機(jī)中,第一種的均值較大;墊片材料中,軟木的均值較大,故最優(yōu)方案是。2022/12/17版權(quán)所有BY張學(xué)毅49(4)統(tǒng)計(jì)決492022/12/1950第三節(jié)一元線性回歸一、一元線性回歸二、a,b的估計(jì)三、總體方差的估計(jì)四、線性假設(shè)的顯著性檢驗(yàn)五、系數(shù)b的置信區(qū)間六、回歸預(yù)測(cè)七、可化為一元線性回歸的例子(自學(xué))2022/12/1750第三節(jié)一元線性回歸一、一元線性回50回歸模型的類型回歸模型的類型51一、一元線性回歸只涉及一個(gè)自變量的回歸;因變量y與自變量x之間為線性關(guān)系。被預(yù)測(cè)或被解釋的變量稱為因變量(dependentvariable),用y表示;用來預(yù)測(cè)或用來解釋因變量的一個(gè)或多個(gè)變量稱為自變量(independentvariable),用x表示。因變量與自變量之間的關(guān)系用一個(gè)線性方程來表示。一、一元線性回歸只涉及一個(gè)自變量的回歸;52一元線性回歸模型的基本形式①描述因變量y如何依賴于自變量x和誤差項(xiàng)

的方程稱為理論回歸模型②一元線性回歸模型可表示為y是x的線性函數(shù)(部分)加上隨機(jī)誤差項(xiàng)線性部分反映了由于x的變化而引起的y的變化;誤差項(xiàng)

是隨機(jī)變量(未納入模型但對(duì)y有影響的諸多因素的綜合影響),反映了除x和y之間的線性關(guān)系之外的隨機(jī)因素對(duì)y的影響,是不能由x和y之間的線性關(guān)系所解釋的變異性。a和b稱為模型的參數(shù)理論回歸模型一元線性回歸模型的基本形式①描述因變量y如何依賴于自變53●在抽樣中,自變量x的取值是固定的,即x是非隨機(jī)的;因變量y是隨機(jī)的。

即當(dāng)解釋變量X取某固定值時(shí),Y的值不確定,Y的不同取值形成一定的分布,這是Y的條件分布?;貧w線,描述的是Y的條件期望E(Y/xi)與之對(duì)應(yīng)xi,代表這些Y的條件期望的點(diǎn)的軌跡所形成的直線或曲線。如注意:

由于單個(gè)數(shù)據(jù)點(diǎn)是從y的分布中抽出來的,可能不在這條回歸線上,因此必須包含隨機(jī)誤差項(xiàng)e來描述模型數(shù)據(jù)點(diǎn).

xy回歸線●在抽樣中,自變量x的取值是固定的,即x是非隨機(jī)的;因變量y54回歸模型的基本假設(shè)假設(shè)1:誤差項(xiàng)的期望值為0,即對(duì)所有的i有假設(shè)2:誤差項(xiàng)的方差為常數(shù),即對(duì)所有的i有假設(shè)3:誤差項(xiàng)之間不存在自相關(guān)關(guān)系,其協(xié)方差為0,即當(dāng)時(shí),有;假設(shè)4:自變量是給定的變量,與隨機(jī)誤差項(xiàng)線性無關(guān);假設(shè)5:隨機(jī)誤差項(xiàng)服從正態(tài)分布。即ε~N(0,σ2)以上這些基本假設(shè)是德國數(shù)學(xué)家高斯最早提出的,故也稱為高斯假定或標(biāo)準(zhǔn)假定?;貧w模型的基本假設(shè)假設(shè)1:誤差項(xiàng)的期望值為0,即對(duì)所有的i有55回歸方程(regressionequation)

描述y的平均值或期望值如何依賴于x的方程稱為回歸方程一元線性回歸方程的形式如下:方程的圖示是一條直線,也稱為直線回歸方程。a是回歸直線在y軸上的截距,是當(dāng)x=0時(shí)y的期望值;b是直線的斜率,稱為回歸系數(shù),表示當(dāng)x每變動(dòng)一個(gè)單位時(shí),y的平均變動(dòng)值。回歸方程(regressionequation)描56.估計(jì)的回歸方程(estimatedregressionequation)一元線性回歸中估計(jì)的回歸方程為用樣本統(tǒng)計(jì)量,代替回歸方程中的未知參數(shù)和,就得到了估計(jì)的回歸方程.總體回歸參數(shù)和

是未知的,必須利用樣本數(shù)據(jù)去估計(jì);其中:是估計(jì)的回歸直線在y

軸上的截距,是直線的斜率,它表示對(duì)于一個(gè)給定的x

的值,是y

的估計(jì)值,也表示x

每變動(dòng)一個(gè)單位時(shí),y的平均變動(dòng)值。.估計(jì)的回歸方程(estimatedregression57.二、a,b的估計(jì)(

普通最小二乘估計(jì)法)

(ordinaryleastsquaresestimators)使因變量的觀察值與估計(jì)值之間的離差平方和達(dá)到最小來求得和的方法。即用最小平方法擬合的直線來代表x與y之間的關(guān)系與實(shí)際數(shù)據(jù)的誤差比其他任何直線的誤差都小。.二、a,b的估計(jì)(普通最小二乘估計(jì)法)

(ordinar582022/12/1959參數(shù)的最小二乘估計(jì)P246-2472022/12/1759參數(shù)的最小二乘估計(jì)P246-247592022/12/1960例9.6【例10.7】一家大型商業(yè)銀行在多個(gè)地區(qū)設(shè)有分行,其業(yè)務(wù)主要是進(jìn)行基礎(chǔ)設(shè)施建設(shè)、國家重點(diǎn)項(xiàng)目建設(shè)、固定資產(chǎn)投資等項(xiàng)目的貸款。近年來,該銀行的貸款額平穩(wěn)增長(zhǎng),但不良貸款額也有較大比例的增長(zhǎng),這給銀行業(yè)務(wù)的發(fā)展帶來較大壓力。為弄清不良貸款形成的原因,管理者希望利用銀行業(yè)務(wù)的有關(guān)數(shù)據(jù)進(jìn)行定量分析,以便找出控制不良貸款的辦法。下面是該銀行所屬的25家分行2019年的有關(guān)業(yè)務(wù)數(shù)據(jù)2022/12/1760例9.6【例10.7】一家大型商業(yè)銀602022/12/19612022/12/1761612022/12/1962不良貸款對(duì)其他變量的散點(diǎn)圖2022/12/1762不良貸款對(duì)其他變量的散點(diǎn)圖622022/12/1963用Excel計(jì)算相關(guān)系數(shù)2022/12/1763用Excel計(jì)算相關(guān)系數(shù)63SUMMARYOUTPUT回歸統(tǒng)計(jì)MultipleR0.849736RSquare0.722051AdjustedRSquare0.709966標(biāo)準(zhǔn)誤差4.45116觀測(cè)值25方差分析

dfSSMSFSignificanceF回歸分析11183.7951183.79559.748967.69E-08殘差23455.694919.81282總計(jì)241639.49

Coefficients標(biāo)準(zhǔn)誤差tStatP-valueLower95%Upper95%下限95.0%上限95.0%Intercept-1.384731.625488-0.851890.40306-4.747311.977845-4.747311.977845XVariable10.0874110.0113087.7297457.69E-080.0640180.1108040.0640180.1108042022/12/1964SUMMARYOUTPUT回歸統(tǒng)計(jì)MultipleR0.642022/12/1965經(jīng)驗(yàn)回歸方程的求法回歸方程為:y=-1.38473

+0.087411

x回歸系數(shù)=0.087411表示,貸款余額每增加1億元,不良貸款平均增加0.087411億元

^2022/12/1765經(jīng)驗(yàn)回歸方程的求法回歸方程為:^652022/12/1966估計(jì)回歸方程的求法不良貸款對(duì)貸款余額回歸方程的圖示2022/12/1766估計(jì)回歸方程的求法不良貸款對(duì)貸款余額662022/12/1967用Excel進(jìn)行回歸分析第1步:選擇“工具”下拉菜單第2步:選擇“數(shù)據(jù)分析”選項(xiàng)第3步:在分析工具中選擇“回歸”,然后選擇“確定”第4步:當(dāng)對(duì)話框出現(xiàn)時(shí)

在“Y值輸入?yún)^(qū)域”設(shè)置框內(nèi)鍵入Y的數(shù)據(jù)區(qū)域在“X值輸入?yún)^(qū)域”設(shè)置框內(nèi)鍵入X的數(shù)據(jù)區(qū)域在“置信度”選項(xiàng)中給出所需的數(shù)值在“輸出選項(xiàng)”中選擇輸出區(qū)域在“殘差”分析選項(xiàng)中選擇所需的選項(xiàng)2022/12/1767用Excel進(jìn)行回歸分析第1步:選擇672022/12/1968三、

的估計(jì)P249-250

稱為殘差平方和,則2022/12/1768三、的估計(jì)682022/12/1969

四、線性假設(shè)的顯著性檢驗(yàn)P2512022/12/1769四、線性假設(shè)的顯著性檢驗(yàn)P25692022/12/1970

五、系數(shù)b的置信區(qū)間P2522022/12/1770五、系數(shù)b的置信區(qū)間P252702022/12/1971六、回歸函數(shù)函數(shù)值的點(diǎn)估計(jì)和置信區(qū)間回歸函數(shù)的點(diǎn)估計(jì)值為

的置信水平為的置信區(qū)間為2022/12/1771六、回歸函數(shù)712022/12/1972七、Y的觀測(cè)值的點(diǎn)預(yù)測(cè)和預(yù)測(cè)區(qū)間2022/12/1772七、Y的觀測(cè)值的點(diǎn)預(yù)測(cè)和預(yù)測(cè)區(qū)間722022/12/1973八、可化為一元線性回歸的例子P255自學(xué)。2022/12/1773八、可化為一元線性回歸的例子P255732022/12/1974第四節(jié)多元線性回歸P257因?yàn)榭陀^現(xiàn)象非常復(fù)雜,現(xiàn)象之間的聯(lián)系方式和性質(zhì)各不相同,影響因變量變化的自變量往往是多個(gè)而不只是一個(gè),其中既有主要因素也有次要因素。如果僅僅進(jìn)行一元回歸分析,不一定能得到滿意的結(jié)果。因此,有必要將一個(gè)因變量與多個(gè)自變量聯(lián)系起來進(jìn)行分析。2022/12/1774第四節(jié)多元線性回歸P742022/12/1975多元線性回歸在線性相關(guān)條件下,研究?jī)蓚€(gè)和兩個(gè)以上自變量對(duì)一個(gè)因變量的數(shù)量變化關(guān)系,稱為多元線性回歸分析,表現(xiàn)這一數(shù)量關(guān)系的數(shù)學(xué)表達(dá)式則稱為多元線性回歸方程或多元線性回歸模型。2022/12/1775多元線性回歸在線性相關(guān)條件下752022/12/1976多元線性回歸2022/12/1776多元線性回歸762022/12/19版權(quán)所有BY張學(xué)毅77第九章第一節(jié)單因素試驗(yàn)的方差分析2022/12/17版權(quán)所有BY張學(xué)毅1第九章第772022/12/19版權(quán)所有BY張學(xué)毅78一、方差分析的有關(guān)概念1.方差分析(AnalysisofVariance,ANOVA)是一種檢驗(yàn)多

個(gè)正態(tài)總體均值是否相等的統(tǒng)計(jì)方法。

2.因素的水平:指試驗(yàn)因素的某種特定狀態(tài)或數(shù)量等級(jí),簡(jiǎn)

稱水平。3.試驗(yàn)指標(biāo):衡量實(shí)驗(yàn)結(jié)果好壞程度的試驗(yàn)數(shù)據(jù)。在單因素方差分析中,將因素的任何一個(gè)水平看作是一個(gè)總體,該水平下試驗(yàn)得到的數(shù)據(jù)可看成是從總體中抽出的一個(gè)樣本。若方差分析中考察的因素只有一個(gè)時(shí),稱為單因素方差分析;若同時(shí)研究?jī)蓚€(gè)因素對(duì)試驗(yàn)指標(biāo)的影響時(shí),則稱為兩因素試驗(yàn)。同時(shí)針對(duì)兩個(gè)因素進(jìn)行,則稱為雙因素方差分析。

2022/12/17版權(quán)所有BY張學(xué)毅2一、方差分析的有782022/12/19版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組79二、單因素方差分析的數(shù)據(jù)結(jié)構(gòu)

2022/12/17版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組3二、單因素792022/12/19版權(quán)所有BY張學(xué)毅80因素A水平A1水平A2…水平As12:2022/12/17版權(quán)所有BY張學(xué)毅4因素A水平A1802022/12/19版權(quán)所有BY張學(xué)毅81表中:為第i個(gè)水平的第j個(gè)觀測(cè)值。記第j個(gè)水平觀測(cè)值的均值為,則有記所有觀測(cè)值的均值為,則有2022/12/17版權(quán)所有BY張學(xué)毅5812022/12/19版權(quán)所有BY張學(xué)毅82三、方差分析中的三個(gè)基本假設(shè)(1)各個(gè)總體都服從正態(tài)分布;(2)各個(gè)總體的方差都相等;(3)各個(gè)觀測(cè)值之間是相互獨(dú)立的。2022/12/17版權(quán)所有BY張學(xué)毅6三、方差分析中的822022/12/19版權(quán)所有BY張學(xué)毅83四、單因素方差分析的數(shù)學(xué)模型由于則有單因素方差分析的數(shù)學(xué)模型1:2022/12/17版權(quán)所有BY張學(xué)毅7四、單因素方差分832022/12/19版權(quán)所有BY張學(xué)毅84四、單因素方差分析的數(shù)學(xué)模型記,為Aj的效應(yīng)。

則有單因素方差分析的數(shù)學(xué)模型2:2022/12/17版權(quán)所有BY張學(xué)毅8四、單因素方差分842022/12/19版權(quán)所有BY張學(xué)毅85從散點(diǎn)圖上可以看出:不同的水平的數(shù)據(jù)是有明顯差異的;同一個(gè)水平的數(shù)據(jù)也明顯不同;不同水平的觀察值與試驗(yàn)指標(biāo)值之間可能有一定的關(guān)系。3.僅從散點(diǎn)圖上觀察還不能提供充分的證據(jù)證明不同水平與試驗(yàn)指標(biāo)值之間有顯著差異。這種差異可能是由于抽樣的隨機(jī)性所造成的,也有可能是系統(tǒng)性影響因素造成的。五、方差分析的基本思想2022/12/17版權(quán)所有BY張學(xué)毅9從散點(diǎn)圖上可以看852022/12/19版權(quán)所有BY張學(xué)毅864.需要有更準(zhǔn)確的方法來檢驗(yàn)這種差異是否顯著,也就是進(jìn)行方差分析。5.隨機(jī)誤差

因素的同一水平(總體)下,樣本各觀察值之間的差異,可以看成是隨機(jī)因素的影響,稱為隨機(jī)誤差;6.系統(tǒng)誤差

因素的不同水平(不同總體)下,各觀察值之間的差異可能是由于抽樣的隨機(jī)性所造成的,也可能是由于水平本身所造成的,后者所形成的誤差是由系統(tǒng)性因素造成的,稱為系統(tǒng)誤差。2022/12/17版權(quán)所有BY張學(xué)毅104.需要有更準(zhǔn)862022/12/19版權(quán)所有BY張學(xué)毅87方差分析的基本思想7.若不同水平對(duì)試驗(yàn)指標(biāo)值沒有影響,則組間誤差中只包含隨機(jī)誤差,沒有系統(tǒng)誤差。這時(shí),組間誤差與組內(nèi)誤差經(jīng)過平均后的數(shù)值就應(yīng)該很接近,它們的比值就會(huì)接近1;8.若不同水平對(duì)試驗(yàn)指標(biāo)值有影響,則在組間誤差中除了包含隨機(jī)誤差外,還會(huì)包含有系統(tǒng)誤差,這時(shí)組間誤差平均后的數(shù)值就會(huì)大于組內(nèi)誤差平均后的數(shù)值,它們之間的比值就會(huì)大于1;9.當(dāng)這個(gè)比值大到某種程度時(shí),就可以說不同水平之間存在著顯著差異,也就是自變量對(duì)因變量有影響。

2022/12/17版權(quán)所有BY張學(xué)毅11方差分析的基本87總離差平方和(

sumofsquaresfortotal)1)全部觀察值與總均值的離差平方和;2)反映全部觀察值的離散狀況。其計(jì)算公式為:六、離差平方和與自由度的分解總離差平方和1)全部觀察值與總均值88效應(yīng)平方和(組間平方和):SumofsquaresforfactorA1)各組平均值與總平均值的離差平方和;2)反映各總體的樣本均值之間的差異程度,又稱組間平方和;3)該平方和既包括隨機(jī)誤差,也包括系統(tǒng)誤差。計(jì)算公式為:

效應(yīng)平方和(組間平方和)1)各組平均值89誤差平方和(組內(nèi)平方和):Sumofsquaresforerror1)每個(gè)水平或組的各樣本數(shù)據(jù)與其組平均值的離差平方和;2)反映每個(gè)樣本各觀察值的離散狀況,又稱組內(nèi)離差平方和;3)該平方和反映的是隨機(jī)誤差的大小。計(jì)算公式為:誤差平方和(組內(nèi)平方和)1)每個(gè)水平或組的各樣本數(shù)據(jù)與其組90三個(gè)離差平方和的關(guān)系總離差平方和=組間平方和+組內(nèi)平方和

三個(gè)離差平方和的關(guān)系總離差平方和=組間平方和+組內(nèi)平方和91三個(gè)離差平方和的自由度之間的關(guān)系:均方三個(gè)離差平方和的自由度之間的關(guān)系:922022/12/19版權(quán)所有BY張學(xué)毅93七、的統(tǒng)計(jì)特征P228根據(jù)概率論與數(shù)理統(tǒng)計(jì)學(xué)知識(shí):1)是總體方差的無偏估計(jì)量,且與原假設(shè)成立與否無關(guān)。即2)是否是總體方差的無偏估計(jì)量,與原假設(shè)成立與否有關(guān)。當(dāng)且僅當(dāng)原假設(shè)成立時(shí),才是總體方差的無偏估計(jì)量。2022/12/17版權(quán)所有BY張學(xué)毅17七、93八、方差分析表通常將上述計(jì)算過程列成一張表格,稱為方差分析表。變差源平方和自由度均方F比因素A(組間)s-1誤差(組內(nèi))n-s-總和n-1-

-

八、方差分析表通常將上述計(jì)算過程列成一張表格,稱為方差分析表942022/12/19版權(quán)所有BY張學(xué)毅95例9.1熱帶雨林一份研究伐木業(yè)對(duì)熱帶雨林影響的統(tǒng)計(jì)研究報(bào)告指出,“環(huán)保主義者對(duì)于林木采伐、開墾和焚燒導(dǎo)致的熱帶雨林的破壞幾近絕望”。這項(xiàng)研究比較了類似地塊上樹木的數(shù)量,這些地塊有的從未采伐過,有的1年前采伐過,有的8年前采伐過。根據(jù)數(shù)據(jù),采伐對(duì)樹木數(shù)量有顯著影響嗎?顯著性水平α=0.05。

2022/12/17版權(quán)所有BY張學(xué)毅19例9.1熱952022/12/19962、提出零假設(shè)和備擇假設(shè)H0:u1=u2=u3H1:u1,u2,u3不全相等。從未采伐過1年前采伐過8年前采伐過2712182212429152221915192018331819161722201412241412272281719192022/12/17202、提出零假設(shè)和備擇假設(shè)從未采伐過1962022/12/19版權(quán)所有BY張學(xué)毅97方差分析表結(jié)論:F值=11.43>3.32,p-值=0.0002<0.05,因此檢驗(yàn)的結(jié)論是采伐對(duì)林木數(shù)量有顯著影響。變差源SSdfMSFP-valueFcrit組間625.162312.5811.430.00023.32組內(nèi)820.723027.36總計(jì)1445.8832

2022/12/17版權(quán)所有BY張學(xué)毅21方差分析表變差972022/12/19版權(quán)所有BY張學(xué)毅98【例9.2】某市消費(fèi)者協(xié)會(huì)為了評(píng)價(jià)該地旅游業(yè)、居民服務(wù)業(yè)、公路客運(yùn)業(yè)和保險(xiǎn)業(yè)的服務(wù)質(zhì)量,從這4個(gè)行業(yè)中分別抽取了不同數(shù)量的企業(yè)。經(jīng)統(tǒng)計(jì),最近一年消費(fèi)者對(duì)這23家企業(yè)投訴的次數(shù)資料如下表所示。這4個(gè)行業(yè)之間服務(wù)質(zhì)量是否有顯著差異?如果有,究竟是在哪些行業(yè)之間?2022/12/17版權(quán)所有BY張學(xué)毅22【例9.2】98解(1)建立假設(shè)

(2)列方差分析表(3)統(tǒng)計(jì)決策因?yàn)椋跃芙^。即有99%的把握認(rèn)為不同行業(yè)之間的服務(wù)質(zhì)量有高度顯著的差異。解(1)建立假設(shè)992022/12/19版權(quán)所有BY張學(xué)毅100第二節(jié)兩因素試驗(yàn)數(shù)據(jù)的方差分析一、無交互作用的雙因素方差分析

若記一因素為因素A,另一因素為因素B,對(duì)A與B同時(shí)進(jìn)行分析,就屬于雙因素方差分,即判斷是否有某一個(gè)或兩個(gè)因素對(duì)試驗(yàn)指標(biāo)有顯著影響,兩個(gè)因素結(jié)合后是否有新效應(yīng)。在統(tǒng)計(jì)學(xué)中將各個(gè)因素的不同水平的搭配所產(chǎn)生的新的影響稱為交互作用。我們先討論無交互作用的雙因素方差分析問題,對(duì)于有交互作用的雙因素方差分析問題稍后再討論。2022/12/17版權(quán)所有BY張學(xué)毅24第二節(jié)兩因1002022/12/19版權(quán)所有BY張學(xué)毅101無交互作用的雙因素方差分析數(shù)據(jù)結(jié)構(gòu)2022/12/17版權(quán)所有BY張學(xué)毅25無交互作用的雙1012022/12/19版權(quán)所有BY張學(xué)毅102雙因素?zé)o交互作用的方差分析,又稱為雙因素?zé)o重復(fù)試驗(yàn)的方差分析;雙因素有交互作用的方差分析,又稱為雙因素等重復(fù)試驗(yàn)的方差分析;判斷因素A的影響是否顯著等價(jià)于檢驗(yàn)假設(shè):判斷因素B的影響是否顯著等價(jià)于檢驗(yàn)假設(shè):其中,表示A的第i個(gè)水平所構(gòu)成的總體均值,表示的B第j個(gè)水平所構(gòu)成的總體均值。2022/12/17版權(quán)所有BY張學(xué)毅26雙因素?zé)o交互作102

對(duì)離差總平方和進(jìn)行分解。與單因素情況類似,能夠證明下列公式成立:總離差平方和的自由度分解為:F統(tǒng)計(jì)量:

對(duì)離差總平方和進(jìn)行分解。與單因素情況類似,能夠1032022/12/19版權(quán)所有BY張學(xué)毅1042022/12/17版權(quán)所有BY張學(xué)毅28104

例9.3為提高某種產(chǎn)品的合格率,考察原料來源地和用量對(duì)其是否有影響。原料來源地有三個(gè):甲、乙、丙;原料用量有三種:現(xiàn)有量、增加5%、增加8%。每個(gè)水平組合各作一次試驗(yàn),得到的數(shù)據(jù)如下表所示。試分析原料來源地和用量對(duì)產(chǎn)品合格率的影響是否顯著?例9.3為提高某種產(chǎn)品的合格率,考察原料來1052022/12/19版權(quán)所有BY張學(xué)毅106【例題】解:(1)建立假設(shè)(2)列方差分析表2022/12/17版權(quán)所有BY張學(xué)毅30【例題】解:(1062022/12/19版權(quán)所有BY張學(xué)毅107(3)統(tǒng)計(jì)決策對(duì)于顯著性水平0.05,查表得臨界值因?yàn)?,,故不拒絕,拒絕。即根據(jù)現(xiàn)有數(shù)據(jù),有95%的把握可以推斷原料來源地對(duì)產(chǎn)品合格率的影響不大,而原料用量對(duì)合格率有顯著影響。由于為最優(yōu)水平。既然原料來源地對(duì)產(chǎn)品合格率的影響不顯著,在保證質(zhì)量的前提下,可以選擇運(yùn)費(fèi)最省的地方作為原料來源地選擇時(shí)的首選。如果丙地的運(yùn)費(fèi)最省,則最優(yōu)方案為。

2022/12/17版權(quán)所有BY張學(xué)毅311072022/12/19版權(quán)所有BY張學(xué)毅108【例9.4】某種火箭使用了四種燃料,三種推進(jìn)器做試驗(yàn)。每種燃料和每種推進(jìn)器的組合各做一次試驗(yàn),得火箭射程數(shù)據(jù)如下表所示。試問不同的燃料、不同的推進(jìn)器分別對(duì)火箭射程有無顯著影響?2022/12/17版權(quán)所有BY張學(xué)毅32【例9.4】1082022/12/19版權(quán)所有BY張學(xué)毅109列方差分析表:2022/12/17版權(quán)所有BY張學(xué)毅331092022/12/19版權(quán)所有BY張學(xué)毅1102022/12/17版權(quán)所有BY張學(xué)毅341102022/12/19版權(quán)所有BY張學(xué)毅1112022/12/17版權(quán)所有BY張學(xué)毅351112022/12/19版權(quán)所有BY張學(xué)毅112二、有交互作用的雙因素方差分析

所謂交互作用,簡(jiǎn)單來說就是不同因素對(duì)試驗(yàn)指標(biāo)的復(fù)合作用,因素A和B的綜合效應(yīng)不是二因素效應(yīng)的簡(jiǎn)單相加。為了能分辨出兩個(gè)因素的交互作用,一般每組試驗(yàn)至少作兩次。2022/12/17版權(quán)所有BY張學(xué)毅36二、有交互作用1122022/12/19版權(quán)所有BY張學(xué)毅113

有交互作用的雙因素方差分析數(shù)據(jù)結(jié)構(gòu)2022/12/17版權(quán)所有BY張學(xué)毅37有交互1132022/12/19版權(quán)所有BY張學(xué)毅1142.建立假設(shè)2022/12/17版權(quán)所有BY張學(xué)毅382.建立假設(shè)1142022/12/19版權(quán)所有BY張學(xué)毅115這就是有交互作用的雙因素方差分析的數(shù)學(xué)模型。2022/12/17版權(quán)所有BY張學(xué)毅391152022/12/19版權(quán)所有BY張學(xué)毅116對(duì)這一模型可設(shè)如下三個(gè)假設(shè):2022/12/17版權(quán)所有BY張學(xué)毅40對(duì)這一模型可設(shè)1162022/12/19版權(quán)所有BY張學(xué)毅1173.方差分析與單因素方差分析的平方和分解類似,有2022/12/17版權(quán)所有BY張學(xué)毅413.方差分析與1172022/12/19版權(quán)所有BY張學(xué)毅1182022/12/17版權(quán)所有BY張學(xué)毅421182022/12/19版權(quán)所有BY張學(xué)毅119雙因素(有交互作用)方差分析表2022/12/17版權(quán)所有BY張學(xué)毅43雙因素(有交互1192022/12/19版權(quán)所有BY張學(xué)毅120

例9.5某公司想將橡膠、塑料和軟木的板材沖壓成密封墊片出售。市場(chǎng)上有兩種不同型號(hào)的沖壓機(jī)可供選擇。為了能對(duì)沖壓機(jī)每小時(shí)所生產(chǎn)的墊片數(shù)進(jìn)行比較,并確定哪種機(jī)器使用何種材料生產(chǎn)墊片的能力更強(qiáng),該公司使用每臺(tái)機(jī)器對(duì)每一種材料分別運(yùn)行三段時(shí)間,得到的試驗(yàn)數(shù)據(jù)(每小時(shí)生產(chǎn)的墊片數(shù))如下表所示,試運(yùn)用方差分析確定最優(yōu)方案。2022/12/17版權(quán)所有BY張學(xué)毅441202022/12/19版權(quán)所有BY張學(xué)毅1212022/12/17版權(quán)所有BY張學(xué)毅451212022/12/19版權(quán)所有BY張學(xué)毅122解(1)建立假設(shè):(2)計(jì)算相應(yīng)的均值和平方和:2022/12/17版權(quán)所有BY張學(xué)毅46解1222022/12/19版權(quán)所有BY張學(xué)毅1232022/12/17版權(quán)所有BY張學(xué)毅471232022/12/19版權(quán)所有BY張學(xué)毅124(3)列方差分析表2022/12/17版權(quán)所有BY張學(xué)毅48(3)列方差1242022/12/19版權(quán)所有BY張學(xué)毅125(4)統(tǒng)計(jì)決策由于

,說明不僅沖壓機(jī)的型號(hào)和墊片材料對(duì)墊片數(shù)量有顯著影響,而且其交互作用也是顯著的。由結(jié)構(gòu)均值表可知,在沖壓機(jī)中,第一種的均值較大;墊片材料中,軟木的均值較大,故最優(yōu)方案是。2022/12/17版權(quán)所有BY張學(xué)毅49(4)統(tǒng)計(jì)決1252022/12/19126第三節(jié)一元線性回歸一、一元線性回歸二、a,b的估計(jì)三、總體方差的估計(jì)四、線性假設(shè)的顯著性檢驗(yàn)五、系數(shù)b的置信區(qū)間六、回歸預(yù)測(cè)七、可化為一元線性回歸的例子(自學(xué))2022/12/1750第三節(jié)一元線性回歸一、一元線性回126回歸模型的類型回歸模型的類型127一、一元線性回歸只涉及一個(gè)自變量的回歸;因變量y與自變量x之間為線性關(guān)系。被預(yù)測(cè)或被解釋的變量稱為因變量(dependentvariable),用y表示;用來預(yù)測(cè)或用來解釋因變量的一個(gè)或多個(gè)變量稱為自變量(independentvariable),用x表示。因變量與自變量之間的關(guān)系用一個(gè)線性方程來表示。一、一元線性回歸只涉及一個(gè)自變量的回歸;128一元線性回歸模型的基本形式①描述因變量y如何依賴于自變量x和誤差項(xiàng)

的方程稱為理論回歸模型②一元線性回歸模型可表示為y是x的線性函數(shù)(部分)加上隨機(jī)誤差項(xiàng)線性部分反映了由于x的變化而引起的y的變化;誤差項(xiàng)

是隨機(jī)變量(未納入模型但對(duì)y有影響的諸多因素的綜合影響),反映了除x和y之間的線性關(guān)系之外的隨機(jī)因素對(duì)y的影響,是不能由x和y之間的線性關(guān)系所解釋的變異性。a和b稱為模型的參數(shù)理論回歸模型一元線性回歸模型的基本形式①描述因變量y如何依賴于自變129●在抽樣中,自變量x的取值是固定的,即x是非隨機(jī)的;因變量y是隨機(jī)的。

即當(dāng)解釋變量X取某固定值時(shí),Y的值不確定,Y的不同取值形成一定的分布,這是Y的條件分布?;貧w線,描述的是Y的條件期望E(Y/xi)與之對(duì)應(yīng)xi,代表這些Y的條件期望的點(diǎn)的軌跡所形成的直線或曲線。如注意:

由于單個(gè)數(shù)據(jù)點(diǎn)是從y的分布中抽出來的,可能不在這條回歸線上,因此必須包含隨機(jī)誤差項(xiàng)e來描述模型數(shù)據(jù)點(diǎn).

xy回歸線●在抽樣中,自變量x的取值是固定的,即x是非隨機(jī)的;因變量y130回歸模型的基本假設(shè)假設(shè)1:誤差項(xiàng)的期望值為0,即對(duì)所有的i有假設(shè)2:誤差項(xiàng)的方差為常數(shù),即對(duì)所有的i有假設(shè)3:誤差項(xiàng)之間不存在自相關(guān)關(guān)系,其協(xié)方差為0,即當(dāng)時(shí),有;假設(shè)4:自變量是給定的變量,與隨機(jī)誤差項(xiàng)線性無關(guān);假設(shè)5:隨機(jī)誤差項(xiàng)服從正態(tài)分布。即ε~N(0,σ2)以上這些基本假設(shè)是德國數(shù)學(xué)家高斯最早提出的,故也稱為高斯假定或標(biāo)準(zhǔn)假定?;貧w模型的基本假設(shè)假設(shè)1:誤差項(xiàng)的期望值為0,即對(duì)所有的i有131回歸方程(regressionequation)

描述y的平均值或期望值如何依賴于x的方程稱為回歸方程一元線性回歸方程的形式如下:方程的圖示是一條直線,也稱為直線回歸方程。a是回歸直線在y軸上的截距,是當(dāng)x=0時(shí)y的期望值;b是直線的斜率,稱為回歸系數(shù),表示當(dāng)x每變動(dòng)一個(gè)單位時(shí),y的平均變動(dòng)值?;貧w方程(regressionequation)描132.估計(jì)的回歸方程(estimatedregressionequation)一元線性回歸中估計(jì)的回歸方程為用樣本統(tǒng)計(jì)量,代替回歸方程中的未知參數(shù)和,就得到了估計(jì)的回歸方程.總體回歸參數(shù)和

是未知的,必須利用樣本數(shù)據(jù)去估計(jì);其中:是估計(jì)的回歸直線在y

軸上的截距,是直線的斜率,它表示對(duì)于一個(gè)給定的x

的值,是y

的估計(jì)值,也表示x

每變動(dòng)一個(gè)單位時(shí),y的平均變動(dòng)值。.估計(jì)的回歸方程(estimatedregression133.二、a,b的估計(jì)(

普通最小二乘估計(jì)法)

(ordinaryleastsquaresestimators)使因變量的觀察值與估計(jì)值之間的離差平方和達(dá)到最小來求得和的方法。即用最小平方法擬合的直線來代表x與y之間的關(guān)系與實(shí)際數(shù)據(jù)的誤差比其他任何直線的誤差都小。.二、a,b的估計(jì)(普通最小二乘估計(jì)法)

(ordinar1342022/12/19135參數(shù)的最小二乘估計(jì)P246-2472022/12/1759參數(shù)的最小二乘估計(jì)P246-2471352022/12/19136例9.6【例10.7】一家大型商業(yè)銀行在多個(gè)地區(qū)設(shè)有分行,其業(yè)務(wù)主要是進(jìn)行基礎(chǔ)設(shè)施建設(shè)、國家重點(diǎn)項(xiàng)目建設(shè)、固定資產(chǎn)投資等項(xiàng)目的貸款。近年來,該

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論