版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
多元逐步回歸方法的基本思路:自動(dòng)地從大量的可供選擇的變量中選取最重要的變量,據(jù)以建立回歸分析的預(yù)測(cè)或者解釋模型。
變量選取的根據(jù)是自變量對(duì)因變量作用程度的大?。罕A糇饔贸潭却蟮淖兞浚蕹饔眯〉淖兞?。是否選取一個(gè)變量,定量判據(jù)之一就是相關(guān)系數(shù)。假定有m個(gè)自變量,1個(gè)因變量(用y表示),則全部變量(包括自變量和因變量)之間的相關(guān)系數(shù)矩陣可以表作§6.1基本原理多元逐步回歸方法的基本思路:自動(dòng)地從大量的可供選根據(jù)相關(guān)系數(shù)定義一個(gè)自變量的“貢獻(xiàn)”系數(shù)——按照貢獻(xiàn)系數(shù)的大小決定一個(gè)自變量的去留。式中Pj表示第j個(gè)自變量對(duì)因變量的貢獻(xiàn)系數(shù),Rjy
表示第j個(gè)自變量與因變量的相關(guān)系數(shù),Rjj表示相關(guān)系數(shù)矩陣對(duì)角線上第j行第j列元素(j=1,2,…,m)。根據(jù)相關(guān)系數(shù)定義一個(gè)自變量的“貢獻(xiàn)”系數(shù)——按照貢獻(xiàn)系數(shù)的大——第l步計(jì)算的貢獻(xiàn)系數(shù)表示為在逐步回歸分析過程中,我們不僅要引入貢獻(xiàn)最大的自變量,同時(shí)要考慮剔除貢獻(xiàn)最小的因變量。因此,變量的存留與否又涉及到另一個(gè)統(tǒng)計(jì)判據(jù)——F檢驗(yàn)。設(shè)定一個(gè)顯著性水平α,查F檢驗(yàn)表,找到F檢驗(yàn)的臨界值Fα。在第l步計(jì)算中,假如第v個(gè)自變量的貢獻(xiàn)系數(shù)最大,數(shù)值為——第l步計(jì)算的貢獻(xiàn)系數(shù)表示為在逐步回歸分析過根據(jù)F檢驗(yàn)來判斷該自變量是否應(yīng)該被引入模型。式中h為尚且沒有被引入模型的變量序號(hào),v
為選出的變量對(duì)應(yīng)的原始變量序號(hào)(v=1,2,…,m)。計(jì)算變量引入的F值判斷公式如下式中n為樣品個(gè)數(shù),l為計(jì)算步驟數(shù),
為第v個(gè)變量第l步的貢獻(xiàn)系數(shù),Ryy為因變量的自相關(guān)系數(shù)。根據(jù)F檢驗(yàn)來判斷該自變量是否應(yīng)該被引入模型。式中h為尚且如果Fin>Fα,則在這個(gè)顯著性水平下,該變量可以被引入模型,否則不要引入。——在第l步計(jì)算中,如果第v個(gè)自變量的貢獻(xiàn)系數(shù)為——?jiǎng)t可以根據(jù)F檢驗(yàn)來判斷該自變量——包括已經(jīng)引入的變量——是否應(yīng)該被剔除。計(jì)算變量剔除的F值判斷公式如下如果Fin>Fα,則在這個(gè)顯著性水平下,該變量可如果Fout≤Fα,則在這個(gè)顯著性水平下,該變量應(yīng)該被剔除,否則就要保留。在整個(gè)逐步回歸計(jì)算過程中,變量的引入和剔除在兩端同時(shí)進(jìn)行。像這樣循環(huán)往復(fù)地計(jì)算,直到所有該引入的變量都被引入,該剔除的變量均被剔除為止。如果Fout≤Fα,則在這個(gè)顯著性水平下,該變6.2.1數(shù)據(jù)準(zhǔn)備§6.2計(jì)算方法借助一個(gè)簡單的實(shí)例說明逐步回歸分析的方法。問題是山東省淄博市旅游業(yè)的發(fā)展分析,我們想搞清楚哪些因素影響淄博市的旅游總收入(表6-2-1)。所能考慮的因素包括:國內(nèi)游客數(shù)量、海外游客數(shù)量、第三產(chǎn)業(yè)的發(fā)展和人均GDP數(shù)量(m=4)。從1995年到2004年一共10個(gè)年份的數(shù)據(jù)(n=10)。6.2.1數(shù)據(jù)準(zhǔn)備§6.2計(jì)算方法借助一個(gè)簡這些因素都與旅游業(yè)總收入具有明確的關(guān)系。而且,作為自變量,它們彼此之間也有很強(qiáng)的關(guān)系。如果將這四個(gè)變量全部引入模型,就會(huì)導(dǎo)致多重共線性的問題。為了得到簡約、可靠的模型,需要借助逐步回歸分析技術(shù)。這些因素都與旅游業(yè)總收入具有明確的關(guān)系。而且,作逐步回歸分析課件為了更為有效地說明問題,我們對(duì)表6-2-1的變量排列順序稍作調(diào)整(表6-2-2)為了更為有效地說明問題,我們對(duì)表6-2-1的變利用表6-2-2的數(shù)據(jù),容易計(jì)算相關(guān)系數(shù),得到矩陣如下(表6-2-3)。逐步回歸計(jì)算就是從這種相關(guān)系數(shù)矩陣出發(fā)的。將這個(gè)矩陣記為利用表6-2-2的數(shù)據(jù),容易計(jì)算相關(guān)系數(shù),得到首先設(shè)定F統(tǒng)計(jì)量的臨界值。取顯著性水平α=0.05,我們有m=4個(gè)自變量,n=10個(gè)觀測(cè)值。不妨取回歸自由度為4、剩余自由度為n-m-1=10-4-1=5的臨界值為我們引入變量的F值下限,即取Fc(in)=5.192。另一方面,假定一個(gè)變量被淘汰,則有m’=3。我們?nèi)★@著性水平α=0.05、回歸自由度為3、剩余自由度為n-m’-1=10-3-1=6的F臨界值為剔除一個(gè)變量的上限,即取Fc(out)=4.757。首先設(shè)定F統(tǒng)計(jì)量的臨界值。取顯著性水平α=0.這一步的計(jì)算可以分解為如下幾個(gè)步驟。6.2.2第一輪計(jì)算(1)計(jì)算自變量的貢獻(xiàn)系數(shù)這一步的計(jì)算可以分解為如下幾個(gè)步驟。6.2.2第一輪計(jì)算((2)找出最大和最小貢獻(xiàn)系數(shù)及其對(duì)應(yīng)的變量序號(hào)顯然,等于0.98246最大,對(duì)應(yīng)的變量序號(hào)v=1。因此,首先考慮引入的變量是國內(nèi)游客數(shù)量x1;
等于0.92574最小,對(duì)應(yīng)的變量序號(hào)v=4。故這一步可以考慮將人均GDP即變量x4剔除。國內(nèi)游客數(shù)量這個(gè)變量是否能被引入模型,還要進(jìn)行一次F檢驗(yàn)。對(duì)于我們的問題,n=10,現(xiàn)在計(jì)算第l=1步。(3)計(jì)算變量引入和剔除的F統(tǒng)計(jì)量(2)找出最大和最小貢獻(xiàn)系數(shù)及其對(duì)應(yīng)的變量序號(hào)顯然,逐步回歸分析課件根據(jù)這個(gè)數(shù)值遠(yuǎn)遠(yuǎn)大于我們?cè)O(shè)定的臨界值Fc(in)=5.192,因此變量x1可以被引入模型。根據(jù)這個(gè)數(shù)值遠(yuǎn)遠(yuǎn)大于我們?cè)O(shè)定的臨界值Fc(in接下來考慮排除貢獻(xiàn)系數(shù)最小的變量。但是否排除,要視Fout值而定。根據(jù)上述計(jì)算結(jié)果,0.92574最小,由式下面公式這個(gè)數(shù)值高于剔除變量的F臨界值4.757,因此第一步不能剔除。接下來考慮排除貢獻(xiàn)系數(shù)最小的變量。但是否排除,要作為對(duì)比,可以計(jì)算出所有變量的F變化值。例如,對(duì)于第二個(gè)變量“第三產(chǎn)業(yè)產(chǎn)值”,變量引入和剔除的F值分別為作為對(duì)比,可以計(jì)算出所有變量的F變化值。例如,(4)相關(guān)系數(shù)矩陣變換,將化為假定第v個(gè)變量在第l步被引入,則相關(guān)系數(shù)矩陣的第v個(gè)元素稱為主元。矩陣變換是圍繞主元進(jìn)行的。相關(guān)系數(shù)矩陣的變換公式如下(4)相關(guān)系數(shù)矩陣變換,將化為假定第v式中j、k分別為相關(guān)系數(shù)矩陣的行列編號(hào)。根據(jù)這個(gè)公式,第一步應(yīng)該改變非主元所在的行、列的元素(j≠v,k≠v),第二步改變主元所在的行的元素(j=v,k≠v),第三步改變主元所在的列的元素(j≠v,k=v),第四步改變主元本身(j=v,k=v)。式中j、k分別為相關(guān)系數(shù)矩陣的行列編號(hào)。根據(jù)這個(gè)——首先變換非主元所在的行和列的元素。我們的主元在第j=1行、第k=1列,故非主元所在的元素為1行、1列以外的元素。例如——首先變換非主元所在的行和列的元素。我們的主元在第j=1行其余計(jì)算依此類推。其余計(jì)算依此類推。——其次改變主元所在行的元素。我們的主元在第j=1行,故改變第1行的元素。例如——其次改變主元所在行的元素。我們的主元在第j=1行,故改變——再次改變主元所在列的元素。我們的主元在第k=1列,故改變第1列的元素。例如——最后改變主元所在的元素。對(duì)于本輪計(jì)算,主元實(shí)際不變:——再次改變主元所在列的元素。我們的主元在第k=1列,故改變這樣,我們得到矩陣在這個(gè)矩陣中,第1行最后一列的元素可以用于建立一元線性回歸模型。如果我們只打算引入一個(gè)關(guān)系最密切的變量,則在數(shù)據(jù)標(biāo)準(zhǔn)化的情況下,可以建立如下模型這樣,我們得到矩陣在這個(gè)矩陣中,第1行最后一列的6.2.3第二輪計(jì)算(1)計(jì)算自變量的貢獻(xiàn)系數(shù)6.2.3第二輪計(jì)算(1)計(jì)算自變量的貢獻(xiàn)系數(shù)(2)找出最大和最小貢獻(xiàn)系數(shù)及其對(duì)應(yīng)的變量序號(hào)從上面的計(jì)算結(jié)果可以看出,不考慮已經(jīng)被引入模型的第一個(gè)變量,在剩余變量中0.01305為最大,對(duì)應(yīng)的變量序號(hào)v=3。因此,第二次可能引入的變量是海外游客數(shù)量x3。同時(shí),0.00043為最小,對(duì)應(yīng)的變量序號(hào)v=4,可以考慮將其剔除。(2)找出最大和最小貢獻(xiàn)系數(shù)及其對(duì)應(yīng)的變量序號(hào)從上面的計(jì)算結(jié)(3)計(jì)算變量引入和剔除的F統(tǒng)計(jì)量海外游客數(shù)量能否被引入模型,依然需要借助F檢驗(yàn)判決?,F(xiàn)在計(jì)算第l=2步,因此應(yīng)有這個(gè)數(shù)值大于我們?cè)O(shè)定的臨界值Fc(in)=5.192,因此變量x3可以被引入模型。當(dāng)我們引入x1的時(shí)候,F(xiàn)值為448.035;現(xiàn)在引入x3,F(xiàn)值在原來的基礎(chǔ)上增加了20.359。(3)計(jì)算變量引入和剔除的F統(tǒng)計(jì)量海外游客數(shù)量能在沒有被引入也沒有被排除的變量中,找到最小貢獻(xiàn)系數(shù),考慮剔除相應(yīng)的變量。但是是否剔除,依然要視Fout值而定。根據(jù)上面的計(jì)算結(jié)果,第四個(gè)變量“人均GDP”的貢獻(xiàn)系數(shù)0.00043最小,其Fout值為因此,這個(gè)變量可以被剔除,不再考慮它的引入。在沒有被引入也沒有被排除的變量中,找到最小貢獻(xiàn)系作為對(duì)比,不妨計(jì)算所有變量的F值,例如對(duì)于第二個(gè)變量“第三產(chǎn)業(yè)產(chǎn)值”,我們有為方便比較,給出全部的F變化值,以供判斷之用。全部計(jì)算結(jié)果列表如下(表6-2-6)??梢钥闯觯呀?jīng)引入的x1的Fout值很高,當(dāng)然不能剔除。作為對(duì)比,不妨計(jì)算所有變量的F值,例如對(duì)于(4)相關(guān)系數(shù)矩陣變換,將
化為
——首先變換非主元所在的行和列的元素。我們的主元在第j=3行、第k=3列,故非主元所在的元素為3行、3列以外的元素。例如——其次改變主元所在行的元素。我們的主元現(xiàn)在在第j=3行,故改變第3行的元素。例如(4)相關(guān)系數(shù)矩陣變換,將化為——首先變——再次改變主元所在列的元素。我們的主元在第k=3列,故改變第1列的元素。例如——再次改變主元所在列的元素。我們的主元在——最后改變主元所在的元素這樣,我們得到相關(guān)矩陣——最后改變主元所在的元素這樣,我們得到相關(guān)矩陣6.2.4第三輪計(jì)算基于第二個(gè)相關(guān)系數(shù)矩陣的變換結(jié)果計(jì)算各個(gè)自變量對(duì)因變量的貢獻(xiàn)系數(shù),方法與前面兩輪完全一樣。不同的是,每一步計(jì)算都是針對(duì)新的相關(guān)系數(shù)矩陣變換結(jié)果進(jìn)行的。計(jì)算的貢獻(xiàn)系數(shù)如表6-2-8所示,這一次第二個(gè)變量“第三產(chǎn)業(yè)產(chǎn)值”的貢獻(xiàn)系數(shù)0.00126為最大。6.2.4第三輪計(jì)算基于第二個(gè)相關(guān)系數(shù)矩陣的變但是,F(xiàn)in值2.33927沒有達(dá)到被引入的標(biāo)準(zhǔn),而Fout值1.94939則達(dá)到被剔除的標(biāo)準(zhǔn)。如果我們繼續(xù)引入新的變量,F(xiàn)值的變化將會(huì)很小,或者說F值的增加量很不顯著。因此,可以考慮中止引入變量的計(jì)算,不再在模型中添加其他變量。至于已經(jīng)引入的變量x1和x3,其Fout值都高于臨界值,無需剔除。至此,整個(gè)變量引入-剔除的過程可以結(jié)束。但是,F(xiàn)in值2.33927沒有達(dá)到被引入的標(biāo)準(zhǔn)
到此為止,根據(jù)我們的選擇標(biāo)準(zhǔn),變量的引入和剔除計(jì)算過程可以結(jié)束。整個(gè)變量引入和剔除的過程可以用框圖表示如下到此為止,根據(jù)我們的選擇標(biāo)準(zhǔn),變量的引入和剔除計(jì)6.2.5參數(shù)估計(jì)和模型建立
計(jì)算模型的回歸系數(shù),建立回歸分析模型。前面的第一個(gè)相關(guān)系數(shù)變換矩陣最后一列給出了引入一個(gè)變量時(shí)的標(biāo)準(zhǔn)化回歸系數(shù):0.99119,這個(gè)數(shù)值就是第一個(gè)自變量與因變量的相關(guān)系數(shù)。第二個(gè)相關(guān)系數(shù)變換矩陣給出了引入兩個(gè)變量時(shí)的標(biāo)準(zhǔn)化回歸系數(shù):0.63341和0.37558,二者之和接近于1。如果我們需要的僅僅是解釋模型而非預(yù)測(cè)模型,則我們的建模工作可以到此為止,得到模型6.2.5參數(shù)估計(jì)和模型建立計(jì)算模型的回歸系數(shù)如果我們需要預(yù)測(cè)模型,則需要開展計(jì)算工作,將標(biāo)準(zhǔn)化回歸參數(shù)轉(zhuǎn)換為非標(biāo)準(zhǔn)化的回歸系數(shù)。計(jì)算過程如下。第一步,計(jì)算原始數(shù)據(jù)的協(xié)方差。如果我們需要預(yù)測(cè)模型,則需要開展計(jì)算工作,將標(biāo)準(zhǔn)逐步回歸分析課件第二步,計(jì)算非標(biāo)準(zhǔn)化回歸系數(shù)。有了協(xié)方差矩陣,結(jié)合前面的相關(guān)系數(shù)矩陣第二步變換結(jié)果,就可以計(jì)算非標(biāo)準(zhǔn)化回歸系數(shù)。注意我們的計(jì)算是從開始的,引入一個(gè)變量時(shí),相關(guān)系數(shù)矩陣變換為;引入兩個(gè)變量時(shí),相關(guān)系數(shù)矩陣變換為
。此后不再引入變量。因此,計(jì)算回歸系數(shù)需要用到l=2時(shí)的相關(guān)系數(shù)矩陣變換結(jié)果
(表6-2-7)。第二步,計(jì)算非標(biāo)準(zhǔn)化回歸系數(shù)。有了協(xié)方差矩陣,結(jié)非標(biāo)準(zhǔn)化回歸系數(shù)計(jì)算公式為這里b0為截距,bj為第j個(gè)回歸系數(shù),l為計(jì)算步驟的編號(hào)數(shù)——我們引入兩個(gè)變量,l=2,
為相關(guān)系數(shù)矩陣第l=2步變換結(jié)果的最后一列的第j個(gè)元素——對(duì)應(yīng)于第j個(gè)被引入的變量,cyy為協(xié)方差矩陣對(duì)角線上的最后一個(gè)元素(右下角),cjj為協(xié)方差矩陣對(duì)角線上對(duì)應(yīng)于第j個(gè)被引入變量的元素,。至于未被引入的變量,回歸系數(shù)以0計(jì)算。非標(biāo)準(zhǔn)化回歸系數(shù)計(jì)算公式為這里b0為截距,bj為對(duì)于上述問題,我們引進(jìn)了兩個(gè)變量x1=國內(nèi)游客數(shù),x3=海外游客數(shù)。可見,j=1對(duì)應(yīng)于國內(nèi)游客數(shù),j=3對(duì)應(yīng)于海外游客數(shù)。于是可得對(duì)于上述問題,我們引進(jìn)了兩個(gè)變量x1=國內(nèi)游客數(shù)逐步回歸分析課件逐步回歸分析課件逐步回歸分析課件§6.3利用消元法進(jìn)行相關(guān)矩陣變換利用Gauss消元法對(duì)增廣矩陣進(jìn)行消元變換。在相關(guān)系數(shù)矩陣旁邊增加一個(gè)并排的(m+1)×(m+1)=5×5單位矩陣主元在第1行第1列,且主元為1,用第1行的元素對(duì)其他行進(jìn)行消元?!?.3利用消元法進(jìn)行相關(guān)矩陣變換利用Gauss消元法對(duì)增逐步回歸分析課件逐步回歸分析課件§6.4回歸結(jié)果檢驗(yàn)§6.4回歸結(jié)果檢驗(yàn)逐步回歸分析課件基本結(jié)論:第一,通過逐步回歸分析過程可知,在影響淄博市旅游收入的各種變量中,最直接的因素就是國內(nèi)游客數(shù)和海外游客數(shù)。其他的如第三產(chǎn)業(yè)產(chǎn)值、人均GDP等都是間接因素。第二,從標(biāo)準(zhǔn)化回歸分析模型可以看出,國內(nèi)游客對(duì)旅游總收入的影響高于海外游客對(duì)旅游總收入的影響。第三,利用非標(biāo)準(zhǔn)化的回歸分析模型,我們可以對(duì)未來旅游收入作一些預(yù)測(cè)。比方說,如果我們能夠預(yù)測(cè)2005年的國內(nèi)游客和海外游客數(shù),就可以估計(jì)當(dāng)年的旅游總收入是多少。基本結(jié)論:第一,通過逐步回歸分析過程可知,在影響淄博市旅游收多元逐步回歸方法的基本思路:自動(dòng)地從大量的可供選擇的變量中選取最重要的變量,據(jù)以建立回歸分析的預(yù)測(cè)或者解釋模型。
變量選取的根據(jù)是自變量對(duì)因變量作用程度的大?。罕A糇饔贸潭却蟮淖兞浚蕹饔眯〉淖兞?。是否選取一個(gè)變量,定量判據(jù)之一就是相關(guān)系數(shù)。假定有m個(gè)自變量,1個(gè)因變量(用y表示),則全部變量(包括自變量和因變量)之間的相關(guān)系數(shù)矩陣可以表作§6.1基本原理多元逐步回歸方法的基本思路:自動(dòng)地從大量的可供選根據(jù)相關(guān)系數(shù)定義一個(gè)自變量的“貢獻(xiàn)”系數(shù)——按照貢獻(xiàn)系數(shù)的大小決定一個(gè)自變量的去留。式中Pj表示第j個(gè)自變量對(duì)因變量的貢獻(xiàn)系數(shù),Rjy
表示第j個(gè)自變量與因變量的相關(guān)系數(shù),Rjj表示相關(guān)系數(shù)矩陣對(duì)角線上第j行第j列元素(j=1,2,…,m)。根據(jù)相關(guān)系數(shù)定義一個(gè)自變量的“貢獻(xiàn)”系數(shù)——按照貢獻(xiàn)系數(shù)的大——第l步計(jì)算的貢獻(xiàn)系數(shù)表示為在逐步回歸分析過程中,我們不僅要引入貢獻(xiàn)最大的自變量,同時(shí)要考慮剔除貢獻(xiàn)最小的因變量。因此,變量的存留與否又涉及到另一個(gè)統(tǒng)計(jì)判據(jù)——F檢驗(yàn)。設(shè)定一個(gè)顯著性水平α,查F檢驗(yàn)表,找到F檢驗(yàn)的臨界值Fα。在第l步計(jì)算中,假如第v個(gè)自變量的貢獻(xiàn)系數(shù)最大,數(shù)值為——第l步計(jì)算的貢獻(xiàn)系數(shù)表示為在逐步回歸分析過根據(jù)F檢驗(yàn)來判斷該自變量是否應(yīng)該被引入模型。式中h為尚且沒有被引入模型的變量序號(hào),v
為選出的變量對(duì)應(yīng)的原始變量序號(hào)(v=1,2,…,m)。計(jì)算變量引入的F值判斷公式如下式中n為樣品個(gè)數(shù),l為計(jì)算步驟數(shù),
為第v個(gè)變量第l步的貢獻(xiàn)系數(shù),Ryy為因變量的自相關(guān)系數(shù)。根據(jù)F檢驗(yàn)來判斷該自變量是否應(yīng)該被引入模型。式中h為尚且如果Fin>Fα,則在這個(gè)顯著性水平下,該變量可以被引入模型,否則不要引入?!诘趌步計(jì)算中,如果第v個(gè)自變量的貢獻(xiàn)系數(shù)為——?jiǎng)t可以根據(jù)F檢驗(yàn)來判斷該自變量——包括已經(jīng)引入的變量——是否應(yīng)該被剔除。計(jì)算變量剔除的F值判斷公式如下如果Fin>Fα,則在這個(gè)顯著性水平下,該變量可如果Fout≤Fα,則在這個(gè)顯著性水平下,該變量應(yīng)該被剔除,否則就要保留。在整個(gè)逐步回歸計(jì)算過程中,變量的引入和剔除在兩端同時(shí)進(jìn)行。像這樣循環(huán)往復(fù)地計(jì)算,直到所有該引入的變量都被引入,該剔除的變量均被剔除為止。如果Fout≤Fα,則在這個(gè)顯著性水平下,該變6.2.1數(shù)據(jù)準(zhǔn)備§6.2計(jì)算方法借助一個(gè)簡單的實(shí)例說明逐步回歸分析的方法。問題是山東省淄博市旅游業(yè)的發(fā)展分析,我們想搞清楚哪些因素影響淄博市的旅游總收入(表6-2-1)。所能考慮的因素包括:國內(nèi)游客數(shù)量、海外游客數(shù)量、第三產(chǎn)業(yè)的發(fā)展和人均GDP數(shù)量(m=4)。從1995年到2004年一共10個(gè)年份的數(shù)據(jù)(n=10)。6.2.1數(shù)據(jù)準(zhǔn)備§6.2計(jì)算方法借助一個(gè)簡這些因素都與旅游業(yè)總收入具有明確的關(guān)系。而且,作為自變量,它們彼此之間也有很強(qiáng)的關(guān)系。如果將這四個(gè)變量全部引入模型,就會(huì)導(dǎo)致多重共線性的問題。為了得到簡約、可靠的模型,需要借助逐步回歸分析技術(shù)。這些因素都與旅游業(yè)總收入具有明確的關(guān)系。而且,作逐步回歸分析課件為了更為有效地說明問題,我們對(duì)表6-2-1的變量排列順序稍作調(diào)整(表6-2-2)為了更為有效地說明問題,我們對(duì)表6-2-1的變利用表6-2-2的數(shù)據(jù),容易計(jì)算相關(guān)系數(shù),得到矩陣如下(表6-2-3)。逐步回歸計(jì)算就是從這種相關(guān)系數(shù)矩陣出發(fā)的。將這個(gè)矩陣記為利用表6-2-2的數(shù)據(jù),容易計(jì)算相關(guān)系數(shù),得到首先設(shè)定F統(tǒng)計(jì)量的臨界值。取顯著性水平α=0.05,我們有m=4個(gè)自變量,n=10個(gè)觀測(cè)值。不妨取回歸自由度為4、剩余自由度為n-m-1=10-4-1=5的臨界值為我們引入變量的F值下限,即取Fc(in)=5.192。另一方面,假定一個(gè)變量被淘汰,則有m’=3。我們?nèi)★@著性水平α=0.05、回歸自由度為3、剩余自由度為n-m’-1=10-3-1=6的F臨界值為剔除一個(gè)變量的上限,即取Fc(out)=4.757。首先設(shè)定F統(tǒng)計(jì)量的臨界值。取顯著性水平α=0.這一步的計(jì)算可以分解為如下幾個(gè)步驟。6.2.2第一輪計(jì)算(1)計(jì)算自變量的貢獻(xiàn)系數(shù)這一步的計(jì)算可以分解為如下幾個(gè)步驟。6.2.2第一輪計(jì)算((2)找出最大和最小貢獻(xiàn)系數(shù)及其對(duì)應(yīng)的變量序號(hào)顯然,等于0.98246最大,對(duì)應(yīng)的變量序號(hào)v=1。因此,首先考慮引入的變量是國內(nèi)游客數(shù)量x1;
等于0.92574最小,對(duì)應(yīng)的變量序號(hào)v=4。故這一步可以考慮將人均GDP即變量x4剔除。國內(nèi)游客數(shù)量這個(gè)變量是否能被引入模型,還要進(jìn)行一次F檢驗(yàn)。對(duì)于我們的問題,n=10,現(xiàn)在計(jì)算第l=1步。(3)計(jì)算變量引入和剔除的F統(tǒng)計(jì)量(2)找出最大和最小貢獻(xiàn)系數(shù)及其對(duì)應(yīng)的變量序號(hào)顯然,逐步回歸分析課件根據(jù)這個(gè)數(shù)值遠(yuǎn)遠(yuǎn)大于我們?cè)O(shè)定的臨界值Fc(in)=5.192,因此變量x1可以被引入模型。根據(jù)這個(gè)數(shù)值遠(yuǎn)遠(yuǎn)大于我們?cè)O(shè)定的臨界值Fc(in接下來考慮排除貢獻(xiàn)系數(shù)最小的變量。但是否排除,要視Fout值而定。根據(jù)上述計(jì)算結(jié)果,0.92574最小,由式下面公式這個(gè)數(shù)值高于剔除變量的F臨界值4.757,因此第一步不能剔除。接下來考慮排除貢獻(xiàn)系數(shù)最小的變量。但是否排除,要作為對(duì)比,可以計(jì)算出所有變量的F變化值。例如,對(duì)于第二個(gè)變量“第三產(chǎn)業(yè)產(chǎn)值”,變量引入和剔除的F值分別為作為對(duì)比,可以計(jì)算出所有變量的F變化值。例如,(4)相關(guān)系數(shù)矩陣變換,將化為假定第v個(gè)變量在第l步被引入,則相關(guān)系數(shù)矩陣的第v個(gè)元素稱為主元。矩陣變換是圍繞主元進(jìn)行的。相關(guān)系數(shù)矩陣的變換公式如下(4)相關(guān)系數(shù)矩陣變換,將化為假定第v式中j、k分別為相關(guān)系數(shù)矩陣的行列編號(hào)。根據(jù)這個(gè)公式,第一步應(yīng)該改變非主元所在的行、列的元素(j≠v,k≠v),第二步改變主元所在的行的元素(j=v,k≠v),第三步改變主元所在的列的元素(j≠v,k=v),第四步改變主元本身(j=v,k=v)。式中j、k分別為相關(guān)系數(shù)矩陣的行列編號(hào)。根據(jù)這個(gè)——首先變換非主元所在的行和列的元素。我們的主元在第j=1行、第k=1列,故非主元所在的元素為1行、1列以外的元素。例如——首先變換非主元所在的行和列的元素。我們的主元在第j=1行其余計(jì)算依此類推。其余計(jì)算依此類推?!浯胃淖冎髟谛械脑?。我們的主元在第j=1行,故改變第1行的元素。例如——其次改變主元所在行的元素。我們的主元在第j=1行,故改變——再次改變主元所在列的元素。我們的主元在第k=1列,故改變第1列的元素。例如——最后改變主元所在的元素。對(duì)于本輪計(jì)算,主元實(shí)際不變:——再次改變主元所在列的元素。我們的主元在第k=1列,故改變這樣,我們得到矩陣在這個(gè)矩陣中,第1行最后一列的元素可以用于建立一元線性回歸模型。如果我們只打算引入一個(gè)關(guān)系最密切的變量,則在數(shù)據(jù)標(biāo)準(zhǔn)化的情況下,可以建立如下模型這樣,我們得到矩陣在這個(gè)矩陣中,第1行最后一列的6.2.3第二輪計(jì)算(1)計(jì)算自變量的貢獻(xiàn)系數(shù)6.2.3第二輪計(jì)算(1)計(jì)算自變量的貢獻(xiàn)系數(shù)(2)找出最大和最小貢獻(xiàn)系數(shù)及其對(duì)應(yīng)的變量序號(hào)從上面的計(jì)算結(jié)果可以看出,不考慮已經(jīng)被引入模型的第一個(gè)變量,在剩余變量中0.01305為最大,對(duì)應(yīng)的變量序號(hào)v=3。因此,第二次可能引入的變量是海外游客數(shù)量x3。同時(shí),0.00043為最小,對(duì)應(yīng)的變量序號(hào)v=4,可以考慮將其剔除。(2)找出最大和最小貢獻(xiàn)系數(shù)及其對(duì)應(yīng)的變量序號(hào)從上面的計(jì)算結(jié)(3)計(jì)算變量引入和剔除的F統(tǒng)計(jì)量海外游客數(shù)量能否被引入模型,依然需要借助F檢驗(yàn)判決?,F(xiàn)在計(jì)算第l=2步,因此應(yīng)有這個(gè)數(shù)值大于我們?cè)O(shè)定的臨界值Fc(in)=5.192,因此變量x3可以被引入模型。當(dāng)我們引入x1的時(shí)候,F(xiàn)值為448.035;現(xiàn)在引入x3,F(xiàn)值在原來的基礎(chǔ)上增加了20.359。(3)計(jì)算變量引入和剔除的F統(tǒng)計(jì)量海外游客數(shù)量能在沒有被引入也沒有被排除的變量中,找到最小貢獻(xiàn)系數(shù),考慮剔除相應(yīng)的變量。但是是否剔除,依然要視Fout值而定。根據(jù)上面的計(jì)算結(jié)果,第四個(gè)變量“人均GDP”的貢獻(xiàn)系數(shù)0.00043最小,其Fout值為因此,這個(gè)變量可以被剔除,不再考慮它的引入。在沒有被引入也沒有被排除的變量中,找到最小貢獻(xiàn)系作為對(duì)比,不妨計(jì)算所有變量的F值,例如對(duì)于第二個(gè)變量“第三產(chǎn)業(yè)產(chǎn)值”,我們有為方便比較,給出全部的F變化值,以供判斷之用。全部計(jì)算結(jié)果列表如下(表6-2-6)??梢钥闯觯呀?jīng)引入的x1的Fout值很高,當(dāng)然不能剔除。作為對(duì)比,不妨計(jì)算所有變量的F值,例如對(duì)于(4)相關(guān)系數(shù)矩陣變換,將
化為
——首先變換非主元所在的行和列的元素。我們的主元在第j=3行、第k=3列,故非主元所在的元素為3行、3列以外的元素。例如——其次改變主元所在行的元素。我們的主元現(xiàn)在在第j=3行,故改變第3行的元素。例如(4)相關(guān)系數(shù)矩陣變換,將化為——首先變——再次改變主元所在列的元素。我們的主元在第k=3列,故改變第1列的元素。例如——再次改變主元所在列的元素。我們的主元在——最后改變主元所在的元素這樣,我們得到相關(guān)矩陣——最后改變主元所在的元素這樣,我們得到相關(guān)矩陣6.2.4第三輪計(jì)算基于第二個(gè)相關(guān)系數(shù)矩陣的變換結(jié)果計(jì)算各個(gè)自變量對(duì)因變量的貢獻(xiàn)系數(shù),方法與前面兩輪完全一樣。不同的是,每一步計(jì)算都是針對(duì)新的相關(guān)系數(shù)矩陣變換結(jié)果進(jìn)行的。計(jì)算的貢獻(xiàn)系數(shù)如表6-2-8所示,這一次第二個(gè)變量“第三產(chǎn)業(yè)產(chǎn)值”的貢獻(xiàn)系數(shù)0.00126為最大。6.2.4第三輪計(jì)算基于第二個(gè)相關(guān)系數(shù)矩陣的變但是,F(xiàn)in值2.33927沒有達(dá)到被引入的標(biāo)準(zhǔn),而Fout值1.94939則達(dá)到被剔除的標(biāo)準(zhǔn)。如果我們繼續(xù)引入新的變量,F(xiàn)值的變化將會(huì)很小,或者說F值的增加量很不顯著。因此,可以考慮中止引入變量的計(jì)算,不再在模型中添加其他變量。至于已經(jīng)引入的變量x1和x3,其Fout值都高于臨界值,無需剔除。至此,整個(gè)變量引入-剔除的過程可以結(jié)束。但是,F(xiàn)in值2.33927沒有達(dá)到被引入的標(biāo)準(zhǔn)
到此為止,根據(jù)我們的選擇標(biāo)準(zhǔn),變量的引入和剔除計(jì)算過程可以結(jié)束。整個(gè)變量引入和剔除的過程可以用框圖表示如下到此為止,根據(jù)我們的選擇標(biāo)準(zhǔn),變量的引入和剔除計(jì)6.2.5參數(shù)估計(jì)和模型建立
計(jì)算模型的回歸系數(shù),建立回歸分析模型。前面的第一個(gè)相關(guān)系數(shù)變換矩陣最后一列給出了引入一個(gè)變量時(shí)的標(biāo)準(zhǔn)化回歸系數(shù):0.99119,這個(gè)數(shù)值就是第一個(gè)自變量與因變量的相關(guān)系數(shù)。第二個(gè)相關(guān)系數(shù)變換矩陣給出了引入兩個(gè)變量時(shí)的標(biāo)準(zhǔn)化
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 蘇教版江蘇省徐州市2023-2024學(xué)年下學(xué)期高二年級(jí)第三次檢測(cè)數(shù)學(xué)試題
- 六年級(jí)數(shù)學(xué)上冊(cè)《高頻錯(cuò)題訓(xùn)練》
- 西京學(xué)院《土木工程施工》2021-2022學(xué)年第一學(xué)期期末試卷
- 2024秋期國家開放大學(xué)本科《古代小說戲曲專題》一平臺(tái)在線形考(形考任務(wù)4)試題及答案
- 2025屆江西省高三語文試題及答案
- 西京學(xué)院《大數(shù)據(jù)存儲(chǔ)與管理技術(shù)》2022-2023學(xué)年期末試卷
- 西華師范大學(xué)《中國宗教史》2022-2023學(xué)年第一學(xué)期期末試卷
- 圖文《黃昏》課件
- 西華師范大學(xué)《外國歷史要籍研讀》2021-2022學(xué)年第一學(xué)期期末試卷
- 西華師范大學(xué)《數(shù)據(jù)結(jié)構(gòu)》2022-2023學(xué)年期末試卷
- 阿奇舒勒矛盾矩陣表
- 中職院校學(xué)前教育專業(yè)學(xué)生職業(yè)認(rèn)同現(xiàn)狀調(diào)查研究
- 《小學(xué)語文關(guān)于整本書閱讀的策略研究》課題研究方案
- join-in(三年級(jí)起點(diǎn))五年級(jí)上冊(cè)劍橋英語備課
- 管理學(xué)基礎(chǔ):管理實(shí)訓(xùn):第十二章考察某企業(yè)的控制系統(tǒng)和第十三章了解某企業(yè)的質(zhì)量保證體系
- 《口腔醫(yī)學(xué)影像學(xué)課件》
- 第15課《誡子書》 統(tǒng)編版語文七年級(jí)上冊(cè)
- 為農(nóng)服務(wù)中心建設(shè)實(shí)施方案(通用3篇)
- GB/T 16400-2023絕熱用硅酸鋁棉及其制品
- 辣白菜制作方法課件
- 少林寺英文簡介-演講課件
評(píng)論
0/150
提交評(píng)論