第五章:回歸模型的函數(shù)形式與變量類型_第1頁
第五章:回歸模型的函數(shù)形式與變量類型_第2頁
第五章:回歸模型的函數(shù)形式與變量類型_第3頁
第五章:回歸模型的函數(shù)形式與變量類型_第4頁
第五章:回歸模型的函數(shù)形式與變量類型_第5頁
已閱讀5頁,還剩39頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、回歸、一元、多元函數(shù)形式、變量類型、模型設(shè)定自相關(guān)、異方差、多重共線和隨機(jī)解釋變量計量基礎(chǔ)方法論理論拓展回歸模型的函數(shù)形式與變量類型授課:梁海兵參數(shù)線性,變量線性現(xiàn)實問題:許多經(jīng)濟(jì)現(xiàn)象,參數(shù)線性/變量線性回歸模型并不適合!參數(shù)線性,變量非線性變量非線性主要講解內(nèi)容 模型的類型與變換; 非線性模型的特殊含義與應(yīng)用; 非線性普通最小二乘法及其應(yīng)用。一、模型的類型與變換至今為止,我們都假設(shè)未知的總體回歸線是線性的,擬合優(yōu)度檢驗及變量顯著性檢驗也都是對函數(shù)形式的線性檢驗。然而,在實際經(jīng)濟(jì)活動中,經(jīng)濟(jì)變量的關(guān)系是復(fù)雜的,直接表現(xiàn)為線性關(guān)系的情況并不多見。1. 變量置換法適用對象:倒數(shù)模型、多項式模型一般

2、地,關(guān)于解釋變量的非線性問題都可以通過變量置換變成線性問題。1QabP2123expexpYedu2. 函數(shù)變換法適用對象:冪函數(shù)模型、指數(shù)函數(shù)模型如果是關(guān)于參數(shù)的非線性問題,變量置換法就無能為力了,函數(shù)變換是常用的方法QAK L eQCab e3. 復(fù)雜函數(shù)模型與級數(shù)展開法( )2(0)(0)( )(0)(0)2!nnnffP xffxxxn4. 無法線性化的模型一般形式為:12(,)kYf X XX12(,)kYf X XX e非線性函數(shù)可線性函數(shù)二、非線性模型的特殊含義與應(yīng)用雖然某些非線性模型對于我們估計來說存在一定的困難,但結(jié)合實際經(jīng)濟(jì)活動,它們往往有著特殊的含義和重要的應(yīng)用。1. 雙

3、對數(shù)模型:如何度量彈性彈性模型iiYAXdYYdXX拓展:多元對數(shù)線性回歸模型01122lnlnlniiiiYXX一個重要應(yīng)用:農(nóng)業(yè)技術(shù)進(jìn)步率的測量tYAe K L M 比較線性和雙對數(shù)回歸模型:究竟選擇哪個模型呢? 規(guī)律之一:根據(jù)數(shù)據(jù)作圖,依圖趨勢建模。 為什么不根據(jù)為什么不根據(jù)r r2 2選擇模型?選擇模型?1.要比較兩個模型r2值,因變量的形式必須相同;2.根據(jù)r2定義,線性模型和雙對數(shù)模型度量意義不同。XY0LnXLnY0在線性模型和對數(shù)線性模型之間選擇:MWD檢驗零假設(shè)H0:線性模型:Y是X的線性函數(shù)。備擇假設(shè)H1:對數(shù)線性模型:LnY是X或LnX的線性函數(shù)。MWD檢驗步驟如下:(1

4、)估計線性模型,得到 Y的估計值(2)估計線性對數(shù)模型,得到 LnY 的估計值(3)求(4)做 Y 對 X 和 Z1i 的回歸如果根據(jù) t 檢驗 Z1i 的系數(shù)是統(tǒng)計顯著的,則拒絕 H0(5)求(6)做 LnY 對 X 或 LogX 和 Z2i 的回歸如果 Z2i 的系數(shù)是統(tǒng)計顯著的,則拒絕 H1iYlniY1ln(ln)iiiZYY2log(ln)iiiZantiYY2. 半對數(shù)模型:如何測度增長率增長率增長率模型01lnttYt1lndYdYYdtdt3. 線性-對數(shù)模型增長模型解釋變量每百分比變動引起因變量的絕對變化量01lntttYX1lndYdYdXdXX三、非線性普通最小二乘法12

5、01(,;,)kkYf X XX (,)iiiYf X21( )(, )niiiQYf X1(, )2(, )()0niiidQdf XiYf Xdd1(, )(, )()0niiidf XiYf Xd一個參數(shù)為例非線性最小二乘法:應(yīng)用舉例墨西哥1955-1974生產(chǎn)函數(shù)數(shù)學(xué)SAT分?jǐn)?shù)函數(shù)1975-2007美國人口增長率iiYAX01lnttYtQAK L eXYab e假設(shè):消費(fèi)收入的指數(shù)函數(shù)假設(shè):消費(fèi)收入的倒數(shù)函數(shù)1Ya bX 到目前為止,在所考慮的線性回歸模型中,解釋變量都是數(shù)值變量或定量變量。但事實上有些時候,解釋變量可能是定性變量。虛擬變量(Dummy Variables)主要講解內(nèi)

6、容 虛擬變量的性質(zhì); 虛擬變量的設(shè)定規(guī)則; 虛擬變量的引入方式; 參數(shù)鄒檢驗; 被解釋變量的類型; 線性概率模型初步; 極大似然估計法原理。一、虛擬變量的性質(zhì) 常見定量變量:收入、產(chǎn)出、成本、價格、重量、溫度等 常見定性變量:性別、種族、膚色、宗教、民族、婚姻、政團(tuán)關(guān)系等具備或不具備某種性質(zhì)定量化01不具備某種性質(zhì)具備某種性質(zhì)D基準(zhǔn)類基準(zhǔn)類二、虛擬變量的設(shè)定規(guī)則 一般原則:如果定性變量有 m 種分類,則需要引入(m-1)個虛擬變量。 如果不符合該原則,則會陷入虛擬變量陷阱,即完全共線性或多重共線性。三、虛擬變量的引入方式方式1:加法方式以性別和受教育程度為例方式2:乘法方式交互項主效應(yīng)交互效應(yīng)

7、以性別和受教育程度為例YX0XYX0YX0Y0一致回歸平行回歸并行回歸相異回歸四、參數(shù)鄒檢驗XXioYH0:參數(shù)穩(wěn)定鄒氏參數(shù)穩(wěn)定性檢驗步驟:首先,分別以兩個連續(xù)的時間序列作為兩個樣本運(yùn)用總模型式進(jìn)行回歸,得到相應(yīng)的殘差平方和RSS1和RSS2;然后,將兩個序列并為一個大樣本后運(yùn)用總模型式進(jìn)行回歸,得到大樣本下的殘差平方和RSSR;最后,通過F統(tǒng)計量,在事先給定的顯著性水平下進(jìn)行假設(shè)檢驗。如果F大于相應(yīng)的臨界值,則拒絕原假設(shè),認(rèn)為發(fā)生了結(jié)構(gòu)變化,參數(shù)是非穩(wěn)定的。12121212()/(1)1,2(1)()/2(1)RRSSRSSRSSkFF knnkRSSRSSnnk應(yīng)用舉例與解釋交互項主效應(yīng)交

8、互效應(yīng)虛擬變量引入交互項的重要應(yīng)用:雙重差分0123()ititititititYdirecttimedirect timeX對照組(direct=0):直管組(direct=1):改革前(time=0):改革后(time=1):改革前(time=0):改革后(time=1):30ititYX302ititYX301ititYX3012ititYX 2itY2itYitY一重差分雙重差分五、被解釋變量類型01122YXX以研究勞動力市場就業(yè) 為例就業(yè)時間就業(yè)意愿就業(yè)種類就業(yè)收入當(dāng)因變量是一個分類變量而不是一個連續(xù)變量時,線性回歸就不適用。實際上,許多社會科學(xué)的觀察都只是分類的而不是連續(xù)的。如政

9、治學(xué)中否選舉某候選人、經(jīng)濟(jì)學(xué)中是否簽訂一個合同、社會學(xué)中犯罪、逃學(xué)、遷移、結(jié)婚、離婚、生育、患病等都可以按照分類變量來測量。六、線性概率模型初步以農(nóng)民工是否愿意轉(zhuǎn)移就業(yè)為例,構(gòu)建如下回歸方程:其中,Yi 是一個二分類變量, Xi 表示第 i 個農(nóng)民工年收入。如果第個農(nóng)民工轉(zhuǎn)移,則 Yi ,否則 Yi 。iiiYXe(|)(1|)iiiiiE YXXP YX因變量為二分類變量的線性回歸模型也被稱為線性概率模型,LPM(|)(1|)iiiiiE YXXP YX(0|)1(1|)1iiiiiP YXP YXX *iiYX 假設(shè)有一個理論上存在的連續(xù)反應(yīng)變量 Y* 代表事件發(fā)生的可能性,其值域為負(fù)無窮

10、到正無窮。當(dāng)該變量的值跨越一個臨界值 C(如 C=0),便導(dǎo)致事件發(fā)生,則有:當(dāng) Y*0時,Yi=1,否則 Yi=0再假設(shè) Y*與 Xi 之間存在如下線性關(guān)系:Logistic分布()()11iiiiPXFXe(1|)(0)iiiiP YXPX1iiXtXePe1iiXtXePe111itXPe事件發(fā)生事件不發(fā)生1iXiiPePln()1iiiPXP七、最大似然估計在線性回歸模型估計未知總體參數(shù)時主要采用最小二乘法,這一方法的原理是根據(jù)線性回歸模型選擇參數(shù)估計值,使因變量的觀測值與模型估計值之間的離差平方值為最小。而最大似然估計法則是統(tǒng)計分析中另一常用模型參數(shù)估計方法。在線性回歸分析中,最大似

11、然估計法可以得到與最小二乘法相同的結(jié)果。與最小二乘法相比,最大似然估計法既可以用于線性模型,也可以用于非線性模型估計。由于Logistic回歸是非線性模型,因此最大似然估計法是最常用的模型估計方法。01YX201(,)iiYNX20121()21( )2iiYXiP Ye概率函數(shù)20121()22011221(,)( ,)(2 )iiYXnnLP Y YYe 似然函數(shù)*20121lnln( 2)()2iiLLnYX如何用最大似然法估計Logistic回歸模型的參數(shù)假設(shè)有由 N 個案例構(gòu)成的總體,Y1, Y2, , YN。從中隨機(jī)抽取 n 個案例作為樣本,觀測值標(biāo)注為 y1, y2, , yn。設(shè)pi=P( yi =1|xi ) 為給定 xi 的條件下得到結(jié)果 yi =1 的條件概率;而在同樣條件下得到結(jié)果 yi =0 的條件概率為 P( yi=0|xi)=1-pi。于是,得到一個觀測值的概率為 P( yi) = piyi(1-pi)1-yi(1)1( )(1)iinyyiiiLpp(1)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論