模型選擇標(biāo)準(zhǔn)與檢驗(yàn)新_第1頁(yè)
模型選擇標(biāo)準(zhǔn)與檢驗(yàn)新_第2頁(yè)
模型選擇標(biāo)準(zhǔn)與檢驗(yàn)新_第3頁(yè)
模型選擇標(biāo)準(zhǔn)與檢驗(yàn)新_第4頁(yè)
模型選擇標(biāo)準(zhǔn)與檢驗(yàn)新_第5頁(yè)
已閱讀5頁(yè),還剩27頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

模型選擇標(biāo)準(zhǔn)與檢驗(yàn)新6/1/2023第一頁(yè),共三十二頁(yè),編輯于2023年,星期六虛擬變量的常見(jiàn)應(yīng)用描述不同類型(如:不同“性別”的人食品消費(fèi)支出是否存在差異)的數(shù)量規(guī)律定性因素間的交互作用如例:“黑人女性”是否受到雙重歧視多種類別的定性變量(如:美國(guó)不同地區(qū)研究生接受率差異)控制時(shí)間特征季節(jié)虛擬變量年份虛擬變量,長(zhǎng)期的序列分為二、三段制度效應(yīng):“國(guó)八條”房地產(chǎn)調(diào)控政策影響效應(yīng)6/1/2023第二頁(yè),共三十二頁(yè),編輯于2023年,星期六第六章復(fù)習(xí)要點(diǎn)多分類定性變量引入虛擬變量的一般原則差別截距系數(shù)(加法引入虛擬變量參數(shù)估計(jì)值)、差別斜率系數(shù)(乘法引入虛擬變量參數(shù)估計(jì)值)的含義回歸結(jié)果分析:具體參見(jiàn)書(shū)后練習(xí)題重點(diǎn)6.6,6.7,6.11,6.13,6.16,6.20,6.21,6.22,6.27,6.286/1/2023第三頁(yè),共三十二頁(yè),編輯于2023年,星期六基本假定違背:不滿足基本假定的情況。(1)模型設(shè)定有偏誤;所選模型是正確設(shè)定的(2)解釋變量之間存在多重共線性;(3)隨機(jī)誤差項(xiàng)序列存在異方差性;(4)隨機(jī)誤差項(xiàng)序列存在序列相關(guān)性。所選模型是正確設(shè)定的解釋變量之間不存在完全線性關(guān)系誤差項(xiàng)方差為常數(shù)誤差項(xiàng)之間不相關(guān)基本假定基本假定基本假定基本假定第四頁(yè),共三十二頁(yè),編輯于2023年,星期六第七章模型選擇:標(biāo)準(zhǔn)與檢驗(yàn)7.1"好的"模型具有的性質(zhì)7.2設(shè)定誤差的類型7.3遺漏相關(guān)解釋變量的模型:過(guò)低擬合模型7.4引入不相關(guān)解釋變量模型:過(guò)度擬合模型7.5不正確的函數(shù)形式7.6變量的度量誤差7.7模型設(shè)定誤差的檢驗(yàn)第五頁(yè),共三十二頁(yè),編輯于2023年,星期六7.1“好的”模型具有的性質(zhì)簡(jiǎn)約性可識(shí)別性擬合優(yōu)度理論一致性預(yù)測(cè)能力模型是對(duì)現(xiàn)實(shí)的抽象,模型應(yīng)盡可能簡(jiǎn)潔即能夠用少數(shù)解釋變量能夠說(shuō)明一個(gè)被解釋變量就不要用多個(gè)解釋變量每個(gè)參數(shù)只有一個(gè)估計(jì)值對(duì)樣本數(shù)據(jù)的擬合程度較好參數(shù)估計(jì)值的符號(hào)與經(jīng)濟(jì)理論相符預(yù)測(cè)值與經(jīng)驗(yàn)值檢驗(yàn)?zāi)P偷挠行?,即具有良好的預(yù)測(cè)能力第六頁(yè),共三十二頁(yè),編輯于2023年,星期六7.2設(shè)定誤差的類型:四個(gè)遺漏相關(guān)變量采用了錯(cuò)誤的函數(shù)形式變量的度量誤差引入無(wú)關(guān)變量請(qǐng)注意:實(shí)踐中的模型設(shè)定誤差可能源于上述一個(gè)或多個(gè)原因。第七頁(yè),共三十二頁(yè),編輯于2023年,星期六對(duì)所研究問(wèn)題的相關(guān)理論了解不深未關(guān)注本領(lǐng)域前期的研究成果在研究中缺乏相關(guān)數(shù)據(jù)數(shù)據(jù)測(cè)量時(shí)有誤差設(shè)定誤差產(chǎn)生的原因第八頁(yè),共三十二頁(yè),編輯于2023年,星期六

采用遺漏相關(guān)變量的模型進(jìn)行估計(jì)而帶來(lái)的誤差稱為遺漏相關(guān)變量誤差

設(shè)正確的模型為

Y=B1+B2X1+B3X2+卻錯(cuò)誤設(shè)定為:

Y=A1+A2X1+v7.3遺漏相關(guān)變量第九頁(yè),共三十二頁(yè),編輯于2023年,星期六遺漏解釋變量將產(chǎn)生如下后果:

(1)如果漏掉的X2與X1相關(guān),使得遺漏變量的模型的最小二乘估計(jì)量是有偏的。即不僅代表了x1對(duì)被解釋變量的直接影響,還代表了對(duì)被解釋變量的間接影響(經(jīng)由x2)。簡(jiǎn)言之,本應(yīng)由x2對(duì)被解釋變量的影響確體現(xiàn)在x1上。第四章之4.9設(shè)定誤差,分析了古鐘拍賣價(jià)格與鐘表年代、競(jìng)標(biāo)人數(shù)的回歸,(見(jiàn)P83)(2)錯(cuò)誤模型的參數(shù)估計(jì)量也是不一致的,即參數(shù)估計(jì)值的均值與其理論值不相等。(3)如果X2與X1不相關(guān),則遺漏變量的模型的估計(jì)量滿足無(wú)偏性與一致性。(4)錯(cuò)誤模型的隨機(jī)誤差項(xiàng)方差是真實(shí)隨機(jī)誤差方差的有偏估計(jì)第十頁(yè),共三十二頁(yè),編輯于2023年,星期六(5)錯(cuò)誤模型的斜率系數(shù)方差也是有偏估計(jì)。

(6)通常的置信區(qū)間和假設(shè)檢驗(yàn)過(guò)程不再可靠,置信區(qū)間會(huì)變寬,會(huì)更頻繁接受零假設(shè)。6/1/2023第十一頁(yè),共三十二頁(yè),編輯于2023年,星期六舉例:嬰兒死亡率的決定因素被解釋變量:嬰兒死亡率(CM)解釋變量:人均國(guó)民收入PGNP;女性識(shí)字率FLR正確模型:上述三個(gè)變量模型(CM對(duì)PGNP、FLR回歸)錯(cuò)誤模型:遺漏FLR變量的兩個(gè)變量模型(CM對(duì)PGNP回歸)結(jié)論:不包含女性識(shí)字率的雙變量模型,錯(cuò)誤之處:不僅忽略了遺漏變量“女性識(shí)字率”對(duì)嬰兒死亡率的影響,而且,也忽略了女性識(shí)字率對(duì)人均國(guó)民收入的影響。因此,錯(cuò)誤模型中的解釋變量PGNP,就擔(dān)負(fù)起遺漏變量“女性識(shí)字率”對(duì)被解釋變量(CM)的影響,從而無(wú)法表現(xiàn)出PGNP對(duì)CM的真實(shí)的影響。提示:在建立計(jì)量經(jīng)濟(jì)模型時(shí),需要對(duì)所研究現(xiàn)象所蘊(yùn)含的經(jīng)濟(jì)理論做深入了解,目的是把相關(guān)變量都引入模型中。6/1/2023第十二頁(yè),共三十二頁(yè),編輯于2023年,星期六包含無(wú)關(guān)變量偏誤:采用包含無(wú)關(guān)解釋變量的模型進(jìn)行估計(jì)帶來(lái)的偏誤。

設(shè)Y=0+1X1+v

(*)

為正確模型,但卻估計(jì)了錯(cuò)誤的模型:

Y=0+1X1+2X2+(**)

如果2=0,則(**)與(*)相同,因此,可將(**)式視為以2=0為約束的(*)式的特殊形式。即P86,第四章所介紹的“受限最小二乘”7.4包含無(wú)關(guān)變量:過(guò)度擬合模型第十三頁(yè),共三十二頁(yè),編輯于2023年,星期六用OLS法估計(jì)模型Y=0+1X1+2X2+由于所有的經(jīng)典假設(shè)都滿足,因此

:(1)OLS估計(jì)量無(wú)偏的,也是一致的(4)但是,引入多余解釋變量的模型的OLS估計(jì)量無(wú)效,不具有最小方差性(2)從錯(cuò)誤的回歸方程中,得到的方差估計(jì)量是正確的(3)置信區(qū)間和假設(shè)檢驗(yàn)仍然是有效的OLS估計(jì)量是線性無(wú)偏估計(jì)量,但非最優(yōu),不再有效。小結(jié):第十四頁(yè),共三十二頁(yè),編輯于2023年,星期六例7-2:舉例說(shuō)明第六章中的6.5:食品支出模型被解釋變量:食品支出解釋變量:稅后收入(x),“性別”(采用加法引入和乘法引入兩個(gè)變量(D、DX)模型:回歸結(jié)果:Y=1432.577+0.0616X-67.893D-0.0063DXt=(5.765)(7.376)(-0.194)(-0.485)6/1/2023第十五頁(yè),共三十二頁(yè),編輯于2023年,星期六結(jié)論前面的模型中引入了差別截距、差別斜率變量的虛擬變量模型,由于D、DX參數(shù)估計(jì)值都不顯著,而引入虛擬變量D的差別截距模型(6-9)的虛擬變量系數(shù)顯著,表明,差別斜率虛擬變量DX很可能屬于多余的。也就是說(shuō),食品支出模型中,正確的引入解釋變量,應(yīng)該是定量變量:稅后收入X,虛擬變量D食品支出模型引入虛擬變量D,表明:男女食品支出的平均水平(截距)存在差異,但男女食品支出的變化率(斜率)無(wú)差異。6/1/2023第十六頁(yè),共三十二頁(yè),編輯于2023年,星期六

當(dāng)選取了錯(cuò)誤函數(shù)形式并對(duì)其進(jìn)行估計(jì)時(shí),帶來(lái)的偏誤稱錯(cuò)誤函數(shù)形式偏誤

容易判斷,這種偏誤所估計(jì)的模型參數(shù)估計(jì)量是有偏估計(jì)。

例如,如果“真實(shí)”的回歸函數(shù)為生產(chǎn)函數(shù)卻估計(jì)線性式:

顯然,兩者的參數(shù)具有完全不同的經(jīng)濟(jì)含義,且估計(jì)結(jié)果一般也是不相同的。

7.5錯(cuò)誤函數(shù)形式第十七頁(yè),共三十二頁(yè),編輯于2023年,星期六例7-3:舉例說(shuō)明被解釋變量:美國(guó)進(jìn)出口商品支出解釋變量:個(gè)人可支配收入(PDI)、年份(Year)線性回歸模型與對(duì)數(shù)回歸模型所得到的參數(shù)估計(jì)值含義是完全不同的,(詳細(xì)解釋見(jiàn)教材第170頁(yè))6/1/2023第十八頁(yè),共三十二頁(yè),編輯于2023年,星期六7.6度量誤差應(yīng)變量中的度量誤差引起的后果不太嚴(yán)重。解釋變量中的度量誤差引起的后果非常嚴(yán)重。建議使用工具變量或替代變量:與原始變量X高度相關(guān),但與回歸誤差項(xiàng)無(wú)關(guān),且不存在度量誤差。若不同時(shí)期變量的定義不同,則需要確保數(shù)據(jù)的可比性。實(shí)踐中的建議:確保解釋變量(X)的數(shù)據(jù)盡可能準(zhǔn)確,不免除記錄、舍入和遺漏誤差。第十九頁(yè),共三十二頁(yè),編輯于2023年,星期六模型設(shè)定偏誤的后果

模型設(shè)定出現(xiàn)誤差時(shí),模型估計(jì)結(jié)果會(huì)與“實(shí)際”有偏差。這種偏差的性質(zhì)與程度與模型設(shè)定誤差的類型密切相關(guān)。第二十頁(yè),共三十二頁(yè),編輯于2023年,星期六7.7模型設(shè)定誤差的檢驗(yàn)

7.7.1檢驗(yàn)是否含有無(wú)關(guān)變量

可用t檢驗(yàn)與F檢驗(yàn)完成。檢驗(yàn)的基本思想:如果模型中誤選了無(wú)關(guān)變量,則其系數(shù)的真值應(yīng)為零。因此,只須對(duì)無(wú)關(guān)變量系數(shù)的顯著性進(jìn)行檢驗(yàn)。

t檢驗(yàn):檢驗(yàn)?zāi)?個(gè)變量是否應(yīng)包括在模型中;

F檢驗(yàn):檢驗(yàn)若干個(gè)變量是否應(yīng)同時(shí)包括在模型中(建議:F檢驗(yàn)可以采用受限最小二乘,可以回答多個(gè)變量是否包含在模型中)。第二十一頁(yè),共三十二頁(yè),編輯于2023年,星期六

7.7.2對(duì)遺漏相關(guān)變量或函數(shù)形式設(shè)定偏誤的檢驗(yàn)

(1)殘差圖示法第二十二頁(yè),共三十二頁(yè),編輯于2023年,星期六

殘差序列變化圖(a)趨勢(shì)變化:模型設(shè)定時(shí)可能遺漏了一隨著時(shí)間的推移而持續(xù)上升的變量

(b)循環(huán)變化:模型設(shè)定時(shí)可能遺漏了一隨著時(shí)間的推移而呈現(xiàn)循環(huán)變化的變量

第二十三頁(yè),共三十二頁(yè),編輯于2023年,星期六(c)

模型函數(shù)形式設(shè)定偏誤時(shí)殘差序列呈現(xiàn)正負(fù)交替變化

圖示:一元回歸模型中,真實(shí)模型呈冪函數(shù)形式,但卻選取了線性函數(shù)進(jìn)行回歸。

第二十四頁(yè),共三十二頁(yè),編輯于2023年,星期六7.7.3在線性模型和對(duì)數(shù)模型之間選擇:MWD檢驗(yàn)H0:線性模型:Y是X的線性函數(shù)H1:對(duì)數(shù)線性模型:Y是X(或LnX)的線性函數(shù)估計(jì)線性模型,得到Y(jié)的擬合值估計(jì)對(duì)數(shù)線性模型,得到LnY的擬合值做Y對(duì)X和Z1的回歸做LnY對(duì)X(或LnX)和Z2的回歸對(duì)Z1的系數(shù)進(jìn)行變量的顯著性檢驗(yàn),若顯著,則拒絕H0對(duì)Z2的系數(shù)進(jìn)行變量的顯著性檢驗(yàn),若顯著,則拒絕H1第二十五頁(yè),共三十二頁(yè),編輯于2023年,星期六例P176:因?yàn)閆1的系數(shù)顯著,則拒絕H0:假設(shè)真實(shí)的進(jìn)口支出函數(shù)是線性的。因?yàn)閆2的系數(shù)顯著,則拒絕H1:假設(shè)真實(shí)的進(jìn)口支出函數(shù)是對(duì)數(shù)線性的。根據(jù)上述結(jié)果,本例中兩個(gè)模型都是合理的。第二十六頁(yè),共三十二頁(yè),編輯于2023年,星期六

7.7.4一般性設(shè)定偏誤檢驗(yàn)

但更準(zhǔn)確更常用的判定方法是拉姆齊(Ramsey)于1969年提出的所謂RESET檢驗(yàn)(regressionerrorspecificationtest)。

基本思想:

如果事先知道遺漏了哪個(gè)變量,只需將此變量引入模型,估計(jì)并檢驗(yàn)其參數(shù)是否顯著不為零即可;問(wèn)題是不知道遺漏了哪個(gè)變量,需尋找一個(gè)替代變量Z,來(lái)進(jìn)行上述檢驗(yàn)。

RESET檢驗(yàn)中,采用所設(shè)定模型中被解釋變量Y的估計(jì)值?的若干次冪來(lái)充當(dāng)該“替代”變量。

第二十七頁(yè),共三十二頁(yè),編輯于2023年,星期六(1)估計(jì)。先估計(jì)原始模型得到擬合值。(4)檢驗(yàn)和判斷。若僅增加一個(gè)“替代”變量,可采用t檢驗(yàn);若增加多個(gè)“替代”變量,可采用“受限最小二乘”的F檢驗(yàn)。(2)觀察殘差與擬合值的關(guān)系,決定引入擬合值的若干次冪進(jìn)入模型作為“替代變量”。(3)再估計(jì)。估計(jì)引入了“替代變量”的新模型。拉齊姆檢驗(yàn)(RESET檢驗(yàn))第二十八頁(yè),共三十二頁(yè),編輯于2023年,星期六RESET檢驗(yàn)評(píng)價(jià)優(yōu)點(diǎn):簡(jiǎn)單易行。缺陷:可用于判斷模型設(shè)定是否錯(cuò)誤,卻不能幫助我們選擇正確模型。因此,該檢驗(yàn)主要是診斷工具。第二十九頁(yè),共三十二頁(yè),編輯于2023年,星期六

例:對(duì)商品進(jìn)口進(jìn)行研究,估計(jì)了中國(guó)商品進(jìn)口M與GDP的關(guān)系,然而,由于僅用GDP來(lái)解釋商品進(jìn)口的變化,明顯地遺漏了諸如商品進(jìn)口價(jià)格、匯率等其他影響因素。在此,采用RESET檢驗(yàn)考察建模時(shí)是否遺漏了重要的相關(guān)變量。(1)用原回歸模型估計(jì)出商品進(jìn)口序列

R2

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論