版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、HEN system office room HEN 16H-HENS2AHENS8Q8-HENH1688第五章離散選擇模型在初級計量經(jīng)濟(jì)學(xué)里,我們已經(jīng)學(xué)習(xí)了解釋變量是虛擬變量的惜況,除此之外,在實 際問題中,存在需要人們對決策與選擇行為的分析與研究,這就是被解釋變量為虛擬變量 的情況。我們把被解釋變量是虛擬變量的線性回歸模型稱為離散選擇模型,本章主要介紹 這一類模型的估計與應(yīng)用。本章主要介紹以下內(nèi)容:1、為什么會有離散選擇模型。2、二元離散選擇模型的表示。3、線性概率模型估計的缺陷。4、Logit模型和Probit模型的建立與應(yīng)用。第一節(jié)模型的基礎(chǔ)與對應(yīng)的現(xiàn)象、問題的提出在研究社會經(jīng)濟(jì)現(xiàn)象時
2、,常常遇見一些特殊的被解釋變量,其表現(xiàn)是選擇與決策問題, 是定性的,沒有觀測數(shù)據(jù)所對應(yīng);或者其觀測到的是受某種限制的數(shù)據(jù)。1、被解釋變量是定性的選擇與決策問題,可以用離散數(shù)據(jù)表示,即取值是不連續(xù)的。 例如,某一事件發(fā)生與否,分別用1和0表示;對某一建議持反對、中立和贊成5種觀點, 分別用0、1、2表示。山離散數(shù)據(jù)建立的模型稱為離散選擇模型。2、被解釋變量取值是連續(xù)的,但取值的范圍受到限制,或者將連續(xù)數(shù)據(jù)轉(zhuǎn)化為 類型 數(shù)據(jù)。例如,消費者購買某種商品,當(dāng)消費者愿意支付的貨幣數(shù)量超過該商品的 最低價值 時,則表示為購買價格;當(dāng)消費者愿意支付的貨幣數(shù)量低于該商品的最低價 值時,則購買 價格為0。這種類
3、型的數(shù)據(jù)成為審查數(shù)據(jù):再例如,在研究居民儲蓄時,調(diào)查數(shù)據(jù)只有存款 一萬元以上的帳戶,這時就不能以此代表所有居民儲蓄的情況,這種數(shù)據(jù)稱為截斷數(shù)據(jù).這 兩種數(shù)據(jù)所建立的模型稱為受限被解釋變量模型。有的時候,人們甚至更愿意將連續(xù)數(shù)據(jù) 轉(zhuǎn)化為上述類型數(shù)據(jù)來度量,例如,高考分?jǐn)?shù)線的設(shè)置,就把高出分?jǐn)?shù)線和低于分?jǐn)?shù)線劃 分為了兩類。下面是兒個離散數(shù)據(jù)的例子。例研究家庭是否購買住房。曲于,購買住房行為要受到許多因素的影響,不僅有家庭 收入、房屋價格,還有房屋的所在環(huán)境、人們的購買心理等,所以人們購買住房的心理價位很難觀測到,但我們可以觀察到是否購買了住房,即 我們希望研究買房的可 能性,即概率?(Y = 1)
4、的大小。例分析公司員工的跳槽行為。員工是否愿意跳槽到另一家公司,取決于薪資、發(fā)展 潛力等諸多因素的權(quán)衡。員工跳槽的成本與收益是多少,我們無法知道,但我們可以觀察 到員工是否跳槽,即例對某項建議進(jìn)行投票。建議對投票者的利益影響是無法知道的,但可以觀察到投 票者的行為只有三種,即研究投票者投什么票的可能性,即p(y = /),7 = i,2,3o從上述被解釋變量所取的離散數(shù)據(jù)看,如果變量只有兩個選擇,則建立的模型為二元 離散選擇模型,乂稱二元型響應(yīng)模型;如果變量有多于二個的選擇,則為多元選擇模型。 本章主要介紹二元離散選擇模型。離散選擇模型起源于Fechner于1860年進(jìn)行的動物條件二元反射研究
5、。1962年, Warner 首次將它應(yīng)用于經(jīng)濟(jì)研究領(lǐng)域,用于研究公共交通工具和私人交通工具的選擇問題。70-80 年代,離散選擇模型被普遍應(yīng)用于經(jīng)濟(jì)布局、企業(yè)選點、交通問題、就業(yè)問題、購買行為等 經(jīng)濟(jì)決策領(lǐng)域的研究。模型的估計方法主要發(fā)展于20世紀(jì)80年代初期。(參見李子奈,高 等計量經(jīng)濟(jì)學(xué),清華大學(xué)出版社,2000年,第155頁-第156頁)二、線性概率模型對于二元選擇問題,可以建立如下計量經(jīng)濟(jì)模型。1、線性概率模型的概念設(shè)家庭購買住房的選擇主要受到家庭的收入水平,則用如下模型表示其中,xr為家庭的收入水平,X為家庭購買住房的選擇,即由于F是取值為0和1的隨機(jī)變量,并定義取丫值為1的概率是
6、0則丫的分布為即隨機(jī)變量丫服從兩點分布。根據(jù)兩點分布,可得丫的數(shù)學(xué)期望為上述數(shù)學(xué)模型的經(jīng)濟(jì)學(xué)解釋是, 因為選擇購買住房變量取值是1,其概率是。,并且 這時對應(yīng)?的表示是一線性關(guān)系,因 此,丫在給定X,下的條件期望E(YXJ可解釋為在給定&下,事件(家庭購買住房)將發(fā) 生的條件概率為?(E = 1|XJ,亦即家庭選顯然從而顯然從而Y01概率1-PPE(YXi = pPiXi=p(5-1)擇購買住房的概率是家庭收入的一個線性函數(shù)。我們稱這一關(guān)系式為線性概率函數(shù)。曲于,Y服從兩點分布,所以,丫的方差為2、線性概率函數(shù)的估計及存在的問題對線性概率函數(shù)直接運用OLS 估計,會存在以下困難。隨機(jī)誤差項的非
7、正態(tài)性I概率 表現(xiàn)表明服從兩點分布。而在經(jīng)典訃量經(jīng)濟(jì)學(xué)中,假定服從正態(tài)分布。的異方差性。事實上,根據(jù)服從兩點分布 貝U妁的方差為Var (uf) = Pi(l-Pj)。表明隨著i的變動是一個變量,則心的方差不是一個固定常數(shù)。利用加權(quán)最小二乘法修正異方差取權(quán)數(shù)為可以證明半具有同方差。在具體估計線性概率模型時,用作為4的估計來計算權(quán)數(shù)H的 估計o3、可決系數(shù)F的非真實性。曲于,被解釋變量Y只取值1或0,不可能有估計的線性 概率模型能很好地擬合這些點,所以,這時計算的正會比1小許多,在大多數(shù)例子中,F(xiàn) 介于與之間。4、0WE7|XJW 1不成立??朔@一問題可直接從對線性概率模型的估計,求出用人工
8、的方法定義當(dāng)1時,取廉二1;當(dāng)時,取二0。但要比較好地解決這類問題,只能考慮采用新的估計方法,這就是將要介紹的 Logit模型和Probit模型。第二節(jié)Logit 模型一、Logit 模型的產(chǎn)生1、產(chǎn)生Logit模型的背最由上述介紹可知,對于線性概率模型來說,存在一些問題,有的問題盡管可以用適當(dāng) 的方法加以彌補(bǔ),但并不完善和理想。古典假定不再成立如存在異方差性,可用加權(quán)0LS方法加以彌補(bǔ)。在線性概率模型中,對于不滿足0的情況,用人工的方法處理,B|J當(dāng)1時,取二1當(dāng)時,取雖然能夠彌補(bǔ)不足,但仍然具有較強(qiáng)的主觀因素。經(jīng)濟(jì)意義也不能很好地得到體現(xiàn)。在線性概率模型E (YX) 二口嚴(yán)伙X嚴(yán)p 中,概
9、率? (y = l)會隨著X,的變化而線性變化,但這與實際悄況通常不符。例如購買住 房,通常收入很高或很低,對于購買住房的可能性都不會有太大的影響,而當(dāng)收入增加很 快時,對購買住房的影響將會很大。所以,購買住房的可能性與收入之間并不是線性關(guān) 系,有可能是一種非線性關(guān)系。2、Logit模型的含義綜合上述討論,我們所需要的是具有如下二分性質(zhì)的模型。隨著&的減小,必趨近0的速度會越來越慢;反過來隨著&的增大,門接近1 的速度也越來越慢,而當(dāng)X,增加很快時,門的變化會比較快。故必與X,之間應(yīng)呈非線性 關(guān)系。并且山概率的屬性,門的變化應(yīng)始終在0和1之間。因此,一個很自然的想法是采用隨機(jī)變量的分布函數(shù)來表
10、示幾與乙的這種非線性關(guān)系。從兒何圖形看,所需要的模型有點像圖那樣,概率位于0與1之間,并隨著非線性地 變化。圖一個累積分布函數(shù)的圖形形如圖所示的S型曲線,就是隨機(jī)變量的一個累積分布函數(shù)(CDF)。因此,當(dāng)回歸中的被解釋變量是取0和1的二分變量時,并且概率值的變化與解釋變量X,之間有上述變 化特征,則可用CDF去建立回歸模型。在二分被解釋變量的研究中可使用多種分布函數(shù)(Cox, 1970)來表示。但最常用的是Logistic分布函數(shù)和標(biāo)準(zhǔn)止態(tài)分布函數(shù),前者導(dǎo)出 Logit模型,后者導(dǎo)出Probit模型。Logistic分布函數(shù)設(shè)P 憶*島土 (12式中, z,=prp叢嚴(yán)并且在該表達(dá)式中,有如下
11、變動規(guī)律,當(dāng) Zj +o時,p. 1 ;當(dāng) Z, T -O0 時,Pi T 0 ;當(dāng)乙=0時,Pl=-o2稱(5-2)式為Logistic分布函數(shù),它具有明顯的S型分布特征。Logit 模型以下是由Logistic分布函數(shù)導(dǎo)出Logit模型。其中,工為機(jī)會概率比(簡稱機(jī)會比,下同),即事件發(fā)生與不發(fā)生所對應(yīng)的概1 -門率之比。稱(5-3)式為Logit模型。3、Logit模型的特點隨著P從0變到1, In ()從丫0變到00 (亦即乙從Y0變到x) 0可以看 1-出,在LPM中概率必須在0與1之間,但對Logit模型并不受此約束。In (上)對X,為線性函數(shù)。1-當(dāng)ln(-D為正的時候,意味著
12、隨著X,的增加,選擇1的可能性也增大1-To 當(dāng) In ()1為負(fù)的時候,隨著To 當(dāng) In ()1會比由1變到0時,ln (_L)會變負(fù)并且在幅度上越來越大;當(dāng)機(jī)會比由1變到無窮 1-時,h】(_L)為正,并且也會越來越大。4、Logit模型與線性回歸模型的區(qū)別(1)Logit模型為非線性模型,盡管等式右端看上去是線性形式,而普通回歸模 型是線性模型。(2)線性回歸模型研究被解釋變量丫的均值E(YXt)與解釋變量X,之間的依存 關(guān)系,而Logistic分布函數(shù)研究的是事件發(fā)生的概率P(Y = X)與解釋變量X,的依存 關(guān)系。(3)線性回歸模型中包含隨機(jī)誤差項,對的要求是要滿足基本假定,而 L
13、ogistic分布函數(shù)沒有出現(xiàn)隨機(jī)誤差項,對模型沒有這樣的要求。(4)在估IT Logit模型時,要求數(shù)據(jù)必須來自于隨機(jī)樣本,即各觀測值相互獨 立,或者說要求樣本分布與總體分布具有同一性,而對線性回歸模型一般悄況下并無這樣 嚴(yán)格的要求。此外,Logit模型與線性回歸模型的一個相同的要求是,解釋變量之間要無多重共線 性,否則,會導(dǎo)致參數(shù)估計的方差變大和不穩(wěn)定。二、Logit 模型的估計為了估it Logit模型,除了 X:夕卜,我們還應(yīng)有In (上)的數(shù)值。由于必只取值為1和0 (即事件發(fā)生或不發(fā)生,如買房或不買房),使得In (上)無意義,通常情況1一下,幾沒有具體的數(shù)據(jù),所以直接對Logit
14、模型進(jìn)行估計有困難。這時,可有以下估計方 法。1、根據(jù)數(shù)據(jù)類型選用0LS方法可通過市場調(diào)杏獲得分組或重復(fù)數(shù)據(jù)資料,用相對頻數(shù)幾二土化為必的估汁。以叫 購買住房為例,將購買住房的惜況分組,假設(shè)第3組共有叫個家庭,收入為乂,其中 有,;個家庭已購買住房,其余未購買。則收入為X,的家庭,購買住房的頻率為將其作為口 的估計,并代入對數(shù)機(jī)會比,有于是,樣本回歸函數(shù)為對上式可直接運用OLS法估汁未知參數(shù)了。具體應(yīng)用可參見Damodar N. Gujarati計量經(jīng) 濟(jì)學(xué)基礎(chǔ)(第四版)下冊,中國人民大學(xué)出版社,2005年。第559頁-第560頁。2、最大似然估計方法在線性回歸中估計總體未知參數(shù)時主要采用OL
15、S方法,這一方法的原理是根據(jù)線性回 歸模型選擇參數(shù)估汁,使被解釋變量的觀測值與模型估汁值之間的離差平方值為最小。而 最大似然估計方法則是統(tǒng)訃分析中常用的經(jīng)典方法之一,它是建立在山聯(lián)合密度函數(shù)所導(dǎo) 出的似然函數(shù),并對其求極值而得到參數(shù)估計的一種方法。在線性回歸分析中最大似然估 計法可以得到與最小二乘法一致的結(jié)果。但是,與最小二乘法相比,最大似然估計法既可 以用于線性模型,乂可以用于非線性模型,由于Logit回歸模型是非線性模型,因此最 大似然估汁法是IT Logit回歸模型最常用的方法。下面,以單變量為例,說明該方法的運 用。假設(shè)有n個樣本觀測數(shù)據(jù)(X,), i = l,2,由于樣本是隨機(jī)抽取,
16、所以,在給定X 條件下得到的力=1和乙=0的概率分別是門和1-門。于是,一個觀測值的概率為其中, 齊二1或匕=0。因為,各項觀察相互獨立,則n次觀察所得的樣本數(shù)據(jù)的聯(lián)合分布可表示為 各邊際分布的連乘積稱上式為n次觀察的似然函數(shù)。山最大似然估汁法的原理知,最大似然估汁就是求解出具 有最大可能取所給定的樣本觀測數(shù)據(jù)的參數(shù)估訃。于是,最大似然估計的關(guān)鍵是估計出人 和B,使得上述表達(dá)式取得最大值。將上式兩端取對數(shù)得稱上式為對數(shù)似然函數(shù)。為了估計能使lnU002)有最大的總體參數(shù)估計診和A,先分別對0,02求偏導(dǎo)數(shù),然后令其為0,得在線性回歸中,似然函數(shù)是通過把偏離差平方和分別對肉,02求偏導(dǎo)數(shù)得到,它
17、對于未知 參數(shù)都是線性的,因此,很容易求解。但是對于Logit回歸中的上述兩個方程是關(guān)于的非 線性函數(shù),求解十分困難。隨著現(xiàn)代計算機(jī)技術(shù)的發(fā)展,許多計量經(jīng)濟(jì)學(xué)和統(tǒng)計學(xué)的軟件 包均有Logit回歸的參數(shù)最大似然估汁值,常用的EViews軟件就含有該估計方法。3、Logit回歸最大似然估計的統(tǒng)計性質(zhì)(1)參數(shù)估訃具有一致性,即當(dāng)樣本觀測增大時,模型的參數(shù)估計值將比較接近參數(shù)的真值。參數(shù)估汁為漸近有效,即當(dāng)樣本觀測增大時,參數(shù)估汁的標(biāo)準(zhǔn)誤相應(yīng)減小。參數(shù)估計滿足漸近正態(tài)性,即隨著樣本觀測的增大,估計的分布近似于正態(tài)分布。這意味著,可以利用這一性質(zhì)對未知參數(shù)進(jìn)行假設(shè)檢驗和區(qū)間估計了。有關(guān)證明可參見 Al
18、drich, John & Forrest D. Nelson. 1984. LinearProbability, Logit, and Probit ModelsNewbury Park, Sage Publications.三、Logit回歸模型的評價和參數(shù)的統(tǒng)計檢驗與一般線性回歸模型一樣,在得到Logit回歸模型的參數(shù)估計后,還應(yīng)對模型進(jìn) 行 評價和相應(yīng)的統(tǒng)汁檢驗。1、模型的擬合優(yōu)度檢驗?zāi)P凸乐瓿梢院?,需要對模型是否有效地描述了模型與觀測數(shù)據(jù)的匹配程度進(jìn)行評 價。如果模型的預(yù)測值(擬合值)能夠與對應(yīng)的觀測值有較高的一致性,就認(rèn)為該模型能 擬合數(shù)據(jù),否則,將不接受這一模型。對Logit回
19、歸模型的評價有多種方法,不同的計算 軟件給出的評價結(jié)果也有差異。這里,我們將根據(jù)EViews軟件,介紹模型擬合優(yōu)度的檢 驗方法。(1) McFadden R2在前面的介紹中,已經(jīng)提到對于離散選擇模型,通常的擬合優(yōu)度用沒有多大意義。在 EViews軟件里,有一種方法即McFadden R2,簡記為其計算公式為式中,UF”為模型中包含 所有解釋變量的無約束對數(shù)似然函數(shù)值,巴為模型中僅含有截距項的有約束的對數(shù)似然 函數(shù)值。從概念上講,UF”和口人分別等價于普通線性回歸模型中的RSS和TSS。與F 樣,也在0到1之間變動。(2)期望-預(yù)測表檢驗該方法的原理是,在模型參數(shù)估汁后,選取適當(dāng)?shù)慕財嘀?7 (
20、0/70,其中,乙B+BZ如果樣 本中的一個觀測數(shù)據(jù)丫的數(shù)值為0,并且該樣本屬于第1組,同時另一個觀測數(shù)據(jù)Y的數(shù)值 為1,并且屬于第2組,就稱這個觀測數(shù)據(jù)是分組恰當(dāng)?shù)模駝t就稱這個觀測數(shù)據(jù)是分組不 恰當(dāng)?shù)?。該方法的思想是利用分組恰當(dāng)與否,得到觀測數(shù)據(jù)占總樣本的比重來檢驗?zāi)P偷?擬合優(yōu)度。如果模型估汁與實際觀測數(shù)據(jù)比較一致,則大多數(shù)的觀測數(shù)據(jù)應(yīng)該是分組恰 勺的,反之,如果分組不恰、“1的觀測數(shù)據(jù)所占的比重很大,說明模型右汁與實際觀測 數(shù)據(jù)的擬合程度較差,模型就需要調(diào)整。利用軟件EViews進(jìn)行期望-預(yù)測表檢驗的步驟如下:第一步,在彳占計好模型的窗口中按此匕路徑選擇 View/Expectatio
21、n Prediction Tableo第二步,出現(xiàn)一個對話框,在對話框里輸入一個截斷值“(Ovpvl),系統(tǒng)默認(rèn)的截斷 值是。通常情況下,可取乂為1的次數(shù)在總觀測次數(shù)中所占的比例作為截斷值的估計值。第三步,點擊0K后可生成對應(yīng)的期望-預(yù)測表。這時便可利用該表進(jìn)行擬合優(yōu)度的判 斷。有關(guān)Logit回歸模型的擬合優(yōu)度其它檢驗方法,如皮爾遜才檢驗、偏差檢驗、從 “仟-么,正Mow擬合優(yōu)度指標(biāo)和信息測量指標(biāo)等??蓞⒁娤嚓P(guān)文獻(xiàn),如王濟(jì)川、郭 志剛,Logistic回歸模型方法與應(yīng)用,高等教育出版社,2001年,第58頁第89頁。2、參數(shù)的顯著性檢驗對模型中參數(shù)的顯著性檢驗,就是決策判斷某個解釋變量對事件的
22、發(fā)生(即選取r = i)是否有顯著性影響。如果檢驗結(jié)果表明該解釋變量對選取丫二1的發(fā)生有顯著性影響, 則認(rèn)為將該解釋變量放入Logit回歸模型中是恰當(dāng)?shù)?。否則,需要對模型進(jìn)行適當(dāng)?shù)恼{(diào) 整。(1)Z檢驗以一元Logit回歸模型為例,設(shè)模型為對該模型中的參數(shù)02的顯著性檢驗的原假設(shè)為日。:02 = 0,即解釋變量X.對事件丫 = 1發(fā)生的概率沒有顯著性影響。根據(jù)參數(shù)的最大似然估計性質(zhì)可知,在大樣本條件 下,介漸近服從正態(tài)分布,于是,在日。:02= 0成立的前提下,檢驗統(tǒng)計量為漸近服從 標(biāo)準(zhǔn)正態(tài)分布。式中,影(壓)為最大似然估il倡的標(biāo)準(zhǔn)誤差。因此,可按常規(guī)查標(biāo)準(zhǔn) 正態(tài)分布表,對原假設(shè)進(jìn)行判斷,從而
23、檢驗?zāi)P椭袇?shù)的顯著性。(2)Wald 檢驗對模型中參數(shù)顯著性檢驗還可使用Wald檢驗,其檢驗統(tǒng)計量為在/70: A= 0下,W漸近服從自由度為1的才分布。因此,可根據(jù)才分布表,在給定的顯著性水平&下,得到相應(yīng)的臨界值,從而判斷參數(shù)的顯著性??蓞㈤?Hauck, W. W. & A. tests as applied to hypotheses in logit analysis.Journal of the American Statistical Association, : 851-853.(3) 似然比檢驗統(tǒng)計學(xué)上已經(jīng)證明,在大樣本情況下,兩個模型之間如果具有嵌套關(guān)系,則兩個模型之間的
24、對數(shù)似然值乘以-2的結(jié)果之差近似服從才分布。這一統(tǒng)計量就是似然比統(tǒng)計量。該檢驗的思想是,假設(shè)一個模型記為中有解釋變量X,另一個模型記為包含了M%/1中所有其它解釋變量,而沒有包含Xj,則稱嵌套于Model亦即Model:包含了 Model!通過這一模型之間嵌套關(guān)系,我們實際上需要判斷的是X,出現(xiàn)在模型Modt71中是否合 適。Hanushek & Jackson , 1977; Aldrich & Nelso, 1984; Greene, 1990; Long, 1997 分別 證實了似然比統(tǒng)計量為其中,山(4汶川)為所設(shè)定的原模型(即包含了所有解釋變量一一“有約束”)的最大 似然函數(shù)的對數(shù)值
25、,】n (嗣池)為省略模型(即省略了解釋變量X/ “無約束” 的最大似然函數(shù)的對數(shù)值,兩者之間的差乘以-2近似地服從才分布,其自山度為省略了的 解釋變量的個數(shù)。接下來,可根據(jù)才分布表,在給定的顯著性水平Q下,得到臨界值,從 而判斷參數(shù)的顯著性。例 分析某種教學(xué)方法對成績影響的有效性,被解釋變量GRADE為接受新教學(xué)方法后 成績是否改善,如果改善取1,否則取0; GPA為平均分?jǐn)?shù);TUCE為測驗得分;PSI為是否 接受新教學(xué)方法,如果接受取1,否則取0。運用EViews軟件中Logit模型估計方法得到 如下結(jié)果IVxe EQU1 Voxlcfile: GKEINF2U4lGxII Eilc E,
26、4i * Qbj ect 乂 i ewQui ck Onti ons WindowViwvv | E cc | Object | 亦Nmme | Estimate | SwcQSt | Stats | ResidsDependent Variable GRADEMethod ML -日 inmry Logit (Quadratic hill climbing) Date: 06/04/06 Time: 22:11Sample 1 32Included observations 32Convergence achieved after 5 iterationsCovariance matrix
27、computed using second derivativesVariableCoefficientStd Errorz-StatisticProb13.021354.931317-2.G405410 0083 0C GPA TUCE PSI282G1131.2S29402 23772G02520.0951580.141554 10.6722350.5014237868806456322344260 0255Mean dependent var S E of regression Sum squ 合Ed resid Log likelihood Restr. log likelihood
28、LR statistic (3 df) Probability(LR stat)03437500 38471G4144171 12 889G3 -20 591731S.404190 001502S D dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter. Avg log likelihood McFadden R-squared0 4825591 0556021 2388191 116333 0.402801 0.374038Obs with Dep=021Total obs32Obs with D
29、ep=1111、由表格寫出估計表達(dá)式2、參數(shù)的顯著性檢驗包括截距項在內(nèi)的4個參數(shù)估計的標(biāo)準(zhǔn)差分別為它們的z統(tǒng)計量分別是給定a = 0.05,表明除了變量TUCE外,其它兩個變量對機(jī)會比均有顯著性的正影響。3、模型的顯著性檢驗(1)由計算表格知,擬合優(yōu)度指標(biāo)略=0.3743,表明模型有一定的擬合優(yōu)度。(2)期望-預(yù)測表檢驗。因為,接受新方法成績有所改善的比例為,所以選取截 斷值為。在建好模型的窗口按前述的路徑得到如下結(jié)果由上表可知,左邊給出的是對觀測數(shù)值分組的結(jié)果,歸入第1組的觀測數(shù)值共為19個,其中,分組恰當(dāng)?shù)臑?7個,分組不恰當(dāng)?shù)臑?個,即對被解釋變量Y = 0的觀測17數(shù)值(總共21個)來
30、講,模型分組恰當(dāng)?shù)谋嚷蕿?(乂);歸入第2組的觀測數(shù)值21為13個,其中,分組恰當(dāng)?shù)臑?個,分組不恰當(dāng)?shù)臑?個,即對被解釋變量丫 = 1的9觀測數(shù)值(總共11個)來講,模型分組的恰當(dāng)比率為( - ) ; 111此得到模型所有觀 11測數(shù)值總的分組恰當(dāng)比率為 (-),說明估計的模型有較好的擬合優(yōu)度。32四、如t模型回歸系數(shù)的解釋山前面的推導(dǎo)可知,將事件發(fā)生的條件概率定義為p (y = iixr) = /7,則我們可得到 如下模型P(Y 11 XJ - + 嚴(yán) 0 曲-i + exp (一肉一 0 丸)(5-3)進(jìn)一步,在發(fā)生比的基礎(chǔ)上,我們還可得到如下模型(5-4)對模型(5-4),由于等式右端
31、為線性表示,則可完全按照線性回歸模型系數(shù)那樣來解釋。 一個解釋變量的作用如果是增加對數(shù)發(fā)生比的話,也就增加了事件發(fā)生的概率。具體來 講,Logit模型的系數(shù)如果是正的并且統(tǒng)計顯著,則在控制其它變量的情況下,對數(shù)發(fā)生 比隨對應(yīng)的解釋變量值增加而增加,相反,一個顯著的負(fù)系數(shù)代表對數(shù)發(fā)生比隨對應(yīng)解釋 變量的增加而減少。如果系數(shù)的統(tǒng)訃性質(zhì)不顯著,說明對應(yīng)解釋變量的作用在統(tǒng)計上與0 無差異。1、按發(fā)生比率來解釋Logit模型的系數(shù)對Logit模型的回歸系數(shù)進(jìn)行解釋時,很難具體把握以對數(shù)單位測量的作用幅度,所 以通常是將Logit作用轉(zhuǎn)換成對應(yīng)的發(fā)生比來解釋。設(shè)模型為轉(zhuǎn)換成發(fā)生比的形式(還原成以。為底的指
32、數(shù)函數(shù))(5-5)1 - Pi式中,截距A可以作為基準(zhǔn)發(fā)生比的對數(shù)?;鶞?zhǔn)的意思是指當(dāng)Logit模型中沒有任何解釋變量時所產(chǎn)生的發(fā)生比?;蛘?,除了常量外,所有解釋變量都取0值時所產(chǎn)生的發(fā)生 比。對于解釋變量的作用的解釋,由(5-5)式看出,各項作用之間已經(jīng)山加法的關(guān)系轉(zhuǎn) 變?yōu)槌朔P(guān)系。因此,系數(shù)伙的作用可解釋為,當(dāng)02為正值時,/將大于1,則在其它條件不變的情況下,/每增加一個單位值時發(fā)生比會相應(yīng)增加;當(dāng)伙為負(fù)值 時,將小于1,說明X,每增加一個單位值時發(fā)生比會相應(yīng)減少;而當(dāng)02為0時,/將等于 1,那么/不論怎樣變化發(fā)生比都不會變化。例如,在新教學(xué)方法采納的分析中,已估計的方程可按指數(shù)運算法則
33、轉(zhuǎn)變?yōu)橛缮鲜霰磉_(dá)式可以看出,由于GPA0,則8261 1,因此,在其它條件不變的悄況下,平均分?jǐn)?shù)每增 加一個單位,將導(dǎo)致接受新教學(xué)方法后成績有所改善的發(fā)生比會相應(yīng)提高。同理,對于變 量TUCE也可作類似的討論;由于PSI為虛擬解釋變量,表示是否接受新教學(xué)方法,如果 接受取1,否則取0,因此,在其它條件不變的情況下,當(dāng)PSI 二 1時,則將會使接受新教 學(xué)方法后,學(xué)習(xí)成績改善的發(fā)生比有所提高,而當(dāng)PSI 二 0時,則將會使接受新教學(xué)方法 后,學(xué)習(xí)成績改善的發(fā)生比保持不變。2、用概率來解釋Logit模型的系數(shù)除了解釋變量對于對數(shù)發(fā)生比的偏作用外,有時也用事件發(fā)生的概率來解釋模型中系 數(shù)的偏作用。對
34、事件發(fā)生概率的偏作用可以通過對Logit模型求X,的偏導(dǎo)數(shù)來加以解釋。其求導(dǎo)結(jié)果如下于是,變量X,對事件發(fā)生概率的偏作用就等于該解釋變量的系數(shù)幾與/7 (1-/7)的乘積。因為“(1-仍永遠(yuǎn)為正值,所以偏作用的符號由伙決定,作用的幅度依賴于幾的幅度和對 應(yīng)于X:特定值的概率,而它與模型中所有其它解釋變量有關(guān)。因此,不同于對發(fā)生比作 用的解釋,對事件發(fā)生概率的偏作用是隨餌值的變化而變化的。這就需要在討論變量X對事件發(fā)生概率的偏作用時,應(yīng)將概率餌值計算出來后,才能解釋其偏作用。3、預(yù)測概率與一般線性回歸模型一樣,根據(jù)Logit模型也可以獲得事件發(fā)生的預(yù)測概率。以一個 解釋變量的Logit模型為例,如果我們知道參數(shù)估計人和懇,并確定某一事件的1,2, 仍,便可將其代入Logit模型,計算預(yù)測概率。計算公式為在計算預(yù)測概率的基礎(chǔ)上,還進(jìn)一步計算在解釋變量發(fā)生離散變化時預(yù)測概率的變 化,這種方法被稱為概率離散變化法。其計算公式是另外,與一般線性回歸模型一樣,由一個解釋變量的Logit模型也可擴(kuò)展到多個解釋 變量
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- GB/T 44985.1-2024農(nóng)業(yè)物聯(lián)網(wǎng)通用技術(shù)要求第1部分:大田種植
- TBS-Corey-lactone-aldehyde-生命科學(xué)試劑-MCE-2452
- Anti-Mouse-CD3E-Antibody-1E11-D-生命科學(xué)試劑-MCE-1878
- 8-Amino-7-oxononanoic-acid-hydrochloride-生命科學(xué)試劑-MCE-9983
- 3-O-Methylguanosine-5-O-triphosphate-sodium-3-O-Methyl-GTP-sodium-生命科學(xué)試劑-MCE-9300
- 二零二五年度大數(shù)據(jù)分析技術(shù)顧問聘請協(xié)議
- 二零二五年度游樂園場地租賃與兒童游樂設(shè)施安全標(biāo)準(zhǔn)制定合同
- 二零二五年度房屋貸款房屋買賣合同范本(含家具)
- 施工現(xiàn)場管理制度化
- 施工方案對籃球場材料的要求與選擇
- 高考英語3500單詞表(帶音標(biāo))(亂序版)默寫背誦通用版
- 最終稿(教學(xué)評一致)課件
- 每個孩子都能像花兒一樣開放
- 2023年廣東省深圳市八年級下學(xué)期物理期中考試試卷
- 《詩詞寫作常識 詩詞中國普及讀物 》讀書筆記思維導(dǎo)圖
- YS/T 34.1-2011高純砷化學(xué)分析方法電感耦合等離子體質(zhì)譜法(ICP-MS)測定高純砷中雜質(zhì)含量
- LY/T 2016-2012陸生野生動物廊道設(shè)計技術(shù)規(guī)程
- 單縣煙草專賣局QC課題多維度降低行政處罰文書出錯率
- 健康養(yǎng)生課件
- 混雜控制系統(tǒng)課件
- 運動技能學(xué)習(xí)原理課件
評論
0/150
提交評論