版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、.廣義線性模型結(jié)課論文學(xué)院:基礎(chǔ)科學(xué)學(xué)院班級(jí):130802班學(xué)生學(xué)號(hào):20132891學(xué)生姓名:白冰指導(dǎo)教師:?jiǎn)文?摘要基于廣義線性模型的本科畢業(yè)生去向的分析摘要:線性回歸模型中是要求因變量是定量變量,而不是定性變量。 但許多實(shí)際問(wèn)題中,經(jīng)常出現(xiàn)因變量是定性變量的情況。 Logistic 回歸分析,處理分類因變量的統(tǒng)計(jì)方法。 Logistic 回歸模型是根據(jù)單個(gè)或多個(gè)連續(xù)型或離散型自變量來(lái)分析和預(yù)測(cè)離散型因變量的多元分析方法,是當(dāng)前常用統(tǒng)計(jì)方法。本文對(duì) Logistic回歸模型的概況,分類,參數(shù)估計(jì)進(jìn)行了分析綜述,并用SAS軟件進(jìn)行數(shù)據(jù)分析從而對(duì)模型進(jìn)行了評(píng)價(jià)及對(duì)回歸系數(shù)做了統(tǒng)計(jì)推斷。得到了很
2、好的預(yù)期效果。關(guān)鍵詞: 累計(jì) Logistic回歸模型;多項(xiàng)Logit模型;最大似然估計(jì);擬合優(yōu)度檢驗(yàn).目錄1.前言42.數(shù)據(jù)來(lái)源及介紹53.基本概念63.1 累積 logit 模型73.2 多項(xiàng) logit 模型74.實(shí)證分析84.1 數(shù)據(jù)處理84.2 累積 Logit 分析84.2.1SAS 程序84.2.2 結(jié)果分析943 多項(xiàng) logit 模型分析124.3.1SAS 程序124.3.2 結(jié)果分析135綜述15參考文獻(xiàn)16.1.前言高校大學(xué)畢業(yè)生作為人才資源中較高層次的一類, 其就業(yè)過(guò)程是國(guó)家高層次人力資源配置最為重要的一個(gè)環(huán)節(jié)。 當(dāng)前,大學(xué)畢業(yè)生就業(yè)已成為社會(huì)普遍關(guān)注的問(wèn)題。大學(xué)生就
3、業(yè)難問(wèn)題的原因非常復(fù)雜, 而且還隱含著深層次的社會(huì)問(wèn)題。在當(dāng)前新形勢(shì)下, 解決高校畢業(yè)生就業(yè)難問(wèn)題也需要政府, 學(xué)校及整個(gè)社會(huì)的努力, 要解決這些問(wèn)題也不能是一蹴而就, 只能通過(guò)全社會(huì)的努力, 創(chuàng)新觀念,完善制度和改進(jìn)工作方式,不斷深化改革來(lái)完成。大學(xué)生畢業(yè)之后的不同走向,很大程度決定定其在大學(xué)里的學(xué)習(xí)方向。大學(xué)生明確自己的畢業(yè)走向, 有利于提高自己大學(xué)學(xué)習(xí)的效率, 以及獲取各類就業(yè)信息的目的性, 從而對(duì)自己的大學(xué)生活有一個(gè)更好的規(guī)劃。現(xiàn)在大學(xué)生普遍面臨巨大的就業(yè)壓力, 從而不可避免的導(dǎo)致了大學(xué)生畢業(yè)走向的多樣化,為了加深對(duì)大學(xué)生今后走向的一個(gè)初步了解, 本文選擇了一個(gè)含有 40 個(gè)樣本的數(shù)據(jù)
4、集, 因變量為本科生畢業(yè)去向, 分為 3 類,分別為工作、 讀研、出國(guó)留學(xué);考察專業(yè)課成績(jī)、 英語(yǔ)成績(jī)、性別和月生活費(fèi)這 4 個(gè)自變量對(duì)本科生畢業(yè)去向的影響。 使用 SAS9.3 軟件對(duì)數(shù)據(jù)進(jìn)行處理, 利用 Logistic 回歸分析影響畢業(yè)生去向的因素。.2.數(shù)據(jù)來(lái)源及介紹1、所用數(shù)據(jù)來(lái)源于應(yīng)用回歸分析第三版第十章課后習(xí)題。2、如表所示, 數(shù)據(jù)中包括 40 位本科畢業(yè)生相關(guān)信息 的數(shù)據(jù),其中:畢業(yè)去向 y:“ 1” =工作,“2”=讀研,“3”=出國(guó)留學(xué)X1: 專業(yè)課成績(jī) X2: 英語(yǔ) X3: 性別 X4: 月生活費(fèi)40 位本科畢業(yè)生相關(guān)信息序號(hào)X1X2X3X4Y19565160022636
5、208501382530700246088085035726517501685850100037959501200289292195029636308501107875190011190780500112828317502138065185031483750600215609006503167590180021763831700118857507502197386095022086661150032193630130022273720850123866019502247663011001259686075022671751100012763721850228608806501296795150
6、0130869305501.316376065013286860750233768516501348292195033573600800136828517502377575075013872631650139818808503409296195023.基本概念logistic回歸比較常用的是因變量為二分類的logistic回歸,這也是比較簡(jiǎn)單的一種形式。但在現(xiàn)實(shí)中,因變量的分類有時(shí)候多于兩類, 如療效可能是“無(wú)效”“顯效”“痊愈”三類, 你當(dāng)然可以把其中兩類進(jìn)行合并, 然后仍然按照二分類 logistic 回歸進(jìn)行分析,但是合并的弊端是顯而易見(jiàn)的,它可能損失一定的信息。而多分類則充分利用了完整
7、的信息,可能提供更多的結(jié)果。多分類 logistic回歸也有兩種,一種是有序分類,一種是無(wú)序分類。有序和無(wú)序的劃分不一定完全按照字面意思理解。比如療效,聽(tīng)起來(lái)似乎是有序的,因?yàn)樗前吹燃?jí)劃分的, 但真正分析時(shí)還是需要結(jié)合具體的數(shù)據(jù)結(jié)構(gòu)、 使用條件和研究目的綜合考慮。一般來(lái)講,有序分類的 logistic回歸可以采用比例優(yōu)勢(shì)模型 ( proportionalodds model),又稱累積 logit模型或累積比數(shù)模型。無(wú)序分類的logistic回歸采用多項(xiàng) logit模型( polynomial logit model)?;谘芯磕康呐c資料類型的不同特點(diǎn),多水平統(tǒng)計(jì)模型有著不同的表達(dá)形式。當(dāng)所
8、研究的資料為多分類離散型數(shù)據(jù)時(shí),其相應(yīng)的多水平統(tǒng)計(jì)模型被稱作多水平多項(xiàng)式模型,其模型中的鏈接函數(shù)可以選擇logit或者 log-log。由于多分類反應(yīng)變量分為無(wú)序分類與有序分類兩種,其多水平模型的具體形式也會(huì)有所不同。.3.1 累積 logit模型其定 如下:*?Y =+ ?+?=1? ?其中, Y*表示 象的內(nèi)在 ,它并不能被直接 量,? 差 ;表示常數(shù) , ?表示系數(shù) 。 果 量 Y為J個(gè)等 的有序 量, J個(gè)等 分 用 1,2,?j 表示,xT=(x 1 ,x2,xp) 自 量。 等 j(j=l,2?k) 的概率 : P(y=j| x), 等 小于等于 J(J=l ,2,k) 的概率 :
9、 P(y j|x)=P(y=1| x)+ ?+P(y=j|x) 。等 小于等于 j 的累 概率。做 logit :logitPj =logitP(yj|x)=lnP(yj|x)j=1,2, ,k-11-P(yj|x)有序分 果的 Logistic回 定 :logitPj= logitP(yj|x)=-j ?j=l ?2, k-1+?=1? ?exp?(- j+? )等價(jià)于 P(y j|x)=?=1 ? ?)1+exp?( - j+?=1 ? ?3.2 多項(xiàng) logit模型 于有 J=1,2,?,J 的非次序反 量,多 Logit 模型可以通 以下 Logit 形式形容:lnP(y=j|x)j
10、?=+?=11-P(y=J|x)?在多 Logit 模型中,Logit 是由反 量中的不重復(fù)的 的 比所形成的。當(dāng)反 量有 J 多 Logit 模型中便有 J一1個(gè)Logit 在累 Logistic回 模型中有 J一 1個(gè)累 Logit 函數(shù)的截距估 ,但是只有一套斜率系數(shù)的估 自 量。而在多 式 Logit 模型中,不 有 J一 1個(gè)截距而且有 J一1套斜率系數(shù)估 同一套自 量。 上式中有每一個(gè)斜率系數(shù)都有兩個(gè)下角 的原因。其中第一個(gè)下角 志不同的 Logit ,第二個(gè)下角 志不同的自 量。在有 J 個(gè) 的多 Logit模型中, J-1 個(gè) Logit可表述 :.lnlnP(y=1|x)1?
11、 ?=+1-P(y=J|x)?=1 1? ?P(y=2|x)2? ?=+?=11-P(y=J|x)2? ?.lnP(y=(J-1)|x)J-1?1-P(y=J|x)=+?=1( J-1)?其中最后一個(gè)類別 ( 即第 J個(gè)類別 ) 被作為參照類, 對(duì)于有 J個(gè)類別的反應(yīng)變量, 歸入因變量中第 j 類的概率可以有下列公式進(jìn)行估計(jì):exp?( j+? ? )P(y=j|x)=?-1?=1?)1+? ?=1exp?( j+?=1?4.實(shí)證分析4.1 數(shù)據(jù) 理在數(shù)據(jù)來(lái)源介紹部分, 專業(yè)課成績(jī)、英語(yǔ)成績(jī)、性別、月生活費(fèi)分別作為自變量,其中兩門課成績(jī)和月生活費(fèi)為數(shù)值型變量,在此為了應(yīng)用軟件分析方便,將這三個(gè)
12、變量變換成定性變量。X1專業(yè)課成績(jī)X2 英語(yǔ)成績(jī)X3 月生活費(fèi)6080x1=06080x2=0500800 x3=080 以上 x1=180 以上 x2=1800 以上 x3=1對(duì)處理過(guò)后的數(shù)據(jù)應(yīng)用SAS軟件來(lái)進(jìn)行累計(jì)Logit回歸分析。4.2 累 Logit 分析數(shù)據(jù)集包含 5 個(gè)變量, y,x1-x4 。響應(yīng)變量 y 包含響應(yīng)的等級(jí);累計(jì)Logit模型用來(lái)研究本科畢業(yè)生畢業(yè)去向的影響因素。以下用SAS語(yǔ)句調(diào)用 Logistic過(guò)程來(lái)擬合這個(gè)模型。4.2.1SAS 程序datawork.bai;.inputy x1-x4;cards;10001710010210011121110121000
13、3210011310112301001311111;proclogisticdata=work.bai1;freqf;classx1-x4;modely=x1-x4;run;4.2.2 結(jié)果分析.檢驗(yàn)比例優(yōu)比的得分卡方統(tǒng)計(jì)量的值是7.7685 ,相對(duì)于 4 個(gè)自由度的卡方分布這是不顯著的( p=0.1004),因此說(shuō)明累積 logit模型對(duì)于擬合這組數(shù)據(jù)是合適的。模型僅有截距項(xiàng)時(shí)的AIC、SC和-2ln (L)的值均大于模型中同時(shí)含有截距和協(xié)變量時(shí)的模型,根據(jù)其值最小原則,選擇協(xié)變量進(jìn)入模型是有效的。模型總體檢驗(yàn)結(jié)果,包括似然比檢驗(yàn)、得分檢驗(yàn)和Wald 檢驗(yàn),該模型有顯著性意義( P0.01)
14、,較好的擬合了此研究數(shù)據(jù)。.以上為最大似然估計(jì)的參數(shù)檢驗(yàn)結(jié)果和幾個(gè)描述統(tǒng)計(jì)量、參數(shù)的OR值,以及 95%可信區(qū)間。結(jié)果表面自變量 x1(p0.05 )、x2( p0.05 )、x4(p0.05 )的回歸系數(shù)未通過(guò)檢驗(yàn),認(rèn)為性別及月生活費(fèi)對(duì)本科生畢業(yè)去向無(wú)顯著影響?;貧w模型系數(shù)的解釋:優(yōu)比估計(jì)值中, OR( x1)=16.42 ,表示在其他條件不變的情況下,專業(yè)課成績(jī)高的畢業(yè)生選擇考研的概率是專業(yè)課成績(jī)低的 16.42 倍, OR(x2) =7.69 ,表示在其他條件不變的情況下, 英語(yǔ)課成績(jī)高的同學(xué)選擇出國(guó)留學(xué)的概率是英語(yǔ)課成績(jī)低的 7.69 倍。因變量 y 對(duì)自變量 x1 和 x2 的累積
15、Logistic回歸模型如下:p2=p(y=2|x )= exp?( 2.121+2.7985x1+2.0399x2)1+?xp?( 2.121+2.7985x1+2.0399x2)p3=p(y 3|x )= exp?( 5.0062+2.7985x1+2.0399x2)1+?xp?(5.0062+2.7985x1+2.0399x2)p2=p(y=2) =p2, p3=p( y=3) =p3-p2,p1=p( y=1)=1-p3.4 3 多項(xiàng) logit模型分析在上述分析中若把因變量的三個(gè)類別看作是有序的,所建立回歸模型, 其中x4(月生活費(fèi))未通過(guò)檢驗(yàn),這顯然與現(xiàn)實(shí)實(shí)際情況不符,接下來(lái)考慮把
16、響應(yīng)變量看作是無(wú)序多類別變量,建立多項(xiàng)logit模型。應(yīng)用 SAS9.3軟件調(diào)用 logistic過(guò)程步來(lái)進(jìn)行建模。4.3.1SAS 程序datawork.bai;inputy x1-x4;cards;100017100102100111211101210003210011310112301001311111;proclogisticdata =work.bai;modely( ref=1)=x1-x4/link =glogit;run;注釋: link=glogit擬合無(wú)序多分類 logistic回歸模型; ref=指明參照的類別。.4.3.2 結(jié)果分析.針對(duì)無(wú)序響應(yīng)變量, 建立的多項(xiàng) Lo
17、git模型中是以 y=1(工作)為參照組。從參數(shù)估計(jì)表中看到, 與參加工作的同學(xué)相比, 讀研的同學(xué)的專業(yè)課成績(jī)更好(x1 的 p 值=0.0011 ),而英語(yǔ)成績(jī)( x2 的 p 值=0.1566 )和經(jīng)濟(jì)狀況( x4 的 p值 =0.9322)沒(méi)有顯著差異;出國(guó)留學(xué)的同學(xué)其專業(yè)課的成績(jī) (x1 的 p 值 =0.4055)和參加工作的同學(xué)沒(méi)有顯著差異, 英語(yǔ)成績(jī)( x2 的 p 值=0.0281 )和經(jīng)濟(jì)狀況(x4的 p 值=0.0134 )則更好 .對(duì) y=2(讀研),exp?( -2.7955+3.8861?1+1.9069?2+0.7388?4)2 =1+exp ( -2.7955+3
18、.8861?1+1.9069?2+0.7388?4)+exp?(-5.1625+3.6194?1+3.4172?2+2.6733?4)對(duì) y3(出國(guó)留學(xué)),3 = exp?(-5.1625+3.6194?1+3.4172?2+2.6733?4 )1+exp ( -2.7955+3.8861?1+1.9069?2+0.7388?4 )+exp?(-5.1625+3.6194?1+3.4172?2+2.6733?4).5綜述多項(xiàng) Logit 模型中, Logit 是由反應(yīng)變量中的不重復(fù)的類別對(duì)的對(duì)比所形成的。然后,對(duì)每一個(gè) Logit 分別建模。若反應(yīng)變量有 J 個(gè)類別,多項(xiàng) Logit 模型中便有 J-1 個(gè) Logit ,且有 J-1 套斜率系數(shù)估計(jì)對(duì)應(yīng)同一套自變量。與之形成對(duì)比的是,在累積 Logitistic 回歸模型中,雖然有 J-1 個(gè)累計(jì) Logit 函數(shù)的截距估計(jì),但只有一套斜率系數(shù)的估計(jì)對(duì)應(yīng)自變量。本文結(jié)合現(xiàn)實(shí)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024-2030年中國(guó)高吸水性樹(shù)脂(SAP)行業(yè)供需預(yù)測(cè)及投資風(fēng)險(xiǎn)研究報(bào)告
- 2024-2030年中國(guó)食品光澤劑市場(chǎng)營(yíng)銷模式及投資前景預(yù)測(cè)報(bào)告
- 2024-2030年中國(guó)陶瓷整體銑刀行業(yè)市場(chǎng)運(yùn)營(yíng)模式及未來(lái)發(fā)展動(dòng)向預(yù)測(cè)報(bào)告
- 2024-2030年中國(guó)阻燃聚酯纖維行業(yè)產(chǎn)銷量預(yù)測(cè)及投資規(guī)劃分析報(bào)告
- 2024-2030年中國(guó)鋁制轉(zhuǎn)向節(jié)行業(yè)前景展望及發(fā)展策略分析報(bào)告版
- 2023年閉式塔資金需求報(bào)告
- 2024年房產(chǎn)銷售居間服務(wù)協(xié)議
- 2024年房產(chǎn)過(guò)戶雙方協(xié)議
- 2024年攜手共居協(xié)議:室友共享規(guī)則全案
- 2024年技術(shù)開(kāi)發(fā)合作協(xié)議樣本
- 精品堆垛機(jī)安裝指導(dǎo)書(shū)
- 前臺(tái)月度績(jī)效考核表(KPI)
- 雞的飼養(yǎng)管理-優(yōu)質(zhì)課件
- 德育課(共19張PPT)
- 歷史幽憤的現(xiàn)代回響——《記念劉和珍君》課堂實(shí)錄
- 化學(xué)微生物學(xué)第7章 微生物轉(zhuǎn)化
- 《少年正是讀書(shū)時(shí)》-完整版PPT課件
- 四、貼標(biāo)機(jī)基本調(diào)整法1
- 船舶建造方案
- 35KV集電線路鐵塔組立專項(xiàng)方案
- 不銹鋼管規(guī)格表大全以及理論重量表大全
評(píng)論
0/150
提交評(píng)論