教師薪金問(wèn)題_第1頁(yè)
教師薪金問(wèn)題_第2頁(yè)
教師薪金問(wèn)題_第3頁(yè)
教師薪金問(wèn)題_第4頁(yè)
教師薪金問(wèn)題_第5頁(yè)
已閱讀5頁(yè),還剩2頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、教師薪金問(wèn)題楊婕 孫佳彬 郭蕓摘要:本文是一個(gè)關(guān)于建立教師薪金影響因素的回歸模型。對(duì)于問(wèn)題(1)我們很難確定到底與哪些因素有關(guān),所以在模型中我們考慮到了題目給出的所有因素,通過(guò)題目給出的數(shù)據(jù),發(fā)現(xiàn)這七個(gè)變量之間與因變量均呈線性關(guān)系,因此我們初步的建立了一般的線性回歸模型,然后我們用MATLAB軟件求解。通過(guò)對(duì)解出的數(shù)據(jù)進(jìn)行分析,我們發(fā)現(xiàn)模型存在缺陷,有些變量對(duì)因變量的影響不顯著,這也就說(shuō)明性別和婚姻狀況上的差異對(duì)所調(diào)查的教師的薪金影響較小。為了使模型得到進(jìn)一步的改進(jìn),我們剔除了其中對(duì)因變量影響不顯著的變量,然后再用對(duì)因變量影響顯著的X1和X4建立了簡(jiǎn)單的統(tǒng)計(jì)回歸模型,求解之后發(fā)現(xiàn),模型依然沒(méi)有

2、達(dá)到理想的效果,然后再利用殘差分析法,在前一模型中增加了他們的交互項(xiàng)和平方項(xiàng),最終得到進(jìn)一步改進(jìn)的模型。然后再利用MATLAB軟件對(duì)其進(jìn)行求解。關(guān)鍵詞:統(tǒng)計(jì)回歸模型;MATLAB軟件;殘差分析法;逐步回歸一問(wèn)題重述某地人事部門(mén)為研究中學(xué)教師的薪金與他們的資歷,性別,教育程度及培訓(xùn)情況等因素之間的關(guān)系,要建立一個(gè)數(shù)學(xué)模型,分析人士策略的合理,特別是考慮女教師是否受到不公平的待遇,以及他們的婚姻狀況是否會(huì)影響收入。為此,從當(dāng)?shù)亟處熤须S機(jī)選了3414位進(jìn)行觀察,然后從中保留了90個(gè)觀察對(duì)象,得到了下表給出的相關(guān)數(shù)據(jù)。盡管這些數(shù)據(jù)具有一定的代表性,但是仍有統(tǒng)計(jì)分析的必要?,F(xiàn)將表中數(shù)據(jù)的符號(hào)介紹如下:Z

3、月薪(元);X1工作時(shí)間(月);X2=1男性,X2=0女性;X3=1男性或單身女性,X3=0已婚女性;X4學(xué)歷(取值06,值越大表示學(xué)歷越高);X5=1受雇于重點(diǎn)中學(xué),X5=0其它;X6=1受過(guò)培訓(xùn)的畢業(yè)生,X6=0未受過(guò)培訓(xùn)的畢業(yè)生或受過(guò)培訓(xùn)的肄業(yè)生;X7=1以?xún)赡暌陨衔磸氖陆虒W(xué)工作,X7=0其它。注意組合(X2,X3)=(1,1),(0,1),(0,0)的含義。(1) 進(jìn)行變量選擇,建立變量X1X7與Z的回歸模型(不一定包括每個(gè)自變量),說(shuō)明教師的薪金與哪些變量關(guān)系密切,是否存在性別和婚姻狀況上的差異。為了數(shù)據(jù)處理上的方便,建立對(duì)薪金取對(duì)數(shù)后作為因變量。(2) 除了變量X1X7本身之外,嘗

4、試將他們的平方項(xiàng)或交互項(xiàng)加入到模型中,建立更好的模型量。(3) 給出變量X1X7的相關(guān)系數(shù),偏向關(guān)系,并對(duì)z,X1X7分析因子關(guān)系。Z X1 X2 X3 X4 X5 X6 X7Z X1 X2 X3 X4 X5 X6 X71998 7 0 0 0 0 0 0462201 158 1 1 4 0 1 121015 14 1 1 0 0 0 0472992 159 1 1 5 1 1 131028 18 1 1 0 1 0 0481695 162 0 1 0 0 0 041250 19 1 1 0 0 0 0491792 167 1 1 0 1 0 051028 19 0 1 0 1 0 05016

5、90 173 0 0 0 0 0 161028 19 0 0 0 0 0 0511827 174 0 0 0 0 0 171018 27 0 0 0 0 0 1522604 175 1 1 2 1 1 081072 30 0 0 0 0 0 0531720 199 0 1 0 0 0 091290 30 1 1 0 0 0 0541720 209 0 0 0 0 0 0101204 30 0 1 0 0 0 0552159 209 0 1 4 1 0 0111352 31 0 1 2 0 1 0561852 210 0 1 0 0 0 0121204 31 0 0 0 1 0 0572104

6、213 1 1 0 1 0 0131104 38 0 0 0 0 0 0581852 220 0 0 0 0 0 1141118 41 1 1 0 0 0 0591852 222 0 0 0 0 0 0151127 42 0 0 0 0 0 0602210 222 1 1 0 0 0 0161259 42 1 1 0 1 0 0612266 223 0 1 0 0 0 0171127 42 1 1 0 0 0 0622027 23 1 1 0 0 0 0181127 42 0 0 0 1 0 0631852 227 0 0 0 1 0 0191095 47 0 0 0 0 0 1641852

7、232 0 0 0 0 0 1201113 52 0 0 0 0 0 1651995 235 0 0 0 0 0 1211462 52 0 1 2 0 1 0662616 245 1 1 3 1 1 0221182 54 1 1 0 0 0 0672324 253 1 1 0 1 0 0231404 54 0 0 0 1 0 0681852 257 0 1 0 0 0 1241182 54 0 0 0 0 0 0692054 260 0 0 0 0 0 0251594 55 1 1 2 1 1 0702617 284 1 1 3 1 1 0261459 66 0 0 0 1 0 0711948

8、 287 1 1 0 0 0 0271237 67 1 1 0 1 0 0721720 290 0 1 0 0 0 1281237 67 0 1 0 1 0 0732604 308 1 1 2 1 1 0291496 75 0 1 0 0 0 0741852 309 1 1 0 1 0 1301424 78 1 1 0 1 0 0751942 319 0 0 0 1 0 0311424 79 0 1 0 0 0 0762027 325 1 1 0 0 0 0321347 91 1 1 0 1 0 0771942 326 1 1 0 1 0 0331343 92 0 0 0 0 0 178172

9、0 329 1 1 0 1 0 0341310 94 0 0 0 1 0 0792048 337 0 0 0 0 0 0351814 103 0 0 2 1 1 0802334 346 1 1 2 1 1 1361534 103 0 0 0 0 0 0811720 355 0 0 0 0 0 1371430 103 1 1 0 0 0 0821942 357 1 1 0 0 0 0381439 111 1 1 0 1 0 0832117 380 1 1 0 0 0 1391946 114 1 1 3 1 1 0842742 387 1 1 2 1 1 1402216 114 1 1 4 1 1

10、 0852740 403 1 1 2 1 1 1411834 114 1 1 4 1 1 1861942 406 1 1 0 1 0 0421414 117 0 0 0 0 0 1872266 437 0 1 0 0 0 0432052 139 1 1 0 1 0 0882436 453 0 1 0 0 0 0442087 140 0 0 2 1 1 1892067 458 0 1 0 0 0 0452264 154 0 0 2 1 1 1902000 464 1 1 2 1 1 0圖1二問(wèn)題分析與模型假設(shè)1.問(wèn)題分析本題要求我們分析教師薪金與他們的資歷,性別,教育程度及培訓(xùn)情況等因素之間的關(guān)

11、系。按我們?nèi)粘I钪械某WR(shí),教師薪金應(yīng)該與他們的資歷,受教育程度有密切關(guān)系,資歷高,受教育程度高其薪金也應(yīng)該相應(yīng)的要高,與其性別,婚姻狀況應(yīng)該沒(méi)有必然的聯(lián)系。為了說(shuō)明教師薪金于各個(gè)因素之間的關(guān)系以及女教師是否收到不公平的待遇,她們的婚姻狀況是否影響其收入。我們建立統(tǒng)計(jì)回歸模型,通過(guò)各組數(shù)據(jù)來(lái)說(shuō)明他們之間的關(guān)系,并進(jìn)一步分析論證來(lái)確定影響教師薪金的因素。2.模型假設(shè)1.工作時(shí)間、性別、教育程度及培訓(xùn)情況之間相互獨(dú)立,沒(méi)有交互作用;2.假設(shè)教師薪金除題中所列因素之外不再考慮其他因素對(duì)教師薪金的影響;3.女性是否結(jié)婚與其工作能力無(wú)關(guān);4.該地區(qū)的人事部門(mén)對(duì)中學(xué)教師的薪金調(diào)查是可信的;三模型建立與求解

12、按一般生活常識(shí),薪金隨工作時(shí)間的增加而增加,學(xué)歷越高薪金也越高。假定工作時(shí)間,學(xué)歷對(duì)薪金的作用是線性的。受雇于重點(diǎn)中學(xué)的薪金應(yīng)高于沒(méi)有受雇于重點(diǎn)中學(xué)的,受過(guò)培訓(xùn)的畢業(yè)生的薪金應(yīng)高于未受過(guò)培訓(xùn)的畢業(yè)生的薪金,從事過(guò)教學(xué)工作的薪金應(yīng)高于其他的。為了便于研究,假定:培訓(xùn)情況,性別,單身與否,受雇于重點(diǎn)中學(xué)與否,以前從事過(guò)教師職業(yè)與否等之間沒(méi)有交互作用,建立薪金Z與工作時(shí)間(X1),性別(X2),婚姻狀況(X3),學(xué)歷(X4),受雇學(xué)校(X5),培訓(xùn)情況(X6)及從事教育年限(X7)之間的多元線性回歸模型(為了數(shù)據(jù)方便起見(jiàn)我們令y=log10(Z))為:y=a0+a1X1+a2X2+a3X3+a4X4

13、+a5X5+a6X6+a7X7+ (1)其中a0,a1,a2,a3,a4,a5,a6,a7是待估計(jì)的回歸系數(shù),是隨機(jī)誤差。它是由眾多的未加考慮的因素(包括隨機(jī)因素)所產(chǎn)生的影響。利用Matlab統(tǒng)計(jì)工具可以得到回歸系數(shù)及其置信區(qū)間(置信水平=0.05),檢驗(yàn)統(tǒng)計(jì)的量R²,F,P的結(jié)果見(jiàn)下表:從而得到回歸模型結(jié)果分析:從表中R²=0.7874,即因變量(薪金)的78.74 %可由模型決定,F(xiàn)值遠(yuǎn)大于F檢驗(yàn)的臨界值,P遠(yuǎn)小于置信水平,所以模型一從整體上看是可用的。進(jìn)一步的討論:模型一的結(jié)果中我們發(fā)現(xiàn)對(duì)于a2,a3,a5,a6,a7其置信區(qū)間中包含0點(diǎn);所以該模型是不可靠的,為了

14、尋求改進(jìn)方向,我們常用殘差分析法表明其回歸系數(shù)(對(duì)因變量y的影響)不是太顯著。從而我們將性別,婚姻狀況,受雇學(xué)校,培訓(xùn)情況及從事教育年限從模型中剔除不予考慮,建立一個(gè)只關(guān)于工作時(shí)間和學(xué)歷程度的模型。得到模型如下:y=b0+b1X1+b4X4+ (2)其中b0,b1,b4是待估計(jì)的回歸系數(shù),是隨機(jī)誤差。它是由眾多的未加考慮的因素(包括隨機(jī)因素)所產(chǎn)生的影響。利用Matlab統(tǒng)計(jì)工具可以得到回歸系數(shù)及其置信區(qū)間(置信水平=0.05),檢驗(yàn)統(tǒng)計(jì)的量R²,F,P的結(jié)果見(jiàn)下表 ,從而得到回歸模型:y=50.4557-7.2050x1+0.046022x4分析,我們通過(guò)用Matlab統(tǒng)計(jì)工具箱逐

15、步回歸方法,我們可看出薪金可能與其它量如資力、性別、教育程度及培訓(xùn)情況等因素存在聯(lián)系,為討論出薪金具體與哪些量存在關(guān)系,用stepwise命令作了薪金關(guān)于工作時(shí)間、學(xué)歷、培訓(xùn)情況、性別、結(jié)婚狀況的Stepwise Plot 圖,和Stepwise Table表,對(duì)剩余標(biāo)準(zhǔn)差(RMSE)和統(tǒng)計(jì)量F的值的分析,可以大概估計(jì)薪金主要與工作時(shí)間、學(xué)歷、培訓(xùn)情況有關(guān)(按相關(guān)性是由大到小排列),而與性別和婚姻狀況關(guān)系甚小。在這里就可以大致說(shuō)明:分析人事策略的合理性,女教師是沒(méi)有受到不公平的待遇的,同時(shí)她們的結(jié)婚與否并不會(huì)影響其收入。2通過(guò)上述的分析,為了得到更好的模型,我們對(duì)上面的模型引入一些自變量之間交

16、互關(guān)系以及引出對(duì)模型影響不顯著的自變量,同時(shí),這個(gè)模型也屬于一個(gè)統(tǒng)計(jì)模型,為此可我們運(yùn)用統(tǒng)計(jì)軟件從眾多的自變量中選出與因變量相關(guān)性較大的那些,我們?cè)O(shè)置信區(qū)間alpha為0.05,容許誤差beta為0.10,并同時(shí)采用逐步回歸。根據(jù)所給的觀測(cè)數(shù)據(jù)以及自變量間的相互關(guān)系,運(yùn)用統(tǒng)計(jì)軟件,可很快得到影響薪金因素的最佳模型:X1 +0.08899358484063X4 同時(shí)通過(guò)MATLAB軟件可得出:R²=0.777 F=151.194 P=0 對(duì)該模型我們做如下結(jié)果分析:我們可以通過(guò)查看對(duì)回歸后的曲線圖象,可以很好地反映出薪金與工作時(shí)間、性別、教育程度及培訓(xùn)情況的關(guān)系。對(duì)于用MATLAB軟件

17、求出的結(jié)果我們做如下分析: R² =0.777,表示變量(薪金)的77.7%是由該模型決定的,F(xiàn)的值遠(yuǎn)遠(yuǎn)的大于了F檢驗(yàn)的臨界值,而且此模型的F值大于了模型一的F值,所以此模型從整體上來(lái)考慮可知此模型更優(yōu)。3雖然薪金的關(guān)于工作時(shí)間、性別、教育程度及培訓(xùn)情況的一個(gè)線性回歸模型已經(jīng)求出,并看到了它與觀測(cè)數(shù)據(jù)比較吻合,但是,我們也應(yīng)該清楚地看到:該模型仍然有相關(guān)系數(shù) 不很理想(即不太接近于1),F(xiàn)也好像沒(méi)有達(dá)到理想的大小,為了求的更好的、更合理的、更有合適的模型,我們?cè)谏厦娴幕A(chǔ)模型中加入一些兩自變量的交叉項(xiàng)或平方項(xiàng),也許可以還有一些組合項(xiàng)很是非常之重要,與因變量有很強(qiáng)的相關(guān)性呢?于是我們可

18、以在這七個(gè)自變量中任意組其中兩個(gè),當(dāng)然也是把這七個(gè)變量的組合都加到模型中。一時(shí)出現(xiàn)了大量的自變量,這時(shí)我們就可以再次使用統(tǒng)計(jì)軟件MATLAB通過(guò)它的幫忙下,我們就可以很簡(jiǎn)單也在大量的自變量中使用逐步回歸的方法,選擇出只與因變量相關(guān)性很大的、且滿(mǎn)足一定要求的那些,并且它算出了該模型的相關(guān)系數(shù)、F檢驗(yàn)值、概率P等等一些評(píng)價(jià)模型穩(wěn)定性、合理性的相關(guān)指標(biāo)。相應(yīng)的模型為: 6.907947097856+0.004509446782595X1X2+(-6.766785398321e-006)X3 +(-0.0259629801793X4X5 +0.09580956153614X6 設(shè)月薪Z與x1、x2、x

19、3、x4、x5、x6、x7的相關(guān)系數(shù)為r1、r2、r3、r4、r5、r6、r7,相關(guān)系數(shù)的計(jì)算公式為:nozx1x2x3x4x5x6x7x8019987000000006102819000000008107230000000013110438000000015112742000000024118254000000036153410300000005417202090000000591852222000000079204833700000006920542600000000圖2:Z與X1的關(guān)系圖圖2是從圖1中抽取Z只與X1相關(guān)的部分,即X2,X3,X4,X5,X6,X7 都為零,并且Z的平均值為

20、z=1429,X1的平均值為x1=120.091. 所以由(1)得r1的分子為:476925,分母為:487577.427,r1=476925/487577.427=0.9782因此,在不考慮其他因素影響的條件下Z與X1正相關(guān)。Z、X1、X2、X3、X4、X5、X6、X7的平均值為下圖: nozx1x2x3x4x5x6x71728.04172.20.460.640.60.440.210.26圖3.平均值Z、X1、X2、X3、X4、X5、X6、X7的值與對(duì)應(yīng)平均值的差值如下圖:zx1x2x3x4x5x6x7zx1x2x3x4x5x6x7-730-165-0.5-0.6-0.6-0.4-0.21-

21、0.3473-140.540.363.4-0.40.790.74-713-1580.540.36-0.6-0.4-0.21-0.31264-130.540.364.40.560.790.74-700-1540.540.36-0.60.56-0.21-0.3-33-10-0.50.36-0.6-0.4-0.21-0.26-478-1530.540.36-0.6-0.4-0.21-0.364-5.20.540.36-0.60.56-0.21-0.26-700-153-0.50.36-0.60.56-0.21-0.3-380.8-0.5-0.6-0.6-0.4-0.210.74-700-153-0.

22、5-0.6-0.6-0.4-0.21-0.3991.8-0.5-0.6-0.6-0.4-0.210.74-710-145-0.5-0.6-0.6-0.4-0.210.748762.80.540.361.40.560.79-0.26-656-142-0.5-0.6-0.6-0.4-0.21-0.3-826.8-0.50.36-0.6-0.4-0.21-0.26-438-1420.540.36-0.6-0.4-0.21-0.3-836.8-0.5-0.6-0.6-0.4-0.21-0.26-524-142-0.50.36-0.6-0.4-0.21-0.343136.8-0.50.363.40.56

23、-0.21-0.26-376-141-0.50.361.4-0.40.79-0.312437.8-0.50.36-0.6-0.4-0.21-0.26-524-141-0.5-0.6-0.60.56-0.21-0.337640.80.540.36-0.60.56-0.21-0.26-624-134-0.5-0.6-0.6-0.4-0.21-0.312447.8-0.5-0.6-0.6-0.4-0.210.74-610-1310.540.36-0.6-0.4-0.21-0.312449.8-0.5-0.6-0.6-0.4-0.21-0.26-601-130-0.5-0.6-0.6-0.4-0.21

24、-0.348249.80.540.36-0.6-0.4-0.21-0.26-469-1300.540.36-0.60.56-0.21-0.353850.8-0.50.36-0.6-0.4-0.21-0.26-601-1300.540.36-0.6-0.4-0.21-0.329950.80.540.36-0.6-0.4-0.21-0.26-601-130-0.5-0.6-0.60.56-0.21-0.312454.8-0.5-0.6-0.60.56-0.21-0.26-633-125-0.5-0.6-0.6-0.4-0.210.7412459.8-0.5-0.6-0.6-0.4-0.210.74

25、-615-120-0.5-0.6-0.6-0.4-0.210.7426762.8-0.5-0.6-0.6-0.4-0.210.74-266-120-0.50.361.4-0.40.79-0.388872.80.540.362.40.560.79-0.26-546-1180.540.36-0.6-0.4-0.21-0.359680.80.540.36-0.60.56-0.21-0.26-324-118-0.5-0.6-0.60.56-0.21-0.312484.8-0.50.36-0.6-0.4-0.210.74-546-118-0.5-0.6-0.6-0.4-0.21-0.332687.8-0

26、.5-0.6-0.6-0.4-0.21-0.26-134-1170.540.361.40.560.79-0.38891120.540.362.40.560.79-0.26-269-106-0.5-0.6-0.60.56-0.21-0.32201150.540.36-0.6-0.4-0.21-0.26-491-1050.540.36-0.60.56-0.21-0.3-8118-0.50.36-0.6-0.4-0.210.74-491-105-0.50.36-0.60.56-0.21-0.38761360.540.361.40.560.79-0.26-232-97.2-0.50.36-0.6-0.

27、4-0.21-0.31241370.540.36-0.60.56-0.210.74-304-94.20.540.36-0.60.56-0.21-0.3214147-0.5-0.6-0.60.56-0.21-0.26-304-93.2-0.50.36-0.6-0.4-0.21-0.32991530.540.36-0.6-0.4-0.21-0.26-381-81.20.540.36-0.60.56-0.21-0.32141540.540.36-0.60.56-0.21-0.26-385-80.2-0.5-0.6-0.6-0.4-0.210.74-81570.540.36-0.60.56-0.21-

28、0.26-418-78.2-0.5-0.6-0.60.56-0.21-0.3320165-0.5-0.6-0.6-0.4-0.21-0.2686-69.2-0.5-0.61.40.560.79-0.36061740.540.361.40.560.790.74-194-69.2-0.5-0.6-0.6-0.4-0.21-0.3-8183-0.5-0.6-0.6-0.4-0.210.74-298-69.20.540.36-0.6-0.4-0.21-0.32141850.540.36-0.6-0.4-0.21-0.26-289-61.20.540.36-0.60.56-0.21-0.33892080

29、.540.36-0.6-0.4-0.210.74218-58.20.540.362.40.560.79-0.310142150.540.361.40.560.790.74488-58.20.540.363.40.560.79-0.310122310.540.361.40.560.790.74106-58.20.540.363.40.560.790.742142340.540.36-0.60.56-0.21-0.26-312-55.2-0.5-0.6-0.6-0.4-0.210.74538265-0.50.36-0.6-0.4-0.21-0.26324-33.20.540.36-0.60.56-0

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論