版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、精選優(yōu)質(zhì)文檔-傾情為你奉上軟件開發(fā)人員的薪金摘要本文所要解決的是研究軟件開發(fā)人員的薪金與他們的資歷、管理責任、教育程度等之間的關系,建立一個模型,以便分析公司人事策略的合理性,并作為新聘人員薪金的考慮。根據(jù)題設條件,結(jié)合實際情況,建立線性回歸模型,方程表達式:其中,是回歸系數(shù), 為隨機誤差,分別為資歷、管理水平和教育程度。結(jié)合題目所給的數(shù)據(jù),運用matlab軟件的命令rearess,求出了軟件開發(fā)人員的薪金與資歷、管理水平、教育水平之間的線性回歸方程: 分析后同時運用殘差分析法發(fā)現(xiàn)模型的缺陷,改進影響軟件開發(fā)人員薪金的因素,改變模型,使得管理責任因素和教育程度因素對薪金是交互作用的,這樣合理化
2、模型后,得出了影響軟件開發(fā)人員薪金因素的最佳多元回歸模型。建立回歸方程: 并用運用matlab軟件得出了該模型的較準確的解: 并對回歸方程和各個因素運用殘差分析法進行了顯著性檢驗,去掉異常數(shù)據(jù)后,在運用matlab軟件求解,得出更為準確的解: 再次運用殘差分析法對模型進行檢驗,說明模型可用。綜上所述,本文對數(shù)據(jù)進行深入分析,運用MATLAB軟件畫圖,制作表格,更形象地反映數(shù)據(jù),簡單明了,運用殘差分析法對模型進行檢驗,說明模型可用。關鍵字:線性回歸模型 ressess 殘差分析法 一問題重述一家高技術公司人事部門為研究軟件開發(fā)人員的薪金與他們的資歷、管理責任、教育程度等之間的關系,要建立一個模型
3、,以便分析公司人事策略的合理性,并作為新聘用人員薪金的參考。他們認為目前公司人員的薪金總體上是合理的,可以作為建模的依據(jù),于是調(diào)查了46名軟件開發(fā)人員的檔案資料,如表,其中資歷一列指從事專業(yè)工作的年數(shù),管理一列中1表示管理人員,0表示非管理人員,教育一列中1表示中學程度,2表示大學程度,3表示更高程度(研究生)。 表一 軟件開發(fā)人員的薪金與他們的資歷、管理責任、教育程度之間的關系編號薪金資歷管理教育編號薪金資歷管理教育11387611124228846122116081032516978711318701113261480380241128310227174048115117671032822
4、184813620872212291354880171177220230144671001810535201311594210029121952033223174101310123133023323780101211149753113425410111212213713123514861110113198003133616882120214114174013724170121315202634133815990130116132314033926330131217128844024017949140218132455024125685151319136775034227837161220159
5、65511431883816022112366601441748316012221351613451920717022313839602461934620012 模型假設(1) 薪金自然隨著資歷(年)的增長而增加;(2) 管理人員的薪金應高于非管理人員; (3) 教育程度越高薪金也越高; (4) 管理責任、教育程度、資歷諸因素之間沒有交互作用;(5) 資歷(年)、管理水平、教育程度分別對薪金的影響是線性的; (6) 目前公司軟件開發(fā)人員的薪金是合理的;(7) 在模型改進中我們假設資歷(年) 、管理水平、教育程度之間存在交互作 用 。3 問題的分析 對于問題,在符合題意并且與實際情況較吻合的情況
6、下,薪金記作,資歷(年)記作,為了表示是否非管理人員,定義 為了表示3種教育程度,定義 , 這樣,中學用=1,=0來表示,大學用=0,=1表示,研究生則用=0,=0表示。 對于影響變量的這些定性因素(管理,教育),在模型求解過程中我們采用“0-1”變量來處理,并運用數(shù)學軟件matlab來求解,最后對所得的解進行討論和分析。4 模型的建立及求解1. 符號的說明:軟件開發(fā)人員的薪金資歷管理責任,教育程度帶估計的回歸系數(shù)(i=1,2,3,4,5,6)隨機誤差隨機誤差, 回歸系數(shù)的樣本估計值回歸系數(shù)的估計值的置信區(qū)間殘差向量R的置信區(qū)間回歸模型的檢驗統(tǒng)計量回歸方程的決定系數(shù)統(tǒng)計量值對應的概率值剩余方差
7、置信水平0.052.模型的建立 薪金與資歷,管理責任,教育程度,之間的多元線性回歸方程為:3. 模型的求解直接利用matlab統(tǒng)計工具箱中的命令regress求解,使用格式為:b,bint,r,rint,stats=regress(y,x,slpha)其中輸入y為模型(1)中的y的數(shù)據(jù)(n維向量,n=30),x為對應于回歸系數(shù)的數(shù)據(jù)矩陣,alpha為置信區(qū)間;輸出b為的估計值,bint為b的置信區(qū)間,r為殘差向量,rint為r的置信區(qū)間,stats為回歸模型的檢驗統(tǒng)計量,有四個值,第1個是回歸方程的決定系數(shù)(是相關系數(shù)),第2個是統(tǒng)計量值,第3個是與統(tǒng)計量值對應的概率值,第4個是剩余方差。 根
8、據(jù)上述方程式,我們用數(shù)學軟件matlab對模型進行求解 可以得到回歸系數(shù)及其置信區(qū)間(置信水平=0.05),檢驗統(tǒng)計量,的結(jié)果,見表二。表二 模型(1)的計算結(jié)果參數(shù)參數(shù)估計值參數(shù)置信區(qū)間1103210258,11807546484,60868836248,7517-2994-3826,-2162148-636,931 =0.579 =226 <0.0001 =1.057x1065. 結(jié)果分析和檢驗1 結(jié)果分析 從表二知=0.975,即因變量(薪金)的95.7%可由模型確定,值遠遠超過的檢驗的臨界值,遠小于,因而模型(1)從整體來看是可用的。比如,利用模型可以估計(或預測)一個大學畢業(yè),
9、有2年資歷,費管理人員的薪金為: =12272 模型中各個回歸系數(shù)的含義可初步解釋如下:的系數(shù)為546,說明資歷增加1年薪金增長546 ;的系數(shù)為6883,說明管理人員薪金多6883 ;的系數(shù)為-2994,說明中學程度薪金比更高的少2994 ;的系數(shù)為148,說明大學程度薪金比更高的多148 ,但是注意到置信區(qū)間包含零點,說明這個系數(shù)的解釋不可靠。需要指出,以上解釋是就平均值來說,并且,一個因素改變引起的因變量的變化量,都是在其他因素不變的條件下成立的。二結(jié)果檢驗 的置信區(qū)間包含零點,說明基本模型(1)存在缺點。為了尋找改進的方向,常用殘差分析方法(殘差指薪金的實際值與用模型估計的薪金y1之差
10、,是模型(1)中隨機誤差的估計值,這里用了一個符號)。我們將影響因素分成資歷與管理-教育組合兩類,管理-教育組合的定義如表三:表三 管理教育組合123456管理010101教育112233 為了對殘差進行分析,圖1給出了與資歷的關系,圖2給出與管理-教育,組合間的關系。 圖1 模型(1)與的關系 圖2模型(1)與,組合 的關系 從圖一看,殘差大概分成3個水平,這是由于6種管理教育組合混合在一起,在模型中未被正確反映的結(jié)果,、;從圖2看,對于前4個管理教育組合,殘差或者全為正,或者全為負,也表明管理教育組合在模型中處理不當。 在模型(1)中國管理責任和教育程度是分別起作用的,事實上,二者可能起著
11、交互作用,如大學程度的管理人員的薪金會比二者分別的薪金制和高一點。以上分析提醒我們,應在基本模型(1)中增加管理與教育,的交互項,建立新的回歸模型。六優(yōu)化方向 通過以上分析,我們在模型一中增加管理與教育,的交互項,建立新的回歸模型。模型記作:利用matlab的統(tǒng)計工具得到的結(jié)果如表四:表四 模型(2)的計算結(jié)果參數(shù)參數(shù)估計值參數(shù)置信區(qū)間1120411044,11363497486,50870486841,7255-1727-1939,7255-348-545,-152-3071-3372,-276918361571,2101 =0.9988 =5545 <0.0001 =3.0047x1
12、04 由表四可知,模型(2)的和值都比模型(1)有所改進,并且所有回歸系數(shù)的置信區(qū)間都不含零點,表明模型(2)是完全可用的。 與模型(1)類似,作模型(2)的兩個殘差分析圖(圖3,圖4),可以看出,已經(jīng)消除了圖1,圖2中的不正常現(xiàn)象,這也說明了模型(2)的適用性。圖3 模型(2)與的關系 圖4 模型(2)與, 組合的關系從圖3,圖4還可以發(fā)現(xiàn)一個異常點:具有10年資歷、大學程度的管理人員(從表1可以查出是33號),他的實際薪金明顯地低與模型的估計值,也明顯低于與他有類似經(jīng)歷的其他人的薪金。這可能是由我們未知的原因造成的,為了使個別的數(shù)據(jù)不致影響整個模型,應該講這個異常數(shù)據(jù)去掉,對模型(2)重新
13、估計回歸系數(shù),得到的結(jié)果如表五,殘差分析圖見圖5,圖6.可以看出,去掉異常數(shù)據(jù)后結(jié)果又有改善。表五 模型(2)去掉異常數(shù)據(jù)后的計算結(jié)果參數(shù)參數(shù)估計值參數(shù)置信區(qū)間1120011139,11261498494,50370416962,7120-1737-1818,-1656-356-431,-281-3056-3171,-294219971894,2100 =0.9998 =36701 <0.0001 =4.347x103 圖5 模型(2)去掉異常數(shù)據(jù)后 圖6 模型(2)去掉異常數(shù)據(jù)后與 與的關系 與, 組合的關系 對于回歸模型(2),用去掉模型異常數(shù)據(jù)(33號)后估計出的系數(shù),得到的結(jié)果是
14、滿意的。作為這個模型的應用之一,不妨用它來"制訂”6種管理教育組合人員的“基礎”薪金(即資歷為零的薪金,當然,這也是平均意義上的)。利用模型(2)和表五容易得到表六:表六 6種管理教育組合人員的“基礎”薪金組合管理教育系數(shù)“基礎”薪金101+9463211+13448302+10844412+1988250311200613+182417 從表六可以看出,大學程度的管理人員的薪金 比研究生程度的管理人員的薪金高,而大學程度的非管理人員的薪金比研究生程度的管理人員的薪金高,而大學程度的非管理人員的薪金比研究生的非管理人員的薪金略低 。當然,這是根據(jù)這家公司實際數(shù)據(jù)建立的模型得到的結(jié)果,
15、并不具普遍性。7 模型評價本文在模型建立時結(jié)合實際情況,對問題進行了適當?shù)募僭O。對于影響因變量的定性變量因素(管理,教育),可以引入01變量來處理,01變量的個數(shù)可比定性因素的水平少1(如教育程度有3個水平,引入2個01變量)。運用到MATLAB軟件進行計算還有制圖,得到較準確的數(shù)據(jù)和圖表。為求結(jié)果的精確,還運用了殘差分析方法,發(fā)現(xiàn)模型的缺陷,引入交互作用項使模型更加完善和具可行性。因有異常數(shù)據(jù)的存在,我們予以剔除,有助于結(jié)果的合理性。對于本文所得的模型也可以用于不同單位,不同行業(yè)某類人才的預測。當然,本文也存在許多不足。但是對于對模型進行的改進和檢驗,難免會出現(xiàn)誤差。 八.參考文獻1將啟源,
16、謝金星,葉俊 數(shù)學建模,高等教育出版社20112周明華,鄔學軍,周凱,李春燕 ,MATLAB實用教程 浙江工業(yè)大學 應用數(shù)學系 2011附錄一:表二的程序及結(jié)果: x1=1 1 1 1 1 2 2 2 2 3 3 3 3 4 4 4 4 5 5 5 6 6 6 6 7 8 8 8 8 10 10 10 10 11 11 12 12 13 13 14 15 16 16 16 17 20'x2=1 0 1 0 0 1 0 0 0 0 1 1 1 0 1 0 0 0 0 1 0 1 0 1 1 0 1 1 0 0 0 1 1 1 0 0 1 0 1 0 1 1 0 0 0 0'x3=
17、1 0 0 0 0 0 0 1 0 0 1 0 0 1 0 0 0 0 0 1 1 0 0 0 1 0 1 0 1 1 0 0 0 0 1 0 0 1 0 0 0 0 0 1 0 1'x4=0 0 0 1 0 1 1 0 0 1 0 1 0 0 0 0 1 1 0 0 0 0 1 1 0 1 0 0 0 0 1 0 1 1 0 1 0 0 1 1 0 1 1 0 1 0'y=13876 11608 18701 11283 11767 20872 11772 10535 12195 12313 14975 21371 19800 11417 20263 13231 12884 1
18、3245 13677 15965 12366 21352 13839 22884 16978 14803 17404 22184 13548 14467 15942 23174 23780 25410 14861 16882 24170 15990 26330 17949 25685 27837 18838 17483 19207 19346'x0=ones(46,1);x=x0 x1 x2 x3 x4;b,bint,r,rint,stats=regress(y,x,0.05);b=vpa(b,8)bint=vpa(bint,8)stats=vpa(stats,8) b = 11032
19、.734 546.12765 6882.5329 -2994.1783 147.73798 bint = 10258.256, 11807.213 484.44860, 607.80670 6248.1051, 7516.9607 -3826.3273, -2162.0294 -635.71842, 931.19438 stats = ., 226.42580, 0., .8 圖一及圖二殘差圖程序段及結(jié)果:x5=2 5 6 3 5 4 3 1 5 3 2 4 6 1 6 5 3 3 5 2 1 6 3 4 2 3 2 6 1 1 3 6 4 4 1 3 6 1 4 3 6 4 3 1 3 1&
20、#39;b,bint,r,rint,stats=regress(y,x,0.05);subplot(2,2,1)plot(x1,r,'r+')subplot(2,2,2)plot(x5,r,'b+')表四的模型及結(jié)果:x1=1 1 1 1 1 2 2 2 2 3 3 3 3 4 4 4 4 5 5 5 6 6 6 6 7 8 8 8 8 10 10 10 10 11 11 12 12 13 13 14 15 16 16 16 17 20'x2=1 0 1 0 0 1 0 0 0 0 1 1 1 0 1 0 0 0 0 1 0 1 0 1 1 0 1 1
21、0 0 0 1 1 1 0 0 1 0 1 0 1 1 0 0 0 0'x3=1 0 0 0 0 0 0 1 0 0 1 0 0 1 0 0 0 0 0 1 1 0 0 0 1 0 1 0 1 1 0 0 0 0 1 0 0 1 0 0 0 0 0 1 0 1'x4=0 0 0 1 0 1 1 0 0 1 0 1 0 0 0 0 1 1 0 0 0 0 1 1 0 1 0 0 0 0 1 0 1 1 0 1 0 0 1 1 0 1 1 0 1 0'x5=2 5 6 3 5 4 3 1 5 3 2 4 6 1 6 5 3 3 5 2 1 6 3 4 2 3 2 6 1 1
22、 3 6 4 4 1 3 6 1 4 3 6 4 3 1 3 1'y=13876 11608 18701 11283 11767 20872 11772 10535 12195 12313 14975 21371 19800 11417 20263 13231 12884 13245 13677 15965 12366 21352 13839 22884 16978 14803 17404 22184 13548 14467 15942 23174 23780 25410 14861 16882 24170 15990 26330 17949 25685 27837 18838 174
23、83 19207 19346'x0=ones(46,1);x=x0 x1 x2 x3 x4 x2.*x3 x2.*x4;b,bint,r,rint,stats=regress(y,x,0.05);b=vpa(b,8)bint=vpa(bint,8)stats=vpa(stats,8) b = 11203.754 496.86393 7047.9997 -1726.5042 -348.39254 -3070.5962 1835.9676 bint = 11044.259, 11363.248 485.63509, 508.09277 6841.0518, 7254.9477 -1938.
24、9889, -1514.0195 -545.21127, -151.57381 -3371.8328, -2769.3595 1571.3704, 2100.5648 stats = ., 5544.7990, 0., 30047.093 圖3及圖4殘差圖程序段及結(jié)果: x1=1 1 1 1 1 2 2 2 2 3 3 3 3 4 4 4 4 5 5 5 6 6 6 6 7 8 8 8 8 10 10 10 10 11 11 12 12 13 13 14 15 16 16 16 17 20'x5=2 5 6 3 5 4 3 1 5 3 2 4 6 1 6 5 3 3 5 2 1 6 3
25、 4 2 3 2 6 1 1 3 6 4 4 1 3 6 1 4 3 6 4 3 1 3 1'y=13876 11608 18701 11283 11767 20872 11772 10535 12195 12313 14975 21371 19800 11417 20263 13231 12884 13245 13677 15965 12366 21352 13839 22884 16978 14803 17404 22184 13548 14467 15942 23174 23780 25410 14861 16882 24170 15990 26330 17949 25685 2
26、7837 18838 17483 19207 19346'subplot(2,2,1)plot(x1,r,'r+')subplot(2,2,2)plot(x5,r,'b+')表五的程序及結(jié)果:x1=1 1 1 1 1 2 2 2 2 3 3 3 3 4 4 4 4 5 5 5 6 6 6 6 7 8 8 8 8 10 10 10 11 11 12 12 13 13 14 15 16 16 16 17 20'x2=1 0 1 0 0 1 0 0 0 0 1 1 1 0 1 0 0 0 0 1 0 1 0 1 1 0 1 1 0 0 0 1 1 0
27、0 1 0 1 0 1 1 0 0 0 0'x3=1 0 0 0 0 0 0 1 0 0 1 0 0 1 0 0 0 0 0 1 1 0 0 0 1 0 1 0 1 1 0 0 0 1 0 0 1 0 0 0 0 0 1 0 1'x4=0 0 0 1 0 1 1 0 0 1 0 1 0 0 0 0 1 1 0 0 0 0 1 1 0 1 0 0 0 0 1 0 1 0 1 0 0 1 1 0 1 1 0 1 0'x5=2 5 6 3 5 4 3 1 5 3 2 4 6 1 6 5 3 3 5 2 1 6 3 4 2 3 2 6 1 1 3 6 4 1 3 6 1 4 3 6 4 3 1 3 1'y=13876 11608 18701 11283 11767 20872 11772 10535 12195 12313 14975 21371 198
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 無人駕駛汽車研發(fā)合同
- 特定行業(yè)技術培訓服務合同協(xié)議
- 二零二五年度海洋工程裝備租賃合同3篇
- 2025年度家居建材企業(yè)試用期銷售顧問合同協(xié)議
- 2025年度海洋監(jiān)測監(jiān)控系統(tǒng)維護與海洋環(huán)境數(shù)據(jù)合同
- 2025年度電力工程知識產(chǎn)權保護電力工程分包合同模板
- 二零二五年度物業(yè)費收取與社區(qū)綠化養(yǎng)護服務合同模板
- 二零二五年度工業(yè)廠房地面硬化工程合同
- 2025年度中式餐廳轉(zhuǎn)讓及裝修設計合同
- 二零二五年度農(nóng)業(yè)技術專利許可合同
- 2025年N1叉車司機考試試題(附答案)
- 《醫(yī)院財務分析報告》課件
- 2025老年公寓合同管理制度
- 2024年考研政治試題及答案
- 2024-2025學年人教版數(shù)學六年級上冊 期末綜合卷(含答案)
- 2024中國汽車后市場年度發(fā)展報告
- 感染性腹瀉的護理查房
- 天津市部分區(qū)2023-2024學年高二上學期期末考試 物理 含解析
- 2025年初級社會工作者綜合能力全國考試題庫(含答案)
- 《人工智能基礎》全套英語教學課件(共7章)
- GB/T 35613-2024綠色產(chǎn)品評價紙和紙制品
評論
0/150
提交評論