做中國糧食產(chǎn)量回歸分析_第1頁
做中國糧食產(chǎn)量回歸分析_第2頁
做中國糧食產(chǎn)量回歸分析_第3頁
做中國糧食產(chǎn)量回歸分析_第4頁
免費預(yù)覽已結(jié)束,剩余7頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、中國糧食產(chǎn)量影響因素分析應(yīng)用統(tǒng)計案例庫封面案例名稱 :基于分位數(shù)回歸的長春市職工工資水平的分析作者 :王純杰, 董小剛,陳嘉,宋芹在 SAS 環(huán)境下利用了經(jīng)典的線性回歸模教學(xué)目的:型,嶺回歸,分位數(shù)回歸模型對影響長春市工資水平發(fā)展的諸多因素進(jìn)行了分析適用課程:應(yīng)用回歸分析學(xué)習(xí)本案例的回歸分析、SAS 軟件前期知識準(zhǔn)備:本案例的知識點:回歸分析多重共線性嶺回歸分位數(shù)回歸中國糧食產(chǎn)量影響因素分析一、案例背景與數(shù)據(jù)介紹1案例背景: 職工平均工資水平不僅衡量一國家或地區(qū)人們生活水平的高低,而且一定程度上也體現(xiàn)了該地區(qū)或國家經(jīng)濟(jì)發(fā)展水平的高低。它是關(guān)系到人們生活水平的最基本的經(jīng)濟(jì)指標(biāo),也為評價衡量居民的

2、生活水平,當(dāng)?shù)亟?jīng)濟(jì)發(fā)展程度提供了重要尺度。對實際工資的研究 , 在理論和實踐上都具有重要意義。我們通過對長春市工資水平的綜合分析,了解長春市工資水平受哪些經(jīng)濟(jì)因素的影響, 以期為進(jìn)一步發(fā)展長春市經(jīng)濟(jì), 提高居民收入提供一些理論依據(jù)。樣本數(shù)據(jù)的選?。?一般地, 影響工資水平?jīng)Q定的因素是多方面的,其中主要包括經(jīng)濟(jì)的發(fā)展?fàn)顩r,政府投資,外資投資,職工數(shù)量,職工素質(zhì)如教育程度,地區(qū)的經(jīng)濟(jì)發(fā)展水平,科技水平,勞動生產(chǎn)率水平,勞動力的供求狀況等。這些因素,與經(jīng)濟(jì)因素交織在一起共同影響工資水平。根據(jù)這些影響因素,列出下面影響職工平均工資水平的變量:Y 職工平均工資(元) ;x1人均生產(chǎn)總值(元) (人均 G

3、DP);x2每一工業(yè)職工創(chuàng)造產(chǎn)值(萬元);x3每一工業(yè)職工實現(xiàn)利稅(元);x4固定資產(chǎn)投資總額(萬元) ;x5職工人數(shù)(萬人) ;x6高等學(xué)校在校學(xué)生數(shù) / 總?cè)丝冢?%);x7全市科技成果(項) ;x8居民消費價格指數(shù) (% ) 。其中, x1為地區(qū)的經(jīng)濟(jì)發(fā)展水平的影響;x2, x3反映職工創(chuàng)造產(chǎn)值方面的影響;x4反映政府投資方面的影響;x6 為教育方面的影響; x7 為科技方面的影響; x8為物價的影響。具體數(shù)據(jù)來自長春市統(tǒng)計年鑒和吉林省統(tǒng)計年鑒。表 1.1經(jīng)典回歸所用數(shù)據(jù)yearyx1x2x3x4x5x6x7x81991210720032.42160.7290749134.20.0079

4、36311106.219922441267833542.4450808138.90.008208116109.119933006363654000.8687673134.80.0093774114.71994427146186.65302.4961008136.70.01019464122.91995501354555.35459.21086570133.90.01064231115.91 本例選自長春工業(yè)大學(xué)2005 級本科生宋芹的優(yōu)秀本科畢業(yè)論文部分節(jié)選,指導(dǎo)教師王純杰做了適當(dāng)修改。中國糧食產(chǎn)量影響因素分析1996637064727.84886.91205555131.90.0109344

5、27110.91997705272247.65283.51060320128.70.011261245104.219986722831111.798091416535105.10.011938561100.619997406992218.1183591944338102.80.01432252298.6200081381155021.529350235242296.90.01843846898.8200191301321927.235584285044692.70.022105498102.32002105181495936.650975.63204576116.90.02750961599.

6、72003113101714843.15545790.0321627231012004129371962956.855249.245995641120.036046637104.12005151092072852.233939.4650421899.20.039781692101.72006183222367761.749596.5950418083.80.041664694101.3二、分析過程1. 本文在最小二乘估計( Ordinary Least Square Estimation , OLSE ) 1 的基礎(chǔ)上研究工資水平受哪些經(jīng)濟(jì)因素的影響,如何受這些經(jīng)濟(jì)因

7、素的影響。首先,做相關(guān)分析, 在 SAS環(huán)境中, 求得相關(guān)系數(shù), 一方面可以得出職工平均工資 ( y)與當(dāng)?shù)亟?jīng)濟(jì)發(fā)展水平( x1),工業(yè)職工創(chuàng)造產(chǎn)值(萬元) ( x2),每一工業(yè)職工實現(xiàn)利稅(元)( x3 ),投資(萬元)( x4), 教育程度( x6),科技水平( x7 )有較大的正相關(guān)關(guān)系;與職工數(shù)量( x5)和物價水平存在負(fù)相關(guān)關(guān)系。這是符合經(jīng)濟(jì)意義的,當(dāng)教育程度,科技水平,當(dāng)?shù)亟?jīng)濟(jì)發(fā)展水平越高時, 職工平均工資越高; 而當(dāng)職工數(shù)量越多, 居民消費價格指數(shù)越高時,職工平均工資越低。 另一方面除居民消費價格指數(shù)與工資的相關(guān)性不大,其余變量與工資的相關(guān)性都較大。至于變量之間的相關(guān)性,除 x8

8、 與其他的變量的相關(guān)系數(shù)的絕對值在0.5左右,其余變量間的相關(guān)性都較大。1.1 普通最小二乘回歸下的工資水平分析在 SAS 環(huán)境 2 中,依據(jù)最小二乘理論,進(jìn)行回歸分析,考察工資如何受當(dāng)?shù)亟?jīng)濟(jì)發(fā)展水平,投資,教育,科技發(fā)展水平的影響。由方差分析表可知, F 統(tǒng)計量的值為 485.02 , F 檢驗的 P 值 0001,說明模型總體擬和效果很好。復(fù)決定系數(shù)R-Square為 0.9982 , 調(diào)整的復(fù)決定系數(shù)Adj R-Sq 為 0.9961 ,說明該模型對原始數(shù)據(jù)的模擬效果很好。通過方差分析表,證明長春市職工工資水平受地區(qū)生產(chǎn)總值,固定投資,教育等經(jīng)濟(jì)因素的影響。由回歸系數(shù)的參數(shù)估計及其回歸系

9、數(shù)的t 檢驗表可知,自變量x2,x3,x7, x8的t檢驗的 p 值均 0.05 ,這些變量不顯著。x2每一工業(yè)職工創(chuàng)造產(chǎn)值,x8職工數(shù)量與職工平均工資在經(jīng)濟(jì)意義上是有影響的,一般而言,職工數(shù)量越多,勞動力數(shù)量供大于求時,根據(jù)價值規(guī)律,職工工資會下降。而現(xiàn)在回歸結(jié)果不符合經(jīng)濟(jì)意義,出現(xiàn)這種情況,有可能是存在多重中國糧食產(chǎn)量影響因素分析共線性的緣故。根據(jù)回歸診斷表知DW檢驗 , DW=2.186,因此不存在序列相關(guān)。根據(jù)學(xué)生化殘差和庫克距離公式,所有殘差的絕對值均小于3,因此不存在異常值問題。通過 SAS 軟件得到共線性診斷結(jié)果,其中最大的特征值是7.94979 ,最小的特征值是0.000837

10、61 。計算出的條件數(shù)最大的是97.42177 ,當(dāng)條件數(shù) 10 時就存在較強(qiáng)的多重共線性,說明本文數(shù)據(jù)存在較強(qiáng)的多重共線性,從本文開頭相關(guān)系數(shù)中也可以看出。文中由于影響工資水平的各個經(jīng)濟(jì)變量也相互影響, 因此存在多重共線性也是合理的.比如 ,經(jīng)濟(jì)繁榮時期, 地區(qū)生產(chǎn)總值和每一職工創(chuàng)造產(chǎn)值都趨于增長;而經(jīng)濟(jì)衰退時期,它們又同時趨于下降.1.2 工資水平的嶺回歸分析處理多重共線性的方法有逐步回歸,主成分回歸,嶺回歸,偏最小二乘回歸等方法. 目前 , 嶺回歸是最有影響的一種新的估計方法. 因此本文采用嶺回歸分析方法 .當(dāng)出現(xiàn)多重共線性時, 普通最小二乘回歸將明顯變壞, A.E.Hoerl(霍爾 )

11、 在 1962年首先提出一種改進(jìn)最小二乘估計的方法, 叫嶺估計 (Ridge Estimate),后來 Hoerl和 Kennard( 肯納德 ) 于 1970年給予了詳細(xì)討論 . 1用嶺回歸方法解決多重共線性的問題,其實質(zhì)是一種自變量選元的過程。在 SAS中應(yīng)用嶺回歸消除多重共線性,進(jìn)行自變量選元,嶺跡圖如圖1:y = 91E-18 +1.6393x1 -0.3769 x2 -0.114x3 +0.3873 x4 +0.1958 x5 -0.4389x6 +0.0253 x7 -0.0365x81.75N161.50Rsq0.9982AdjRsq1.250.9961RMSE0.06211.0

12、00.750.500.250.00-0.25-0.500.00.10.20.30.40.50.60.70.80.91.0Ridge kPlotx1x2x3x4x5x6x7x8圖1嶺跡圖中國糧食產(chǎn)量影響因素分析嶺回歸系數(shù)表給出了當(dāng)嶺參數(shù)k 取從 0 到 1 之間的不同值時, 各個自變量的回歸系數(shù)。嶺跡圖 1 對此更直觀的用圖形表示出來。從圖1 可以看出, x8 的系數(shù)極小,一直很平穩(wěn)的在 0 附近,因此 x8 很自然應(yīng)該是被剔除的;剔除 x8 后按同樣的方法重新作嶺回歸。依次將x3, x5, x2, x7 剔除。從整體上看,當(dāng)k 達(dá)到 0.15 0.25 之間時,各個系數(shù)已大體上趨于穩(wěn)定,因此在

13、這一區(qū)間上取一個k 值作嶺回歸可能得到較好的效果。最后,當(dāng)僅剩下x1,x4, x6 時,重新作嶺回歸。用x1, x4, x6重新作嶺回歸,嶺跡圖如圖2:y = 2E-17 +1.0364 x1 +0.3806 x4 -0.4155x60.55N160.50Rsq0.9886AdjRsq0.450.9857RMSE0.11940.400.350.300.250.200.150.100.0500.0750.1000.1250.1500.1750.2000.2250.250Ridge kPlotx1x4x6圖2 嶺跡圖根據(jù)輸出結(jié)果和嶺跡圖2,可以看出至此所有剩余變量的嶺跡圖都已經(jīng)很好了。當(dāng)嶺參數(shù) k

14、 為 0.2 時,所有變量的系數(shù)都已經(jīng)基本穩(wěn)定。因此,取嶺參數(shù)k=0.21 ,標(biāo)準(zhǔn)化后回歸方程為:y= -1.5965E-16+ 0.36655 x 1 + 0.31704x 4 +0.24929 x 6可見,地區(qū)生產(chǎn)總值與固定資產(chǎn)投資對工資水平有幾乎同樣重要的作用,回歸系數(shù)分別為0.36655 和 0.31704 。教育對工資水平也具有顯著的正相關(guān)關(guān)系,其回歸系數(shù)為0.24929 ,說明當(dāng)?shù)亟?jīng)濟(jì)總量和投資對工資水平的影響較教育對工資的影響程度更大。如果一個地方的經(jīng)濟(jì)發(fā)展水平高,那么該地的各種經(jīng)濟(jì)因素就相對較高,這樣受經(jīng)濟(jì)因素影響較大的職工的平均工資水平相應(yīng)會較高。要提高長春市的職工工資水平,

15、首先政府應(yīng)致力于發(fā)展該地的經(jīng)濟(jì),教育,增加投資,擴(kuò)大吸引外資。其次,還應(yīng)注意收入分配制度的合理性,避免收入差距過大,實現(xiàn)公正,合理的收入分配制度。調(diào)節(jié)過高收入,補貼較低收入。另外,由于影響工資水平的因素是很復(fù)雜的,勞動生產(chǎn)率的高低、勞動力市場的供求關(guān)中國糧食產(chǎn)量影響因素分析系以及影響勞動力市場的制度性因素等都會影響工資水平,本模型并沒有包括這些因素,因此本模型僅供參考。通過實際措施來提高工資水平時,除應(yīng)考慮本模型中所考慮的因素外,還應(yīng)該考慮物價,勞動生產(chǎn)率,勞動力供求,勞動力市場制度等因素。2職工工資水平的分位數(shù)回歸分析2.1 分位數(shù)回歸模型從理論上說 , 經(jīng)典線性回歸是擬合y 的條件均值與自

16、變量x 之間的線性關(guān)系, 而分位數(shù)回歸是通過估計被解釋變量(因變量) 在 01 之間的不同分位數(shù)值, 對特定分布的數(shù)據(jù)進(jìn)行估計。另外 , 最小二乘法與分位數(shù)回歸的回歸系數(shù)在解釋含義上有所不同, 最小二乘法估計式是自變量對因變量的平均邊際效果, 而分位數(shù)回歸估計式則是自變量對因變量的某個特定分位數(shù)的邊際效果。最小二乘法只能提供一個平均數(shù), 而分位數(shù)回歸卻能提供許多不同分位數(shù)的估計結(jié)果。對分位數(shù)回歸而言, 被解釋變量y 的 分位數(shù)函數(shù)Q() 可以定義為 ( 李育安 , 2006)5:Q(r )infy : F ( y)()其中,0|t|X1Pr|t|X2Pr|t|X3Pr|t數(shù)|0.11197.3

17、27.00010.602.00010.0007.000192764.5.000810.21279.775.00010.595.00010.0007.000191904.5.000310.31373.259.00010.638.00010.0007.00011170720.027930.41502.259.00020.601.00010.0007.00041018820.089390.51824.0640.00430.7140.00130.00070.02091703650.114110.62030.3500.00620.6390.00820.00070.03791386270.263400.7

18、1734.5510.02770.6380.01640.00060.135193706.70.496200.82897.633.00010.987.00010.0011.0001389603.000110.92127.173.00011.087.00010.0003.0001287669.000中國糧食產(chǎn)量影響因素分析81表 1不同分位數(shù)時x1 x2 x3 的系數(shù)表從分位數(shù)回歸模型的結(jié)果來看, 在影響工資水平的模型中, 地區(qū)生產(chǎn)總值(X1)在10%-90%的分位數(shù)回歸中均顯著 , 且系數(shù)的大小呈現(xiàn)遞增趨勢, 這表明當(dāng)長春市經(jīng)濟(jì)發(fā)展水平較低時 , 長春市職工平均工資要低于平均水平, 而對于處于條件

19、分布高端的行業(yè), 外資企業(yè)對內(nèi)資企業(yè)研發(fā)的促進(jìn)作用相對較高,即地區(qū)發(fā)展水平對工資水平有正向影響。在90%分位數(shù)回歸時,地區(qū)經(jīng)濟(jì)發(fā)展處于條件分布高端的系數(shù)值要明顯大于處于條件分布低端的系數(shù), 比如在 10%的分位水平上 , 其系數(shù)為 0.6028,而在 90%的分位水平 , 其系數(shù)為 1.0878 。充分說明工資水平較大時 , 當(dāng)?shù)亟?jīng)濟(jì)發(fā)展水平對工資的邊際貢獻(xiàn)較大10 。固定資產(chǎn)投資除了在70%分位數(shù)回歸中系數(shù)的顯著性結(jié)果為0.1351 不顯著,在其他分位數(shù)回歸中都很顯著說明固定資產(chǎn)投資對工資水平有顯著影響。并且在10% 60%的分位數(shù)回歸中系數(shù)均保持在0.0007水平, 說明當(dāng)工資水平處于低階

20、段時,增加一單位固定資產(chǎn)投資,工資水平都會增加0.0007個單位。而當(dāng)工資水平升高到一定階段時,固定資產(chǎn)投資對工資水平的影響則不穩(wěn)定, 比如 70%,80%,90%的分位數(shù)回歸系數(shù)分別為0.0006 ,0.0011 ,0.0003 。觀察不同分位數(shù)回歸時教育程度的系數(shù):發(fā)現(xiàn)其系數(shù)呈現(xiàn)遞增的趨勢。 說明對處于條件分布高端的情況時, 教育程度對工資水平的促進(jìn)效應(yīng)要明顯大于處于低端的情況, 即教育程度越高,其對工資水平的影響程度越高。教育程度在 10%、 20%, 30%及 80%,90%的分位數(shù)回歸中系數(shù)的顯著性檢驗均0.05, 沒有通過顯著性檢驗.這說明在兩端的情況, 教育對工資的影響要大于中間

21、的情況。即當(dāng)工資水平較低和較高時,教育對工資的影響較大,而工資水平處于中等程度時,教育對工資的影響則小一些。為了進(jìn)一步分析在不同分位數(shù)時模型中各系數(shù)的變動趨勢,繪制不同分位數(shù)時各系數(shù)的變化如下 ( 見圖 6) :中國糧食產(chǎn)量影響因素分析圖 6 不同分位數(shù)時 x1 x2 x3的系數(shù)趨勢圖在圖 6 中我們繪制了不同分位數(shù)時地區(qū)生產(chǎn)總值,固定資產(chǎn)投資,教育對長春市職工平均工資的影響。 從圖中可知 , 地區(qū)經(jīng)濟(jì)發(fā)展有利于工資水平的提高, 且隨著地區(qū)經(jīng)濟(jì)的不斷發(fā)展 , 當(dāng)?shù)亟?jīng)濟(jì)對工資水平的促進(jìn)作用越來越顯著。自改革開放以來,長春市經(jīng)濟(jì)有了較大發(fā)展,當(dāng)工資水平處于分布高端, 經(jīng)濟(jì)發(fā)展對工資水平的正向影響最為顯著。當(dāng)工資水平處于分布低端和中端時,固定資產(chǎn)投資對工資水平的提高有比較穩(wěn)定的正促進(jìn)作用。 從圖中可以看出, 在 0.6 分位數(shù)以前的分位數(shù)回歸中,固定資產(chǎn)投資的系數(shù)保持不變。隨著工資水平由條件分布的低端向高端變動, 固定資產(chǎn)投資對工資的正向影響先

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論