統(tǒng)計(jì)學(xué)本科畢業(yè)論文2改——基于spss的多元回歸分析模型選取的應(yīng)用殷婷_第1頁
統(tǒng)計(jì)學(xué)本科畢業(yè)論文2改——基于spss的多元回歸分析模型選取的應(yīng)用殷婷_第2頁
統(tǒng)計(jì)學(xué)本科畢業(yè)論文2改——基于spss的多元回歸分析模型選取的應(yīng)用殷婷_第3頁
統(tǒng)計(jì)學(xué)本科畢業(yè)論文2改——基于spss的多元回歸分析模型選取的應(yīng)用殷婷_第4頁
統(tǒng)計(jì)學(xué)本科畢業(yè)論文2改——基于spss的多元回歸分析模型選取的應(yīng)用殷婷_第5頁
已閱讀5頁,還剩27頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、 畢 業(yè) 論 文題 目 基于SPSS的多元回歸分析模型選取的應(yīng)用 院 (系) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院 專業(yè)年級 2010級統(tǒng)計(jì)學(xué)專業(yè) 學(xué)生姓名 殷婷 學(xué)號 2010101217 指導(dǎo)教師 安軍 職稱 副教授 日 期 2014-5-10 基于SPSS的多元回歸分析模型選取的應(yīng)用 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院 2010級統(tǒng)計(jì)專業(yè)2班殷婷 學(xué)號:2010101217指導(dǎo)老師 安軍摘 要 本文不僅對于復(fù)雜的統(tǒng)計(jì)計(jì)算通過常用的計(jì)算機(jī)應(yīng)用軟件SPSS來實(shí)現(xiàn),同時(shí)通過對兩組數(shù)據(jù)的實(shí)證分析,來研究統(tǒng)計(jì)學(xué)中多元回歸分析中的變量選取,讓大家對統(tǒng)計(jì)學(xué)中的多元回歸分析中模型的選取以及變量的選取和操作方法有更深層次的了解. 一組數(shù)據(jù)是對于淘

2、寶交易額的未來發(fā)展趨勢的研究,一組數(shù)據(jù)時(shí)對于我國財(cái)政收入的研究. 本文通過兩個(gè)實(shí)證即淘寶交易額研究和財(cái)政收入研究從不同程度上對非線性回歸模型和變量選取的研究運(yùn)用通俗的語言和淺顯的描述將SPSS在多元回歸分析中的統(tǒng)計(jì)分析方法呈現(xiàn)在大家面前,讓大家對多元回歸分析以及SPSS軟件都可以有更深一步的了解. 通過SPSS軟件對數(shù)據(jù)進(jìn)行分析,對數(shù)據(jù)進(jìn)行處理的方法進(jìn)行總結(jié),找出SPSS對于數(shù)據(jù)處理和分析的優(yōu)缺點(diǎn),最后得在對變量的選取和軟件的操作提出建議. 關(guān)鍵詞:統(tǒng)計(jì)學(xué),SPSS,變量選取,多元回歸分析 AbstractThis article not only for complex statistica

3、l calculations done by the commonly used computer application software of SPSS, through the empirical analysis of the two groups of data at the same time, to study the statistics of the variables in the multivariate regression analysis, let everybody in the multiple regression analysis of statistica

4、l model selection as well as the selection of variables and operation methods have a deeper understanding. Is a set of data for the future development trend of research taobao transactions, a set of data for the research of our country's fiscal revenue. In this paper, through two empirical taoba

5、o transactions and fiscal revenue research from different degree of the study of nonlinear regression model and variable selection using a common language and plain the SPSS statistical analysis method in multiple regression analysis of present in front of everyone, let everyone to multiple regressi

6、on analysis and SPSS software can have a deeper understanding. Through SPSS software to analyze data, and summarizes method of data processing, find out the advantages and disadvantages of SPSS for data processing and analysis, finally had to put forward the proposal to the operation of the selectio

7、n of variables and software. Keywords: Statistical, SPSS, The selection of variables, multiple regression analysis 目 錄第一章 引 言3第二章 多元回歸模型的選取42.1 多元回歸分析概述42.2 相關(guān)系數(shù)概述52.3 非線性回歸模型概述52.4 多元線性回歸模型自變量的選取6第三章 非線性回歸模型案例:淘寶交易額模型的研究73.1 回歸模型變量的確定73.1.1 數(shù)據(jù)來源73.1.2 復(fù)相關(guān)系數(shù)83.1.3 散點(diǎn)圖看線性關(guān)系93.1.4 回歸分析看擬合度113.1.5 確定回歸

8、模型變量113.2 調(diào)整后的變量的相關(guān)分析123.2.1 散點(diǎn)圖123.2.2 計(jì)算相關(guān)系數(shù)143.3 多元線性回歸分析163.4 小 結(jié)18第四章 線性回歸分析變量選取案例:財(cái)政收入模型的研究184.1 數(shù)據(jù)來源及變量選取184.2 相關(guān)分析204.2.1 散點(diǎn)圖204.2.2 計(jì)算相關(guān)系數(shù)214.3 線性回歸分析244.4 逐步回歸264.5 小 結(jié)27第五章 總 結(jié)28參考文獻(xiàn)30第一章 引 言隨著社會(huì)的發(fā)展,統(tǒng)計(jì)的運(yùn)用范圍越來越廣泛,統(tǒng)計(jì)學(xué)作為高等院校經(jīng)濟(jì)類專業(yè)和工商管理類專業(yè)的核心課程,不管是在經(jīng)濟(jì)管理領(lǐng)域,或是在軍事、醫(yī)學(xué)等領(lǐng)域的研究中對于數(shù)量分析與統(tǒng)計(jì)分析都需要更高的要求,需要用

9、到的數(shù)學(xué)知識較多,應(yīng)用方面的靈活性也較強(qiáng),計(jì)算量大且復(fù)雜.然而科學(xué)研究的深入,研究的對象也日益變得復(fù)雜,復(fù)雜系統(tǒng)的研究問題更是成為當(dāng)今研究的熱點(diǎn). 為了更好的描述一個(gè)復(fù)雜的現(xiàn)象,就需要大量的數(shù)據(jù)和信息,如何高效、準(zhǔn)確地利用已知的信息便成為當(dāng)今社會(huì)研究的一項(xiàng)重要課題. 在科學(xué)技術(shù)飛速發(fā)展的今天,統(tǒng)計(jì)學(xué)通過不斷吸收和融合相關(guān)學(xué)科的新理論,開發(fā)應(yīng)用新技術(shù)和新方法,拓展新的領(lǐng)域的同時(shí)不斷深化和豐富了統(tǒng)計(jì)學(xué)傳統(tǒng)領(lǐng)域的理論與方法. 在我國,社會(huì)主義市場經(jīng)濟(jì)體制的逐步建立,實(shí)踐發(fā)展的需要對統(tǒng)計(jì)學(xué)提出了新的更多、更高的要求. 隨著我國社會(huì)主義市場經(jīng)濟(jì)的成長和不斷完善,統(tǒng)計(jì)學(xué)的潛在功能將得到更充分更完滿的開掘.

10、 從20世紀(jì)60年代開始,關(guān)于回歸自變量的選擇成為統(tǒng)計(jì)學(xué)中研究的熱點(diǎn)問題,統(tǒng)計(jì)學(xué)家提出了許多回歸選元的準(zhǔn)則,并提出了許多行之有效的選元方法. 在應(yīng)用回歸分析去處理實(shí)際問題時(shí),回歸自變量選擇是首先要解決的重要問題. 通常在做回歸分析時(shí),人們根據(jù)所研究問題的目的,結(jié)合經(jīng)濟(jì)理論羅列出對因變量可能有影響的的一些因素作為自變量引進(jìn)回歸模型,把一些對因變量影響很小的,有些甚至是沒有影響的自變量,不但使得計(jì)算量變大,估計(jì)和預(yù)測的精度也下降了. 此外,如果遺漏了某些重要變量,回歸方程的效果肯定不好. SPSS軟件作為當(dāng)今國際上運(yùn)用廣泛的統(tǒng)計(jì)分析軟件,其功能齊全帶有各種特點(diǎn),在各個(gè)領(lǐng)域內(nèi)都得到了迅速普及,并成為

11、各個(gè)行業(yè)提高管理水平、形成科學(xué)決策的重要手段. 然而,我國對于該軟件的運(yùn)用和理解始終處于早期應(yīng)用階段,無論是在功能的研究開發(fā)還是實(shí)際生活當(dāng)中的運(yùn)用都與西方發(fā)達(dá)國家相差甚遠(yuǎn). 尤其是在管理決策方面,都因?yàn)闆]有進(jìn)行深度分析而造成了浪費(fèi),要么就是利用SPSS軟件進(jìn)行簡單分析而未進(jìn)行深度開發(fā),導(dǎo)致所得的信息有限、各信息間的關(guān)系不明確,最終導(dǎo)致管理者的判斷出現(xiàn)偏差.基于以上背景,本文通過總結(jié)和吸取其他國內(nèi)外學(xué)者對統(tǒng)計(jì)學(xué)研究的,并結(jié)合我國的實(shí)際情況,本文采用了案例一對于網(wǎng)絡(luò)購物這塊的的研究,通過對2005年到2012年的居民消費(fèi)水平,以及我國網(wǎng)絡(luò)普及度,我國人人均純收入以及我國的居民消費(fèi)水平對淘寶網(wǎng)的未來

12、發(fā)展趨勢進(jìn)行非線性回歸模型的研究以及案例二對于我國財(cái)政收入的進(jìn)行變量選取研究,通過對1992年到2012年的人均國內(nèi)生產(chǎn)總值,城鎮(zhèn)居民家庭人均可支配收入,全社會(huì)固定投資,進(jìn)出口總額,居民消費(fèi)價(jià)格水平對我國財(cái)政收入的影響進(jìn)行定量數(shù)據(jù)的研究. 通過對數(shù)據(jù)的選取,回歸模型的確定以及軟件的操作方法來告知讀者如何在SPSS的操作中變量選取的原則、要求和方法. 第二章 多元回歸模型的選取2.1 多元回歸分析概述回歸分析是確定兩種或兩種以上變數(shù)間相互依賴的定量關(guān)系的一種統(tǒng)計(jì)分析方法(即尋找具有相關(guān)關(guān)系的變量減的數(shù)學(xué)表達(dá)式并進(jìn)行統(tǒng)計(jì)推斷的一種統(tǒng)計(jì)方法). 按照其所涉及的自變量,可分為一元回歸分析和多元回歸分析

13、;線性回歸分析和非線性回歸分析是按照自變量和因變量之間的關(guān)系劃分的.而本文運(yùn)用了多元線性回歸分析中的方法,多元線性回歸分析就是指回歸分析中包括兩個(gè)或兩個(gè)以上的自變量,且因變量和自變量之間是線性關(guān)系. 多元回歸分析的主要內(nèi)容有以下幾點(diǎn):(1)從一組數(shù)據(jù)出發(fā),確定某些變量之間的定量關(guān)系式,即建立數(shù)學(xué)模型并估計(jì)其中的未知參數(shù). 估計(jì)參數(shù)的常用方法是最小二乘法;(2)對這些關(guān)系式的可信程度進(jìn)行檢驗(yàn);(3)在許多自變量共同影響著一個(gè)因變量的關(guān)系中,判斷哪些自變量的影響是顯著的,哪些自變量的影響是不顯著的,將影響顯著的自變量選入模型中,而剔除影響不顯著的變量,通常用逐步回歸等方法;(4)利用所求的關(guān)系式對

14、某一生產(chǎn)過程進(jìn)行預(yù)測或控制. 回歸分析研究的主要問題是確定與間的定量關(guān)系表達(dá)式,這種表達(dá)式稱為回歸方程;對求得的回歸方程的可信度進(jìn)行檢驗(yàn);判斷自變量對因變量有無影響;利用所求得的回歸方程進(jìn)行預(yù)測和控制. 回歸分析主要應(yīng)用于研究兩個(gè)變量之間到底是哪個(gè)變量受哪個(gè)變量的影響,影響程度如何,通過分析現(xiàn)象之間相關(guān)的具體形式,確定其因果關(guān)系,并用數(shù)學(xué)模型來表現(xiàn)其具體關(guān)系,并根據(jù)實(shí)測數(shù)據(jù)來求解模型的各個(gè)參數(shù),然后評價(jià)回歸模型是否能夠很好的擬合實(shí)測數(shù)據(jù);如果能夠很好的擬合,則可以根據(jù)自變量作進(jìn)一步預(yù)測.2.2 相關(guān)系數(shù)概述  相關(guān)關(guān)系是一種非確定性的關(guān)系,相關(guān)系數(shù)是研究變量之間線性相關(guān)程度

15、的量. 相關(guān)關(guān)系是現(xiàn)象間客觀存在的,但數(shù)值又是不嚴(yán)格及不完全確定的相互依存關(guān)系. 1)復(fù)相關(guān)系數(shù) 在一元回歸分析中我們用相關(guān)系數(shù)來說明兩變量之間線性相關(guān)的程度,在多元回歸分析中,仍用它來表示與其他自變量之間的線性密切程度,此為復(fù)相關(guān)系數(shù). 復(fù)相關(guān)是指因變量與多個(gè)自變量之間的相關(guān)關(guān)系. 復(fù)相關(guān)系數(shù)只是反映變量間表面的非本質(zhì)的聯(lián)系,因?yàn)樽兞亢苡锌赡苁艿狡渌兞康挠绊? 2)偏相關(guān)系數(shù)在多變量的情況下,變量之間的相關(guān)系數(shù)是相當(dāng)復(fù)雜的. 任意兩個(gè)變量之間都有可能存在著相關(guān)關(guān)系,因此,只知道被解釋變量與解釋變量的總的相關(guān)程度是不夠的. 如果需要了解某兩個(gè)變量間的相關(guān)程度,就應(yīng)在消除其他變量影響的情況下來

16、計(jì)算他們的相關(guān)系數(shù),這就是偏相關(guān)系數(shù). 偏相關(guān)系數(shù)與復(fù)相關(guān)系數(shù)不同,復(fù)相關(guān)系數(shù)的取值在0-1之間,而偏相關(guān)系數(shù)則是有正有負(fù),所以復(fù)相關(guān)系數(shù)與偏相關(guān)系數(shù)之間也有可能相差很大. 變量之間本存在錯(cuò)綜復(fù)雜的關(guān)系,甚至可能使得符號也相反,但是偏相關(guān)系數(shù)才是變現(xiàn)變量之間的本質(zhì)聯(lián)系的. 偏相關(guān)的主要用途:偏相關(guān)主要是用來研究自變量與因變量之間的關(guān)系的,其通過得到的自變量與因變量數(shù)據(jù)來進(jìn)行計(jì)算,通過偏相關(guān)系數(shù)可以看出哪些自變量對因變量的影響更大一些,同時(shí)對于偏相關(guān)系數(shù)較小的變量,可以剔除. 2.3 非線性回歸模型概述非線性回歸模型是指在眾多的現(xiàn)象中,分析變量之間的關(guān)系時(shí)不符合解釋變量線性和參數(shù)線性的一種模型.

17、在實(shí)際的經(jīng)濟(jì)活動(dòng)中,經(jīng)濟(jì)變量的關(guān)系是相當(dāng)復(fù)雜的,直接表示為線性關(guān)系的情況也并不多見.但大多數(shù)的非線性關(guān)系是可以通過一些簡單的數(shù)學(xué)處理,使之轉(zhuǎn)化為線性關(guān)系,從而通過線性回歸來進(jìn)行計(jì)算.而非線性回歸模型又分為可化為線性模型的非線性回歸模型和不可化為線性模型的非線性回歸模型.本文研究的是可轉(zhuǎn)化為線性模型的非線性回歸模型,而可轉(zhuǎn)化為線性模型的非線性回歸模型又有好幾種方法可以對變量進(jìn)行轉(zhuǎn)換.其有以下幾種模型:1) 多項(xiàng)式函數(shù)模型對于形如: ,的模型為多項(xiàng)式模型.令 ,原模型可化為線性形式 ,那么就可以用多元線性回歸分析的方法進(jìn)行處理了.2) 指數(shù)函數(shù)模型對于形如: ,的模型為指數(shù)函數(shù)模型. 令 ,原模型

18、可化為線性形式 ,那么就可以用多元線性回歸分析的方法進(jìn)行處理了.3) 雙曲線模型;4) 半對數(shù)模型和雙對數(shù)模型等.本文將對指數(shù)函數(shù)型非線性模型進(jìn)行案例說明,所以對于其他類型的非線性回歸模型的道理是一致的,在這里就不進(jìn)行一一解釋.2.4 多元線性回歸模型自變量的選擇在多元線性回歸模型中自變量的選擇實(shí)質(zhì)上就是模型的選擇. 現(xiàn)設(shè)一切可供選擇的變量是個(gè) ,它們組成的回歸模型稱為全模型(記:),在獲得組觀測數(shù)據(jù)后,我們有模型: , 其中:是的觀測值,是未知參數(shù)向量,是結(jié)構(gòu)矩陣,并假定的秩為. 現(xiàn)從這個(gè)變量中選變量,不妨設(shè),那么對全模型中的參數(shù)和結(jié)構(gòu)矩陣可作如下的分塊(記:): , .我們稱下面的回歸模型

19、為選模型: ,其中:是的觀測值,是未知參數(shù)向量, 是結(jié)構(gòu)矩陣,并假定的秩為.自變量的選擇可以看成是這樣的兩個(gè)問題,一是究竟是用全模型還是用選模型,二是若用選模型,則究竟應(yīng)包含多少變量最適合. 然而自變量的選擇與相關(guān)系數(shù),回歸分析都有密切的關(guān)系,自變量的選擇需要通過一系列的驗(yàn)證,剔除之后才能得到最好的變量從而得到最好的回歸模型. 下面我們用兩個(gè)案例來對多元回歸模型的選取來進(jìn)行解釋和探討.第三章 非線性回歸模型案例:淘寶交易額研究3.1 回歸模型變量的確定 3.1.1數(shù)據(jù)來源 為研究淘寶網(wǎng)未來發(fā)展趨勢,從新浪官方微博淘寶數(shù)據(jù)魔方中獲得淘寶2009年聚劃算中購物群眾的年齡比例作為定性數(shù)據(jù),進(jìn)行研究年

20、齡對淘寶購物的影響. 并在新浪財(cái)經(jīng)網(wǎng)上獲得淘寶網(wǎng)自2003年到2012年的淘寶交易額以及淘寶注冊人數(shù)的數(shù)據(jù). 在中商情報(bào)局里獲得我國近網(wǎng)絡(luò)普及度等數(shù)據(jù)并從國家統(tǒng)計(jì)年鑒中選取統(tǒng)計(jì)指標(biāo)居民消費(fèi)水平. 淘寶注冊人數(shù)()在一定程度上反應(yīng)了網(wǎng)絡(luò)購物的群眾的人數(shù),反應(yīng)了當(dāng)今社會(huì)網(wǎng)絡(luò)購物的普遍性. 同時(shí)淘寶的注冊人數(shù)也展現(xiàn)了人們對網(wǎng)絡(luò)購物的認(rèn)可度,換言之也就是說接受了網(wǎng)絡(luò)購物并會(huì)在網(wǎng)上進(jìn)行消費(fèi),是對網(wǎng)絡(luò)購物很大程度上的支持. 我國網(wǎng)絡(luò)普及度()是指我國近幾年網(wǎng)絡(luò)在我國普及的范圍,這一塊更好的反映了網(wǎng)絡(luò)對居民網(wǎng)絡(luò)消費(fèi)的影響,因?yàn)榫W(wǎng)絡(luò)是網(wǎng)絡(luò)消費(fèi)的必要條件. 我國網(wǎng)絡(luò)普及度反映的是在我國日趨發(fā)展的經(jīng)濟(jì)下,人們對網(wǎng)

21、絡(luò)的接受程以及信任程度也是直接影響到淘寶的網(wǎng)絡(luò)購物. 居民消費(fèi)水平()主要通過消費(fèi)的物質(zhì)產(chǎn)品和勞務(wù)的數(shù)量和質(zhì)量來反映. 居民消費(fèi)水平的提高也能很好的展現(xiàn)在網(wǎng)絡(luò)消費(fèi)上作出的貢獻(xiàn). 第二產(chǎn)業(yè)增加值()是指采礦業(yè),制造業(yè),電力、煤氣及水的生產(chǎn)和供應(yīng)業(yè),建筑業(yè). 而制造業(yè)的發(fā)展也相繼影響著產(chǎn)品的銷售,所以在這里采用第二產(chǎn)業(yè)對淘寶交易額的影響. 通過對以上這三個(gè)定量數(shù)據(jù)的研究來其與淘寶交易額的關(guān)系,從而研究淘寶未來的發(fā)展趨勢以及優(yōu)劣態(tài). 原始數(shù)據(jù)如下:表3.1為消除數(shù)據(jù)之間因單位不同產(chǎn)生的量綱的影響,對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化得如下數(shù)據(jù)得到表3.23.1.2 復(fù)相關(guān)系數(shù)對表3.2 的數(shù)據(jù)進(jìn)行復(fù)相關(guān)系數(shù)的研究,看變

22、量之間的復(fù)相關(guān)關(guān)系,得到如下表3.3的復(fù)相關(guān)系數(shù)表: 表3.3 表3.3中有帶“*”號的結(jié)果表明有關(guān)的兩變量在0.01的顯著性水平下顯著相關(guān),由上圖可知,與的相關(guān)系數(shù)為0.987>0,表示變量之間存在線性關(guān)系,其相關(guān)系數(shù)檢驗(yàn)對應(yīng)的概率值為0.000,低于顯著性水平0.05,說明淘寶交易額與淘寶注冊人數(shù)之間相關(guān)性顯著. 與的相關(guān)系數(shù)為0.923>0,表示變量之間存在線性關(guān)系,其對應(yīng)值為0.000,小于顯著性水平0.05,說明淘寶交易額與我國網(wǎng)絡(luò)普及度之間相關(guān)性顯著.與的相關(guān)系數(shù)為0.963>0,表示變量之間存在線性關(guān)系,其對應(yīng)值為0.000,小于顯著性水平0.05,說明淘寶交易

23、額與居民消費(fèi)水平之間相關(guān)性顯著. 與的相關(guān)系數(shù)為0.919>0,表示變量之間存在線性關(guān)系,其對應(yīng)值為0.000,小于顯著性水平0.05,說明我國第二產(chǎn)業(yè)增加值與居民消費(fèi)水平之間相關(guān)性顯著. 綜上所述通過SPSS得出的相關(guān)系數(shù)的矩陣得到為:0.987 ,0.923 ,0.963 ,0.919 . 雖然變量都通過了檢驗(yàn),但是可以看到和較另外兩個(gè)復(fù)相關(guān)系數(shù)較低,因此對變量進(jìn)行散點(diǎn)圖的分析來了解自變量與因變量的相關(guān)關(guān)系.3.1.3 散點(diǎn)圖看線性關(guān)系對與各個(gè)變量作出散點(diǎn)圖 (1)淘寶注冊人數(shù)與淘寶網(wǎng)交易總額的相關(guān)性散點(diǎn)圖:圖3.1 (2)網(wǎng)絡(luò)普及度與淘寶網(wǎng)交易總額的散點(diǎn)圖:圖3.2 (3)我國居民

24、消費(fèi)水平與淘寶交易額的散點(diǎn)圖:圖3.3 (4)第二產(chǎn)業(yè)增加值對淘寶交易額的散點(diǎn)圖:圖3.4圖3.2和3.4分別是自變量和與因變量的相關(guān)系數(shù)圖,可以看出自變量和因變量之間呈明顯的指數(shù)線性關(guān)系,而變量也是同樣與因變量之間呈明顯的指數(shù)線性關(guān)系.他們之間是非線性回歸模型的關(guān)系. 所擬合的效果不理想所以我們還需要對數(shù)據(jù)進(jìn)行進(jìn)一步的處理和分析,得到確切的答案. 3.1.4 回歸分析看擬合度 對數(shù)據(jù)進(jìn)行回歸分析:表3.4 表3.4是自變量與因變量得到的回歸分析,可知,因變量與常數(shù)項(xiàng)和自變量,的回歸的標(biāo)準(zhǔn)化回歸系數(shù)分別為0.01,0.660,-0.229,1.439,-0.899.而通過檢驗(yàn)可以看到由上表2.

25、4可以看出常數(shù)項(xiàng)以及各自變量的值分別為:0.906,0.000,0.018,0.000及0.000. 可以看出原始變量所得到的值并沒有全部通過檢驗(yàn). 說明常數(shù)項(xiàng)對因變量影響不顯著. 對數(shù)據(jù)進(jìn)行值檢驗(yàn),在給定的,自由度的臨界值時(shí),查表得2.262,其常數(shù)項(xiàng)的值為0.123小于2.262,說明常數(shù)項(xiàng)不顯著. 綜上所述,可以初步得到一個(gè)模型為: . 3.1.5確定回歸模型變量 綜上通過散點(diǎn)圖、復(fù)相關(guān)系數(shù)以及回歸分析可以知道由于自變量和與因變量之間是非線性關(guān)系,是呈指數(shù)線性關(guān)系為研究之間線性關(guān)系,所以得到的模型的擬合程度并不是很理想.因此對自變量和進(jìn)行取的對數(shù)即和來對變量進(jìn)行研究看擬合效果得到下表.表

26、3.5下面對表3.5進(jìn)行變量分析與研究,通過對非線性模型中的變量的研究來了解多元回歸分析中變量的選取與使用,同時(shí)對自變量進(jìn)一步進(jìn)行分析.3.2 調(diào)整后變量的相關(guān)分析3.2.1 散點(diǎn)圖對與各個(gè)變量作出散點(diǎn)圖 (1)淘寶注冊人數(shù)與淘寶網(wǎng)交易總額的相關(guān)性散點(diǎn)圖:圖3.5 (2)的網(wǎng)絡(luò)普及度次方與淘寶網(wǎng)交易總額的相關(guān)性檢驗(yàn):圖3.6 (3)我國居民消費(fèi)水平與淘寶交易額的相關(guān)性檢驗(yàn):圖3.7 (4)的第二產(chǎn)業(yè)增加值的次方對淘寶交易額的影響:圖3.8 由以上四個(gè)散點(diǎn)圖可知,其所有的點(diǎn)均落在了左上至右下的一條直線上,表明了數(shù)據(jù)之間存在顯著相關(guān)關(guān)系. 所以我們還需要對數(shù)據(jù)進(jìn)行進(jìn)一步的分析,得到確切的答案. 2

27、.2.2 計(jì)算相關(guān)系數(shù)(1)復(fù)相關(guān)系數(shù)是用來衡量回歸直線對于觀察值配合的密切程度,即用來衡量因變量與自變量,之間相關(guān)的密切程度. 以下是用SPSS對數(shù)據(jù)進(jìn)行相關(guān)性分析,得到如下的相關(guān)系數(shù)圖表3.6 圖中有帶“*”號的結(jié)果表明有關(guān)的兩變量在0.01的顯著性水平下顯著相關(guān),由上圖可知,與的相關(guān)系數(shù)為0.987>0,表示變量之間存在線性關(guān)系,其相關(guān)系數(shù)檢驗(yàn)對應(yīng)的概率P值為0.000,低于顯著性水平0.05,說明淘寶交易額與淘寶注冊人數(shù)之間相關(guān)性顯著. 與的相關(guān)系數(shù)為0.979>0,表示變量之間存在線性關(guān)系,其對應(yīng)P值為0.000,小于顯著性水平0.05,說明淘寶交易額與我國網(wǎng)絡(luò)普及度之間

28、相關(guān)性顯著.與的相關(guān)系數(shù)為0.963>0,表示變量之間存在線性關(guān)系,其對應(yīng)P值為0.000,小于顯著性水平0.05,說明淘寶交易額與居民消費(fèi)水平之間相關(guān)性顯著. 與的相關(guān)系數(shù)為0.997>0,表示變量之間存在線性關(guān)系,其對應(yīng)P值為0.000,小于顯著性水平0.05,說明我國第二產(chǎn)業(yè)增加值與居民消費(fèi)水平之間相關(guān)性顯著. 綜上所述通過SPSS得出的相關(guān)系數(shù)的矩陣得到為:0.987 ,0.979 ,0.963 ,0.997 . 由以上數(shù)據(jù)可以看出,各列之間存在正相關(guān)關(guān)系. 即淘寶網(wǎng)注冊人數(shù)、的我國網(wǎng)絡(luò)普及度、我國居民消費(fèi)水平、的我國第二產(chǎn)業(yè)增加值次方與淘寶交易總額存在顯著的相關(guān)關(guān)系. (

29、2) 計(jì)算偏相關(guān)系數(shù):下面是用SPSS作出的偏相關(guān)系數(shù): 消除我國網(wǎng)絡(luò)普及度、第二產(chǎn)業(yè)增加值和居民消費(fèi)水平的影響后,計(jì)算淘寶注冊人數(shù)與淘寶交易額的偏相關(guān)系數(shù)為:表3.7由上可知,淘寶注冊人數(shù)與淘寶交易額的偏相關(guān)系數(shù)為0.795. 消除淘寶交易額、第二產(chǎn)業(yè)增加值和居民消費(fèi)水平的影響后,我國網(wǎng)絡(luò)普及度和淘寶交易額的偏相關(guān)系數(shù)為:表3.8由上可知我國網(wǎng)絡(luò)普及度與淘寶交易額的偏相關(guān)系數(shù)為0.733. 消除淘寶注冊人數(shù)、第二產(chǎn)業(yè)增加值和我國網(wǎng)絡(luò)普及度的影響后,我國居民消費(fèi)水平和淘寶交易額的偏相關(guān)系數(shù):表3.9由上可知,我國居民消費(fèi)水平和淘寶交易額的偏相關(guān)系數(shù)為-0.932. 消除淘寶注冊人數(shù)、我國網(wǎng)絡(luò)普

30、及度和居民消費(fèi)水平的影響后,計(jì)算第二產(chǎn)業(yè)增加值與淘寶交易額的偏相關(guān)系數(shù):表3.10由上可知,的第二產(chǎn)業(yè)增加值次方與淘寶交易額的偏相關(guān)系數(shù)為0.946. 下表為各個(gè)變量之間的偏相關(guān)系數(shù)表,為方便,這里直接變各變量之間的偏相關(guān)系數(shù):0.7950.773-0.9320.9460.795-0.6110.758-0.590.773-0.6110.702-0.521-0.9320.7580.7020.8180.946-0.59-0.5210.818表3.11這里我們對變量和采用的是其指數(shù)冪,是因?yàn)樵趯ψ兞康南嚓P(guān)性進(jìn)行檢驗(yàn)時(shí),通過散點(diǎn)圖可以看出和與因變量之間呈的是指數(shù)線性關(guān)系,是非線性關(guān)系所以對數(shù)據(jù)進(jìn)行了處

31、理,因?yàn)樵甲兞恐g存在的非線性關(guān)系得出的結(jié)果不具有代表性. 可以通過散點(diǎn)圖看到從以上的偏相關(guān)系數(shù)來看,如果,和保持不變,與之間存在相關(guān)關(guān)系,當(dāng),和的保持不變時(shí),和之間存在相關(guān)關(guān)系,其他關(guān)系同上,在這里就不進(jìn)行一一解釋.我們也可以通過以上的偏相關(guān)系數(shù)表可以看出各個(gè)自變量之間也存在一定的偏相關(guān)關(guān)系,但是相對于自變量與因變量之間的偏相關(guān)關(guān)系較小,說明這些變量之間的選擇比較顯著.但是其關(guān)系強(qiáng)度較前者略低,所以經(jīng)過以上系數(shù)得到的偏相關(guān)系數(shù)可以看出,其相關(guān)程度較原關(guān)系的強(qiáng)度低,應(yīng)采用原數(shù)據(jù)的自變量和因變量. 即所采用的自變量和因變量保持不變.通過復(fù)相關(guān)系數(shù)的計(jì)算和偏相關(guān)系數(shù)的計(jì)算結(jié)果可以看出,復(fù)相關(guān)系數(shù)

32、的取值在0-1之間,偏相關(guān)系數(shù)的取值在-1到1之間,由上數(shù)據(jù)便可看出偏相關(guān)系數(shù)與復(fù)相關(guān)系數(shù)之間的差距相差甚大,有的甚至改變了符號. 從上可以看出通過復(fù)相關(guān)系數(shù)不能很好的確定變量之間的相關(guān)關(guān)系,不能明確的解釋變量,而偏回歸系數(shù)可以看出變量是否符合要求. 從下面的回歸分析中繼續(xù)對變量進(jìn)行研究.3.3 多元線性回歸分析對數(shù)據(jù)進(jìn)行回歸分析,得到如下結(jié)果:表3.12復(fù)相關(guān)系數(shù)為1,判定系數(shù)為0.999,調(diào)整系數(shù)為0.999,估計(jì)值的標(biāo)準(zhǔn)誤差為0.03296. 表3.13 由上面結(jié)果的看其顯著性檢驗(yàn)結(jié)果為,回歸平方和為9.993,殘差平方和0.007,總平方和10.000, 統(tǒng)計(jì)量的值為2.299E3,對

33、應(yīng)的概率值為0.000,小于顯著性水平0.05,即:淘寶交易總額與淘寶網(wǎng)注冊人數(shù)、的我國網(wǎng)絡(luò)普及度次方、我國居民消費(fèi)水平和的我國第二產(chǎn)業(yè)增加值次方之間存在線性關(guān)系,所以可認(rèn)為所建立的回歸方程有效. 表3.14由上表可知,因變量與常數(shù)項(xiàng)和自變量,的回歸的標(biāo)準(zhǔn)化回歸系數(shù)分別為-1.119,0.244,0.107,-0.321,0.615. 3個(gè)回歸系數(shù)的顯著性水平均小于0.05,這里可以認(rèn)為自變量,對因變量有顯著性影響. 于是得到回歸方程為: ,由上圖可知對數(shù)據(jù)進(jìn)行值檢驗(yàn),在給定的,自由度的臨界值時(shí),查表得2.262,因?yàn)椋?的參數(shù)對應(yīng)的統(tǒng)計(jì)量的絕對值均大于2.262,這說明的顯著性水平下,斜率系

34、數(shù)均顯著不為0,表明淘寶網(wǎng)注冊人數(shù),的我國網(wǎng)絡(luò)普及度次方,我國居民消費(fèi)水平,的我國第二產(chǎn)業(yè)增加值次方等變量聯(lián)合起來對該商品的消費(fèi)支出有顯著的影響. P檢驗(yàn):由上表可以看出各自變量以及常數(shù)項(xiàng)的P值分別為:0.00,0.018,0.039,0.001及0.000,可以看出其P值均小于0.05,均通過檢驗(yàn) 綜上所述,四個(gè)自變量對因變量都有顯著性影響,并都通過了檢驗(yàn)可以得到最優(yōu)方程式為: .2.4 小 結(jié) 通過相關(guān)系數(shù)和回歸分析對原始變量進(jìn)行對比,通過相關(guān)系數(shù)的對比可以看到對變量進(jìn)行處理后所得到的回歸方程的擬合效果更好,對因變量的影響更加的顯著. 再加上最后對變量進(jìn)行回歸分析及檢驗(yàn)可以得出淘寶網(wǎng)注冊人

35、數(shù),的我國網(wǎng)絡(luò)普及度次方,我國居民消費(fèi)水平,的我國第二產(chǎn)業(yè)增加值次方等變量聯(lián)合起來對淘寶交易總額有更顯著的影響.說明研究多元線性回歸分析中對變量的線性關(guān)系的要求也是直接影響自變量對因變量影響程度的重要因素. 在研究變量之間相關(guān)關(guān)系的時(shí)候一定要對變量進(jìn)行檢驗(yàn)和處理. 綜上可以知道影響淘寶交易額的公式可以近似為: .即:淘寶注冊人數(shù)增加就可使得淘寶網(wǎng)的交易額增加. 眾所周知我國網(wǎng)絡(luò)普及度是在逐年增加的,可以看出淘寶交易額的增加與我國網(wǎng)絡(luò)普及度呈指數(shù)增長,隨著社會(huì)的發(fā)展,中國的發(fā)展更是越來越迅速,網(wǎng)絡(luò)普及度的增加使得更多的地方有網(wǎng)絡(luò),更多的人了解網(wǎng)絡(luò)才能使得我國淘寶注冊人數(shù)的增加. 同時(shí)我國第二產(chǎn)業(yè)

36、增加值表示了我國制造業(yè)的增加,而淘寶的銷售與制造業(yè)之間存在緊密的關(guān)系,這里可以看到我國第二產(chǎn)業(yè)增加值與淘寶交易額呈指數(shù)型增長趨勢.這幾個(gè)自變量之間存在著相對嚴(yán)密的關(guān)系. 人均收入的增加固使得人們的消費(fèi)指數(shù)上升,那么人們在網(wǎng)絡(luò)購物和日常消費(fèi)的比例也會(huì)發(fā)生變化,這里我們可以看出這個(gè)比例是在增加的,那么淘寶交易額增加也是必不可少的.第四章 線性回歸分析變量選取案例:財(cái)政收入模型的研究4.1 數(shù)據(jù)來源及變量選取為研究我國財(cái)政收入情況,為研究人均國內(nèi)生產(chǎn)總值,城鎮(zhèn)居民家庭人均可支配收入,全社會(huì)固定資產(chǎn)投資,第一產(chǎn)業(yè)增加值,教育經(jīng)費(fèi)對財(cái)政收入的影響,通過中國國家統(tǒng)計(jì)局下載1992年到2012年的數(shù)據(jù)進(jìn)行研

37、究. 人均國內(nèi)生產(chǎn)()總是指國內(nèi)生產(chǎn)總值的絕對值與該年平均人口的比值,是衡量一個(gè)國家或地區(qū)每個(gè)居民對該國家或地區(qū)的經(jīng)濟(jì)貢獻(xiàn)或創(chuàng)造價(jià)值的指標(biāo). 城鎮(zhèn)居民家庭人均可支配收入()是指在16周歲及以上,有勞動(dòng)能力,參加或要求參加社會(huì)經(jīng)濟(jì)活動(dòng)的人口. 全社會(huì)固定資產(chǎn)投資()反映固定資產(chǎn)投資規(guī)模、結(jié)構(gòu)和發(fā)展速度的綜合性指標(biāo)的同時(shí),也是觀察工程進(jìn)度和考核投資效果的重要依據(jù).第一產(chǎn)業(yè)增加值()是指按市場價(jià)格計(jì)算的一個(gè)國家(或地區(qū))所有常住單位在一定時(shí)期內(nèi)從事第一產(chǎn)業(yè)生產(chǎn)活動(dòng)的最終成果. 第一產(chǎn)業(yè)是指農(nóng)、林、牧、漁業(yè). 教育經(jīng)費(fèi)總投入()包括國家財(cái)政性教育經(jīng)費(fèi)、社會(huì)團(tuán)體和公民個(gè)人辦學(xué)經(jīng)費(fèi)、社會(huì)捐贈(zèng)經(jīng)費(fèi)、學(xué)費(fèi)和雜

38、費(fèi)、其他教育經(jīng)費(fèi). 財(cái)政收入()指國家財(cái)政參與社會(huì)產(chǎn)品分配所取得的收入,是實(shí)現(xiàn)國家職能的財(cái)力保證. 原數(shù)據(jù)如下: 表4.1由于數(shù)據(jù)單位不同,為了消除量綱的影響,用SPSS對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,得到如下標(biāo)準(zhǔn)化的數(shù)據(jù)(所有取值保留了兩位小數(shù)):表4.2以上為數(shù)據(jù)標(biāo)準(zhǔn)化后的數(shù)據(jù),下面的案例會(huì)針對標(biāo)準(zhǔn)化后的數(shù)據(jù)進(jìn)行研究.4.2 相關(guān)分析4.2.1 散點(diǎn)圖(1)人均國內(nèi)生產(chǎn)總值與我國財(cái)政收入的關(guān)系散點(diǎn)圖:圖4.1 (2)城鎮(zhèn)居民家庭人均可支配收入與我國財(cái)政收入的線性關(guān)系:圖4.2(3)全社會(huì)固定資產(chǎn)投資與我國財(cái)政收入的線性關(guān)系:圖4.3 (4)我國的第一產(chǎn)業(yè)的增加值與財(cái)政收入的線性關(guān)系:圖4.4(5)

39、我國教育經(jīng)費(fèi)的總投入與財(cái)政收入的線性關(guān)系: 圖4.5由以上四個(gè)線性趨勢圖可以初步看出人均國內(nèi)生產(chǎn)總值、城鎮(zhèn)居民家庭人均可支配收入、全社會(huì)固定資產(chǎn)投資、我國的第一產(chǎn)業(yè)增加值、我國的教育經(jīng)費(fèi)總投入與財(cái)政收入存在顯著相關(guān). 為驗(yàn)證其實(shí)際關(guān)系需要對數(shù)據(jù)進(jìn)行進(jìn)一步分析. 4.2.2 相關(guān)系數(shù) (1)本案例中計(jì)算的是因變量與自變量,,之間相關(guān)的密切程度. 以下是用SPSS對數(shù)據(jù)進(jìn)行相關(guān)性分析,得到如下的相關(guān)系數(shù)圖 表4.3圖中有帶“*”號的結(jié)果表明有關(guān)的兩變量在0.01的顯著性水平下顯著相關(guān),由上圖可知,與的相關(guān)系數(shù)為0.996>0,表示呈顯著線性關(guān)系,其 值為0.000,低于顯著性水平0.05,說

40、明人均國內(nèi)生產(chǎn)總值與我國財(cái)政收入之間相關(guān)性顯著. 與的相關(guān)系數(shù)為0.990>0,表示呈顯著線性關(guān)系,其值為0.000,低于顯著性水平0.05,說明城鎮(zhèn)居民家庭人均可支配收入與我國財(cái)政收入之間相關(guān)性顯著. 與的相關(guān)系數(shù)為0.997>0,表示呈顯著線性關(guān)系,其 P值為0.000,低于顯著性水平0.05,說明全社會(huì)固定資產(chǎn)投資與我國財(cái)政收入之間相關(guān)性顯著. 與的相關(guān)系數(shù)為0.991>0,表示呈顯著線性關(guān)系,其 P值為0.000,低于顯著性水平0.05,說明我國的第一產(chǎn)業(yè)增加值與財(cái)政收入之間相關(guān)性顯著. 與的相關(guān)系數(shù)為0.991>0,表示呈顯著線性關(guān)系,其 P值為0.000,低

41、于顯著性水平0.05,說明我國的教育經(jīng)費(fèi)總投入與財(cái)政收入之間相關(guān)性顯著. 綜上所述通過SPSS得出的相關(guān)系數(shù)的矩陣得到為:0.996 ,0.990 ,0.997 ,0.991 ,0.999 , 由以上數(shù)據(jù)可以看出,各列之間存在正相關(guān)關(guān)系. 即人均國內(nèi)生產(chǎn)總值、城鎮(zhèn)居民家庭人均可支配收入、全社會(huì)固定資產(chǎn)投資、我國的第一產(chǎn)業(yè)增加值、我國的教育經(jīng)費(fèi)總投入與財(cái)政收入存在顯著性相關(guān)關(guān)系. (2)計(jì)算偏相關(guān)系數(shù):下面是用SPSS作出人均國內(nèi)生產(chǎn)總值、城鎮(zhèn)居民家庭人均可支配收入、全社會(huì)固定資產(chǎn)投資、我國的第一產(chǎn)業(yè)增加值、我國的教育經(jīng)費(fèi)總投入與財(cái)政收入的偏相關(guān)系數(shù):表4.4表4.50.871-0.8750.2

42、33-0.3060.9060.8710.896-0.1110.431-0.7260.896-0.875-0.114-0.120.8830.233-0.111-0.1140.2820.115-0.3060.431-0.120.2820.1730.906-0.7260.8830.1150.173表4.6表4.6為回歸分析圖中的人均國內(nèi)生產(chǎn)總值、城鎮(zhèn)居民家庭人均可支配收入、全社會(huì)固定資產(chǎn)投資、我國的第一產(chǎn)業(yè)增加值、我國的教育經(jīng)費(fèi)總投入與財(cái)政收入的偏相關(guān)系數(shù),表3.10為SPSS偏相關(guān)系數(shù)操作中得出的我國人均國內(nèi)生產(chǎn)總值與我國財(cái)政收入的偏相關(guān)系數(shù). 由人均國內(nèi)生產(chǎn)總值為例可以看出我國人均國內(nèi)生產(chǎn)總值與

43、我國財(cái)政收入的偏相關(guān)系數(shù)為0.693. P值檢驗(yàn)的概率為0.002<0.05,可以說明我國人均國內(nèi)生產(chǎn)總值與我國財(cái)政收入之間顯著性相關(guān). 表3.11是變量與變量之間的偏相關(guān)系數(shù),可以看出其他自變量與自變量之間的偏相關(guān)系數(shù)并不高. 同理,從以上的偏相關(guān)系數(shù)來看,如果人均國內(nèi)生產(chǎn)總值、全社會(huì)固定資產(chǎn)投資、第一產(chǎn)業(yè)增加值、教育經(jīng)費(fèi)保持不變,城鎮(zhèn)居民家庭人均可支配收入與財(cái)政收入的偏相關(guān)系數(shù)為-0.834,其對應(yīng)的P值檢驗(yàn)為0.000<0.05,城鎮(zhèn)居民家庭人均可支配收入與財(cái)政收入之間存在顯著相關(guān),當(dāng)人均國內(nèi)生產(chǎn)總值、城鎮(zhèn)居民家庭人均可支配收入、我國的第一產(chǎn)業(yè)增加值、教育經(jīng)費(fèi)保持不變,全社會(huì)

44、固定資產(chǎn)投資與財(cái)政收入的偏相關(guān)系數(shù)為-0.282,其P值檢驗(yàn)為0.272>0.05,即全社會(huì)固定資產(chǎn)投資與財(cái)政收入之間不存在顯著相關(guān). 當(dāng)人均國內(nèi)生產(chǎn)總值、城鎮(zhèn)居民家庭人均可支配收入、全社會(huì)固定資產(chǎn)、教育經(jīng)費(fèi)投資保持不變,我國的第一產(chǎn)業(yè)增加值與財(cái)政收入的偏相關(guān)系數(shù)為-0.361,其P值檢驗(yàn)為0.154>0.05, 我國的進(jìn)出口總額與財(cái)政收入的相關(guān)性不顯著. 當(dāng)人均國內(nèi)生產(chǎn)總值、城鎮(zhèn)居民家庭人均可支配收入、全社會(huì)固定資產(chǎn)投資和我國的第一產(chǎn)業(yè)增加值保持不變,教育經(jīng)費(fèi)總投入與財(cái)政收入的偏相關(guān)系數(shù)為0.885,其P值檢驗(yàn)為0.000<0.05, 我國的教育經(jīng)費(fèi)總投入與財(cái)政收入的存在顯

45、著相關(guān)性. 常數(shù)項(xiàng)的P值為1,sig大于0.05只表示此常數(shù)值不是很大 ,這里的常數(shù)項(xiàng)對數(shù)據(jù)的影響不顯著,也需要剔除. 而因變量與自變量和的偏相關(guān)系數(shù)很低,說明其對因變量的影響不顯著,應(yīng)該剔除,下面通過回歸分析和逐步回歸對數(shù)據(jù)處理和整理. 4.3 線性回歸分析 對數(shù)據(jù)進(jìn)行回歸分析,得到如下結(jié)果:表4.7 復(fù)相關(guān)系數(shù)為1,判定系數(shù)為1,調(diào)整系數(shù)為1,估計(jì)值的標(biāo)準(zhǔn)誤差為0.01766. 表4.8 由上面結(jié)果的看其顯著性檢驗(yàn)結(jié)果為,回歸平方和為19.995,殘差平方和0.005,總平方和20, F統(tǒng)計(jì)量的值為1.282E4,對應(yīng)的概率P值為0.000,小于顯著性水平0.05,即:人均國內(nèi)生產(chǎn)總值、城

46、鎮(zhèn)居民家庭人均可支配收入、全社會(huì)固定資產(chǎn)投資、我國的第一產(chǎn)業(yè)增加值、我國的教育經(jīng)費(fèi)總投入與財(cái)政收入之間存在線性關(guān)系,所以可認(rèn)為所建立的回歸方程有效. 表4.9 由上圖可知,因變量與常數(shù)項(xiàng)和自變量,的回歸的標(biāo)準(zhǔn)化回歸系數(shù)分別為-6.671E-170.74,-0.584,0.54,-0.64,0.851. 5個(gè)回歸系數(shù)中可以看出,的顯著性水平大于0.05,即自變量,對因變量的顯著性不明顯. 常數(shù)項(xiàng)為的值為1,即說明常數(shù)項(xiàng)近似為0.而自變量,的值檢驗(yàn)均小于0.05,說明自變量,對因變量有顯著性影響. 檢驗(yàn):在給定的,自由度的臨界值時(shí),查表得2.209可以看出常數(shù)項(xiàng)及自變量,的參數(shù)對應(yīng)的值的絕對值均大

47、于2.201,這表明顯著性水平5%的情況下,人均國內(nèi)生產(chǎn)總值、城鎮(zhèn)居民家庭人均可支配收入、教育經(jīng)費(fèi)總投入等變量聯(lián)合起來對我國的財(cái)政收入有顯著的影響. 而我國的進(jìn)出口總額的值為0.233小于2.209,說明我國的進(jìn)出口總額對我國的財(cái)政收入的影響不顯著. 所以需要對數(shù)據(jù)進(jìn)行逐步回歸,剔除影響不顯著的變量. 其回歸方程為: .4.4逐步回歸 由上可知自變量進(jìn)出口總額未通過檢驗(yàn),因此對數(shù)據(jù)進(jìn)行逐步回歸的處理. 對人均國內(nèi)生產(chǎn)總值、城鎮(zhèn)居民家庭人均可支配收入、全社會(huì)固定資產(chǎn)投資、我國的第一產(chǎn)業(yè)增加值、我國的教育經(jīng)費(fèi)總投入與財(cái)政收入進(jìn)行逐步回歸分析得:表4.10 由上可以看出,被剔除. 其逐步回歸的順序?yàn)?/p>

48、,.表4.11 上表為逐步回歸模型的統(tǒng)計(jì)量,從上表可以看到自變量的判定系數(shù)分別為1,0.999,0.999,這說明自變量與因變量之間的擬合程度很好.調(diào)整后的判定系數(shù)與判定系數(shù)相同,其估計(jì)標(biāo)準(zhǔn)誤差分別為 0.04762,0.03533,0.01766其值均很小,說明所選值之間的標(biāo)準(zhǔn)誤差很小. 表4.12 上表為方差分析表,及逐步回歸每一步的回歸模型的方差分析,可以看出其顯著性水平的概率均為0.000,表明此回歸模型極顯著. CoefficientsaModelUnstandardized CoefficientsStandardized CoefficientstSig.BStd. ErrorB

49、eta1x5.999.011.99993.818.0002x51.300.0751.30017.434.000x2-.303.075-.303-4.063.0013x5.935.062.93515.157.000x2-.652.060-.652-10.866.000x1.713.096.7137.420.000a. Dependent Variable: y表4.13上表為回歸方程系數(shù)表,根據(jù)多元回歸模型: ,通過SPSS作出的逐步回歸得到以上的結(jié)果,在統(tǒng)計(jì)顯著水平,則檢驗(yàn)值為2.201下,三個(gè)變量及常數(shù)項(xiàng)的檢驗(yàn)的絕對值分別為15.157,10.866,7.420其絕對值均大于2.201,說明

50、三個(gè)因子自變量的顯著性水平高. 可得到的最優(yōu)回歸方程為: .Trend值為該區(qū)域中1992年到2012年的模擬值. 該值可以通過最優(yōu)方程式得出,比如2012年的值為 ,由上結(jié)果可以看出誤差較小,其誤差百分比在以內(nèi)的占比比較大,說明模擬效果還可以. 求得的逐步回歸模型效果比較顯著. 4.5小 結(jié)通過SPSS操作最后得到的我國財(cái)政收入的預(yù)測方程式: , 再加上最后對數(shù)據(jù)的檢驗(yàn)可以得出人均國內(nèi)生產(chǎn)總值、城鎮(zhèn)居民家庭人均可支配收入、我國教育經(jīng)費(fèi)總投入對財(cái)政收入有顯著的影響. 從上面的操作可以看出變量通過初步的選取是不夠的,需要對所選自變量進(jìn)行檢驗(yàn),然后剔除未通過檢驗(yàn)的變量,所以在案例二較案例一的區(qū)別在

51、于多了一個(gè)逐步回歸分析. 即:眾所周知人均國內(nèi)生產(chǎn)總值,城鎮(zhèn)居民家庭人均可支配收入,全社會(huì)固定投資都是逐年變化的,這里表現(xiàn)出的城鎮(zhèn)居民家庭人均可支配收入為負(fù)指標(biāo),隨著社會(huì)的發(fā)展,中國的發(fā)展更是越來越迅速,這三個(gè)自變量之間存在著相對嚴(yán)密的關(guān)系. 第五章 總 結(jié)SPSS 是世界上最早采用圖形菜單驅(qū)動(dòng)界面的統(tǒng)計(jì)軟件,其最突出的特點(diǎn)就是操作界面極為友好,輸出結(jié)果美觀漂亮,是“統(tǒng)計(jì)產(chǎn)品與服務(wù)解決方案”軟件.對于那些常見的統(tǒng)計(jì)方法,SPSS的命令語句、子命令及選擇項(xiàng)的大部分都是由“對話框”的操作完成. 所以不需要花大量時(shí)間來記憶這些大量的命令、過程或選擇項(xiàng). 由以上SPSS的操作方法可以知道SPSS中有很

52、多的統(tǒng)計(jì)方法,適合專業(yè)的統(tǒng)計(jì)人員對數(shù)據(jù)進(jìn)行統(tǒng)計(jì)整理得出自己想要的結(jié)果. SPSS在得出的趨勢線以及變量之間的線性關(guān)系,需要自己用一元線性回歸的方法得出數(shù)據(jù)之間的系數(shù),然后自己把方程寫在趨勢線旁邊. 由兩個(gè)案例分析中可以看出在對數(shù)據(jù)計(jì)算結(jié)果如果需要更精確一點(diǎn),就需要通過對多元回歸分析的操作方法進(jìn)行對比可以知道,采用逐步回歸分析的方法對數(shù)據(jù)進(jìn)行處理,剔除沒有通過檢驗(yàn)的,對因變量影響不顯著的. 由以上案例中可以看到,多元回歸分析中變量的選擇不能靠簡單的自行篩選就可以,有時(shí)候?qū)τ谝恍┳兞康暮Y選都通過檢驗(yàn),并不能代表你在選擇數(shù)據(jù)上有多高明,而是需要通過相關(guān)性分析,計(jì)算復(fù)相關(guān)系數(shù)和偏相關(guān)系數(shù)來了解你所選的

53、變量之間的相關(guān)關(guān)系的大小,而變量之間存在線性關(guān)系和非線性關(guān)系需要通過散點(diǎn)圖的觀察來對變量之間關(guān)系進(jìn)行判斷. 在一些情況下,某些自變量的觀測數(shù)據(jù)的獲得代價(jià)十分貴,這些自變量可能對因變量的影響非常小,而我們把它引進(jìn)了模型中,勢必造成數(shù)據(jù)收集和模型的應(yīng)用不必要的加大.所以在回歸分析中,對進(jìn)入模型的自變量作精心的選擇是十分必要的. 所以我們在選擇回歸模型時(shí)一定要注意.而本文可以讓我們知道在多元回歸分析中變量的選擇中我們需要的是先選擇模型,案例一我們是對于非線性回歸模型轉(zhuǎn)化為線性回歸模型同時(shí)采用的是全模型進(jìn)行分析,案例二我們用得則是選模型,及在變量的選取上我們應(yīng)該如何去選擇. 相關(guān)系數(shù)以及方差分析就是很好檢驗(yàn)數(shù)據(jù)的方法,同時(shí)逐步回歸時(shí)對數(shù)據(jù)進(jìn)行剔除的一個(gè)很好方法. 從而可以看出所選的變量是否符合要求. 然后再通過回歸分析,看數(shù)據(jù)之間的值檢驗(yàn),是否通過值檢驗(yàn),如果兩個(gè)檢驗(yàn)均通過,說明說選定的變量在多元回歸分析中,自變量對因變量有顯著性影響,從而確定影響程度的大小,最后在通過檢驗(yàn)之后得到最優(yōu)方程式,這就是自變量與因變量之間的關(guān)聯(lián)方程式. 該方程式預(yù)測了我國淘寶注冊人數(shù),網(wǎng)絡(luò)普及度和居民消費(fèi)水平

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論