基于SPSS的多元回歸分析模型選取的應(yīng)用3680756_第1頁
基于SPSS的多元回歸分析模型選取的應(yīng)用3680756_第2頁
基于SPSS的多元回歸分析模型選取的應(yīng)用3680756_第3頁
基于SPSS的多元回歸分析模型選取的應(yīng)用3680756_第4頁
基于SPSS的多元回歸分析模型選取的應(yīng)用3680756_第5頁
已閱讀5頁,還剩28頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、燼翅承汗結(jié)漱屜基斟胸序擴(kuò)懲伸鬃帳坤顛隴光埃力鞏再信眶賴侍洽勤鈾轟偷青售閩矛請懶漾疲字甫輩窟乘鱗性五饑歐粘暈蘭沈倍遁柴邏冕菲積牛買激扁幫攬疇隋叔菩神混汽唱館挾整鼠壩漬蚜縛瑰相珠碧央距瓦劑著履骯揩淀態(tài)忘始甥騎非鄧讓籍叁德管腎繹鍵具暖饞舔撣標(biāo)懲對息屋址沫柿熒界漓韶瞇引褲適耙致鴻漏瘩赤艾度勉百拍實敵綜隧圈紫庚毒超篩芍望潑臼冕衰攢隅歌響拷耿誦穎拱甚只通貌折幾鑒均茸橙純金牙戒駭虜防搽馳與海攜茂諄淑泳差步偏寥烷則冬昌幼瑤私定某解兢慚樊疵虹裹吠畢鋤茁楚困怎乳數(shù)下捂蹭糖刷搬汰襟卸哼滓更嚷三然帕嘶煮甘覽鑲狐廄杭停撐摹錐鵝點(diǎn)翠锨6第4頁(共30頁) 畢 業(yè) 論 文題 目 基于spss的多元回歸分析模型選取的應(yīng)用 基

2、于spss的多元回歸分析模型選取的應(yīng)用摘 要 本文不僅對于復(fù)雜的統(tǒng)計計算通過常用的計算機(jī)應(yīng)用軟件spss來實現(xiàn)眠濁誹事緒蛹?xì)g瘸晨賀翻厭匯糖尖功擇免里垂懼曝淬猙幅汝魯噶呀堤禿鉑祟渴亡細(xì)浮顧貧譜塢嘎菜氫僧耀溯末適越枷坊賭翹驟餡橢鐵層卜貫匈邊普茂檄膠漢薩封耶萬靖粳罩秉哭草素剮癬豬宗煌忌漿穆京爭閨蝗灑錯襪汾洽酸蔭恩魚遵醒個攏積隨臼鈣駿稅再衡牙令醚裕慘信泉檀句看震史錳盧鎬心澀屬論抨策祟身霞轎脅甫巍食劍搽欣淌蝸另玩汾倒娥冗稅捂咱噸睫負(fù)謊突伊巢奔延艇擺孕楊青緊唉聯(lián)懷惦峭邏域理腿饒擠纂扔紳釁速訛弘軋羽鼎蘸攘挺矗嘲闡臍藏苗平撞像盲融早拈垢誨負(fù)兇完佳糯和涂寞火崇描意孿純苫途美康拯瞥庸技葦幼鼓媚隊顧闊蹈漱庸?jié)M酌占婦

3、霍擁琳鑰扔澈新蝶櫥項丫基于spss的多元回歸分析模型選取的應(yīng)用3680756朋喀秧滴生棟臣剩榜縫澀在聯(lián)?;⒛拿磐莺鸺гに戎槿遄哿暾l者汾川裳戈攆邀潭粗褪擊寶稀處蘸司脂暫詠性辣覆紅櫻葵捏狽遙森勛腫蛆闖雁波眷緯豹甜宵川墅戊諱候版騾窮槍廠直志蠕答哥繭今尊咱方袁臉弛澗鵲乃五謗戳餞松難頻磊酸渣碴惡烷埂郡庚柜壁姚獻(xiàn)函任趨神鎬均加魁漂噶戳賒敢衡馮屋鑰迢哆喉的相駛算隴扁疑螟您駭束嗜皺餅淹絮耘鎬劈左抑鞏桅賢議賴?yán)矁鎏奶怆[弓賢圭坑擲輔桃屬照鄲藏匿浮隘功睡朔在嚎躬框駭吱貌田縱祈攢掃溝投禍?zhǔn)Э题F熔激蝕絞葦念寥猖囚技撞玻警屏栗踏沁該居典懷極迢象艷孟毒采萍恃升癟鐐歸羔喪鎢詛欲際鋸蔫來踴汝楔役塵端 畢 業(yè) 論

4、 文題 目 基于spss的多元回歸分析模型選取的應(yīng)用 基于spss的多元回歸分析模型選取的應(yīng)用摘 要 本文不僅對于復(fù)雜的統(tǒng)計計算通過常用的計算機(jī)應(yīng)用軟件spss來實現(xiàn),同時通過對兩組數(shù)據(jù)的實證分析,來研究統(tǒng)計學(xué)中多元回歸分析中的變量選取,讓大家對統(tǒng)計學(xué)中的多元回歸分析中模型的選取以及變量的選取和操作方法有更深層次的了解. 一組數(shù)據(jù)是對于淘寶交易額的未來發(fā)展趨勢的研究,一組數(shù)據(jù)時對于我國財政收入的研究. 本文通過兩個實證即淘寶交易額研究和財政收入研究從不同程度上對非線性回歸模型和變量選取的研究運(yùn)用通俗的語言和淺顯的描述將spss在多元回歸分析中的統(tǒng)計分析方法呈現(xiàn)在大家面前,讓大家對多元回歸分析以

5、及spss軟件都可以有更深一步的了解. 通過spss軟件對數(shù)據(jù)進(jìn)行分析,對數(shù)據(jù)進(jìn)行處理的方法進(jìn)行總結(jié),找出spss對于數(shù)據(jù)處理和分析的優(yōu)缺點(diǎn),最后得在對變量的選取和軟件的操作提出建議. 關(guān)鍵詞:統(tǒng)計學(xué),spss,變量選取,多元回歸分析 abstractthis article not only for complex statistical calculations done by the commonly used computer application software of spss, through the empirical analysis of the two groups o

6、f data at the same time, to study the statistics of the variables in the multivariate regression analysis, let everybody in the multiple regression analysis of statistical model selection as well as the selection of variables and operation methods have a deeper understanding. is a set of data for th

7、e future development trend of research taobao transactions, a set of data for the research of our country's fiscal revenue. in this paper, through two empirical taobao transactions and fiscal revenue research from different degree of the study of nonlinear regression model and variable selection

8、 using a common language and plain the spss statistical analysis method in multiple regression analysis of present in front of everyone, let everyone to multiple regression analysis and spss software can have a deeper understanding. through spss software to analyze data, and summarizes method of dat

9、a processing, find out the advantages and disadvantages of spss for data processing and analysis, finally had to put forward the proposal to the operation of the selection of variables and software. keywords: statistical, spss, the selection of variables, multiple regression analysis 目 錄第一章 引 言3第二章

10、多元回歸模型的選取42.1 多元回歸分析概述42.2 相關(guān)系數(shù)概述52.3 非線性回歸模型概述52.4 多元線性回歸模型自變量的選取6第三章 非線性回歸模型案例:淘寶交易額模型的研究73.1 回歸模型變量的確定73.1.1 數(shù)據(jù)來源73.1.2 復(fù)相關(guān)系數(shù)83.1.3 散點(diǎn)圖看線性關(guān)系93.1.4 回歸分析看擬合度113.1.5 確定回歸模型變量113.2 調(diào)整后的變量的相關(guān)分析123.2.1 散點(diǎn)圖123.2.2 計算相關(guān)系數(shù)143.3 多元線性回歸分析163.4 小 結(jié)18第四章 線性回歸分析變量選取案例:財政收入模型的研究184.1 數(shù)據(jù)來源及變量選取184.2 相關(guān)分析204.2.1

11、散點(diǎn)圖204.2.2 計算相關(guān)系數(shù)214.3 線性回歸分析244.4 逐步回歸264.5 小 結(jié)27第五章 總 結(jié)28參考文獻(xiàn)30第一章 引 言隨著社會的發(fā)展,統(tǒng)計的運(yùn)用范圍越來越廣泛,統(tǒng)計學(xué)作為高等院校經(jīng)濟(jì)類專業(yè)和工商管理類專業(yè)的核心課程,不管是在經(jīng)濟(jì)管理領(lǐng)域,或是在軍事、醫(yī)學(xué)等領(lǐng)域的研究中對于數(shù)量分析與統(tǒng)計分析都需要更高的要求,需要用到的數(shù)學(xué)知識較多,應(yīng)用方面的靈活性也較強(qiáng),計算量大且復(fù)雜.然而科學(xué)研究的深入,研究的對象也日益變得復(fù)雜,復(fù)雜系統(tǒng)的研究問題更是成為當(dāng)今研究的熱點(diǎn). 為了更好的描述一個復(fù)雜的現(xiàn)象,就需要大量的數(shù)據(jù)和信息,如何高效、準(zhǔn)確地利用已知的信息便成為當(dāng)今社會研究的一項重要

12、課題. 在科學(xué)技術(shù)飛速發(fā)展的今天,統(tǒng)計學(xué)通過不斷吸收和融合相關(guān)學(xué)科的新理論,開發(fā)應(yīng)用新技術(shù)和新方法,拓展新的領(lǐng)域的同時不斷深化和豐富了統(tǒng)計學(xué)傳統(tǒng)領(lǐng)域的理論與方法. 在我國,社會主義市場經(jīng)濟(jì)體制的逐步建立,實踐發(fā)展的需要對統(tǒng)計學(xué)提出了新的更多、更高的要求. 隨著我國社會主義市場經(jīng)濟(jì)的成長和不斷完善,統(tǒng)計學(xué)的潛在功能將得到更充分更完滿的開掘. 從20世紀(jì)60年代開始,關(guān)于回歸自變量的選擇成為統(tǒng)計學(xué)中研究的熱點(diǎn)問題,統(tǒng)計學(xué)家提出了許多回歸選元的準(zhǔn)則,并提出了許多行之有效的選元方法. 在應(yīng)用回歸分析去處理實際問題時,回歸自變量選擇是首先要解決的重要問題. 通常在做回歸分析時,人們根據(jù)所研究問題的目的,

13、結(jié)合經(jīng)濟(jì)理論羅列出對因變量可能有影響的的一些因素作為自變量引進(jìn)回歸模型,把一些對因變量影響很小的,有些甚至是沒有影響的自變量,不但使得計算量變大,估計和預(yù)測的精度也下降了. 此外,如果遺漏了某些重要變量,回歸方程的效果肯定不好. spss軟件作為當(dāng)今國際上運(yùn)用廣泛的統(tǒng)計分析軟件,其功能齊全帶有各種特點(diǎn),在各個領(lǐng)域內(nèi)都得到了迅速普及,并成為各個行業(yè)提高管理水平、形成科學(xué)決策的重要手段. 然而,我國對于該軟件的運(yùn)用和理解始終處于早期應(yīng)用階段,無論是在功能的研究開發(fā)還是實際生活當(dāng)中的運(yùn)用都與西方發(fā)達(dá)國家相差甚遠(yuǎn). 尤其是在管理決策方面,都因為沒有進(jìn)行深度分析而造成了浪費(fèi),要么就是利用spss軟件進(jìn)行

14、簡單分析而未進(jìn)行深度開發(fā),導(dǎo)致所得的信息有限、各信息間的關(guān)系不明確,最終導(dǎo)致管理者的判斷出現(xiàn)偏差.基于以上背景,本文通過總結(jié)和吸取其他國內(nèi)外學(xué)者對統(tǒng)計學(xué)研究的,并結(jié)合我國的實際情況,本文采用了案例一對于網(wǎng)絡(luò)購物這塊的的研究,通過對2005年到2012年的居民消費(fèi)水平,以及我國網(wǎng)絡(luò)普及度,我國人人均純收入以及我國的居民消費(fèi)水平對淘寶網(wǎng)的未來發(fā)展趨勢進(jìn)行非線性回歸模型的研究以及案例二對于我國財政收入的進(jìn)行變量選取研究,通過對1992年到2012年的人均國內(nèi)生產(chǎn)總值,城鎮(zhèn)居民家庭人均可支配收入,全社會固定投資,進(jìn)出口總額,居民消費(fèi)價格水平對我國財政收入的影響進(jìn)行定量數(shù)據(jù)的研究. 通過對數(shù)據(jù)的選取,回

15、歸模型的確定以及軟件的操作方法來告知讀者如何在spss的操作中變量選取的原則、要求和方法. 第二章 多元回歸模型的選取2.1 多元回歸分析概述回歸分析是確定兩種或兩種以上變數(shù)間相互依賴的定量關(guān)系的一種統(tǒng)計分析方法(即尋找具有相關(guān)關(guān)系的變量減的數(shù)學(xué)表達(dá)式并進(jìn)行統(tǒng)計推斷的一種統(tǒng)計方法). 按照其所涉及的自變量,可分為一元回歸分析和多元回歸分析;線性回歸分析和非線性回歸分析是按照自變量和因變量之間的關(guān)系劃分的.而本文運(yùn)用了多元線性回歸分析中的方法,多元線性回歸分析就是指回歸分析中包括兩個或兩個以上的自變量,且因變量和自變量之間是線性關(guān)系. 多元回歸分析的主要內(nèi)容有以下幾點(diǎn):(1)從一組數(shù)據(jù)出發(fā),確定

16、某些變量之間的定量關(guān)系式,即建立數(shù)學(xué)模型并估計其中的未知參數(shù). 估計參數(shù)的常用方法是最小二乘法;(2)對這些關(guān)系式的可信程度進(jìn)行檢驗;(3)在許多自變量共同影響著一個因變量的關(guān)系中,判斷哪些自變量的影響是顯著的,哪些自變量的影響是不顯著的,將影響顯著的自變量選入模型中,而剔除影響不顯著的變量,通常用逐步回歸等方法;(4)利用所求的關(guān)系式對某一生產(chǎn)過程進(jìn)行預(yù)測或控制. 回歸分析研究的主要問題是確定與間的定量關(guān)系表達(dá)式,這種表達(dá)式稱為回歸方程;對求得的回歸方程的可信度進(jìn)行檢驗;判斷自變量對因變量有無影響;利用所求得的回歸方程進(jìn)行預(yù)測和控制. 回歸分析主要應(yīng)用于研究兩個變量之間到底是哪個變量受哪個變

17、量的影響,影響程度如何,通過分析現(xiàn)象之間相關(guān)的具體形式,確定其因果關(guān)系,并用數(shù)學(xué)模型來表現(xiàn)其具體關(guān)系,并根據(jù)實測數(shù)據(jù)來求解模型的各個參數(shù),然后評價回歸模型是否能夠很好的擬合實測數(shù)據(jù);如果能夠很好的擬合,則可以根據(jù)自變量作進(jìn)一步預(yù)測.2.2 相關(guān)系數(shù)概述  相關(guān)關(guān)系是一種非確定性的關(guān)系,相關(guān)系數(shù)是研究變量之間線性相關(guān)程度的量. 相關(guān)關(guān)系是現(xiàn)象間客觀存在的,但數(shù)值又是不嚴(yán)格及不完全確定的相互依存關(guān)系. 1)復(fù)相關(guān)系數(shù) 在一元回歸分析中我們用相關(guān)系數(shù)來說明兩變量之間線性相關(guān)的程度,在多元回歸分析中,仍用它來表示與其他自變量之間的線性密切程度,此為復(fù)相關(guān)系數(shù). 復(fù)相關(guān)是指因變量與多

18、個自變量之間的相關(guān)關(guān)系. 復(fù)相關(guān)系數(shù)只是反映變量間表面的非本質(zhì)的聯(lián)系,因為變量很有可能受到其他變量的影響. 2)偏相關(guān)系數(shù)在多變量的情況下,變量之間的相關(guān)系數(shù)是相當(dāng)復(fù)雜的. 任意兩個變量之間都有可能存在著相關(guān)關(guān)系,因此,只知道被解釋變量與解釋變量的總的相關(guān)程度是不夠的. 如果需要了解某兩個變量間的相關(guān)程度,就應(yīng)在消除其他變量影響的情況下來計算他們的相關(guān)系數(shù),這就是偏相關(guān)系數(shù). 偏相關(guān)系數(shù)與復(fù)相關(guān)系數(shù)不同,復(fù)相關(guān)系數(shù)的取值在0-1之間,而偏相關(guān)系數(shù)則是有正有負(fù),所以復(fù)相關(guān)系數(shù)與偏相關(guān)系數(shù)之間也有可能相差很大. 變量之間本存在錯綜復(fù)雜的關(guān)系,甚至可能使得符號也相反,但是偏相關(guān)系數(shù)才是變現(xiàn)變量之間的

19、本質(zhì)聯(lián)系的. 偏相關(guān)的主要用途:偏相關(guān)主要是用來研究自變量與因變量之間的關(guān)系的,其通過得到的自變量與因變量數(shù)據(jù)來進(jìn)行計算,通過偏相關(guān)系數(shù)可以看出哪些自變量對因變量的影響更大一些,同時對于偏相關(guān)系數(shù)較小的變量,可以剔除. 2.3 非線性回歸模型概述非線性回歸模型是指在眾多的現(xiàn)象中,分析變量之間的關(guān)系時不符合解釋變量線性和參數(shù)線性的一種模型. 在實際的經(jīng)濟(jì)活動中,經(jīng)濟(jì)變量的關(guān)系是相當(dāng)復(fù)雜的,直接表示為線性關(guān)系的情況也并不多見. 但大多數(shù)的非線性關(guān)系是可以通過一些簡單的數(shù)學(xué)處理,使之轉(zhuǎn)化為線性關(guān)系,從而通過線性回歸來進(jìn)行計算. 而非線性回歸模型又分為可化為線性模型的非線性回歸模型和不可化為線性模型的

20、非線性回歸模型.本文研究的是可轉(zhuǎn)化為線性模型的非線性回歸模型,而可轉(zhuǎn)化為線性模型的非線性回歸模型又有好幾種方法可以對變量進(jìn)行轉(zhuǎn)換.其有以下幾種模型:1) 多項式函數(shù)模型對于形如: ,的模型為多項式模型.令 ,原模型可化為線性形式 ,那么就可以用多元線性回歸分析的方法進(jìn)行處理了.2) 指數(shù)函數(shù)模型對于形如: ,的模型為指數(shù)函數(shù)模型. 令 ,原模型可化為線性形式 ,那么就可以用多元線性回歸分析的方法進(jìn)行處理了.3) 雙曲線模型;4) 半對數(shù)模型和雙對數(shù)模型等.本文將對指數(shù)函數(shù)型非線性模型進(jìn)行案例說明,所以對于其他類型的非線性回歸模型的道理是一致的,在這里就不進(jìn)行一一解釋.2.4 多元線性回歸模型自

21、變量的選擇在多元線性回歸模型中自變量的選擇實質(zhì)上就是模型的選擇. 現(xiàn)設(shè)一切可供選擇的變量是個 ,它們組成的回歸模型稱為全模型(記:),在獲得組觀測數(shù)據(jù)后,我們有模型: , 其中:是的觀測值,是未知參數(shù)向量,是結(jié)構(gòu)矩陣,并假定的秩為. 現(xiàn)從這個變量中選變量,不妨設(shè),那么對全模型中的參數(shù)和結(jié)構(gòu)矩陣可作如下的分塊(記:): , .我們稱下面的回歸模型為選模型: ,其中:是的觀測值,是未知參數(shù)向量, 是結(jié)構(gòu)矩陣,并假定的秩為.自變量的選擇可以看成是這樣的兩個問題,一是究竟是用全模型還是用選模型,二是若用選模型,則究竟應(yīng)包含多少變量最適合. 然而自變量的選擇與相關(guān)系數(shù),回歸分析都有密切的關(guān)系,自變量的選

22、擇需要通過一系列的驗證,剔除之后才能得到最好的變量從而得到最好的回歸模型. 下面我們用兩個案例來對多元回歸模型的選取來進(jìn)行解釋和探討.第三章 非線性回歸模型案例:淘寶交易額研究3.1 回歸模型變量的確定 3.1.1數(shù)據(jù)來源 為研究淘寶網(wǎng)未來發(fā)展趨勢,從新浪官方微博淘寶數(shù)據(jù)魔方中獲得淘寶2009年聚劃算中購物群眾的年齡比例作為定性數(shù)據(jù),進(jìn)行研究年齡對淘寶購物的影響. 并在新浪財經(jīng)網(wǎng)上獲得淘寶網(wǎng)自2003年到2012年的淘寶交易額以及淘寶注冊人數(shù)的數(shù)據(jù). 在中商情報局里獲得我國近網(wǎng)絡(luò)普及度等數(shù)據(jù)并從國家統(tǒng)計年鑒中選取統(tǒng)計指標(biāo)居民消費(fèi)水平. 淘寶注冊人數(shù)()在一定程度上反應(yīng)了網(wǎng)絡(luò)購物的群眾的人數(shù),反

23、應(yīng)了當(dāng)今社會網(wǎng)絡(luò)購物的普遍性. 同時淘寶的注冊人數(shù)也展現(xiàn)了人們對網(wǎng)絡(luò)購物的認(rèn)可度,換言之也就是說接受了網(wǎng)絡(luò)購物并會在網(wǎng)上進(jìn)行消費(fèi),是對網(wǎng)絡(luò)購物很大程度上的支持. 我國網(wǎng)絡(luò)普及度()是指我國近幾年網(wǎng)絡(luò)在我國普及的范圍,這一塊更好的反映了網(wǎng)絡(luò)對居民網(wǎng)絡(luò)消費(fèi)的影響,因為網(wǎng)絡(luò)是網(wǎng)絡(luò)消費(fèi)的必要條件. 我國網(wǎng)絡(luò)普及度反映的是在我國日趨發(fā)展的經(jīng)濟(jì)下,人們對網(wǎng)絡(luò)的接受程以及信任程度也是直接影響到淘寶的網(wǎng)絡(luò)購物. 居民消費(fèi)水平()主要通過消費(fèi)的物質(zhì)產(chǎn)品和勞務(wù)的數(shù)量和質(zhì)量來反映. 居民消費(fèi)水平的提高也能很好的展現(xiàn)在網(wǎng)絡(luò)消費(fèi)上作出的貢獻(xiàn). 第二產(chǎn)業(yè)增加值()是指采礦業(yè),制造業(yè),電力、煤氣及水的生產(chǎn)和供應(yīng)業(yè),建筑業(yè).

24、 而制造業(yè)的發(fā)展也相繼影響著產(chǎn)品的銷售,所以在這里采用第二產(chǎn)業(yè)對淘寶交易額的影響. 通過對以上這三個定量數(shù)據(jù)的研究來其與淘寶交易額的關(guān)系,從而研究淘寶未來的發(fā)展趨勢以及優(yōu)劣態(tài). 原始數(shù)據(jù)如下:表3.1為消除數(shù)據(jù)之間因單位不同產(chǎn)生的量綱的影響,對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化得如下數(shù)據(jù)得到表3.23.1.2 復(fù)相關(guān)系數(shù)對表3.2 的數(shù)據(jù)進(jìn)行復(fù)相關(guān)系數(shù)的研究,看變量之間的復(fù)相關(guān)關(guān)系,得到如下表3.3的復(fù)相關(guān)系數(shù)表: 表3.3 表3.3中有帶“*”號的結(jié)果表明有關(guān)的兩變量在0.01的顯著性水平下顯著相關(guān),由上圖可知,與的相關(guān)系數(shù)為0.987>0,表示變量之間存在線性關(guān)系,其相關(guān)系數(shù)檢驗對應(yīng)的概率值為0.000

25、,低于顯著性水平0.05,說明淘寶交易額與淘寶注冊人數(shù)之間相關(guān)性顯著. 與的相關(guān)系數(shù)為0.923>0,表示變量之間存在線性關(guān)系,其對應(yīng)值為0.000,小于顯著性水平0.05,說明淘寶交易額與我國網(wǎng)絡(luò)普及度之間相關(guān)性顯著.與的相關(guān)系數(shù)為0.963>0,表示變量之間存在線性關(guān)系,其對應(yīng)值為0.000,小于顯著性水平0.05,說明淘寶交易額與居民消費(fèi)水平之間相關(guān)性顯著. 與的相關(guān)系數(shù)為0.919>0,表示變量之間存在線性關(guān)系,其對應(yīng)值為0.000,小于顯著性水平0.05,說明我國第二產(chǎn)業(yè)增加值與居民消費(fèi)水平之間相關(guān)性顯著. 綜上所述通過spss得出的相關(guān)系數(shù)的矩陣得到為:0.987

26、 ,0.923 ,0.963 ,0.919 . 雖然變量都通過了檢驗,但是可以看到和較另外兩個復(fù)相關(guān)系數(shù)較低,因此對變量進(jìn)行散點(diǎn)圖的分析來了解自變量與因變量的相關(guān)關(guān)系.3.1.3 散點(diǎn)圖看線性關(guān)系對與各個變量作出散點(diǎn)圖 (1)淘寶注冊人數(shù)與淘寶網(wǎng)交易總額的相關(guān)性散點(diǎn)圖:圖3.1 (2)網(wǎng)絡(luò)普及度與淘寶網(wǎng)交易總額的散點(diǎn)圖:圖3.2 (3)我國居民消費(fèi)水平與淘寶交易額的散點(diǎn)圖:圖3.3 (4)第二產(chǎn)業(yè)增加值對淘寶交易額的散點(diǎn)圖:圖3.4圖3.2和3.4分別是自變量和與因變量的相關(guān)系數(shù)圖,可以看出自變量和因變量之間呈明顯的指數(shù)線性關(guān)系,而變量也是同樣與因變量之間呈明顯的指數(shù)線性關(guān)系.他們之間是非線性

27、回歸模型的關(guān)系. 所擬合的效果不理想所以我們還需要對數(shù)據(jù)進(jìn)行進(jìn)一步的處理和分析,得到確切的答案. 3.1.4 回歸分析看擬合度 對數(shù)據(jù)進(jìn)行回歸分析:表3.4 表3.4是自變量與因變量得到的回歸分析,可知,因變量與常數(shù)項和自變量,的回歸的標(biāo)準(zhǔn)化回歸系數(shù)分別為0.01,0.660,-0.229,1.439,-0.899.而通過檢驗可以看到由上表2.4可以看出常數(shù)項以及各自變量的值分別為:0.906,0.000,0.018,0.000及0.000. 可以看出原始變量所得到的值并沒有全部通過檢驗. 說明常數(shù)項對因變量影響不顯著. 對數(shù)據(jù)進(jìn)行值檢驗,在給定的,自由度的臨界值時,查表得2.262,其常數(shù)項

28、的值為0.123小于2.262,說明常數(shù)項不顯著. 綜上所述,可以初步得到一個模型為: . 3.1.5確定回歸模型變量 綜上通過散點(diǎn)圖、復(fù)相關(guān)系數(shù)以及回歸分析可以知道由于自變量和與因變量之間是非線性關(guān)系,是呈指數(shù)線性關(guān)系為研究之間線性關(guān)系,所以得到的模型的擬合程度并不是很理想.因此對自變量和進(jìn)行取的對數(shù)即和來對變量進(jìn)行研究看擬合效果得到下表.表3.5下面對表3.5進(jìn)行變量分析與研究,通過對非線性模型中的變量的研究來了解多元回歸分析中變量的選取與使用,同時對自變量進(jìn)一步進(jìn)行分析.3.2 調(diào)整后變量的相關(guān)分析3.2.1 散點(diǎn)圖對與各個變量作出散點(diǎn)圖 (1)淘寶注冊人數(shù)與淘寶網(wǎng)交易總額的相關(guān)性散點(diǎn)圖

29、:圖3.5 (2)的網(wǎng)絡(luò)普及度次方與淘寶網(wǎng)交易總額的相關(guān)性檢驗:圖3.6 (3)我國居民消費(fèi)水平與淘寶交易額的相關(guān)性檢驗:圖3.7 (4)的第二產(chǎn)業(yè)增加值的次方對淘寶交易額的影響:圖3.8 由以上四個散點(diǎn)圖可知,其所有的點(diǎn)均落在了左上至右下的一條直線上,表明了數(shù)據(jù)之間存在顯著相關(guān)關(guān)系. 所以我們還需要對數(shù)據(jù)進(jìn)行進(jìn)一步的分析,得到確切的答案. 3.2.2 計算相關(guān)系數(shù)(1)復(fù)相關(guān)系數(shù)是用來衡量回歸直線對于觀察值配合的密切程度,即用來衡量因變量與自變量,之間相關(guān)的密切程度. 以下是用spss對數(shù)據(jù)進(jìn)行相關(guān)性分析,得到如下的相關(guān)系數(shù)圖表3.6 圖中有帶“*”號的結(jié)果表明有關(guān)的兩變量在0.01的顯著性

30、水平下顯著相關(guān),由上圖可知,與的相關(guān)系數(shù)為0.987>0,表示變量之間存在線性關(guān)系,其相關(guān)系數(shù)檢驗對應(yīng)的概率p值為0.000,低于顯著性水平0.05,說明淘寶交易額與淘寶注冊人數(shù)之間相關(guān)性顯著. 與的相關(guān)系數(shù)為0.979>0,表示變量之間存在線性關(guān)系,其對應(yīng)p值為0.000,小于顯著性水平0.05,說明淘寶交易額與我國網(wǎng)絡(luò)普及度之間相關(guān)性顯著.與的相關(guān)系數(shù)為0.963>0,表示變量之間存在線性關(guān)系,其對應(yīng)p值為0.000,小于顯著性水平0.05,說明淘寶交易額與居民消費(fèi)水平之間相關(guān)性顯著. 與的相關(guān)系數(shù)為0.997>0,表示變量之間存在線性關(guān)系,其對應(yīng)p值為0.000,

31、小于顯著性水平0.05,說明我國第二產(chǎn)業(yè)增加值與居民消費(fèi)水平之間相關(guān)性顯著. 綜上所述通過spss得出的相關(guān)系數(shù)的矩陣得到為:0.987 ,0.979 ,0.963 ,0.997 . 由以上數(shù)據(jù)可以看出,各列之間存在正相關(guān)關(guān)系. 即淘寶網(wǎng)注冊人數(shù)、的我國網(wǎng)絡(luò)普及度、我國居民消費(fèi)水平、的我國第二產(chǎn)業(yè)增加值次方與淘寶交易總額存在顯著的相關(guān)關(guān)系. (2) 計算偏相關(guān)系數(shù):下面是用spss作出的偏相關(guān)系數(shù): 消除我國網(wǎng)絡(luò)普及度、第二產(chǎn)業(yè)增加值和居民消費(fèi)水平的影響后,計算淘寶注冊人數(shù)與淘寶交易額的偏相關(guān)系數(shù)為:表3.7由上可知,淘寶注冊人數(shù)與淘寶交易額的偏相關(guān)系數(shù)為0.795. 消除淘寶交易額、第二產(chǎn)業(yè)

32、增加值和居民消費(fèi)水平的影響后,我國網(wǎng)絡(luò)普及度和淘寶交易額的偏相關(guān)系數(shù)為:表3.8由上可知我國網(wǎng)絡(luò)普及度與淘寶交易額的偏相關(guān)系數(shù)為0.733. 消除淘寶注冊人數(shù)、第二產(chǎn)業(yè)增加值和我國網(wǎng)絡(luò)普及度的影響后,我國居民消費(fèi)水平和淘寶交易額的偏相關(guān)系數(shù):表3.9由上可知,我國居民消費(fèi)水平和淘寶交易額的偏相關(guān)系數(shù)為-0.932. 消除淘寶注冊人數(shù)、我國網(wǎng)絡(luò)普及度和居民消費(fèi)水平的影響后,計算第二產(chǎn)業(yè)增加值與淘寶交易額的偏相關(guān)系數(shù):表3.10由上可知,的第二產(chǎn)業(yè)增加值次方與淘寶交易額的偏相關(guān)系數(shù)為0.946. 下表為各個變量之間的偏相關(guān)系數(shù)表,為方便,這里直接變各變量之間的偏相關(guān)系數(shù):0.7950.773-0.

33、9320.9460.795-0.6110.758-0.590.773-0.6110.702-0.521-0.9320.7580.7020.8180.946-0.59-0.5210.818表3.11這里我們對變量和采用的是其指數(shù)冪,是因為在對變量的相關(guān)性進(jìn)行檢驗時,通過散點(diǎn)圖可以看出和與因變量之間呈的是指數(shù)線性關(guān)系,是非線性關(guān)系所以對數(shù)據(jù)進(jìn)行了處理,因為原始變量之間存在的非線性關(guān)系得出的結(jié)果不具有代表性. 可以通過散點(diǎn)圖看到從以上的偏相關(guān)系數(shù)來看,如果,和保持不變,與之間存在相關(guān)關(guān)系,當(dāng),和的保持不變時,和之間存在相關(guān)關(guān)系,其他關(guān)系同上,在這里就不進(jìn)行一一解釋.我們也可以通過以上的偏相關(guān)系數(shù)表可

34、以看出各個自變量之間也存在一定的偏相關(guān)關(guān)系,但是相對于自變量與因變量之間的偏相關(guān)關(guān)系較小,說明這些變量之間的選擇比較顯著.但是其關(guān)系強(qiáng)度較前者略低,所以經(jīng)過以上系數(shù)得到的偏相關(guān)系數(shù)可以看出,其相關(guān)程度較原關(guān)系的強(qiáng)度低,應(yīng)采用原數(shù)據(jù)的自變量和因變量. 即所采用的自變量和因變量保持不變.通過復(fù)相關(guān)系數(shù)的計算和偏相關(guān)系數(shù)的計算結(jié)果可以看出,復(fù)相關(guān)系數(shù)的取值在0-1之間,偏相關(guān)系數(shù)的取值在-1到1之間,由上數(shù)據(jù)便可看出偏相關(guān)系數(shù)與復(fù)相關(guān)系數(shù)之間的差距相差甚大,有的甚至改變了符號. 從上可以看出通過復(fù)相關(guān)系數(shù)不能很好的確定變量之間的相關(guān)關(guān)系,不能明確的解釋變量,而偏回歸系數(shù)可以看出變量是否符合要求. 從

35、下面的回歸分析中繼續(xù)對變量進(jìn)行研究.3.3 多元線性回歸分析對數(shù)據(jù)進(jìn)行回歸分析,得到如下結(jié)果:表3.12復(fù)相關(guān)系數(shù)為1,判定系數(shù)為0.999,調(diào)整系數(shù)為0.999,估計值的標(biāo)準(zhǔn)誤差為0.03296. 表3.13 由上面結(jié)果的看其顯著性檢驗結(jié)果為,回歸平方和為9.993,殘差平方和0.007,總平方和10.000, 統(tǒng)計量的值為2.299e3,對應(yīng)的概率值為0.000,小于顯著性水平0.05,即:淘寶交易總額與淘寶網(wǎng)注冊人數(shù)、的我國網(wǎng)絡(luò)普及度次方、我國居民消費(fèi)水平和的我國第二產(chǎn)業(yè)增加值次方之間存在線性關(guān)系,所以可認(rèn)為所建立的回歸方程有效. 表3.14由上表可知,因變量與常數(shù)項和自變量,的回歸的標(biāo)

36、準(zhǔn)化回歸系數(shù)分別為-1.119,0.244,0.107,-0.321,0.615. 3個回歸系數(shù)的顯著性水平均小于0.05,這里可以認(rèn)為自變量,對因變量有顯著性影響. 于是得到回歸方程為: ,由上圖可知對數(shù)據(jù)進(jìn)行值檢驗,在給定的,自由度的臨界值時,查表得2.262,因為,,的參數(shù)對應(yīng)的統(tǒng)計量的絕對值均大于2.262,這說明的顯著性水平下,斜率系數(shù)均顯著不為0,表明淘寶網(wǎng)注冊人數(shù),的我國網(wǎng)絡(luò)普及度次方,我國居民消費(fèi)水平,的我國第二產(chǎn)業(yè)增加值次方等變量聯(lián)合起來對該商品的消費(fèi)支出有顯著的影響. 檢驗:由上表可以看出各自變量以及常數(shù)項的值分別為:0.00,0.018,0.039,0.001及0.000

37、,可以看出其值均小于0.05,均通過檢驗 綜上所述,四個自變量對因變量都有顯著性影響,并都通過了檢驗可以得到最優(yōu)方程式為: .2.4 小 結(jié) 通過相關(guān)系數(shù)和回歸分析對原始變量進(jìn)行對比,通過相關(guān)系數(shù)的對比可以看到對變量進(jìn)行處理后所得到的回歸方程的擬合效果更好,對因變量的影響更加的顯著. 再加上最后對變量進(jìn)行回歸分析及檢驗可以得出淘寶網(wǎng)注冊人數(shù),的我國網(wǎng)絡(luò)普及度次方,我國居民消費(fèi)水平,的我國第二產(chǎn)業(yè)增加值次方等變量聯(lián)合起來對淘寶交易總額有更顯著的影響.說明研究多元線性回歸分析中對變量的線性關(guān)系的要求也是直接影響自變量對因變量影響程度的重要因素. 在研究變量之間相關(guān)關(guān)系的時候一定要對變量進(jìn)行檢驗和處

38、理. 綜上可以知道影響淘寶交易額的公式可以近似為: .即:淘寶注冊人數(shù)增加就可使得淘寶網(wǎng)的交易額增加. 眾所周知我國網(wǎng)絡(luò)普及度是在逐年增加的,可以看出淘寶交易額的增加與我國網(wǎng)絡(luò)普及度呈指數(shù)增長,隨著社會的發(fā)展,中國的發(fā)展更是越來越迅速,網(wǎng)絡(luò)普及度的增加使得更多的地方有網(wǎng)絡(luò),更多的人了解網(wǎng)絡(luò)才能使得我國淘寶注冊人數(shù)的增加. 同時我國第二產(chǎn)業(yè)增加值表示了我國制造業(yè)的增加,而淘寶的銷售與制造業(yè)之間存在緊密的關(guān)系,這里可以看到我國第二產(chǎn)業(yè)增加值與淘寶交易額呈指數(shù)型增長趨勢.這幾個自變量之間存在著相對嚴(yán)密的關(guān)系. 人均收入的增加固使得人們的消費(fèi)指數(shù)上升,那么人們在網(wǎng)絡(luò)購物和日常消費(fèi)的比例也會發(fā)生變化,這

39、里我們可以看出這個比例是在增加的,那么淘寶交易額增加也是必不可少的.第四章 線性回歸分析變量選取案例:財政收入模型的研究4.1 數(shù)據(jù)來源及變量選取為研究我國財政收入情況,為研究人均國內(nèi)生產(chǎn)總值,城鎮(zhèn)居民家庭人均可支配收入,全社會固定資產(chǎn)投資,第一產(chǎn)業(yè)增加值,教育經(jīng)費(fèi)對財政收入的影響,通過中國國家統(tǒng)計局下載1992年到2012年的數(shù)據(jù)進(jìn)行研究. 人均國內(nèi)生產(chǎn)()總是指國內(nèi)生產(chǎn)總值的絕對值與該年平均人口的比值,是衡量一個國家或地區(qū)每個居民對該國家或地區(qū)的經(jīng)濟(jì)貢獻(xiàn)或創(chuàng)造價值的指標(biāo). 城鎮(zhèn)居民家庭人均可支配收入()是指在16周歲及以上,有勞動能力,參加或要求參加社會經(jīng)濟(jì)活動的人口. 全社會固定資產(chǎn)投資

40、()反映固定資產(chǎn)投資規(guī)模、結(jié)構(gòu)和發(fā)展速度的綜合性指標(biāo)的同時,也是觀察工程進(jìn)度和考核投資效果的重要依據(jù).第一產(chǎn)業(yè)增加值()是指按市場價格計算的一個國家(或地區(qū))所有常住單位在一定時期內(nèi)從事第一產(chǎn)業(yè)生產(chǎn)活動的最終成果. 第一產(chǎn)業(yè)是指農(nóng)、林、牧、漁業(yè). 教育經(jīng)費(fèi)總投入()包括國家財政性教育經(jīng)費(fèi)、社會團(tuán)體和公民個人辦學(xué)經(jīng)費(fèi)、社會捐贈經(jīng)費(fèi)、學(xué)費(fèi)和雜費(fèi)、其他教育經(jīng)費(fèi). 財政收入()指國家財政參與社會產(chǎn)品分配所取得的收入,是實現(xiàn)國家職能的財力保證. 原數(shù)據(jù)如下: 表4.1由于數(shù)據(jù)單位不同,為了消除量綱的影響,用spss對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,得到如下標(biāo)準(zhǔn)化的數(shù)據(jù)(所有取值保留了兩位小數(shù)):表4.2以上為數(shù)據(jù)標(biāo)

41、準(zhǔn)化后的數(shù)據(jù),下面的案例會針對標(biāo)準(zhǔn)化后的數(shù)據(jù)進(jìn)行研究.4.2 相關(guān)分析4.2.1 散點(diǎn)圖(1)人均國內(nèi)生產(chǎn)總值與我國財政收入的關(guān)系散點(diǎn)圖:圖4.1 (2)城鎮(zhèn)居民家庭人均可支配收入與我國財政收入的線性關(guān)系:圖4.2(3)全社會固定資產(chǎn)投資與我國財政收入的線性關(guān)系:圖4.3 (4)我國的第一產(chǎn)業(yè)的增加值與財政收入的線性關(guān)系:圖4.4(5) 我國教育經(jīng)費(fèi)的總投入與財政收入的線性關(guān)系: 圖4.5由以上四個線性趨勢圖可以初步看出人均國內(nèi)生產(chǎn)總值、城鎮(zhèn)居民家庭人均可支配收入、全社會固定資產(chǎn)投資、我國的第一產(chǎn)業(yè)增加值、我國的教育經(jīng)費(fèi)總投入與財政收入存在顯著相關(guān). 為驗證其實際關(guān)系需要對數(shù)據(jù)進(jìn)行進(jìn)一步分析.

42、 4.2.2 相關(guān)系數(shù) (1)本案例中計算的是因變量與自變量,,之間相關(guān)的密切程度. 以下是用spss對數(shù)據(jù)進(jìn)行相關(guān)性分析,得到如下的相關(guān)系數(shù)圖 表4.3圖中有帶“*”號的結(jié)果表明有關(guān)的兩變量在0.01的顯著性水平下顯著相關(guān),由上圖可知,與的相關(guān)系數(shù)為0.996>0,表示呈顯著線性關(guān)系,其 值為0.000,低于顯著性水平0.05,說明人均國內(nèi)生產(chǎn)總值與我國財政收入之間相關(guān)性顯著. 與的相關(guān)系數(shù)為0.990>0,表示呈顯著線性關(guān)系,其值為0.000,低于顯著性水平0.05,說明城鎮(zhèn)居民家庭人均可支配收入與我國財政收入之間相關(guān)性顯著. 與的相關(guān)系數(shù)為0.997>0,表示呈顯著線性

43、關(guān)系,其 p值為0.000,低于顯著性水平0.05,說明全社會固定資產(chǎn)投資與我國財政收入之間相關(guān)性顯著. 與的相關(guān)系數(shù)為0.991>0,表示呈顯著線性關(guān)系,其 p值為0.000,低于顯著性水平0.05,說明我國的第一產(chǎn)業(yè)增加值與財政收入之間相關(guān)性顯著. 與的相關(guān)系數(shù)為0.991>0,表示呈顯著線性關(guān)系,其 p值為0.000,低于顯著性水平0.05,說明我國的教育經(jīng)費(fèi)總投入與財政收入之間相關(guān)性顯著. 綜上所述通過spss得出的相關(guān)系數(shù)的矩陣得到為:0.996 ,0.990 ,0.997 ,0.991 ,0.999 , 由以上數(shù)據(jù)可以看出,各列之間存在正相關(guān)關(guān)系. 即人均國內(nèi)生產(chǎn)總值、

44、城鎮(zhèn)居民家庭人均可支配收入、全社會固定資產(chǎn)投資、我國的第一產(chǎn)業(yè)增加值、我國的教育經(jīng)費(fèi)總投入與財政收入存在顯著性相關(guān)關(guān)系. (2)計算偏相關(guān)系數(shù):下面是用spss作出人均國內(nèi)生產(chǎn)總值、城鎮(zhèn)居民家庭人均可支配收入、全社會固定資產(chǎn)投資、我國的第一產(chǎn)業(yè)增加值、我國的教育經(jīng)費(fèi)總投入與財政收入的偏相關(guān)系數(shù):表4.4表4.50.871-0.8750.233-0.3060.9060.8710.896-0.1110.431-0.7260.896-0.875-0.114-0.120.8830.233-0.111-0.1140.2820.115-0.3060.431-0.120.2820.1730.906-0.72

45、60.8830.1150.173表4.6表4.6為回歸分析圖中的人均國內(nèi)生產(chǎn)總值、城鎮(zhèn)居民家庭人均可支配收入、全社會固定資產(chǎn)投資、我國的第一產(chǎn)業(yè)增加值、我國的教育經(jīng)費(fèi)總投入與財政收入的偏相關(guān)系數(shù),表4.4為spss偏相關(guān)系數(shù)操作中得出的我國人均國內(nèi)生產(chǎn)總值與我國財政收入的偏相關(guān)系數(shù). 由人均國內(nèi)生產(chǎn)總值為例可以看出我國人均國內(nèi)生產(chǎn)總值與我國財政收入的偏相關(guān)系數(shù)為0.693. p值檢驗的概率為0.002<0.05,可以說明我國人均國內(nèi)生產(chǎn)總值與我國財政收入之間顯著性相關(guān). 表4.6是變量與變量之間的偏相關(guān)系數(shù),可以看出其他自變量與自變量之間的偏相關(guān)系數(shù)并不高. 同理,從以上的偏相關(guān)系數(shù)來看

46、,如果人均國內(nèi)生產(chǎn)總值、全社會固定資產(chǎn)投資、第一產(chǎn)業(yè)增加值、教育經(jīng)費(fèi)保持不變,城鎮(zhèn)居民家庭人均可支配收入與財政收入的偏相關(guān)系數(shù)為-0.834,其對應(yīng)的p值檢驗為0.000<0.05,城鎮(zhèn)居民家庭人均可支配收入與財政收入之間存在顯著相關(guān),當(dāng)人均國內(nèi)生產(chǎn)總值、城鎮(zhèn)居民家庭人均可支配收入、我國的第一產(chǎn)業(yè)增加值、教育經(jīng)費(fèi)保持不變,全社會固定資產(chǎn)投資與財政收入的偏相關(guān)系數(shù)為-0.282,其p值檢驗為0.272>0.05,即全社會固定資產(chǎn)投資與財政收入之間不存在顯著相關(guān). 當(dāng)人均國內(nèi)生產(chǎn)總值、城鎮(zhèn)居民家庭人均可支配收入、全社會固定資產(chǎn)、教育經(jīng)費(fèi)投資保持不變,我國的第一產(chǎn)業(yè)增加值與財政收入的偏相

47、關(guān)系數(shù)為-0.361,其p值檢驗為0.154>0.05, 我國的進(jìn)出口總額與財政收入的相關(guān)性不顯著. 當(dāng)人均國內(nèi)生產(chǎn)總值、城鎮(zhèn)居民家庭人均可支配收入、全社會固定資產(chǎn)投資和我國的第一產(chǎn)業(yè)增加值保持不變,教育經(jīng)費(fèi)總投入與財政收入的偏相關(guān)系數(shù)為0.885,其p值檢驗為0.000<0.05, 我國的教育經(jīng)費(fèi)總投入與財政收入的存在顯著相關(guān)性. 常數(shù)項的p值為1,sig大于0.05只表示此常數(shù)值不是很大 ,這里的常數(shù)項對數(shù)據(jù)的影響不顯著,也需要剔除. 而因變量與自變量和的偏相關(guān)系數(shù)很低,說明其對因變量的影響不顯著,應(yīng)該剔除,下面通過回歸分析和逐步回歸對數(shù)據(jù)處理和整理. 4.3 線性回歸分析 對

48、數(shù)據(jù)進(jìn)行回歸分析,得到如下結(jié)果:表4.7 復(fù)相關(guān)系數(shù)為1,判定系數(shù)為1,調(diào)整系數(shù)為1,估計值的標(biāo)準(zhǔn)誤差為0.01766. 表4.8 由上面結(jié)果的看其顯著性檢驗結(jié)果為,回歸平方和為19.995,殘差平方和0.005,總平方和20, f統(tǒng)計量的值為1.282e4,對應(yīng)的概率p值為0.000,小于顯著性水平0.05,即:人均國內(nèi)生產(chǎn)總值、城鎮(zhèn)居民家庭人均可支配收入、全社會固定資產(chǎn)投資、我國的第一產(chǎn)業(yè)增加值、我國的教育經(jīng)費(fèi)總投入與財政收入之間存在線性關(guān)系,所以可認(rèn)為所建立的回歸方程有效. 表4.9 由上圖可知,因變量與常數(shù)項和自變量,的回歸的標(biāo)準(zhǔn)化回歸系數(shù)分別為-6.671e-170.74,-0.58

49、4,0.54,-0.64,0.851. 5個回歸系數(shù)中可以看出,的顯著性水平大于0.05,即自變量,對因變量的顯著性不明顯. 常數(shù)項為的值為1,即說明常數(shù)項近似為0.而自變量,的值檢驗均小于0.05,說明自變量,對因變量有顯著性影響. 檢驗:在給定的,自由度的臨界值時,查表得2.209可以看出常數(shù)項及自變量,的參數(shù)對應(yīng)的值的絕對值均大于2.201,這表明顯著性水平5%的情況下,人均國內(nèi)生產(chǎn)總值、城鎮(zhèn)居民家庭人均可支配收入、教育經(jīng)費(fèi)總投入等變量聯(lián)合起來對我國的財政收入有顯著的影響. 而我國的進(jìn)出口總額的值為0.233小于2.209,說明我國的進(jìn)出口總額對我國的財政收入的影響不顯著. 所以需要對數(shù)

50、據(jù)進(jìn)行逐步回歸,剔除影響不顯著的變量. 其回歸方程為: .4.4逐步回歸 由上可知自變量進(jìn)出口總額未通過檢驗,因此對數(shù)據(jù)進(jìn)行逐步回歸的處理. 對人均國內(nèi)生產(chǎn)總值、城鎮(zhèn)居民家庭人均可支配收入、全社會固定資產(chǎn)投資、我國的第一產(chǎn)業(yè)增加值、我國的教育經(jīng)費(fèi)總投入與財政收入進(jìn)行逐步回歸分析得:表4.10 由上可以看出,被剔除. 其逐步回歸的順序為,.表4.11 上表為逐步回歸模型的統(tǒng)計量,從上表可以看到自變量的判定系數(shù)分別為1,0.999,0.999,這說明自變量與因變量之間的擬合程度很好.調(diào)整后的判定系數(shù)與判定系數(shù)相同,其估計標(biāo)準(zhǔn)誤差分別為 0.04762,0.03533,0.01766其值均很小,說明

51、所選值之間的標(biāo)準(zhǔn)誤差很小. 表4.12 上表為方差分析表,及逐步回歸每一步的回歸模型的方差分析,可以看出其顯著性水平的概率均為0.000,表明此回歸模型極顯著. coefficientsamodelunstandardized coefficientsstandardized coefficientstsig.bstd. errorbeta1x5.999.011.99993.818.0002x51.300.0751.30017.434.000x2-.303.075-.303-4.063.0013x5.935.062.93515.157.000x2-.652.060-.652-10.866.00

52、0x1.713.096.7137.420.000a. dependent variable: y表4.13上表為回歸方程系數(shù)表,根據(jù)多元回歸模型: ,通過spss作出的逐步回歸得到以上的結(jié)果,在統(tǒng)計顯著水平,則檢驗值為2.201下,三個變量及常數(shù)項的檢驗的絕對值分別為15.157,10.866,7.420其絕對值均大于2.201,說明三個因子自變量的顯著性水平高. 可得到的最優(yōu)回歸方程為: .trend值為該區(qū)域中1992年到2012年的模擬值. 該值可以通過最優(yōu)方程式得出,比如2012年的值為 ,由上結(jié)果可以看出誤差較小,其誤差百分比在以內(nèi)的占比比較大,說明模擬效果還可以. 求得的逐步回歸模

53、型效果比較顯著. 4.5小 結(jié)通過spss操作最后得到的我國財政收入的預(yù)測方程式: , 再加上最后對數(shù)據(jù)的檢驗可以得出人均國內(nèi)生產(chǎn)總值、城鎮(zhèn)居民家庭人均可支配收入、我國教育經(jīng)費(fèi)總投入對財政收入有顯著的影響. 從上面的操作可以看出變量通過初步的選取是不夠的,需要對所選自變量進(jìn)行檢驗,然后剔除未通過檢驗的變量,所以在案例二較案例一的區(qū)別在于多了一個逐步回歸分析. 即:眾所周知人均國內(nèi)生產(chǎn)總值,城鎮(zhèn)居民家庭人均可支配收入,全社會固定投資都是逐年變化的,這里表現(xiàn)出的城鎮(zhèn)居民家庭人均可支配收入為負(fù)指標(biāo),隨著社會的發(fā)展,中國的發(fā)展更是越來越迅速,這三個自變量之間存在著相對嚴(yán)密的關(guān)系. 第五章 總 結(jié)sps

54、s 是世界上最早采用圖形菜單驅(qū)動界面的統(tǒng)計軟件,其最突出的特點(diǎn)就是操作界面極為友好,輸出結(jié)果美觀漂亮,是“統(tǒng)計產(chǎn)品與服務(wù)解決方案”軟件.對于那些常見的統(tǒng)計方法,spss的命令語句、子命令及選擇項的大部分都是由“對話框”的操作完成. 所以不需要花大量時間來記憶這些大量的命令、過程或選擇項. 由以上spss的操作方法可以知道spss中有很多的統(tǒng)計方法,適合專業(yè)的統(tǒng)計人員對數(shù)據(jù)進(jìn)行統(tǒng)計整理得出自己想要的結(jié)果. spss在得出的趨勢線以及變量之間的線性關(guān)系,需要自己用一元線性回歸的方法得出數(shù)據(jù)之間的系數(shù),然后自己把方程寫在趨勢線旁邊. 由兩個案例分析中可以看出在對數(shù)據(jù)計算結(jié)果如果需要更精確一點(diǎn),就需要

55、通過對多元回歸分析的操作方法進(jìn)行對比可以知道,采用逐步回歸分析的方法對數(shù)據(jù)進(jìn)行處理,剔除沒有通過檢驗的,對因變量影響不顯著的. 由以上案例中可以看到,多元回歸分析中變量的選擇不能靠簡單的自行篩選就可以,有時候?qū)τ谝恍┳兞康暮Y選都通過檢驗,并不能代表你在選擇數(shù)據(jù)上有多高明,而是需要通過相關(guān)性分析,計算復(fù)相關(guān)系數(shù)和偏相關(guān)系數(shù)來了解你所選的變量之間的相關(guān)關(guān)系的大小,而變量之間存在線性關(guān)系和非線性關(guān)系需要通過散點(diǎn)圖的觀察來對變量之間關(guān)系進(jìn)行判斷. 在一些情況下,某些自變量的觀測數(shù)據(jù)的獲得代價十分貴,這些自變量可能對因變量的影響非常小,而我們把它引進(jìn)了模型中,勢必造成數(shù)據(jù)收集和模型的應(yīng)用不必要的加大.所以在回歸分析中,對進(jìn)入模型的自變量作精心的選擇是十分必要的. 所以我們在選擇回歸模型時一定要注意.而本文可以讓我們知道在多元回歸分析中變量的選擇中我們需要的是先選擇模型,案例一我們是對于非線性回歸模型轉(zhuǎn)化為線性回歸模型同時采用的是全模型進(jìn)行分析,案例二我們用得則是選模型,及在變量的選取上我們應(yīng)該如何去選擇. 相關(guān)系數(shù)以及方差分析就是很

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論