第4章spss統(tǒng)計(jì)技術(shù)1_第1頁(yè)
第4章spss統(tǒng)計(jì)技術(shù)1_第2頁(yè)
第4章spss統(tǒng)計(jì)技術(shù)1_第3頁(yè)
第4章spss統(tǒng)計(jì)技術(shù)1_第4頁(yè)
第4章spss統(tǒng)計(jì)技術(shù)1_第5頁(yè)
已閱讀5頁(yè),還剩150頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、.SPSS基本操作及描述統(tǒng)計(jì)T檢驗(yàn)2檢驗(yàn)回歸分析.數(shù)據(jù)的輸入和保存 NA Not Answered. NAP Not Appropriate. DK Dont Know, 畫(huà)圖數(shù)據(jù)分組描述統(tǒng)計(jì) 頻數(shù) 描述.數(shù)據(jù)-排序數(shù)據(jù)-拆分轉(zhuǎn)換-計(jì)算轉(zhuǎn)換編碼. 像年齡變量、收入變量、成績(jī)變量都是典型的連續(xù)像年齡變量、收入變量、成績(jī)變量都是典型的連續(xù)變量。這就是我們前面介紹的變量。這就是我們前面介紹的Pearson相關(guān)。相關(guān)。.例例從某系隨機(jī)選取了從某系隨機(jī)選取了40名大學(xué)生進(jìn)行追蹤研究,分別名大學(xué)生進(jìn)行追蹤研究,分別在入學(xué)后一周、第一學(xué)年末、第二學(xué)年末和第三學(xué)在入學(xué)后一周、第一學(xué)年末、第二學(xué)年末和第三學(xué)年末

2、共年末共4次英語(yǔ)詞匯測(cè)驗(yàn)推算得到的被試的英語(yǔ)詞匯次英語(yǔ)詞匯測(cè)驗(yàn)推算得到的被試的英語(yǔ)詞匯量(單位:千)。表中的變量如下:性別(量(單位:千)。表中的變量如下:性別(0表示女表示女生,生,1表示男生),表示男生),test1(入學(xué)后一周詞匯量),(入學(xué)后一周詞匯量),test2(第一學(xué)年末詞匯量),(第一學(xué)年末詞匯量),test3(第二學(xué)年末(第二學(xué)年末詞匯量),詞匯量),test4(第三學(xué)年末詞匯量)。(第三學(xué)年末詞匯量)。想計(jì)算并檢驗(yàn)學(xué)生英語(yǔ)詞匯量四次測(cè)驗(yàn)之間的相關(guān)想計(jì)算并檢驗(yàn)學(xué)生英語(yǔ)詞匯量四次測(cè)驗(yàn)之間的相關(guān)系數(shù)。系數(shù)。.在進(jìn)行相關(guān)分析之前,可以使用在進(jìn)行相關(guān)分析之前,可以使用Graphs菜單

3、菜單中的中的Scatter命令作散點(diǎn)圖。命令作散點(diǎn)圖。散點(diǎn)圖是以點(diǎn)的分布反映變量之間相關(guān)情況的散點(diǎn)圖是以點(diǎn)的分布反映變量之間相關(guān)情況的統(tǒng)計(jì)圖形,根據(jù)圖中的各點(diǎn)分布走向和密集程統(tǒng)計(jì)圖形,根據(jù)圖中的各點(diǎn)分布走向和密集程度,大致可以判斷變量之間的關(guān)系。度,大致可以判斷變量之間的關(guān)系。.按順序按順序GraphsScatter單擊,打開(kāi)單擊,打開(kāi)Scatterplot散點(diǎn)散點(diǎn)圖主對(duì)話框。圖主對(duì)話框。1、Simple簡(jiǎn)單散點(diǎn)圖,只顯示一對(duì)相關(guān)變量的散點(diǎn)圖簡(jiǎn)單散點(diǎn)圖,只顯示一對(duì)相關(guān)變量的散點(diǎn)圖4、3-D三維散點(diǎn)圖,顯示三個(gè)相關(guān)變量之間的散點(diǎn)圖三維散點(diǎn)圖,顯示三個(gè)相關(guān)變量之間的散點(diǎn)圖3、Matrix矩陣散點(diǎn),

4、在矩陣中顯示多個(gè)相關(guān)變量之間的散點(diǎn)圖矩陣散點(diǎn),在矩陣中顯示多個(gè)相關(guān)變量之間的散點(diǎn)圖2、Overlay重疊散點(diǎn)圖,可顯示多對(duì)相關(guān)變量的散點(diǎn)圖重疊散點(diǎn)圖,可顯示多對(duì)相關(guān)變量的散點(diǎn)圖.把把test1選擇作為選擇作為Y軸變量,把軸變量,把test2選擇作為選擇作為X軸變量。軸變量。.4.004.505.00第一學(xué)年末詞匯量第一學(xué)年末詞匯量3.003.203.403.603.804.004.20入入學(xué)學(xué)后后一一周周詞詞匯匯量量結(jié)果:結(jié)果:.矩陣散點(diǎn)圖矩陣散點(diǎn)圖在矩陣變量框內(nèi)要選擇兩個(gè)或兩個(gè)以上的變量在矩陣變量框內(nèi)要選擇兩個(gè)或兩個(gè)以上的變量.入學(xué)后一周詞匯量第一學(xué)年末詞匯量第一學(xué)年末詞匯量第三學(xué)年末詞匯量

5、第三學(xué)年末詞匯量第一學(xué)年末詞匯量第一學(xué)年末詞匯量入學(xué)后一周詞匯量.編輯散點(diǎn)圖編輯散點(diǎn)圖.選中圖中的點(diǎn),打選中圖中的點(diǎn),打開(kāi)開(kāi)Properties圖形圖形屬性對(duì)話框,選擇屬性對(duì)話框,選擇Marker點(diǎn)選項(xiàng)卡。點(diǎn)選項(xiàng)卡。在選項(xiàng)卡中,選擇在選項(xiàng)卡中,選擇點(diǎn)的類型點(diǎn)的類型(Type)、點(diǎn)的大小點(diǎn)的大小(Size)、點(diǎn)的外周線點(diǎn)的外周線(Border Width)以以及點(diǎn)的顏色及點(diǎn)的顏色(Color)。.選擇分析分析菜單下的相關(guān)分析相關(guān)分析下兩個(gè)變量間的相關(guān)分析兩個(gè)變量間的相關(guān)分析選項(xiàng)菜單菜單.2單擊按鈕3單擊OK1選擇變量皮爾遜皮爾遜相關(guān)系數(shù)相關(guān)系數(shù)如果兩變量相關(guān)顯著,需要標(biāo)注顯著性檢顯著性檢驗(yàn)選項(xiàng)驗(yàn)

6、選項(xiàng).將將、指定為指定為。.C Co or rr re el la at ti io on ns s1.886*.773*.675*.000.000.00040404040.886*1.860*.679*.000.000.00040404040.773*.860*1.836*.000.000.00040404040.675*.679*.836*1.000.000.000.40404040Pearson CorrelationSig. (2-tailed)NPearson CorrelationSig. (2-tailed)NPearson CorrelationSig. (2-tailed)N

7、Pearson CorrelationSig. (2-tailed)N入學(xué)后一周詞匯量第一學(xué)年末詞匯量第一學(xué)年末詞匯量第三學(xué)年末詞匯量入學(xué)后一周詞匯量第一學(xué)年末詞匯量第一學(xué)年末詞匯量第三學(xué)年末詞匯量Correlation is significant at the 0.01 level (2-tailed).*. 結(jié)果和討論結(jié)果和討論.每個(gè)變量有三行數(shù)據(jù),第一行是該變量與其他變量每個(gè)變量有三行數(shù)據(jù),第一行是該變量與其他變量之間的相關(guān)系數(shù),右上角標(biāo)有之間的相關(guān)系數(shù),右上角標(biāo)有“”的表示在的表示在0.01水平上是顯著的。水平上是顯著的。Sig.(2-tailed)雙尾雙尾t檢驗(yàn)結(jié)果,對(duì)于相關(guān)系數(shù)為

8、檢驗(yàn)結(jié)果,對(duì)于相關(guān)系數(shù)為0的的假設(shè)成立的概率。假設(shè)成立的概率。N為參與相關(guān)系數(shù)計(jì)算的有效觀測(cè)量數(shù)。為參與相關(guān)系數(shù)計(jì)算的有效觀測(cè)量數(shù)。.結(jié)論:結(jié)論:r = 0.886,P =0.0000.01,拒絕,拒絕H0??梢哉J(rèn)為可以認(rèn)為test1和和test2之間有正的之間有正的直線直線相關(guān)關(guān)系。相關(guān)關(guān)系。H0:=0,即,即test1和和test2無(wú)直線相關(guān)關(guān)系無(wú)直線相關(guān)關(guān)系。相關(guān)性檢驗(yàn)相關(guān)性檢驗(yàn)C Co or rr re el la at ti io on ns s1.886*.0004040.886*1.000.4040Pearson CorrelationSig. (2-tailed)NPearso

9、n CorrelationSig. (2-tailed)N入學(xué)后一周詞匯量第一學(xué)年末詞匯量入學(xué)后一周詞匯量第一學(xué)年末詞匯量Correlation is significant at the 0.01 level (2-tailed).*. .等級(jí)變量的相關(guān)分析等級(jí)變量的相關(guān)分析前面介紹了等級(jí)相關(guān),下面看如何利用前面介紹了等級(jí)相關(guān),下面看如何利用SPSS來(lái)實(shí)來(lái)實(shí)現(xiàn)這種計(jì)算現(xiàn)這種計(jì)算。.例:例: 12名學(xué)生的兩門(mén)功課成績(jī)?cè)u(píng)定分?jǐn)?shù)名學(xué)生的兩門(mén)功課成績(jī)?cè)u(píng)定分?jǐn)?shù)見(jiàn)下表。問(wèn)這兩門(mén)功課的成績(jī)是否具有見(jiàn)下表。問(wèn)這兩門(mén)功課的成績(jī)是否具有一致性?一致性? .學(xué)生學(xué)生1 12 23 34 45 56 67 78 8

10、9 91010 1111 1212課程課程A A 良良 優(yōu)優(yōu) 優(yōu)優(yōu) 良良 優(yōu)優(yōu) 良良 中中 良良 良良 中中 優(yōu)優(yōu) 中中課程課程B B 良良 優(yōu)優(yōu) 良良 優(yōu)優(yōu) 優(yōu)優(yōu) 良良 中中 優(yōu)優(yōu) 中中 良良 優(yōu)優(yōu) 中中優(yōu)優(yōu)1良良2中中3 數(shù)據(jù)數(shù)據(jù).課程A課程B數(shù)據(jù)錄入數(shù)據(jù)錄入.選擇分析分析菜單下的相關(guān)分析相關(guān)分析下兩個(gè)變量間的相關(guān)分析兩個(gè)變量間的相關(guān)分析選項(xiàng)菜單菜單.2單擊按鈕3單擊OK1選擇變量斯皮爾曼斯皮爾曼相關(guān)系數(shù)相關(guān)系數(shù).Correlations1.000.657*.0201212.657*1.000.020.1212Correlation CoefficientSig. (2-tailed)NC

11、orrelation CoefficientSig. (2-tailed)N課程A課程BSpearmans rho課程A課程BCorrelation is significant at the .05 level (2-tailed).*. 結(jié)論:結(jié)論:r s= 0.657,P =0.0200.05,接受原假設(shè),方差齊,接受原假設(shè),方差齊.方差分析表方差分析表組間組間組內(nèi)組內(nèi)平方和平方和自由度自由度均方均方F值值P值值如果P0.05 接受原假設(shè)0.093/0.25=3.72.多重比較(多重比較(LSD法)法)P值值均數(shù)差值均數(shù)差值1,2間有差異,1,3間沒(méi)差異,2,3間沒(méi)差異.多重比較(多重比

12、較(SNK法)法)均數(shù)均數(shù)P值值每一列表示一個(gè)亞組,亞組中的無(wú)差異,不同亞組間p0.05.練習(xí):某職業(yè)病防治院對(duì)31名石棉礦工中的石棉肺患者、可疑患者及非患者進(jìn)行了用力肺活量(L)測(cè)定,問(wèn)三組石棉礦工的用力肺活量有無(wú)差別石棉肺患者可疑患者非患者1.82.32.91.42.13.21.52.12.72.12.12.81.92.62.71.72.531.82.33.41.92.431.82.43.41.83.323.5.例例2 下下表是表是11名戰(zhàn)士在不同海拔高度的血氨值名戰(zhàn)士在不同海拔高度的血氨值( )。試作方差分析。試作方差分析 Lmol4-6 不同海拔高度的血氨值不同海拔高度的血氨值(Lmo

13、l戰(zhàn)士編號(hào)戰(zhàn)士編號(hào) 平原平原 3500m 4500m 1 32.7 33.7 39.2 2 35.4 35.4 57.2 3 33.3 48.3 47.6 4 44.8 40.2 40.7 5 32.3 31.6 31.5 6 36.5 39.8 42.9 7 40.1 37.9 45.4 8 38.6 38.8 44.3 9 42.2 51.3 54.2 10 34.8 36.8 46.0 11 40.5 41.2 45.9 合合 計(jì)計(jì)(iT) 411.2 435.0 494.9 4-6 不不同同海海拔拔高高度度的的血血氨氨值值(Lmol) .1 1行行3 3列列( (指標(biāo)變量、處理組分組變

14、量、指標(biāo)變量、處理組分組變量、 單位組分組變量單位組分組變量) ) .AnalyzeAnalyze General Linear ModelsGeneral Linear Models(一般線性模型)(一般線性模型) Univariate Univariate (單變量)(單變量).Univariate對(duì)話框?qū)υ捒蚍纸M變量分組變量多重比較多重比較模型模型選項(xiàng)選項(xiàng).Univariate:Model 對(duì)話框?qū)υ捒蛉蛩啬P腿蛩啬P妥远x模型自定義模型分析效應(yīng)選項(xiàng)分析效應(yīng)選項(xiàng)主效應(yīng)主效應(yīng).Univariate:Model 對(duì)話框?qū)υ捒?Post Hoc Multiple Comperisons f

15、or Observed Means對(duì)話框?qū)υ捒?Options對(duì)話框?qū)υ捒蚓鶖?shù)估計(jì)均數(shù)估計(jì)描述統(tǒng)計(jì)描述統(tǒng)計(jì)量量方差齊性方差齊性檢驗(yàn)檢驗(yàn).點(diǎn)擊點(diǎn)擊“OK”,運(yùn)行結(jié)果,運(yùn)行結(jié)果.有效數(shù)據(jù)例數(shù)統(tǒng)計(jì)有效數(shù)據(jù)例數(shù)統(tǒng)計(jì).分組統(tǒng)計(jì)描分組統(tǒng)計(jì)描述(均數(shù)、述(均數(shù)、標(biāo)準(zhǔn)差)標(biāo)準(zhǔn)差).方差分析表方差分析表平方和平方和自由度自由度均方均方F值值P值值. 首先是所用方差分析模型的檢驗(yàn),P值為0.003,P小于0.05,因此所用的模型有統(tǒng)計(jì)學(xué)意義,可以用它來(lái)判斷模型中系數(shù)有無(wú)統(tǒng)計(jì)學(xué)意義; 第二行是截距,它在我們的分析中沒(méi)有實(shí)際意義,忽略即可; 第三行是變量海拔分組,p小于0.01有統(tǒng)計(jì)學(xué)意義; 第四行是戰(zhàn)士編號(hào),有統(tǒng)計(jì)

16、學(xué)意義,但是我們這里不關(guān)心.均數(shù)估計(jì)均數(shù)估計(jì)均數(shù)均數(shù)標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤均數(shù)均數(shù)95%可信區(qū)間可信區(qū)間.多重比較多重比較P值值均數(shù)差值均數(shù)差值.例8.1 對(duì)小白鼠喂以A、B、C三種不同的營(yíng)養(yǎng)素,目的是了解不同營(yíng)養(yǎng)素增重的效果。采用隨機(jī)區(qū)組設(shè)計(jì)方法,以窩別作為劃分區(qū)組的特征,以消除遺傳因素對(duì)體重增長(zhǎng)的影響?,F(xiàn)將同品系同體重的24只小白鼠分為8個(gè)區(qū)組,每個(gè)區(qū)組3只小白鼠。三周后體重增量結(jié)果(克)列于下表,問(wèn)小白鼠經(jīng)三種不同營(yíng)養(yǎng)素喂養(yǎng)后所增體重有無(wú)差別?.回歸分析的意義回歸分析就是對(duì)具有相關(guān)關(guān)系的兩個(gè)或兩個(gè)以上變回歸分析就是對(duì)具有相關(guān)關(guān)系的兩個(gè)或兩個(gè)以上變量之間數(shù)量變化的一般關(guān)系進(jìn)行測(cè)定,確立一個(gè)量之間數(shù)量

17、變化的一般關(guān)系進(jìn)行測(cè)定,確立一個(gè)相應(yīng)的數(shù)學(xué)表達(dá)式,以便從一個(gè)已知量來(lái)推測(cè)另相應(yīng)的數(shù)學(xué)表達(dá)式,以便從一個(gè)已知量來(lái)推測(cè)另一個(gè)未知量,為估算預(yù)測(cè)提供一個(gè)重要的方法。一個(gè)未知量,為估算預(yù)測(cè)提供一個(gè)重要的方法。.(一)概念:1.相關(guān)分析相關(guān)分析用一個(gè)指標(biāo)來(lái)表明現(xiàn)象間共變的相用一個(gè)指標(biāo)來(lái)表明現(xiàn)象間共變的相互依存關(guān)系的密切程度?;ヒ来骊P(guān)系的密切程度。廣義的相關(guān)分析包括相關(guān)分析(狹廣義的相關(guān)分析包括相關(guān)分析(狹義的相關(guān)分析)和回歸分析。義的相關(guān)分析)和回歸分析。2.回歸分析回歸分析根據(jù)其相關(guān)關(guān)系的具體形態(tài),選擇根據(jù)其相關(guān)關(guān)系的具體形態(tài),選擇一個(gè)合適的數(shù)學(xué)模型(稱為回歸方一個(gè)合適的數(shù)學(xué)模型(稱為回歸方程式),來(lái)

18、近似地表達(dá)變量間的平程式),來(lái)近似地表達(dá)變量間的平均變化關(guān)系。均變化關(guān)系。.1.相關(guān)分析中不必確定自變量和因變量; 而在回歸分析中,必須事先確定自變量和因變量,且只能從自變量去推測(cè)因變量,而不能從因變量去推斷自變量。2.相關(guān)分析不能指出變量關(guān)系的具體形式; 而回歸分析能確切的指出變量之間關(guān)系的具體形式,可根據(jù)回歸模型從已知量估計(jì)和預(yù)測(cè)未知量。3.相關(guān)分析所涉及的變量一般都是隨機(jī)變量, 而回歸分析中因變量是隨機(jī)的,自變量則作為研究時(shí)給定的非隨機(jī)變量。.有共同的研究對(duì)象,常常必須互相補(bǔ)充。只有當(dāng)變量之間存在著高度相關(guān)時(shí),進(jìn)行回歸分析尋求其相關(guān)的具體形式才有意義。簡(jiǎn)單說(shuō):1、相關(guān)分析是回歸分析的基礎(chǔ)

19、和前提;2、回歸分析是相關(guān)分析的深入和繼續(xù)。.r=0:無(wú)法預(yù)測(cè);無(wú)法預(yù)測(cè);r=1:預(yù)測(cè)完全準(zhǔn)確,沒(méi)有誤差。:預(yù)測(cè)完全準(zhǔn)確,沒(méi)有誤差。.(二)回歸分析理解.一一 元線元線性回性回歸歸Simple Linear regression.回歸模型回歸模型多元回歸多元回歸一元回歸一元回歸線性回歸線性回歸線性回歸線性回歸曲線回歸曲線回歸.線性回歸分析概述. 通過(guò)樣本數(shù)據(jù)建立一個(gè)回歸方程后,不通過(guò)樣本數(shù)據(jù)建立一個(gè)回歸方程后,不能立即就用于對(duì)某個(gè)實(shí)際問(wèn)題的預(yù)測(cè)。因能立即就用于對(duì)某個(gè)實(shí)際問(wèn)題的預(yù)測(cè)。因?yàn)?,?yīng)用最小二乘法求得的樣本回歸直線為,應(yīng)用最小二乘法求得的樣本回歸直線作為對(duì)總體回歸直線的近似,這種近似是作為

20、對(duì)總體回歸直線的近似,這種近似是否合理,必須對(duì)其作各種統(tǒng)計(jì)檢驗(yàn)。一般否合理,必須對(duì)其作各種統(tǒng)計(jì)檢驗(yàn)。一般經(jīng)常作以下的統(tǒng)計(jì)檢驗(yàn)。經(jīng)常作以下的統(tǒng)計(jì)檢驗(yàn)。 .(1)擬合優(yōu)度檢驗(yàn))擬合優(yōu)度檢驗(yàn) 回歸方程的擬合優(yōu)度檢驗(yàn)就是要檢驗(yàn)樣本回歸方程的擬合優(yōu)度檢驗(yàn)就是要檢驗(yàn)樣本數(shù)據(jù)聚集在樣本回歸直線周?chē)拿芗潭?,?shù)據(jù)聚集在樣本回歸直線周?chē)拿芗潭?,從而判斷回歸方程對(duì)樣本數(shù)據(jù)的代表程度。從而判斷回歸方程對(duì)樣本數(shù)據(jù)的代表程度。(自變量引起的離差平方和,占總離差平方和自變量引起的離差平方和,占總離差平方和的比重的比重)回歸方程的擬合優(yōu)度檢驗(yàn)一般用確定系數(shù)回歸方程的擬合優(yōu)度檢驗(yàn)一般用確定系數(shù)R2實(shí)現(xiàn)。該指標(biāo)是建立在對(duì)

21、總離差平方和進(jìn)行實(shí)現(xiàn)。該指標(biāo)是建立在對(duì)總離差平方和進(jìn)行分解的基礎(chǔ)之上。分解的基礎(chǔ)之上。.(2)回歸方程的顯著性檢驗(yàn)()回歸方程的顯著性檢驗(yàn)(F檢驗(yàn))檢驗(yàn)) 回歸方程的顯著性檢驗(yàn)是對(duì)因變量與所回歸方程的顯著性檢驗(yàn)是對(duì)因變量與所有自變量之間的線性關(guān)系是否顯著的一有自變量之間的線性關(guān)系是否顯著的一種假設(shè)檢驗(yàn)。種假設(shè)檢驗(yàn)?;貧w方程的顯著性檢驗(yàn)一般采用回歸方程的顯著性檢驗(yàn)一般采用F檢驗(yàn),利檢驗(yàn),利用方差分析的方法進(jìn)行。用方差分析的方法進(jìn)行。 .SPSS原假設(shè):原假設(shè):統(tǒng)計(jì)的就是統(tǒng)計(jì)的就是F值的概率,即計(jì)算值的概率,即計(jì)算F值所對(duì)應(yīng)的值所對(duì)應(yīng)的P值值原假設(shè):回歸方程不顯著原假設(shè):回歸方程不顯著.(3 3)

22、回歸系數(shù)的顯著性檢驗(yàn)()回歸系數(shù)的顯著性檢驗(yàn)(t t檢驗(yàn))檢驗(yàn)) 所謂回歸系數(shù)的顯著性檢驗(yàn),就是根據(jù)所謂回歸系數(shù)的顯著性檢驗(yàn),就是根據(jù)樣本估計(jì)的結(jié)果對(duì)總體回歸系數(shù)的有關(guān)假設(shè)進(jìn)行樣本估計(jì)的結(jié)果對(duì)總體回歸系數(shù)的有關(guān)假設(shè)進(jìn)行檢驗(yàn)。檢驗(yàn)。 之所以對(duì)回歸系數(shù)進(jìn)行顯著性檢驗(yàn),是之所以對(duì)回歸系數(shù)進(jìn)行顯著性檢驗(yàn),是因?yàn)榛貧w方程的顯著性檢驗(yàn)只能檢驗(yàn)所有回歸系因?yàn)榛貧w方程的顯著性檢驗(yàn)只能檢驗(yàn)所有回歸系數(shù)是否同時(shí)與零有顯著性差異,它不能保證回歸數(shù)是否同時(shí)與零有顯著性差異,它不能保證回歸方程中不包含不能較好解釋說(shuō)明因變量變化的自方程中不包含不能較好解釋說(shuō)明因變量變化的自變量。因此,可以通過(guò)回歸系數(shù)顯著性檢驗(yàn)對(duì)每變量。

23、因此,可以通過(guò)回歸系數(shù)顯著性檢驗(yàn)對(duì)每個(gè)回歸系數(shù)進(jìn)行考察。個(gè)回歸系數(shù)進(jìn)行考察。 原假設(shè):回歸系數(shù)原假設(shè):回歸系數(shù)=0=0.回歸參數(shù)顯著性檢驗(yàn)的基本步驟?;貧w參數(shù)顯著性檢驗(yàn)的基本步驟。 提出假設(shè)提出假設(shè) 計(jì)算回歸系數(shù)的計(jì)算回歸系數(shù)的t t統(tǒng)計(jì)量值統(tǒng)計(jì)量值 根據(jù)給定的顯著水平根據(jù)給定的顯著水平確定臨界值,或者確定臨界值,或者計(jì)算計(jì)算t t值所對(duì)應(yīng)的值所對(duì)應(yīng)的p p值(后者為值(后者為spssspss用的方用的方式)式) 作出判斷作出判斷.1.繪制散點(diǎn)圖,觀察x和y是否有線性關(guān)系。2.建立回歸模型。3.回歸方程顯著性檢驗(yàn)。4.計(jì)算回歸估計(jì)標(biāo)準(zhǔn)誤差。5.根據(jù)建立的模型進(jìn)行預(yù)測(cè)。.例例 某醫(yī)生為了探討缺碘

24、地區(qū)母嬰某醫(yī)生為了探討缺碘地區(qū)母嬰TSH水平的關(guān)系,水平的關(guān)系,隨機(jī)抽取隨機(jī)抽取10對(duì)數(shù)據(jù)如下,試求臍帶血對(duì)數(shù)據(jù)如下,試求臍帶血TSH水平水平y(tǒng)對(duì)對(duì)母血母血TSH水平水平x的直線回歸方程。的直線回歸方程。.輸入移去的變量輸入移去的變量b模型輸入的變量移去的變量方法1VAR00002a.輸入a. 已輸入所有請(qǐng)求的變量。b. 因變量: VAR00003結(jié)果結(jié)果模型匯總模型匯總模型RR 方調(diào)整 R 方標(biāo)準(zhǔn)估計(jì)的誤差1.681a.463.396 .32848a. 預(yù)測(cè)變量: (常量), VAR00002。.Model為回歸方程模型編號(hào)為回歸方程模型編號(hào)(不同方法對(duì)應(yīng)不同不同方法對(duì)應(yīng)不同模型模型)R為回

25、歸方程的復(fù)相關(guān)系數(shù)為回歸方程的復(fù)相關(guān)系數(shù)R Square即即R2系數(shù),用以判斷自變量對(duì)因變系數(shù),用以判斷自變量對(duì)因變量的影響有多大,但這并不意味著越大越好量的影響有多大,但這并不意味著越大越好自變量增多時(shí),自變量增多時(shí),R2系數(shù)會(huì)增大,但模型的擬系數(shù)會(huì)增大,但模型的擬合度未必更好合度未必更好Adjusted R Square即修正即修正R2,為了盡可能確,為了盡可能確切地反映模型的擬合度,用該參數(shù)修正切地反映模型的擬合度,用該參數(shù)修正R2系數(shù)系數(shù)偏差,它未必隨變量個(gè)數(shù)的增加而增加偏差,它未必隨變量個(gè)數(shù)的增加而增加Std. Error of the Estimate是估計(jì)的標(biāo)準(zhǔn)誤差是估計(jì)的標(biāo)準(zhǔn)誤

26、差.Anovab模型 平方和df均方FSig.1回歸.7451.7456.908.030a殘差.8638.108總計(jì)1.6099a. 預(yù)測(cè)變量: (常量), VAR00002。b. 因變量: VAR00003系數(shù)系數(shù)a模型 非標(biāo)準(zhǔn)化系 標(biāo)準(zhǔn)系數(shù) t Sig. B 標(biāo)準(zhǔn)誤差試用版1(常量) 2.994.6104.912.001VAR00002.997.379.6812.628.030a. 因變量: VAR00003.Sum of Squares為回歸平方和為回歸平方和(Regression)、殘差平方和()、殘差平方和(Residual)、)、總平方和(總平方和(Total)df 為自由度為自由

27、度Mean Square方差檢驗(yàn)的結(jié)果方差檢驗(yàn)的結(jié)果sig0.05 說(shuō)明回歸模型在說(shuō)明回歸模型在0.05的顯著性水平上是顯著的。的顯著性水平上是顯著的。5.標(biāo)準(zhǔn)化系數(shù)表示該系數(shù)對(duì)因變量的影響,絕對(duì)標(biāo)準(zhǔn)化系數(shù)表示該系數(shù)對(duì)因變量的影響,絕對(duì)值大影響就大。值大影響就大。6.根據(jù)最后一張表,回歸系數(shù)在根據(jù)最后一張表,回歸系數(shù)在0.05的顯著性水的顯著性水平上顯著,可以建立回歸模型。平上顯著,可以建立回歸模型。.練習(xí)某國(guó)營(yíng)農(nóng)場(chǎng)在試驗(yàn)田上研究耕種深度對(duì)水稻產(chǎn)量的關(guān)系,所得資料如下表。試求水稻產(chǎn)量與耕種深度的直線回歸方程。耕種深度(厘米)耕種深度(厘米)81012141618公頃產(chǎn)量(噸)公頃產(chǎn)量(噸)6.

28、07.57.89.210.812.0.練習(xí):為了研究旅行社廣告費(fèi)用對(duì)銷(xiāo)售額的影響,收集到7家旅行社的銷(xiāo)售額與廣告費(fèi)用的數(shù)據(jù)如下表。試進(jìn)行回歸分析。廣告費(fèi)用廣告費(fèi)用2000200050003000900080007000銷(xiāo)售額銷(xiāo)售額15000 30000 30000 25000 55000 45000 60000.模型匯總模型匯總模型RR 方調(diào)整 R 方標(biāo)準(zhǔn) 估計(jì)的誤差1.875a.765.7188782.64376a. 預(yù)測(cè)變量: (常量), VAR00005。AnovaAnovab b模型平方和df均方FSig.1回歸1.257E911.257E916.299.010a殘差3.857E857

29、.713E7總計(jì)1.643E96a. 預(yù)測(cè)變量: (常量), VAR00005。b. 因變量: VAR00006系數(shù)系數(shù)a模型非標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)系數(shù)tSig.B標(biāo)準(zhǔn) 誤差試用版1(常量)11573.034 7150.8271.618.166VAR000054.9721.232.8754.037.010a. 因變量: VAR00006.以年齡為自變量以年齡為自變量x,血壓為因變量血壓為因變量y,可,可作出如下散點(diǎn)圖:作出如下散點(diǎn)圖:年齡394745476545674267563650392144血壓144120138145162142170124158154136142120120116年齡645

30、659344248451720195363292569血壓162150140110128130135114116124158144130125175練習(xí):某醫(yī)學(xué)研究所對(duì)練習(xí):某醫(yī)學(xué)研究所對(duì)30個(gè)不同年齡的人的血壓個(gè)不同年齡的人的血壓(高壓)進(jìn)行了測(cè)量,得到如下數(shù)據(jù):(高壓)進(jìn)行了測(cè)量,得到如下數(shù)據(jù):.mmmxbxbxbbxxxfY 2211021),(對(duì)于多元線性回歸主要需研究如下幾個(gè)問(wèn)題:對(duì)于多元線性回歸主要需研究如下幾個(gè)問(wèn)題:建立因變量建立因變量Y與與x1、x2、xm的經(jīng)驗(yàn)公式(回的經(jīng)驗(yàn)公式(回歸方程)歸方程)對(duì)經(jīng)驗(yàn)公式的可信度進(jìn)行檢驗(yàn)對(duì)經(jīng)驗(yàn)公式的可信度進(jìn)行檢驗(yàn)判斷每個(gè)自變量判斷每個(gè)自變量

31、xi(i=1, , m)對(duì)對(duì)Y的影響是否顯的影響是否顯著?著?利用經(jīng)驗(yàn)公式進(jìn)行預(yù)報(bào)、控制及指導(dǎo)生產(chǎn)利用經(jīng)驗(yàn)公式進(jìn)行預(yù)報(bào)、控制及指導(dǎo)生產(chǎn)診斷經(jīng)驗(yàn)公式是否適合這組數(shù)據(jù)診斷經(jīng)驗(yàn)公式是否適合這組數(shù)據(jù).mmnxbxbxbbxxxfY 2211021),(0:2100 mbbbbH方差分析的主要思想是把方差分析的主要思想是把 yi 的總方差進(jìn)行分解:的總方差進(jìn)行分解: MSSESSyyyyyynidefiniiinii 121212模型平方和模型平方和誤差平方和誤差平方和二、多元線性回歸二、多元線性回歸參數(shù)估計(jì)方法參數(shù)估計(jì)方法最小二乘法最小二乘法回歸方程顯著性的檢驗(yàn)回歸方程顯著性的檢驗(yàn)就是檢驗(yàn)以下假設(shè)是就

32、是檢驗(yàn)以下假設(shè)是否成立(采用方差分析法):否成立(采用方差分析法):. 如果自變量對(duì)如果自變量對(duì)Y的影響顯著,則總方差主要應(yīng)由的影響顯著,則總方差主要應(yīng)由xi引起,也就是原假設(shè)不成立,從而檢驗(yàn)統(tǒng)計(jì)量為:引起,也就是原假設(shè)不成立,從而檢驗(yàn)統(tǒng)計(jì)量為:)()()1(均均方方誤誤差差模模型型均均方方EMSMMSkmESSkMSSF 方差來(lái)方差來(lái)源源自由度自由度平方和平方和均方均方Fp值值自變量自變量mMSSMMSMMSEMSp隨機(jī)誤隨機(jī)誤差差n-m-1ESSEMS和和n-1TSS多元線性回歸的方差分析表:多元線性回歸的方差分析表:. 在實(shí)際問(wèn)題中,影響因變量在實(shí)際問(wèn)題中,影響因變量Y的因素(自變量)可

33、的因素(自變量)可能很多。在回歸方程中,如果漏掉了重要因素,則會(huì)能很多。在回歸方程中,如果漏掉了重要因素,則會(huì)產(chǎn)生大的偏差;但如果回歸式中包含的因素太多,則產(chǎn)生大的偏差;但如果回歸式中包含的因素太多,則不僅使用不便,且可能影響預(yù)測(cè)精度。如何選擇適當(dāng)不僅使用不便,且可能影響預(yù)測(cè)精度。如何選擇適當(dāng)?shù)淖兞?,建立最?yōu)的回歸方程呢?的變量,建立最優(yōu)的回歸方程呢? 在最優(yōu)的方程中,所有變量對(duì)因變量在最優(yōu)的方程中,所有變量對(duì)因變量Y的影響都應(yīng)的影響都應(yīng)該是顯著的,而所有對(duì)該是顯著的,而所有對(duì)Y影響不顯著的變量都不包含影響不顯著的變量都不包含在方程中。選擇方法主要有:在方程中。選擇方法主要有:逐步篩選法逐步篩

34、選法(STEPWISE) (最常用最常用)向前引入法向前引入法(FORWARD)向后剔除法向后剔除法(BACKWARD)等等逐步回歸逐步回歸變量選擇問(wèn)題變量選擇問(wèn)題.開(kāi)始開(kāi)始對(duì)不在方程中的變對(duì)不在方程中的變量考慮能否引入?量考慮能否引入?引入變量引入變量能能對(duì)已在方程中的變對(duì)已在方程中的變量考慮能否剔除?量考慮能否剔除?能能剔除變量剔除變量否否篩選結(jié)束篩選結(jié)束否否逐步回歸的基本思想和步驟:逐步回歸的基本思想和步驟:.某地區(qū)大春某地區(qū)大春糧食產(chǎn)量糧食產(chǎn)量 y 和大春糧食和大春糧食播種面積播種面積x1、化肥用量化肥用量x2、肥豬發(fā)展頭肥豬發(fā)展頭數(shù)數(shù)x3、水稻、水稻抽穗揚(yáng)花期抽穗揚(yáng)花期降雨量降雨量x4的的數(shù)據(jù)如下表,數(shù)據(jù)如下表,尋求大春糧尋求大春糧食產(chǎn)量的預(yù)食產(chǎn)量的預(yù)報(bào)模型。報(bào)模型。例例2、大春糧食產(chǎn)量的預(yù)報(bào)模型、大春糧食產(chǎn)量的預(yù)報(bào)模型.按按GraphsScatter Simple順序展開(kāi)對(duì)話框順序展開(kāi)對(duì)話框?qū)選入選入Y Axis,然后將其余變量逐個(gè)選入,然后將其余變量逐個(gè)選入X Axis ,繪出散點(diǎn)圖,觀察是否適宜

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論