統(tǒng)計(jì)學(xué)及統(tǒng)計(jì)學(xué)軟件使用教程課件_第1頁
統(tǒng)計(jì)學(xué)及統(tǒng)計(jì)學(xué)軟件使用教程課件_第2頁
統(tǒng)計(jì)學(xué)及統(tǒng)計(jì)學(xué)軟件使用教程課件_第3頁
統(tǒng)計(jì)學(xué)及統(tǒng)計(jì)學(xué)軟件使用教程課件_第4頁
統(tǒng)計(jì)學(xué)及統(tǒng)計(jì)學(xué)軟件使用教程課件_第5頁
已閱讀5頁,還剩253頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

統(tǒng)計(jì)學(xué)及統(tǒng)計(jì)學(xué)軟件使用教程1統(tǒng)計(jì)學(xué)簡介2方差分析3回歸分析4正交設(shè)計(jì)5統(tǒng)計(jì)分析軟件SAS6統(tǒng)計(jì)分析軟件SPSS系統(tǒng)分析室制作1整理課件前言:統(tǒng)計(jì)學(xué)簡介

什么是統(tǒng)計(jì)學(xué):

統(tǒng)計(jì)學(xué)是關(guān)于數(shù)理統(tǒng)計(jì)的收獲、整理、分析和推斷的一門科學(xué),他可以分為描述性統(tǒng)計(jì)學(xué)和推斷性統(tǒng)計(jì)學(xué)兩大類。描述性統(tǒng)計(jì)學(xué)給出的是將原始數(shù)據(jù)資料加工成有用的圖表的方法(例如:南陽漢冶特鋼11月份不合格品綜合判定統(tǒng)計(jì)分析),這些方法包括數(shù)據(jù)的收集、整理、概括和描述等。如果在研究中可以得到整個(gè)整體,那么描述性統(tǒng)計(jì)學(xué)就足夠了,但是,實(shí)際中往往只能得到總體的一小部分(成樣本),這就需要通過這些樣本的有限的、不確定的信息來確定有關(guān)總體的信息,這就是推斷統(tǒng)計(jì)的研究領(lǐng)域。

2整理課件統(tǒng)計(jì)學(xué)的理論基礎(chǔ)是數(shù)理統(tǒng)計(jì)學(xué),數(shù)理統(tǒng)計(jì)學(xué)是數(shù)學(xué)的一個(gè)分支,有一系列的公理、定理以及嚴(yán)格證明來組成,它還涉及到助學(xué)的其他領(lǐng)域,例如微積分、概率論合高等代數(shù)等。為了使這些理論也適用于一般的研究者,人們將其簡單化,變的非數(shù)學(xué)化,由此產(chǎn)生了一般統(tǒng)計(jì)學(xué)。不同的專業(yè)領(lǐng)域(如建筑學(xué),人類學(xué)、生物學(xué)、經(jīng)濟(jì)學(xué)等等)與一般統(tǒng)計(jì)學(xué)結(jié)合,就產(chǎn)生了相應(yīng)的專業(yè)統(tǒng)計(jì)學(xué)。08【全美經(jīng)典】統(tǒng)計(jì)學(xué)原理(上).pdf08【全美經(jīng)典】統(tǒng)計(jì)學(xué)原理(下).pdf統(tǒng)計(jì)學(xué)經(jīng)典教材:3整理課件描述性統(tǒng)計(jì)學(xué)知識(shí)章節(jié)4整理課件5整理課件推斷性統(tǒng)計(jì)學(xué)知識(shí)章節(jié)6整理課件7整理課件8整理課件第一節(jié)方差分析

一、幾個(gè)概念二、單因子方差分析

9整理課件一、幾個(gè)概念在試驗(yàn)中改變狀態(tài)的因素稱為因子,常用大寫英文字母A、B、C、…等表示。因子在試驗(yàn)中所處的狀態(tài)稱為因子的水平。用代表因子的字母加下標(biāo)表示,記為A1,A2,…,Ak。試驗(yàn)中所考察的指標(biāo)(可以是質(zhì)量特性也可以是產(chǎn)量特性或其它)用Y表示。Y是一個(gè)隨機(jī)變量。單因子試驗(yàn):若試驗(yàn)中所考察的因子只有一個(gè)。10整理課件[例2.1-1]現(xiàn)有甲、乙、丙三個(gè)工廠生產(chǎn)同一種零件,為了了解不同工廠的零件的強(qiáng)度有無明顯的差異,現(xiàn)分別從每一個(gè)工廠隨機(jī)抽取四個(gè)零件測(cè)定其強(qiáng)度,數(shù)據(jù)如表所示,試問三個(gè)工廠的零件的平均強(qiáng)度是否相同?

工廠量件強(qiáng)度

10310198110

113107108116

82928486三個(gè)工廠的零件強(qiáng)度

11整理課件在這一例子中,考察一個(gè)因子:因子A:工廠該因子有三個(gè)水平:甲、乙、丙試驗(yàn)指標(biāo)是:零件強(qiáng)度這是一個(gè)單因子試驗(yàn)的問題。每一水平下的試驗(yàn)結(jié)果構(gòu)成一個(gè)總體,現(xiàn)在需要比較三個(gè)總體均值是否一致。如果每一個(gè)總體的分布都是正態(tài)分布,并且各個(gè)總體的方差相等,那么比較各個(gè)總體均值是否一致的問題可以用方差分析方法來解決。12整理課件二、單因子方差分析

假定因子A有r個(gè)水平,在Ai水平下指標(biāo)服從正態(tài)分布,其均值為,方差為,i=1,2,…,r。每一水平下的指標(biāo)全體便構(gòu)成一個(gè)總體,共有r個(gè)總體,這時(shí)比較各個(gè)總體的問題就變成比較各個(gè)總體的均值是否相同的問題了,即要檢驗(yàn)如下假設(shè)是否為真:13整理課件當(dāng)不真時(shí),表示不同水平下的指標(biāo)的均值有顯著差異,此時(shí)稱因子A是顯著的,否則稱因子A不顯著。檢驗(yàn)這一假設(shè)的分析方法便是方差分析。14整理課件方差分析的三個(gè)基本假定1.在水平下,指標(biāo)服從正態(tài)分布;2.在不同水平下,各方差相等;3.各數(shù)據(jù)相互獨(dú)立。15整理課件設(shè)在一個(gè)試驗(yàn)中只考察一個(gè)因子A,它有r個(gè)水平,在每一水平下進(jìn)行m次重復(fù)試驗(yàn),其結(jié)果用表示,i=1,2,…,r。常常把數(shù)據(jù)列成如下表格形式:單因子試驗(yàn)數(shù)據(jù)表16整理課件記第i水平下的數(shù)據(jù)均值為,總均值為。此時(shí)共有n=rm個(gè)數(shù)據(jù),這n個(gè)數(shù)據(jù)不全相同,它們的波動(dòng)(差異)可以用總離差平方和ST去表示記第i水平下的數(shù)據(jù)和為Ti,;17整理課件引起數(shù)據(jù)波動(dòng)(差異)的原因不外如下兩個(gè):一是由于因子A的水平不同,當(dāng)假設(shè)H0不真時(shí),各個(gè)水平下指標(biāo)的均值不同,這必然會(huì)使試驗(yàn)結(jié)果不同,我們可以用組間離差平方和來表示,也稱因子A的離差平方和:這里乘以m是因?yàn)槊恳凰较逻M(jìn)行了m次試驗(yàn)。18整理課件二是由于存在隨機(jī)誤差,即使在同一水平下獲得的數(shù)據(jù)間也有差異,這是除了因子A的水平外的一切原因引起的,我們將它們歸結(jié)為隨機(jī)誤差,可以用組內(nèi)離差平方和表示:Se:也稱為誤差的離差平方和19整理課件可以證明有如下平方和分解式:ST、SA、Se的自由度分別用、、表示,它們也有分解式:,其中:因子或誤差的離差平方和與相應(yīng)的自由度之比稱為因子或誤差的均方和,并分別記為:兩者的比記為:20整理課件當(dāng)時(shí)認(rèn)為在顯著性水平上因子A是顯著的。其中是自由度為的F分布的1-α分位數(shù)。單因子方差分析表

21整理課件各個(gè)離差平方和的計(jì)算:

其中是第i個(gè)水平下的數(shù)據(jù)和;T表示所有n=rm個(gè)數(shù)據(jù)的總和。

22整理課件進(jìn)行方差分析的步驟如下:

(1)計(jì)算因子A的每一水平下數(shù)據(jù)的和T1,T2,…,Tr及總和T;

(2)計(jì)算各類數(shù)據(jù)的平方和;

(3)依次計(jì)算ST,SA,Se;

(4)填寫方差分析表;

(5)對(duì)于給定的顯著性水平α,將求得的F值與F分布表中的臨界值比較,當(dāng)時(shí)認(rèn)為因子A是顯著的,否則認(rèn)為因子A是不顯著的。

23整理課件對(duì)上例的分析

(1)計(jì)算各類和:

每一水平下的數(shù)據(jù)和為:

數(shù)據(jù)的總和為T=1200

(2)計(jì)算各類平方和:

原始數(shù)據(jù)的平方和為:

每一水平下數(shù)據(jù)和的平方和為

24整理課件(3)計(jì)算各離差平方和:

ST=121492-12002/12=1492,fT=3×4-1=11SA=485216/4-12002/12=1304,fA=3-1=2Se=1492-1304=188,fe=11-2=925整理課件(4)列方差分析表:

[例2.1-1]的方差分析表

26整理課件(5)如果給定=0.05,從F分布表查得

由于F>4.26,所以在=0.05水平上結(jié)論是因子A是顯著的。這表明不同的工廠生產(chǎn)的零件強(qiáng)度有明顯的差異。

當(dāng)因子A是顯著時(shí),我們還可以給出每一水平下指標(biāo)均值的估計(jì),以便找出最好的水平。在單因子試驗(yàn)的場合,第i個(gè)水平指標(biāo)均值的估計(jì)為:

27整理課件在本例中,三個(gè)工廠生產(chǎn)的零件的平均強(qiáng)度的的估計(jì)分別為:

由此可見,乙廠生產(chǎn)的零件的強(qiáng)度的均值最大,如果我們需要強(qiáng)度大的零件,那么購買乙廠的為好;而從工廠來講,甲廠與丙廠應(yīng)該設(shè)法提高零件的強(qiáng)度。

誤差方差的估計(jì):這里方差的估計(jì)是MSe。在本例中:的估計(jì)是20.9。

的估計(jì)是

[例2.1-2]略(見教材P92)28整理課件三、重復(fù)數(shù)不等的情況若在每一水平下重復(fù)試驗(yàn)次數(shù)不同,假定在Ai水平下進(jìn)行次試驗(yàn),那么進(jìn)行方差分析的步驟仍然同上,只是在計(jì)算中有兩個(gè)改動(dòng):

29整理課件例2.1-3某型號(hào)化油器原中小喉管的結(jié)構(gòu)使油耗較大,為節(jié)約能源,設(shè)想了兩種改進(jìn)方案以降低油耗。油耗的多少用比油耗進(jìn)行度量,現(xiàn)在對(duì)用各種結(jié)構(gòu)的中小喉管制造的化油器分別測(cè)定其比油耗,數(shù)據(jù)如表所列,試問中小喉管的結(jié)構(gòu)(記為因子A)對(duì)平均比油油耗的影響是否顯著。(這里假定每一種結(jié)構(gòu)下的油耗服從等方差的正態(tài)分布)

30整理課件[例2.1-3]的試驗(yàn)結(jié)果

水平試驗(yàn)結(jié)果(比油耗-220)A1:原結(jié)構(gòu)11.012.87.68.34.75.59.310.3A2:改進(jìn)方案12.84.5-1.50.2A3:改進(jìn)方案24.36.11.43.6(為簡化計(jì)算,這里一切數(shù)據(jù)均減去220,不影響F比的計(jì)算及最后分析因子的顯著性)31整理課件(1)各水平下的重復(fù)試驗(yàn)次數(shù)及數(shù)據(jù)和分別為:

A1:m1=8,T1=69.5A2:m2=4,T2=6.0A3:m3=4,T3=15.4總的試驗(yàn)次數(shù)n=16,數(shù)據(jù)的總和為T=90.9

32整理課件(2)計(jì)算各類平方和:

(3)計(jì)算各離差平方和:

ST=757.41-516.43=240.98,fT=16-1=15SA=672.07-516.43=155.64,fA=3-1=2Se=240.98-155.64=85.34,fe=15-2=1333整理課件(4)列方差分析表:

[例2.1-3]方差分析表

34整理課件(5)如果給定=0.05,從F分布表查得

由于F>3.81,所以在α=0.05水平上我們的結(jié)論是因子A是顯著的。這表明不同的中小喉管結(jié)構(gòu)生產(chǎn)的化油器的平均比油耗有明顯的差異。

35整理課件我們還可以給出不同結(jié)構(gòu)生產(chǎn)的化油器的平均比油耗的估計(jì):

這里加上220是因?yàn)樵谠瓟?shù)據(jù)中減去了220的緣故。

由此可見,從比油耗的角度看,兩種改進(jìn)結(jié)構(gòu)都比原來的好,特別是改進(jìn)結(jié)構(gòu)1。

在本例中誤差方差的估計(jì)為6.56,標(biāo)準(zhǔn)差的估計(jì)為2.56。

36整理課件第二節(jié)回歸分析

例2.2-1合金的強(qiáng)度y與合金中的碳含量x有關(guān)。為了生產(chǎn)出強(qiáng)度滿足顧客需要的合金,在冶煉時(shí)應(yīng)該如何控制碳含量?如果在冶煉過程中通過化驗(yàn)得到了碳含量,能否預(yù)測(cè)合金的強(qiáng)度?

這時(shí)需要研究兩個(gè)變量間的關(guān)系。首先是收集數(shù)據(jù)(xi,yi),i=1,2,…,n?,F(xiàn)從生產(chǎn)中收集到表2.2-1所示的數(shù)據(jù)。

37整理課件表2.2-1數(shù)據(jù)表

38整理課件一、散布圖6050400.150.200.10xy[例2.2-1]的散布圖39整理課件二、相關(guān)系數(shù)

1.相關(guān)系數(shù)的定義

在散布圖上n個(gè)點(diǎn)在一條直線附近,但又不全在一條直線上,稱為兩個(gè)變量有線性相關(guān)關(guān)系,可以用相關(guān)系數(shù)r去描述它們線性關(guān)系的密切程度

40整理課件其中41整理課件性質(zhì):

表示n個(gè)點(diǎn)在一條直線上,這時(shí)兩個(gè)變量間完全線性相關(guān)。

r>0表示當(dāng)x增加時(shí)y也增大,稱為正相關(guān)

r<0表示當(dāng)x增加時(shí)y減小,稱為負(fù)相關(guān)

r=0表示兩個(gè)變量間沒有線性相關(guān)關(guān)系,但并不排斥兩者間有其它函數(shù)關(guān)系。

42整理課件2.相關(guān)系數(shù)的檢驗(yàn)

若記兩個(gè)變量x和y理論的相關(guān)系數(shù)為,其中x為一般變量,y服從等方差的正態(tài)分布,則對(duì)給定的顯著性水平,當(dāng)可以認(rèn)為兩者間存在一定的線性相關(guān)關(guān)系,可以從表2.2-2中查出。(其中n為樣本量)。

43整理課件3.具體計(jì)算

求上例的相關(guān)系數(shù):

步驟如下:

(1)計(jì)算變量x與y的數(shù)據(jù)和:

Tx==1.90,Ty==590.5

(2)計(jì)算各變量的平方和與乘積和:

44整理課件(3)計(jì)算Lxx,Lyy,Lxy:

Lxy=95.9250-1.90×590.5/12=2.4292

Lxx=0.3194-1.902/12=0.0186

Lyy=29392.75-590.52/12=335.2292

(4)計(jì)算r:在=0.05時(shí),,由于r>0.576,說明兩個(gè)變量間有(正)線性相關(guān)關(guān)系。

45整理課件四、一元線性回歸方程

1.一元線性回歸方程的求法:

一元線性回歸方程的表達(dá)式為

其中a與b使下列離差平方和達(dá)到最?。?/p>

通過微分學(xué)原理,可知

,

稱這種估計(jì)為最小二乘估計(jì)。

b稱為回歸系數(shù);a一般稱為常數(shù)項(xiàng)。

46整理課件求一元線性回歸方程的步驟如下:

(1)計(jì)算變量x與y的數(shù)據(jù)和Tx,Ty;(2)計(jì)算各變量的平方和與乘積和;(3)計(jì)算Lxx,Lxy;(4)求出b與a;47整理課件利用前面的數(shù)據(jù),可得:

b=2.4392/0.0186=130.6022

a=590.5/12-130.6022×1.90/12=28.5297

(5)寫出回歸方程:

畫出的回歸直線一定通過(0,a)與兩點(diǎn)

上例:

或48整理課件2.回歸方程的顯著性檢驗(yàn)

有兩種方法:

一是用上述的相關(guān)系數(shù);

二是用方差分析方法(為便于推廣到多元線性回歸的場合),將總的離差平方和分解成兩個(gè)部分:回歸平方和與離差平方和。

49整理課件總的離差平方和:

回歸平方和:

離差平方和:

且有ST=SR+SE,其中

它們的自由度分別為:

fT=n-1,fR=1,fE=n-2=fT-fR

50整理課件計(jì)算F比,

對(duì)給定的顯著性水平,當(dāng)時(shí)認(rèn)為回歸方程是顯著的,即回歸方程是有意義的。一般也列成方差分析表。

51整理課件對(duì)上面的例子,作方差分析的步驟如下:

根據(jù)前面的計(jì)算

(1)計(jì)算各類平方和:

ST=Lyy=335.2292,fT=12-1=11SR=bLxy=130.6022×2.4292=317.2589,fR=1SE=335.2292-317.2589=17.9703,fE=11-1=10

52整理課件(2)列方差分析表:

[例2.2-1]的方差分析表

53整理課件對(duì)給定的顯著性水平=0.05,有

F0.95(1,10)=4.96

由于F>4.96,所以在0.05水平上認(rèn)為回歸方程是顯著的(有意義的)。

54整理課件3.利用回歸方程進(jìn)行預(yù)測(cè)

對(duì)給定的,y的預(yù)測(cè)值為

概率為的y的預(yù)測(cè)區(qū)間是其中當(dāng)n較大,與相差不大,那么可給出近似的預(yù)測(cè)區(qū)間,此時(shí)55整理課件進(jìn)行預(yù)測(cè)的步驟如下:

(1)對(duì)給出的x0求預(yù)測(cè)值

上例,設(shè)x0=0.16,則

(2)求的估計(jì)

上例有

56整理課件(3)求

上例n=12,如果求概率為95%的預(yù)測(cè)區(qū)間,那么t0.975(10)=2.228,所以

(4)寫出預(yù)測(cè)區(qū)間

上例為(49.43-3.11,49.43+3.11)=(46.32,52.54)

57整理課件由于u0.975=1.96,故概率為0.95的近似的預(yù)測(cè)區(qū)間為:∵∴所求區(qū)間:(49.43-2.63,49.43+2.63)=(46.80,52.06)相差較大的原因總n較小。58整理課件四、可化為一元線性回歸的曲線回歸在兩個(gè)重復(fù)的散布圖上,n個(gè)點(diǎn)的散布不一定都在一條直線附近波動(dòng),有時(shí)可能在某條曲線附近波動(dòng),這時(shí)以建立曲線回方程為好。1.確定曲線回歸方程形式2.曲線回歸方程中參數(shù)的估計(jì)通過適當(dāng)?shù)淖儞Q,化為一元線性回歸的形式,再利用一元線性回歸中的最小二乘估計(jì)方法獲得。59整理課件回歸曲線的形式:(1),(a>0,b>0)(2),(b>0)(3),(b>0)(4),(b>0)60整理課件3.曲線回歸方程的比較常用的比較準(zhǔn)則:(1)要求相關(guān)指數(shù)R大,其平方也稱為決定系數(shù),它被定義為:(2)要求剩余標(biāo)準(zhǔn)差s小,它被定義為:61整理課件第三節(jié)正交設(shè)計(jì)一、試驗(yàn)設(shè)計(jì)的基本概念與正交表(一)試驗(yàn)設(shè)計(jì)多因素試驗(yàn)遇到的最大困難是試驗(yàn)次數(shù)太多,若十個(gè)因素對(duì)產(chǎn)品質(zhì)量有影響,每個(gè)因素取兩個(gè)不同狀態(tài)進(jìn)行比較,有210=1024、如果每個(gè)因素取三個(gè)不同狀態(tài)310=59049個(gè)不同的試驗(yàn)條件

62整理課件選擇部分條件進(jìn)行試驗(yàn),再通過數(shù)據(jù)分析來尋找好的條件,這便是試驗(yàn)設(shè)計(jì)問題。通過少量的試驗(yàn)獲得較多的信息,達(dá)到試驗(yàn)的目的。

利用正交表進(jìn)行試驗(yàn)設(shè)計(jì)的方法就是正交試驗(yàn)設(shè)計(jì)。

63整理課件(二)正交表

64整理課件“L”表示正交表,“9”是表的行數(shù),在試驗(yàn)中表示試驗(yàn)的條件數(shù),“4”是列數(shù),在試驗(yàn)中表示可以安排的因子的最多個(gè)數(shù),“3”是表的主體只有三個(gè)不同數(shù)字,在試驗(yàn)中表示每一因子可以取的水平數(shù)。

65整理課件正交表具有正交性,這是指它有如下兩個(gè)特點(diǎn):

(1)每列中每個(gè)數(shù)字重復(fù)次數(shù)相同。

在表L9(34)中,每列有3個(gè)不同數(shù)字:1,2,3,每一個(gè)出現(xiàn)3次。

(2)將任意兩列的同行數(shù)字看成一個(gè)數(shù)對(duì),那么一切可能數(shù)對(duì)重復(fù)次數(shù)相同。

在表L9(34)中,任意兩列有9種可能的數(shù)對(duì):(1,1),(1,2),(1,3),(2,1),(2,2),(2,3),(3,1),(3,2),(3,3)每一對(duì)出現(xiàn)一次。

66整理課件常用的正交表有兩大類

(1)一類正交表的行數(shù)n,列數(shù)p,水平數(shù)q間有如下關(guān)系:

n=qk,k=2,3,4,…,p=(n-1)/(q-1)

如:L4(23),L8(27),L16(215),L32(231)等,可以考察因子間的交互作用。

(2)另一類正交表的行數(shù),列數(shù),水平數(shù)之間不滿足上述的兩個(gè)關(guān)系

如:L12(211),L18(37),L20(219),L36(313)等

這類正交表不能用來考察因子間的交互作用常用正交表見附錄67整理課件二、無交互作用的正交設(shè)計(jì)與數(shù)據(jù)分析

試驗(yàn)設(shè)計(jì)一般有四個(gè)步驟:

1.試驗(yàn)設(shè)計(jì)2.進(jìn)行試驗(yàn)獲得試驗(yàn)結(jié)果3.數(shù)據(jù)分析4.驗(yàn)證試驗(yàn)68整理課件例2.3-1磁鼓電機(jī)是彩色錄像機(jī)磁鼓組件的關(guān)鍵部件之一,按質(zhì)量要求其輸出力矩應(yīng)大于210g.cm。某生產(chǎn)廠過去這項(xiàng)指標(biāo)的合格率較低,從而希望通過試驗(yàn)找出好的條件,以提高磁鼓電機(jī)的輸出力矩。

69整理課件(一)試驗(yàn)的設(shè)計(jì)

在安排試驗(yàn)時(shí),一般應(yīng)考慮如下幾步:

(1)明確試驗(yàn)?zāi)康?/p>

(2)明確試驗(yàn)指標(biāo)

(3)確定因子與水平

(4)選用合適的正交表,進(jìn)行表頭設(shè)計(jì),列出試驗(yàn)計(jì)劃

70整理課件在本例中:

試驗(yàn)?zāi)康模禾岣叽殴碾姍C(jī)的輸出力矩

試驗(yàn)指標(biāo):輸出力矩

確定因子與水平:經(jīng)分析影響輸出力矩的可能因子及水平見表2.3-2

表2.3-2因子水平表71整理課件選表:首先根據(jù)因子的水平數(shù),找出一類正交表

再根據(jù)因子的個(gè)數(shù)確定具體的表

把因子放到表的列上去,稱為表頭設(shè)計(jì)把放因子的列中的數(shù)字改為因子的真實(shí)水平,便成為一張?jiān)囼?yàn)計(jì)劃表,每一行便是一個(gè)試驗(yàn)條件。在正交設(shè)計(jì)中n個(gè)試驗(yàn)條件是一起給出的的,稱為“整體設(shè)計(jì)”,并且均勻分布在試驗(yàn)空間中。表頭設(shè)計(jì)ABC列號(hào)

123472整理課件試驗(yàn)計(jì)劃與試驗(yàn)結(jié)果

73整理課件9個(gè)試驗(yàn)點(diǎn)的分布

3C3C2C1A115798642A2A3B1B2B374整理課件(二)進(jìn)行試驗(yàn),并記錄試驗(yàn)結(jié)果

在進(jìn)行試驗(yàn)時(shí),要注意幾點(diǎn):

1.除了所考察的因子外的其它條件,盡可能保持相同

2.試驗(yàn)次序最好要隨機(jī)化

3.必要時(shí)可以設(shè)置區(qū)組因子

75整理課件(三)數(shù)據(jù)分析

1.數(shù)據(jù)的直觀分析

(1)尋找最好的試驗(yàn)條件

在A1水平下進(jìn)行了三次試驗(yàn):#1,#2,#3,而在這三次試驗(yàn)中因子B的三個(gè)水平各進(jìn)行了一次試驗(yàn),因子C的三個(gè)水平也各進(jìn)行了一次試驗(yàn)。

在A2水平下進(jìn)行了三次試驗(yàn):#4,#5,#6,在這三次試驗(yàn)中因子B與C的三個(gè)水平各進(jìn)行了一次試驗(yàn)。

在A3水平下進(jìn)行了三次試驗(yàn):#7,#8,#9,在這三次試驗(yàn)中因子B與C的三個(gè)水平各進(jìn)行了一次試驗(yàn)。

76整理課件將全部試驗(yàn)分成三個(gè)組,那么這三組數(shù)據(jù)間的差異就反映了因子A的三個(gè)水平的差異,為此計(jì)算各組數(shù)據(jù)的和與平均:

T1=y1+y2+y3=160+215+180=555

=T1/3=185

T2=y4+y5+y6=168+236+190=594

=T2/3=198

T3=y7+y8+y9=157+205+140=502

=T3/3=167.3

同理

對(duì)因子B與C將數(shù)據(jù)分成三組分別比較

77整理課件所有計(jì)算列在下面的計(jì)算表中

例2.3-1直觀分析計(jì)算表

78整理課件(2)各因子對(duì)指標(biāo)影響程度大小的分析極差的大小反映了因子水平改變時(shí)對(duì)試驗(yàn)結(jié)果的影響大小。這里因子的極差是指各水平平均值的最大值與最小值之差,譬如對(duì)因子A來講:

RA=198-167.3=30.7

其它的結(jié)果也列在上表中。從三個(gè)因子的極差可知因子B的影響最大,其次是因子A,而因子C的影響最小。

79整理課件(3)各因子不同水平對(duì)指標(biāo)的影響圖從圖上可以明顯地看出每一因子的最好水平A2,B2,C3,也可以看出每個(gè)因子對(duì)指標(biāo)影響的大小RB>RA>RC。

CBA22020519017516090011001300101112708090RARBRC圖2.3-2因子各水平對(duì)輸出力矩的影響

80整理課件由于正交表的特點(diǎn),使試驗(yàn)條件均勻分布在試驗(yàn)空間中,因此使數(shù)據(jù)間具有整齊可比性,上述的直觀分析可以進(jìn)行。但是極差大到什么程度可以認(rèn)為水平的差異確實(shí)是有影響的呢?

2.數(shù)據(jù)的方差分析

要把引起數(shù)據(jù)波動(dòng)的原因進(jìn)行分解,數(shù)據(jù)的波動(dòng)可以用離差平方和來表示。

81整理課件正交表中第j列的離差平方和的計(jì)算公式:

其中Tij為第j列第i水平的數(shù)據(jù)和,T為數(shù)據(jù)總和,n為正交表的行數(shù),q為該列的水平數(shù)

該列表頭是哪個(gè)因子,則該Sj即為該因子的離差平方和,譬如SA=S1

正交表總的離差平方和為:

在這里有:82整理課件[例2.3-1]的方差分析計(jì)算表83整理課件第4列上沒有放因子,稱為空白列。S4僅反映由誤差造成的數(shù)據(jù)波動(dòng),稱為誤差平方和。Se=S4利用可以驗(yàn)證平方和的計(jì)算是否正確。84整理課件[例2.3-1]的方差分析表因子A與B在顯著性0.10與0.05上都是顯著的,而因子C不顯著。85整理課件3.最佳條件的選擇對(duì)顯著因子應(yīng)該取最好的水平;對(duì)不顯著因子的水平可以任意選取,在實(shí)際中通常從降低成本、操作方便等角度加以選擇。上面的例子中對(duì)因子A與B應(yīng)該選擇A2B2,因子C可以任選,譬如為節(jié)約材料可選擇C1。86整理課件4.貢獻(xiàn)率分析方法當(dāng)試驗(yàn)指標(biāo)不服從正態(tài)分布時(shí),進(jìn)行方差分析的依據(jù)就不夠充足,此時(shí)可通過比較各因子的“貢獻(xiàn)率”來衡量因子作用的大小。由于S因中除因子的效應(yīng)外,還包含誤差,從而稱S因-f因Ve為因子的純離差平方和,將因子的純離差平方和與ST的比稱為因子的貢獻(xiàn)率。(四)驗(yàn)證試驗(yàn)對(duì)A2B2C1進(jìn)行三次試驗(yàn),結(jié)果為:234,240,220,平均值為231.3此結(jié)果是滿意的87整理課件三、有交互作用的正交設(shè)計(jì)與數(shù)據(jù)分析例2.3-2為提高某種農(nóng)藥的收率,需要進(jìn)行試驗(yàn)。(一)試驗(yàn)的設(shè)計(jì)明確試驗(yàn)?zāi)康拿鞔_試驗(yàn)指標(biāo)確定試驗(yàn)中所考慮的因子與水平,并確定可能存在并要考察的交互作用選用合適的正交表。88整理課件在本例中:試驗(yàn)?zāi)康模禾岣咿r(nóng)藥的收率試驗(yàn)指標(biāo):收率確定因子與水平以及所要考察的交互作用:因子水平表還要考察因子A與B交互作用89整理課件選表:首先根據(jù)因子的水平數(shù),找出一類正交表再根據(jù)因子的個(gè)數(shù)及交互作用個(gè)數(shù)確定具體的表。把因子放到表的列上去,但是要先放有交互作用的兩個(gè)因子,并利用交互作用表,標(biāo)出交互作用所在列,以便于今后的數(shù)據(jù)分析。把放因子的列中的數(shù)字改為因子的真實(shí)水平,便成為一張?jiān)囼?yàn)計(jì)劃表。90整理課件L8(27)的交互作用表91整理課件試驗(yàn)計(jì)劃92整理課件(二)數(shù)據(jù)分析1.數(shù)據(jù)的方差分析在二水平正交表中一列的離差平方和有一個(gè)簡單的計(jì)算公式:其中T1j、T2j分別是第j列一水平與二水平數(shù)據(jù)的和,n是正交表的行數(shù)93整理課件[例2.3-2]的計(jì)算表94整理課件[例2.3-2]的方差分析表95整理課件其中:SA=S1,SB=S2,SC=S4,SD=S7SA×B=S3,Se=S5+S6fA=fB=fC=fD=fA×B=1,fe=296整理課件A×B的搭配表2.最佳條件的選擇故最佳條件是:A2B1C2A2B1的搭配為好,C取2水平為好。97整理課件(三)避免混雜現(xiàn)象——表頭設(shè)計(jì)的一個(gè)原則選擇正交表時(shí)必須滿足下面一個(gè)條件:“所考察的因子與交互作用自由度之和≤n-1”,其中n是正交表的行數(shù)。不過在存在交互作用的場合,這一條件滿足時(shí)還不一定能用來安排試驗(yàn),所以這是一個(gè)必要條件。98整理課件例2.3-3給出下列試驗(yàn)的表頭設(shè)計(jì):(1)A、B、C、D為二水平因子,同時(shí)考察交互作用A×B,A×C(2)A、B、C、D為二水平因子,同時(shí)考察交互作用A×B,C×D(3)A、B、C、D、E為三水平因子,同時(shí)考察交互作用A×B它們分別要用L8(27),L16(215),L27(313)99整理課件SAS軟件簡介

SAS是美國與西歐使用最為廣泛的三大著名統(tǒng)計(jì)分析軟件(SAS,SPSS和SYSTAT)之一,是目前國際上最為流行的一種大型統(tǒng)計(jì)分析系統(tǒng),被譽(yù)為統(tǒng)計(jì)分析的標(biāo)準(zhǔn)軟件。是國際上公認(rèn)的最權(quán)威的統(tǒng)計(jì)軟件。以苛刻嚴(yán)格著稱于世的美國FDA新藥審批程序中,新藥試驗(yàn)結(jié)果的統(tǒng)計(jì)分析規(guī)定只能用SAS進(jìn)行,其他軟件的計(jì)算結(jié)果一律無效!哪怕只是簡單的均數(shù)和標(biāo)準(zhǔn)差也不行!由此可見SAS的權(quán)威地位。2004年開始中國新藥臨床試驗(yàn)結(jié)果規(guī)定應(yīng)用SAS軟件分析。100整理課件SAS與SPSS比較作為統(tǒng)計(jì)軟件大家族里的“傻瓜相機(jī)”,SPSS的功能是最弱的,但易用性排在所有統(tǒng)計(jì)軟件之首。不過SPSS的易用性也極大的限制了它的功能和可擴(kuò)展性。除了SPSS本身的菜單提供的功能,用戶無法通過編程或者插件來擴(kuò)展它的功能,而且SPSS提供的都只是最基本的常用的方法。101整理課件SAS全球?qū)I(yè)認(rèn)證SAS專業(yè)認(rèn)證是一項(xiàng)擁有極高國際聲譽(yù)的專業(yè)認(rèn)證,在歐美等國的職場上流行的一句話“IfyouhaveaSAScertification,Youwillneverloseyourjob”。銷售模式:只租不售(每5年一個(gè)周期)財(cái)富500強(qiáng)中97%的企業(yè)都在使用SAS商業(yè)智能解決方案102整理課件103整理課件2003年(301醫(yī)院與軍事醫(yī)科院博士生)各統(tǒng)計(jì)軟件使用情況104整理課件Pubmed檢索SCI英文文獻(xiàn)各統(tǒng)計(jì)軟件使用情況105整理課件SAS軟件功能進(jìn)行數(shù)據(jù)管理數(shù)據(jù)輸入、建庫、保存……進(jìn)行統(tǒng)計(jì)分析t檢驗(yàn)方差分析卡方檢驗(yàn)相關(guān)、回歸秩和檢驗(yàn)……106整理課件SAS的安裝SAS8.12版本是windows操作系統(tǒng)下的32位軟件,和其他windows系統(tǒng)下的軟件安裝方法類似。用鼠標(biāo)左鍵雙擊光盤根目錄下的setup圖標(biāo),然后按照提示安裝。107整理課件SAS的啟動(dòng)單擊開始菜單“程序”項(xiàng)。桌面上雙擊此快捷方式也可啟動(dòng)SAS。108整理課件執(zhí)行開始菜單中程序單項(xiàng)【程序】-【TheSASSystem】-【TheSASSystemforWindows】109整理課件SAS退出方式1:選擇關(guān)閉按鈕方式2:執(zhí)行菜單命令【File】→【Exit】方式3:在命令框執(zhí)行BYE或ENDSAS命令110整理課件SAS窗口PGM窗口(ProgramEditor):提供編寫SAS程序的文本編輯器LOG窗口:顯示執(zhí)行程序過程中的相關(guān)信息OUTPUT窗口:顯示程序運(yùn)行的結(jié)果命令窗口與探索者窗口111整理課件程序編輯窗口日志窗口結(jié)果輸出窗口探索者窗口命令窗口112整理課件113整理課件114整理課件115整理課件SAS程序的編寫一個(gè)完整的SAS程序一般由數(shù)據(jù)步(DATA步)和過程步(PROC步)兩部分組成。DATA步以DATA語句開始,通過指定數(shù)據(jù)集名稱、定義變量名及類型和讀入數(shù)據(jù)等建立SAS數(shù)據(jù)集。過程步以PROC語句開始,通過調(diào)用不同的分析模塊來分析SAS數(shù)據(jù)集。116整理課件其它格式的數(shù)據(jù)庫直接導(dǎo)入轉(zhuǎn)換:

excel(.xls);dbase(.dbf);lotus(.wk)等將數(shù)據(jù)讀入系統(tǒng),建立數(shù)據(jù)集(直接輸入Editor窗口)。SAS數(shù)據(jù)集建立117整理課件外部數(shù)據(jù)導(dǎo)入例:有一批體檢數(shù)據(jù),包括受檢者的姓名、性別、年齡、身高、體重信息。要求按性別分別計(jì)算身高、體重的描述性統(tǒng)計(jì)量:均值、標(biāo)準(zhǔn)差、最大值、最小值。該數(shù)據(jù)以Excel.xls文件形式儲(chǔ)存。文件名稱:tijiandata.xls118整理課件119整理課件ImportData120整理課件121整理課件122整理課件123整理課件庫標(biāo)記導(dǎo)入的SAS數(shù)據(jù)庫文件名124整理課件125整理課件探索者窗口126整理課件127整理課件128整理課件在Editor程序編輯窗口輸入源程序數(shù)據(jù)步:將數(shù)據(jù)讀入系統(tǒng),建立數(shù)據(jù)集:DATA語句開始,后面加上數(shù)據(jù)庫的名字。INPUT語句描述數(shù)據(jù)變量,用$表示變量是字符型CARDS語句指示后面是數(shù)據(jù),每行為一個(gè)觀測(cè)數(shù)據(jù),數(shù)據(jù)間無分號(hào)。數(shù)據(jù)最后以“;”開頭的空行結(jié)束。每個(gè)語句都以“;”結(jié)束。129整理課件SAS程序數(shù)據(jù)步格式Data<數(shù)據(jù)庫名稱>;Input<變量名1>$<變量名2>….<變量名K>@@;Cards;..............................;130整理課件數(shù)據(jù)步

過程步131整理課件SAS過程步對(duì)數(shù)據(jù)集中數(shù)據(jù)進(jìn)行分析、處理。以PROC語句開始,調(diào)用SAS過程。每個(gè)語句都以“;”結(jié)束。整個(gè)程序最后要有RUN語句。132整理課件過程步133整理課件SAS程序的書寫格式不分大小寫單個(gè)名稱中不能空格,不同名稱間必須空格一行可寫多條語句,用分號(hào)分割一條語句可寫多行數(shù)據(jù)行后不加分號(hào),數(shù)據(jù)最后單獨(dú)加分號(hào)行程序用“RUN;”語句結(jié)束134整理課件運(yùn)行SAS程序方式一:鼠標(biāo)點(diǎn)擊執(zhí)行按鈕方式二:按功能鍵“F8”方式三:執(zhí)行菜單命令Run→Submit方式四:在命令框輸入SUBMIT命令并執(zhí)行135整理課件136整理課件SAS程序?qū)嵗?/p>

某學(xué)生上學(xué)期8門課程的分?jǐn)?shù)分別為88,90,87,76,92,78,80,86。試用SAS編程求其平均分?jǐn)?shù)。(1)

在PGM窗口鍵入下列程序

datafenshu;inputchengji@@;cards;88

90

87

76

92

78

80

86;procmeans;varchengji;run;

過程步數(shù)據(jù)步137整理課件查看結(jié)果(output窗口)AnalysisVariable:chengji

N

Mean

StdDev

Minimum

Maximum

-----------------------------------------------------------------------

8

84.6250000

5.8782286

76.0000000

92.0000000

-----------------------------------------------------------------------

從結(jié)果看出,該學(xué)生上學(xué)期8門課程的平均成績?yōu)?4.625。138整理課件查看運(yùn)行過程及出錯(cuò)信息激活LOG窗口(F6)

黑色文字:源程序及運(yùn)行情況藍(lán)色文字:程序運(yùn)行情況的說明信息紅色文字:出錯(cuò)信息綠色文字:警告信息139整理課件140整理課件保存SAS程序及其他窗口內(nèi)容激活相應(yīng)窗口,然后選擇:方式一:鼠標(biāo)點(diǎn)擊“存盤”工具按鈕方式二:執(zhí)行菜單命令【File】→【Save】/【Saveas】可保存程序、數(shù)據(jù)文件、運(yùn)行結(jié)果、日志等。SAS保存成純文本格式文件(.txt)。141整理課件保存的文件的名142整理課件在SAS系統(tǒng)內(nèi)打開已保存的文件只能在ProgramEdit窗口打開文件,選擇:方式一:鼠標(biāo)點(diǎn)擊“打開”工具按鈕方式二:執(zhí)行菜單命令【File】→【Open】可打開以前保存的程序、數(shù)據(jù)文件、運(yùn)行結(jié)果、日志等文件及其他文本格式的文件。143整理課件SAS程序主要關(guān)鍵詞means;(n,mean,std,Q1,Q3,CV,median,clm…)

univariatenormal;(正態(tài)性檢驗(yàn),均數(shù)是否為0的假設(shè)檢驗(yàn):參數(shù)與非參數(shù)檢驗(yàn))ttest;(兩個(gè)樣本均數(shù)比較的t檢驗(yàn))anova;(各樣本含量相等的方差分析)

glm;(各樣本含量不等的方差分析)npar1way;(非參數(shù)檢驗(yàn))

reg;(線性回歸方程:單元或多元)corr;(線性相關(guān):線性相關(guān)或秩相關(guān))freq;(卡方、Fisher檢驗(yàn))logistic;(非線性回歸)

lifetest;(生存分析)proc144整理課件定量資料的描述性分析145整理課件分析結(jié)果146整理課件定量資料的正態(tài)性檢驗(yàn)147整理課件正態(tài)性檢驗(yàn)結(jié)果148整理課件配對(duì)設(shè)計(jì)的t-test為了比較兩種方法對(duì)乳酸飲料中脂肪的含量測(cè)定結(jié)果是否不同,隨機(jī)抽取了10份乳酸飲料制品,分別采用哥特里-羅紫法和脂肪酸水解法測(cè)定其結(jié)果,問兩種方法檢測(cè)結(jié)果是否不同?編號(hào)哥特里-羅紫法脂肪酸水解法10.8400.58020.5910.50930.6740.50040.6320.31650.6870.33760.9780.51770.7500.45480.7300.51291.2000.997100.8700.506149整理課件150整理課件151整理課件成組設(shè)計(jì)資料的t-test國產(chǎn)藥進(jìn)口藥-5-176448634777607458-2-14897277486361705436228266-14采用國產(chǎn)藥物和進(jìn)口藥物治療絕經(jīng)后婦女骨質(zhì)疏松癥,試比較兩種藥物的療效是否有差別152整理課件153整理課件154整理課件完全隨機(jī)設(shè)計(jì)資料的方差分析(教科書73頁)安慰劑組2.4g組4.8g組7.2g組3.532.422.860.894.593.362.281.064.344.322.391.082.662.342.281.273.592.682.481.633.132.952.281.894.042.632.321.743.532.862.612.163.652.933.643.373.852.172.582.974.072.723.651.693.932.223.682.114.192.902.652.812.962.973.022.52155整理課件156整理課件方差齊性檢驗(yàn)157整理課件158整理課件159整理課件160整理課件161整理課件162整理課件163整理課件四格表資料的χ2-test組別有效無效合計(jì)有效率胞磷膽堿4665288.5%神經(jīng)節(jié)苷脂1882669.2%合計(jì)64147882.1%某醫(yī)師欲比較胞磷膽堿與神經(jīng)節(jié)苷脂治療腦血管疾病的療效,將78例腦血管疾病患者隨機(jī)分為兩組,試比較兩種藥物的療效164整理課件165整理課件166整理課件167整理課件配對(duì)四格表資料的χ2-test配對(duì)設(shè)計(jì)的卡方檢驗(yàn)168整理課件169整理課件170整理課件171整理課件非參數(shù)檢驗(yàn)(配對(duì))172整理課件173整理課件174整理課件非參數(shù)檢驗(yàn)9D11CDSC25325526636646647748751097121071111比較小白鼠接種三種不同菌型傷寒桿菌9D、11C、DSC1后存活的日數(shù)。175整理課件176整理課件177整理課件178整理課件179整理課件180整理課件直線相關(guān)與回歸年齡尿肌酐含量133.54113.0193.0962.4882.56103.36123.1872.65某地方病研究所調(diào)查了8名正常兒童的尿肌酐含量,試估計(jì)尿肌酐含量對(duì)其年齡的回歸方程。181整理課件回歸相關(guān)182整理課件183整理課件184整理課件一、基礎(chǔ)介紹1、SPSS的簡介2、SPSS的安裝和界面介紹3、變量的屬性和定義方法4、SPSS數(shù)據(jù)的錄入5、數(shù)據(jù)文件的操作(可以打開Excel文檔,保存為多種格式)185整理課件1、SPSS簡介SPSS的全稱是:StatisticalProgramforSocialSciences,即社會(huì)科學(xué)統(tǒng)計(jì)程序。該軟件是公認(rèn)的最優(yōu)秀的統(tǒng)計(jì)分析軟件包之一。 作為統(tǒng)計(jì)分析工具,理論嚴(yán)謹(jǐn)、內(nèi)容豐富,數(shù)據(jù)管理、統(tǒng)計(jì)分析、趨勢(shì)研究、制表繪圖、文字處理等功能,幾乎無所不包。186整理課件2、SPSS的安裝步驟:

1、啟動(dòng)Windows,并將SPSS系統(tǒng)安裝盤插入CD-ROM光盤驅(qū)動(dòng)器。 2、若系統(tǒng)設(shè)置為自動(dòng)運(yùn)行光盤狀態(tài),則光盤自動(dòng)執(zhí)行setup.exe文件,若光盤沒有自動(dòng)運(yùn)行,可啟動(dòng)資源管理器,用鼠標(biāo)雙擊光盤驅(qū)動(dòng)器圖標(biāo),運(yùn)行setup.exe文件,進(jìn)入安裝前的選擇畫面。 3、雙擊installSPSS選項(xiàng),進(jìn)入SPSS15.0forwindow安裝初始畫面,(接受軟件使用協(xié)議,輸入用戶名,機(jī)構(gòu)名稱,選擇安裝路徑,單擊“install”按扭,開始安裝SPSS15.0forwindow軟件。

4、根據(jù)安裝過程的提示,依次順序插換原盤直至安裝完成。

5、安裝完畢后,運(yùn)行SPSS許可證向?qū)?,選擇注冊(cè)軟件的類型和序列號(hào)。當(dāng)軟件注冊(cè)后,方可正常使用。187整理課件SPSS的啟動(dòng) 在Windows的程序管理器中雙擊SPSSFORWINDOWS圖標(biāo)以打開SPSS程序組,選擇SPSS圖標(biāo)并雙擊之,即可啟動(dòng)SPSS。SPSS啟動(dòng)成功后出現(xiàn)SPSS的封面及主窗口,5秒鐘后或點(diǎn)擊鼠標(biāo)左鍵,封面消失,呈現(xiàn)SPSS的預(yù)備工作狀態(tài)

188整理課件SPSS的菜單界面 菜單欄選項(xiàng):1、File:文件管理菜單,有關(guān)文件的調(diào)入、存儲(chǔ)、顯示和打印等; 2、Edit:編輯菜單,有關(guān)文本內(nèi)容的選擇、拷貝、剪貼、尋找和替換等;3、Data:數(shù)據(jù)管理菜單,有關(guān)數(shù)據(jù)變量定義、數(shù)據(jù)格式選定、觀察對(duì)象的選擇、排序、加權(quán)、數(shù)據(jù)文件的轉(zhuǎn)換、連接、匯總等;4、analyze:SPSS軟件統(tǒng)計(jì)分析功能的最核心部分。幾乎所有的統(tǒng)計(jì)分析功能都可以通過主菜單中的Analyze模塊提供的各類過程來完成。5、Transform:數(shù)據(jù)轉(zhuǎn)換處理菜單,有關(guān)數(shù)值的計(jì)算、重新賦值、缺失值替代等;6、Statistics:統(tǒng)計(jì)菜單,有關(guān)一系列統(tǒng)計(jì)方法的應(yīng)用;7、Graphs:作圖菜單,有關(guān)統(tǒng)計(jì)圖的制作;8、Utilities:用戶選項(xiàng)菜單,有關(guān)命令解釋、字體選擇、文件信息、定義輸出標(biāo)題、窗口設(shè)計(jì)等;9、Windows:窗口管理菜單,有關(guān)窗口的排列、選擇、顯示等;10、Help:求助菜單,有關(guān)幫助文件的調(diào)用、查尋、顯示等。

點(diǎn)擊菜單選項(xiàng)即可激活菜單,這時(shí)彈出下拉式子菜單,用戶可根據(jù)自己的需求再點(diǎn)擊子菜單的選項(xiàng),完成特定的功能。

189整理課件3、定義變量啟動(dòng)SPSS后,出現(xiàn)如圖2-1所示數(shù)據(jù)編輯窗口。由于目前還沒有輸入數(shù)據(jù),因此顯示的是一個(gè)空文件。190整理課件

定義變量

輸入數(shù)據(jù)前首先要定義變量。定義變量即要定義變量名、變量類型、變量長度(小數(shù)位數(shù))、變量標(biāo)簽(或值標(biāo)簽)和變量的格式。單擊數(shù)據(jù)編輯窗口左下方的“VariableView”標(biāo)簽或雙擊列的題頭(Var),進(jìn)入如圖2-2所示的變量定義視圖窗口,在此窗口中即可定義變量。191整理課件圖2-2變量定義視圖窗口192整理課件

變量的定義信息在圖2-2所示的窗口中每一行表示一個(gè)變量的定義信息,包括Name、Type、Width、Decimal、Label、Values、Missing、Columns、Align、Measure等。193整理課件1.定義變量名(Name)SPSS默認(rèn)的變量為Var00001、Var00002等,用戶也可以根據(jù)自己的需要來命名變量。SPSS變量的命名和一般的編程語言一樣,有一定的命名規(guī)則,具體內(nèi)容如下。變量名必須以字母、漢字或字符@開頭,其他字符可以是任何字母、數(shù)字或_、@、#、$等符號(hào)。變量最后一個(gè)字符不能是句號(hào)。變量名總長度不能超過8個(gè)字符(即4個(gè)漢字)。不能使用空白字符或其他特殊字符(如“!”、“?”等)。

194整理課件2.定義變量類型(Type)單擊Type相應(yīng)單元中的按鈕,彈出如圖2-3所示的對(duì)話框,在對(duì)話框中選擇合適的變量類型并單擊“OK”按鈕,即可定義變量類型。SPSS的主要變量類型如下:195整理課件3.變量長度(Width)設(shè)置變量的長度,當(dāng)變量為日期型時(shí)無效。196整理課件4.變量小數(shù)點(diǎn)位數(shù)(Decimal)設(shè)置變量的小數(shù)點(diǎn)位數(shù),當(dāng)變量為日期型時(shí)無效。197整理課件5.變量標(biāo)簽(Label)變量標(biāo)簽是對(duì)變量名的進(jìn)一步描述,變量只能由不超過8個(gè)字符組成,而8個(gè)字符經(jīng)常不足以表示變量的含義。而變量標(biāo)簽可長達(dá)120個(gè)字符,變量標(biāo)簽可顯示大小寫,需要時(shí)可用變量標(biāo)簽對(duì)變量名的含義加以解釋。198整理課件6.變量值標(biāo)簽(Values)值標(biāo)簽是對(duì)變量的每一個(gè)可能取值的進(jìn)一步描述。199整理課件7.缺失值的定義方式(Missing)SPSS有兩類缺失值:系統(tǒng)缺失值和用戶缺失值。單擊Missing相應(yīng)單元中的按鈕,在彈出的如圖2-5所示的對(duì)話框中可改變?nèi)笔е档亩x方式,在SPSS中有兩種定義缺失值的方式。可以定義3個(gè)單獨(dú)的缺失值??梢远x一個(gè)缺失值范圍和一個(gè)單獨(dú)的缺失值。200整理課件8.變量的顯示寬度(Columns)輸入變量的顯示寬度,默認(rèn)為8。201整理課件9.變量顯示的對(duì)齊方式(Align)選擇變量值顯示時(shí)的對(duì)齊方式:Left(左對(duì)齊)、Right(右對(duì)齊)、Center(居中對(duì)齊)。默認(rèn)是右對(duì)齊。202整理課件10.變量的測(cè)量尺度(Measure)

變量按測(cè)量精度可以分為定性變量、定序變量、定距變量和定比變量幾種。SPSS將其分為定距變量(Scale)、定序變量(Ordinal)、定類變量(Nominal)。定距變量:年齡、溫度、重量、次數(shù)等,包括連續(xù)變量和不連續(xù)變量。定序變量:職稱(高下)、程度(高低)等。定類變量:職業(yè)、性別等。203整理課件4、數(shù)據(jù)的錄入

錄入數(shù)據(jù)的一般方法:定義了所有變量后,單擊“DataView”標(biāo)簽,即可在出現(xiàn)的數(shù)據(jù)視圖(編輯)窗中輸入數(shù)據(jù)。數(shù)據(jù)錄入時(shí)可以逐行錄入,也可以逐列。204整理課件數(shù)據(jù)的錄入技巧:1.減少無用擊鍵次數(shù)技巧1:問卷錄入時(shí)一般從左到右輸入,換行時(shí)多有不便。開始輸入時(shí)不要按”右”方向鍵,按tab鍵光標(biāo)自然向右,需要換行時(shí)按回車,光標(biāo)自然回到第一行開始錄入的列,節(jié)省時(shí)間。另:如果在其他情況下需要從上往下輸入,先用鼠標(biāo)選定特定區(qū)域,輸入時(shí)按回車鍵光標(biāo)自然向下。到了最底行光標(biāo)自然換行。技巧2:按“F4“(=Ctrl+Y)可以重復(fù)上一步操作。205整理課件數(shù)據(jù)的錄入技巧:2.數(shù)字小鍵盤的盲打注意指法,食指放4,管7和1,中指放5,管6和2和小數(shù)點(diǎn),無名指放6,管9和3,小拇指管回車鍵,大拇指管0.熟練加以練習(xí)。206整理課件數(shù)據(jù)的錄入技巧:3.批量錄入相同數(shù)據(jù)連續(xù)以及不連續(xù)空間都可以。不連續(xù)分布數(shù)據(jù):按Ctrl不放然后用鼠標(biāo)點(diǎn)擊需要填入數(shù)據(jù)的單元格,再再最后的單元格里輸入數(shù)據(jù),最后按Ctrl+回車就行了。連續(xù)區(qū)域輸入:用鼠標(biāo)圈出一塊地,在光標(biāo)所在單元格(白色那個(gè))輸入數(shù)據(jù),再Ctrl+回車,一氣呵成。207整理課件

錄入帶有變量值標(biāo)簽的數(shù)據(jù)在錄入帶有變量值標(biāo)簽的數(shù)據(jù)時(shí),用戶手工輸入的是實(shí)際的變量值,而屏幕上顯示的是與該變量對(duì)應(yīng)的變量值標(biāo)簽。選中“ValueLables”的效果208整理課件5、讀取Excel軟件文件(.xls)Excel軟件可能是Windows系列操作系統(tǒng)中使用最多的數(shù)據(jù)表格軟件。Excel文件以.xls為擴(kuò)展名保存。該文件除了保存純數(shù)據(jù)信息外,還保存了另外一些數(shù)據(jù)信息。SPSS提供了與Excel文件的接口,可以方便地將Excel文件讀入數(shù)據(jù)編輯窗口。具體的操作過程如下。209整理課件圖2-58讀取Excel文件210整理課件圖2-59“OpeningExcelDataSource”對(duì)話框211整理課件SPSS默認(rèn)將某個(gè)sheet中所有數(shù)據(jù)都讀入到數(shù)據(jù)編輯窗口中。在“Range”框中輸入要讀取數(shù)據(jù)的范圍,也允許指定讀取一部分區(qū)域的數(shù)據(jù),如要讀入前50行數(shù)據(jù),則在該框中輸入A1:F50,表示讀取的區(qū)域是以A1單元為左上角,F(xiàn)50為右下角的矩形區(qū)域。Excel表格中每一行為SPSS的一個(gè)個(gè)案。單擊“Continue”按鈕,即可完成數(shù)據(jù)導(dǎo)入。212整理課件

SPSS數(shù)據(jù)文件的保存在錄入數(shù)據(jù)時(shí),應(yīng)及時(shí)保存數(shù)據(jù),防止數(shù)據(jù)的丟失,以便再次使用該數(shù)據(jù)。213整理課件用戶確定盤符、路徑、文件名以及文件格式后單擊“Save”按鈕,即可保存為指定類型的數(shù)據(jù)文件。SPSS支持的常見的數(shù)據(jù)文件存放格式如下。SPSS(*.sav)SPSS/PC+(*.sys)SPSSPortable(*.por)Tabdelimited(*.dat)214整理課件SPSS的數(shù)據(jù)結(jié)構(gòu)定義1.用Execl錄入數(shù)據(jù)之后,復(fù)制(或者用SPSS打開.xls文檔)到SPSS中去。2.定義變量的屬性。打開“Data”選擇“DefiningVariableProperties”命令,分別或者一起設(shè)置各變量的屬性。215整理課件整體定義變量屬性216整理課件二、SPSS的使用2.1、基本統(tǒng)計(jì)分析2.11基本統(tǒng)計(jì)量的定義和計(jì)算2.12頻數(shù)分析過程2.2、spss統(tǒng)計(jì)圖形的創(chuàng)建和編輯2.21spss圖形基本功能介紹2.22具體介紹一下圖表的用法(條形圖、線圖、面積圖)217整理課件SPSS基本統(tǒng)計(jì)分析是進(jìn)行其他統(tǒng)計(jì)分析的基礎(chǔ)和前提。通過基本統(tǒng)計(jì)方法的學(xué)習(xí),可以對(duì)要分析數(shù)據(jù)的總體特征有比較準(zhǔn)確的把握,從而有助于選擇其他更為深入的統(tǒng)計(jì)分析方法。這里主要介紹如何在SPSS中進(jìn)行平均數(shù)、中位數(shù)、眾數(shù)、均值標(biāo)準(zhǔn)誤差、頻數(shù)、方差、標(biāo)準(zhǔn)差等的操作。大家可以據(jù)此自己探索其它的統(tǒng)計(jì)分析操作。218整理課件常用基本統(tǒng)計(jì)量的英文名均值(Mean)中位數(shù)(Median)眾數(shù)(Mode)百分位數(shù)(Percentile)樣本方差(Variance)樣本標(biāo)準(zhǔn)差(Std.deviation)偏度(Skewness):取值分布對(duì)稱性峰度(Kurtosis):取值分布形態(tài)陡緩219整理課件2.1均值(Mean)和均值標(biāo)準(zhǔn)誤差(S.E.mean)2.11統(tǒng)計(jì)學(xué)上的定義和計(jì)算公式定義:均值(平均值、平均數(shù))表示的是某變量所有取值的集中趨勢(shì)或平均水平。例如,學(xué)生某門學(xué)科的平均成績、公司員工的平均收入、某班級(jí)學(xué)生的平均身高等。計(jì)算公式如下。220整理課件總體平均數(shù):若一組數(shù)據(jù)X1,X2,…,XN,代表一個(gè)大小為N的有限總體,則其總體平均數(shù)為221整理課件樣本平均數(shù):若一組數(shù)據(jù)x1,x2,…,xn,代表一個(gè)大小為n的有限樣本,則其樣本平均數(shù)為222整理課件樣本數(shù)據(jù)來自總體。樣本的統(tǒng)計(jì)描述量可以反映總體數(shù)據(jù)的特征,但由于抽樣等原因,使得樣本數(shù)據(jù)不一定能夠完全準(zhǔn)確地反映總體,它可能與總體的真實(shí)值之間存在一定的差異。進(jìn)行不同次抽樣,會(huì)得到若干個(gè)不同的樣本均值,它們與總體均值存在著不同的差異。均值標(biāo)準(zhǔn)誤差(StandardErrorofMean,S.E.mean)就是描述這些樣本均值與總體均值之間平均差異程度的統(tǒng)計(jì)量。223整理課件SPSS中實(shí)現(xiàn)過程研究問題求某班級(jí)學(xué)生在一次數(shù)學(xué)測(cè)驗(yàn)中的平均成績,數(shù)據(jù)如表3-1所示。數(shù)學(xué)成績998879595489795689992389705067788956表3-1 某班級(jí)的數(shù)學(xué)成績224整理課件實(shí)現(xiàn)步驟圖3-1在菜單中選擇“Frequencies”命令225整理課件圖3-2“Frequencies”對(duì)話框(一)226整理課件圖3-3“Frequencies:Statistics”對(duì)話框(一)百分位數(shù)偏離度中心趨勢(shì)分布標(biāo)準(zhǔn)差方差標(biāo)準(zhǔn)誤差227整理課件結(jié)果和討論228整理課件中位數(shù)(Median)統(tǒng)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論