均值比較與方差分析.ppt_第1頁
均值比較與方差分析.ppt_第2頁
均值比較與方差分析.ppt_第3頁
均值比較與方差分析.ppt_第4頁
均值比較與方差分析.ppt_第5頁
已閱讀5頁,還剩62頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、2014數(shù)學(xué)建模培訓(xùn),第5講 均值比較與方差分析,一、SPSS數(shù)據(jù)的錄入與管理,2020/12/9,4,由于建立數(shù)據(jù)文件是SPSS分析的基礎(chǔ),所以本講首先簡要介紹數(shù)據(jù)的錄入與管理。 SPSS具有很強(qiáng)的數(shù)據(jù)處理和分析能力,它可以讀取11種不同類型的外部文件,存儲30種不同類型的數(shù)據(jù)文件。 利用SPSS對數(shù)據(jù)進(jìn)行分析, 首先,2020/12/9,5,要建立數(shù)據(jù)文件。另外,有時還需要對已有數(shù)據(jù)文件進(jìn)行編輯、管理,如變量、屬性和文件的管理等。 1. 數(shù)據(jù)的錄入與調(diào)用 下面用一個實(shí)例介紹建立數(shù)據(jù)文件和錄入數(shù)據(jù)的方法。 例1 現(xiàn)有15人的體檢資料,試建立SPSS數(shù)據(jù)文件,并存為1_1.sav,2020/1

2、2/9,6,體檢資料包含的信息有編號、姓名、文化程度、出生日期、體檢日期、身高、體重、疾病名稱。 在SPSS中,錄入數(shù)據(jù)時,首先要根據(jù)數(shù)據(jù)特征確定變量的名稱、類型(寬度,小數(shù))、標(biāo)簽、值等。 本例中的變量特征如下,2020/12/9,7,2020/12/9,8,數(shù)據(jù)錄入過程與方法: (1) 啟動SPSS,選擇“輸入數(shù)據(jù)”,進(jìn)入數(shù)據(jù)編輯器; (2) 選擇變量視圖; (3) 依次錄入各變量的名稱、類型 (寬度, 小數(shù))、標(biāo)簽、值; (4) 選擇數(shù)據(jù)視圖; (5) 依次錄入相應(yīng)數(shù)據(jù),2020/12/9,9,保存后即生成.sav文件。 如果SPSS需調(diào)用Excel文件,當(dāng)數(shù)據(jù)較少時,可直接復(fù)制;當(dāng)數(shù)據(jù)

3、較多時,可通過: 文件打開數(shù)據(jù)庫新建查詢Excel files流程調(diào)入Excel 數(shù)據(jù)。 調(diào)入數(shù)據(jù)后,可按照前述方式對其分別定義變量各屬性,2020/12/9,10,調(diào)入Excel數(shù)據(jù)要特別注意第1行數(shù)據(jù)的變化。 2. 數(shù)據(jù)的管理 數(shù)據(jù)文件建立后,有時需要對變量進(jìn)行管理,如插入變量、定義變量屬性、復(fù)制變量屬性等。 數(shù)據(jù)管理主要通過“數(shù)據(jù)”菜單進(jìn)行,請各位自行練習(xí),二、均值比較,2020/12/9,12,1. 引言 在科學(xué)實(shí)驗中常常要研究不同實(shí)驗條件或方法對實(shí)驗結(jié)果的影響。比如,幾種不同藥物對某種疾病的療效;不同飼料對牲畜體重增長的效果等。 研究上述問題的基本思路是比較不同實(shí)驗條件或方法下樣本均

4、值間的差異,2020/12/9,13,比較樣本均值間的差異是否具有統(tǒng)計學(xué)意義的常用方法有均值比較和方差分析。 均值比較僅用于單因素兩水平設(shè)計和單組設(shè)計中均值的檢驗,而方差分析可用于單因素多水平設(shè)計和多因素設(shè)計中均值的檢驗。 簡單地說,均值比較僅適用于兩,2020/12/9,14,個樣本均值的比較,而方差分析適用 三個及以上樣本均值的比較。 2. 均值比較的原理與步驟 均值比較采用假設(shè)檢驗原理,并設(shè)總體均為正態(tài)分布,比較步驟為: (1) 提出假設(shè) 通常假設(shè)差異不顯著。 (2) 構(gòu)造檢驗統(tǒng)計量,2020/12/9,15,總體方差已知時,構(gòu)造的統(tǒng)計量服從正態(tài)分析,稱為Z檢驗。大多數(shù)情況下,總體方差未

5、知,此時構(gòu)造的統(tǒng)計量服從t分布,稱為t檢驗。 (3) 確定顯著性水平(拒真概率) 顯著性水平 即為檢驗時犯拒真 錯誤概率的最大允許值,也就是說接受假設(shè)的正確率至少為,2020/12/9,16,通常取 。 (4) 計算檢驗統(tǒng)計量t0 (5) 作出推斷(兩種方法) 用統(tǒng)計量若 , 則拒絕假設(shè),即差異顯著。 用顯著性概率P值(sig.)若顯著性概率 ,則拒絕假設(shè),即差異顯著,2020/12/9,17,2020/12/9,18,3. 單一樣本均值的t檢驗 單一樣本均值的檢驗,即只對單一變量的均值進(jìn)行檢驗,用于檢驗樣本均值是否與給定的總體均值之間存在顯著差異。 例1 已知某年級15個學(xué)生身高數(shù)據(jù)如下,檢

6、驗其平均身高是否與全年級平均身高165相同,2020/12/9,19,解 分析-比較均值-單樣本t檢驗。 選身高入檢驗變量,檢驗值設(shè)為165;選項中置信區(qū)間百分比默認(rèn)為0.95,即,2020/12/9,20,顯然,在0.05水平下應(yīng)接受假設(shè),即15個學(xué)生的平均身高與年級平均身高無顯著差異,2020/12/9,21,4. 獨(dú)立樣本均值的t檢驗 獨(dú)立樣本均值的檢驗用于檢驗兩個來自獨(dú)立正態(tài)總體的樣本均值之間是否存在顯著差異。 例2 根據(jù)下列數(shù)據(jù)比較男生和女生的平均身高是否相等。 解 本題首先要注意數(shù)據(jù)格式。 可以設(shè)置三列數(shù)據(jù)。第一列為序,2020/12/9,22,號(字符型或數(shù)據(jù)型),第二列為身高(

7、數(shù)值型),第三列為性別(字符型, 字符1表示男生,字符0表示女生)。 此時一定要在數(shù)據(jù)視圖的“值”中進(jìn)行值標(biāo)簽定義,如1=“男生”, 0= “女生”。 分析-比較均值-獨(dú)立樣本t檢驗,2020/12/9,23,選身高入檢驗變量,選性別入分組變量,并在定義組中定義組1, 組2的值分別為1, 0。 其余默認(rèn),確定,2020/12/9,24,F=0.843, P=0.3750.01,按0.01水平可認(rèn)為男女生總體方差相等,應(yīng)選擇方差相等的結(jié)果,2020/12/9,25,顯然,在0.01水平下應(yīng)拒絕假設(shè),即男女生的平均身高有顯著差異,2020/12/9,26,5. 配對樣本均值的t檢驗 配對樣本均值的

8、檢驗用于檢驗兩個具有配對關(guān)系的正態(tài)總體的樣本均值之間是否存在顯著差異。 配對的兩個樣本值是一一對應(yīng)的,且容量相同。例如,一組病人治療前后身體的指標(biāo);一個年級學(xué)生的期中和期末成績,2020/12/9,27,例3 根據(jù)下列數(shù)據(jù)比較期中和期末成績是否相等。 解 本題數(shù)據(jù)格式與例2不同。 分析-比較均值-配對樣本t檢驗,2020/12/9,28,期中期末成績高度相關(guān)且顯著。 拒絕假設(shè),期中期末成績差異明顯,三、方差分析,2020/12/9,30,1. 方差分析及基本概念 在科學(xué)研究中,經(jīng)常要分析多種因素對研究對象某些特征值的影響。例如,醫(yī)學(xué)界研究幾種藥物對某種疾病的療效;體育科研中研究訓(xùn)練方法訓(xùn)練時間

9、和運(yùn)動量對提高運(yùn)動成績的效果。方差分析就是研究各種因素對研究對象某種特征值影響大小的一種,2020/12/9,31,統(tǒng)計方法。 下面通過一個例子簡要介紹方差分析中的相關(guān)概念。 引例 一家超市要研究競爭者的數(shù)量對銷售額是否有顯著影響。抽取3家超市,競爭者數(shù)量按0個, 1個, 2個, 3個以上分為4類,獲得的年銷售額如下表。試研究競爭者的數(shù)量對銷售額,2020/12/9,32,是否有顯著影響。 研究對象即試驗結(jié)果稱為試驗指標(biāo),簡稱指標(biāo),常用y表示,如本例中的銷售額,2020/12/9,33,在試驗中要通過改變狀態(tài)加以考察的因素稱為因子,常用A,B,C,表示,如本例中的競爭者。 因子在試驗中所取的不

10、同狀態(tài)稱為因子的水平,常用A1, A2, , Ar表示, r稱為因子A的水平數(shù)。本例中顯然有4個水平。 從平均銷售額來看,好像競爭者,2020/12/9,34,個數(shù)對銷售額有一定影響,但仔細(xì)分析一下數(shù)據(jù),問題就不那么簡單。 可以看到,在競爭者個數(shù)相同的條件下,不同超市的銷售額也不完全一樣。由于試驗時已考慮超市的其它條件基本相同,產(chǎn)生這種差異的原因主要是試驗過程中各種偶然因素,稱之為試驗誤差,2020/12/9,35,因此對不同競爭者個數(shù)超市平均銷售額的差異應(yīng)作仔細(xì)分析,以確定差異究竟是由試驗誤差引起的,還是由于競爭者個數(shù)不同引起的。 如果差異是由試驗誤差引起的,則認(rèn)為競爭者個數(shù)對銷售額沒有顯著

11、影響,簡稱因子不顯著。 如果不同水平下銷售額的不同,2020/12/9,36,除了誤差影響外,主要是由水平不同造成的,則認(rèn)為競爭者個數(shù)對銷售額有顯著影響,簡稱因子顯著。 2. 方差分析基本思想 方差分析的基本思想是:假設(shè)待比較的均值都相等,然后將總偏差平方和分解為效應(yīng)平方和SA與誤差平方和Se兩部分,再利用SA 和Se 構(gòu)造F 統(tǒng),2020/12/9,37,計量進(jìn)行假設(shè)檢驗,從而判定均值之間是否存在差異。 由于檢驗統(tǒng)計量是根據(jù)組間方差和組內(nèi)方差構(gòu)造的,所以稱此方法為方差分析。 3. 單因子方差分析 單因子方差分析研究一個因子的不同水平對指標(biāo)是否有顯著影響,2020/12/9,38,單因子方差分

12、析的步驟為: (1) 提出假設(shè) 通常假設(shè)影響不顯著。 (2) 構(gòu)造檢驗統(tǒng)計量 方差分析構(gòu)造的檢驗統(tǒng)計量服從F分布。 (3) 確定顯著性水平 顯著性水平 即為檢驗時犯錯誤,2020/12/9,39,的概率,也就是說接受假設(shè)的正確率為 。 通常取 。 (4) 計算檢驗統(tǒng)計量F0 (5) 作出推斷 可以根據(jù)下列兩種方法推斷: 用統(tǒng)計量若 , 則拒絕假設(shè),即影響顯著,2020/12/9,40,用P值若 ,則拒絕假設(shè),即影響顯著。 顯著性水平 越小,顯著性越高,且有如下規(guī)則,2020/12/9,41,2020/12/9,42,例4 對引例進(jìn)行方差分析。 解 (1) 建立數(shù)據(jù)文件,格式為:數(shù)據(jù)為2列,第1

13、列為因子的水平,第2列為對應(yīng)的銷售額。 (2) 分析-比較均值-單因素ANOVA。 (3) 選銷售額為因變量,競爭者為因子,2020/12/9,43,4) 在對比欄中選擇“多項式(線性)”;在兩兩比較欄中選擇“LSD”, 其它默認(rèn); (5) 在選項中可選擇“方差同質(zhì)性檢驗”和“均值圖,2020/12/9,44,因子分析要求各水平下總體方差相等,即方差齊性。 本題中方差齊性檢驗統(tǒng)計量等于0.746,P=0.5540.1,通過檢驗,即可認(rèn)為滿足方差齊性,2020/12/9,45,競爭者個數(shù)對銷售額影響顯著,2020/12/9,46,2020/12/9,47,同時比較多個水平間指標(biāo)差異是否顯著稱為多

14、重比較。 表中數(shù)據(jù)顯示,0和1,0和3,1和3,2和3差異不顯著,而0和2,1和2差異顯著。 均值圖顯示了均值的變化趨勢,也從一定程度上驗證了多重比較的結(jié)論,2020/12/9,48,2020/12/9,49,4. 多因子方差分析 多因子方差分析研究兩個及以上因素是否對指標(biāo)產(chǎn)生顯著影響。 多因子方差分析不僅能分析多個因素對指標(biāo)的獨(dú)立影響,更能分析多個因素的交互作用能否對指標(biāo)產(chǎn)生顯著影響,進(jìn)而找到有利于指標(biāo)的最優(yōu)組合,2020/12/9,50,下面以兩因子為例介紹多因子方差分析。 在兩因子分析中,不僅要通過試驗數(shù)據(jù)分析因子A的r水平及因子B的s個水平對指標(biāo)y是否有顯著影響,有時還要考慮兩個因子聯(lián)

15、合起來對指標(biāo)y是否有顯著影響,這種聯(lián)合作用稱為因子的交互作用,記為AB,2020/12/9,51,若一個因子水平下的指標(biāo)不受另一個因子不同水平的影響,則稱這兩個因子無交互作用。否則,稱這兩個因子有交互作用。 無交互作用,2020/12/9,52,有交互作用 無交互作用時雙因子方差分析的步驟為: (1) 提出假設(shè) 通常假設(shè)影響不顯著,2020/12/9,53,2) 構(gòu)造檢驗統(tǒng)計量 構(gòu)造的檢驗統(tǒng)計量服從F分布。 (3) 確定顯著性水平 (4) 計算檢驗統(tǒng)計量 (5) 作出推斷 有交互作用時雙因子方差分析的步驟為: (1) 提出假設(shè),2020/12/9,54,通常假設(shè)影響不顯著。 (2) 構(gòu)造檢驗統(tǒng)

16、計量 構(gòu)造的檢驗統(tǒng)計量服從F分布。 (3) 確定顯著性水平 (4) 計算檢驗統(tǒng)計量 (5) 作出推斷 若 ,則在 水平下因子A顯著,2020/12/9,55,若 ,則在 水平下因子B顯著; 若 ,則在 水平下因子AB顯著。 例5 有4個品牌的電腦在5個地區(qū)銷售,銷售量見下表。試分析電腦品牌和銷售地區(qū)對銷售量的影響。 解 (1) 建立數(shù)據(jù)文件,格式為,2020/12/9,56,數(shù)據(jù)為3列,第1列為銷售量,第2,3列分別為地區(qū)和品牌。 (2) 分析-一般線性模型-單變量。注:這里的變量是指因變量。 (3) 選銷售量為因變量,地區(qū)和品牌為固定因子。 (4) 模型選項中選“設(shè)定”,并將地區(qū)和品牌選入模

17、型,2020/12/9,57,5) 對比和繪制選項可以默認(rèn)。 (6) 在兩兩比較選項中選地區(qū)或品牌進(jìn)比較框,并選擇LSD方法。 (7) 在選項欄中可選擇輸出“方差齊性檢驗”,2020/12/9,58,有時,由于數(shù)據(jù)原因,SPSS無法進(jìn)行方差齊性檢驗(如本例)。不過,一般認(rèn)為,方差齊性檢驗不太重要,只要各組樣本數(shù)量相等即可,2020/12/9,59,地區(qū)不顯著,而品牌高度顯著,2020/12/9,60,2020/12/9,61,多重比較的解釋同前。 例5中并未考慮交互作用。若要考慮交互作用,則應(yīng)選擇全因子分析模型,但并不是任何數(shù)據(jù)都可以進(jìn)行全因子分析,如例5。 下面用例6說明如何進(jìn)行交互作用分析。 例6 將超市位置按商業(yè)區(qū)、居民,2020/12/9,62,區(qū)和寫字樓分成3類,并在不同位置分別隨機(jī)抽取3家超市,競爭者數(shù)量按0個, 1個, 2個, 3個

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論