




下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、主成分分析主成分分析(principalcomponentanalysis)將多個(gè)變量通過線性變換以選出較少個(gè)數(shù)重要變量的一種多元統(tǒng)計(jì)分析方法。又稱主分量分析。在實(shí)際課題中,為了全面分析問題,往往提出很多與此有關(guān)的變量(或因素),因?yàn)槊總€(gè)變量都在不同程度上反映這個(gè)課題的某些信息。但是,在用統(tǒng)計(jì)分析方法研究這個(gè)多變量的課題時(shí),變量個(gè)數(shù)太多就會(huì)增加課題的復(fù)雜性。人們自然希望變量個(gè)數(shù)較少而得到的信息較多。在很多情形,變量之間是有一定的相關(guān)關(guān)系的,當(dāng)兩個(gè)變量之間有一定相關(guān)關(guān)系時(shí),可以解釋為這兩個(gè)變量反映此課題的信息有一定的重疊。主成分分析是對于原先提出的所有變量,建立盡可能少的新變量,使得這些新變量是
2、兩兩不相關(guān)的,而且這些新變量在反映課題的信息方面盡可能保持原有的信息。主成分分析首先是由K. 皮爾森對非隨機(jī)變量引入的,爾后H. 霍特林將此方法推廣到隨機(jī)向量的情形。信息的大小通常用離差平方和或方差來衡量。( 1 )主成分分析的原理及基本思想。原理:設(shè)法將原來變量重新組合成一組新的互相無關(guān)的幾個(gè)綜合變量,同時(shí)根據(jù)實(shí)際需要從中可以取出幾個(gè)較少的總和變量盡可能多地反映原來變量的信息的統(tǒng)計(jì)方法叫做主成分分析或稱主分量分析,也是數(shù)學(xué)上處理降維的一種方法?;舅枷耄褐鞒煞址治鍪窃O(shè)法將原來眾多具有一定相關(guān)性(比如P 個(gè)指標(biāo)),重新組合成一組新的互相無關(guān)的綜合指標(biāo)來代替原來的指標(biāo)。通常數(shù)學(xué)上的處理就是將原來
3、 P 個(gè)指標(biāo)作線性組合,作為新的綜合指標(biāo)。最經(jīng)典的做法就是用F1 (選取的第一個(gè)線性組合,即第一個(gè)綜合指標(biāo))的方差來表達(dá),即Var(F1) 越大,表示F1 包含的信息越多。因此在所有的線性組合中選取的F1 應(yīng)該是方差最大的,故稱F1 為第一主成分。如果第一主成分不足以代表原來P 個(gè)指標(biāo)的信息,再考慮選取F2 即選第二個(gè)線性組合,為了有效地反映原來信息,F(xiàn)1 已有的信息就不需要再出現(xiàn)再F2 中,用數(shù)學(xué)語言表達(dá)就是要求Cov(F1,F2)=0 ,則稱F2 為第二主成分,依此類推可以構(gòu)造出第三、第四,第 P 個(gè)主成分。(2)步驟Fp=a1mZX1+a2mZX2+ +apmZXp其中a1i,a2i,a
4、pi(i=1,m)為X 的協(xié)方差陣的特征值多對應(yīng)的特征向量, ZX1,ZX2,ZXp是原始變量經(jīng)過標(biāo)準(zhǔn)化處理的值,因?yàn)樵趯?shí)際應(yīng)用中,往往存在指標(biāo)的量綱不同,所以在計(jì)算之前須先消除量綱的影響,而將原始數(shù)據(jù)標(biāo)準(zhǔn)化,本文所采用的數(shù)據(jù)就存在量綱影響注:本文指的數(shù)據(jù)標(biāo)準(zhǔn)化是指Z 標(biāo)準(zhǔn)化 。A=(aij)pm=(a1,a2,am,), Rai=iai , R為相關(guān)系數(shù)矩陣,i、ai是相應(yīng)的特征值和單位特征向量, 1 2 p。0進(jìn)行主成分分析主要步驟如下:1. 指標(biāo)數(shù)據(jù)標(biāo)準(zhǔn)化( SPSS 軟件自動(dòng)執(zhí)行);2. 指標(biāo)之間的相關(guān)性判定;3. 確定主成分個(gè)數(shù)m ;4. 主成分 Fi 表達(dá)式;5. 主成分 Fi 命
5、名;回歸分析回歸分析 ( regressionanalysis)是確定兩種或兩種以上變數(shù)間相互依賴的定量關(guān)系的一種統(tǒng)計(jì)分析方法。運(yùn)用十分廣泛,回歸分析按照涉及的自變量的多少,可分為一元回歸分析和多元回歸分析;按照自變量和因變量之間的關(guān)系類型,可分為線性回歸分析和 非線性回歸分析。如果在回歸分析中,只包括一個(gè)自變量 和一個(gè) 因變量 ,且二者的關(guān)系可用一條直線近似表示,這種回歸分析稱為一元線性回歸分析。如果回歸分析中包括兩個(gè)或兩個(gè)以上的自變量,且因變量和自變量之間是線性關(guān)系,則稱為多元線性回歸分析。方差齊性線性關(guān)系效應(yīng)累加變量無測量誤差變量服從多元正態(tài)分布觀察獨(dú)立模型完整(沒有包含不該進(jìn)入的變量、
6、也沒有漏掉應(yīng)該進(jìn)入的變量)誤差項(xiàng)獨(dú)立且服從(0,1 )正態(tài)分布?,F(xiàn)實(shí)數(shù)據(jù)常常不能完全符合上述假定。因此,統(tǒng)計(jì)學(xué)家研究出許多的回歸模型來解決線性回歸模型假定過程的約束。研究一個(gè)或多個(gè)隨機(jī)變量Y1, Y2, Yi 與另一些變量X1 、 X2 , Xk之間的關(guān)系的統(tǒng)計(jì)方法。又稱多重回歸分析。通常稱Y1 ,Y2 , ,Yi 為因變量,X1 、X2 , Xk為自變量。回歸分析是一類數(shù)學(xué)模型,特別當(dāng)因變量和自變量為線性關(guān)系時(shí),它是一種特殊的線性模型。最簡單的情形是一個(gè)自變量和一個(gè)因變量,且它們大體上有線性關(guān)系,這叫一元線性回歸,即模型為Y a bX ,這里X 是自變量,Y 是因變量,是隨機(jī)誤差,通常假定隨
7、機(jī)誤差的均值 為 0,方差 為 2( 2 大于 0 )2與 X 的值無關(guān)。若進(jìn)一步假定隨機(jī)誤差遵從正態(tài)分布,就叫做正態(tài)線性模型。一般的情形,差有k 個(gè)自變量和一個(gè)因變量,因變量的值可以分解為兩部分:一部分是由自變量的影響,即表示為自變量的函數(shù) ,其中函數(shù)形式已知,但含一些未知參數(shù) ;另一部分是由于其他未被考慮的因素和隨機(jī)性 的影響,即隨機(jī)誤差。當(dāng)函數(shù)形式為未知參數(shù)的線性函數(shù)時(shí),稱線性回歸分析模型;當(dāng)函數(shù)形式為未知參數(shù)的非線性 函數(shù)時(shí),稱為非線性回歸分析模型。當(dāng)自變量的個(gè)數(shù)大于1 時(shí)稱為多元回歸,當(dāng)因變量個(gè)數(shù)大于 1 時(shí)稱為多重回歸。回歸分析的主要內(nèi)容為:從一組數(shù)據(jù)出發(fā)確定某些變量之間的定量關(guān)系
8、式,即建立 數(shù)學(xué)模型并估計(jì)其中的未知參數(shù)。估計(jì)參數(shù)的常用方法是最小二乘法。對這些關(guān)系式的可信程度進(jìn)行檢驗(yàn)。在許多自變量共同影響著一個(gè)因變量的關(guān)系中,判斷哪個(gè)(或哪些)自變量的影響是顯著的,哪些自變量的影響是不顯著的,將影響顯著的自變量選入模型中,而剔除影響不顯著的變量,通常用逐步回歸、向前回歸和向后回歸等方法。利用所求的關(guān)系式對某一生產(chǎn)過程進(jìn)行預(yù)測或控制。回歸分析的應(yīng)用是非常廣泛的,統(tǒng)計(jì) 軟件包 使各種回歸方法計(jì)算十分方便。 編輯本段回歸分析的應(yīng)用相關(guān)分析研究的是現(xiàn)象之間是否相關(guān)、相關(guān)的方向和密切程度,一般不區(qū)別自變量或因變量。而回歸分析則要分析現(xiàn)象之間相關(guān)的具體形式,確定其因果關(guān)系,并用數(shù)學(xué)
9、模型來表現(xiàn)其具體關(guān)系。比如說,從相關(guān)分析中我們可以得知“質(zhì)量 ”和 “用戶滿意度 ”變量密切相關(guān),但是這兩個(gè)變量之間到底是哪個(gè)變量受哪個(gè)變量的影響,影響程度如何,則需要通過回歸分析方法來確定。一般來說,回歸分析是通過規(guī)定因變量和自變量來確定變量之間的因果關(guān)系,建立回歸模型,并根據(jù)實(shí)測數(shù)據(jù)來求解模型的各個(gè)參數(shù),然后評(píng)價(jià)回歸模型是否能夠很好的擬合實(shí)測數(shù)據(jù);如果能夠很好的擬合,則可以根據(jù)自變量作進(jìn)一步預(yù)測。例如,如果要研究質(zhì)量和用戶滿意度之間的因果關(guān)系,從實(shí)踐意義上講,產(chǎn)品質(zhì)量會(huì)影響用戶的滿意情況,因此設(shè)用戶滿意度為因變量,記為Y ;質(zhì)量為自變量,記為 X 。根據(jù)圖8 3 的散點(diǎn)圖,可以建立下面的線
10、性關(guān)系:Y=A+BX+式中:A 和B 為待定參數(shù),A 為回歸直線的截距;B 為回歸直線的斜率,表示X變化一個(gè)單位時(shí),Y 的平均變化情況;為依賴于用戶滿意度的隨機(jī)誤差項(xiàng)。在 SPSS軟件里可以很容易地實(shí)現(xiàn)線性回歸,回歸方程如下:y=0.857+0.836x回歸直線在y 軸上的截距為0.857、斜率0.836,即質(zhì)量每提高一分,用戶滿意度平均上升0.836分;或者說質(zhì)量每提高1 分對用戶滿意度的貢獻(xiàn)是0.836分。740)this.width=740上面所示的例子是簡單的一個(gè)自變量的線性回歸問題,在數(shù)據(jù)分析的時(shí)候,也可以將此推廣到多個(gè)自變量的多元回歸,具體的回歸過程和意義請參考相關(guān)的統(tǒng)計(jì)學(xué)書籍。此
11、外,在 SPSS的結(jié)果輸出里,還可以匯報(bào)R2 ,F(xiàn) 檢驗(yàn)值和 T 檢驗(yàn)值。 R2 又稱為方程的確定性系數(shù)(coefficient ofdetermination),表示方程中變量X對Y的解釋程度。R2 取值在0 到 1之間,越接近1 ,表明方程中X 對 Y 的解釋能力越強(qiáng)。通常將 R2乘以 100 來表示回歸方程解釋Y 變化的百分比。F 檢驗(yàn)是通過方差分析表輸出的,通過顯著性水平(significantlevel)檢驗(yàn)回歸方程的線性關(guān)系是否顯著。一般來說,顯著性水平在0.05 以下,均有意義。當(dāng)F 檢驗(yàn)通過時(shí),意味著方程中至少有一個(gè)回歸系數(shù)是顯著的,但是并不一定所有的回歸系數(shù)都是顯著的,這樣就
12、需要通過 T 檢驗(yàn)來驗(yàn)證回歸系數(shù)的顯著性。同樣地,T 檢驗(yàn)可以通過顯著性水平或查表來確定。在上面所示的例子中,各參數(shù)的意義如表8 2 所示。表 8 2線性回歸方程檢驗(yàn)指標(biāo)顯著性水平意義“質(zhì)量”解釋了R89 的 “用戶滿0.89意度 ”的變化程度F276.82回歸方程的線性0.001關(guān)系顯著T16.64回歸方程的系數(shù)0.001顯著示例SIM 手機(jī)用戶滿意度與相關(guān)變量線性回歸分析我們以SIM手機(jī)的用戶滿意度與相關(guān)變量的線性回歸分析為例,來進(jìn)一步說明線性回歸的應(yīng)用。從實(shí)踐意義講上,手機(jī)的用戶滿意度應(yīng)該與產(chǎn)品的質(zhì)量、價(jià)格和形象有關(guān),因此我們以“用戶滿意度”為因變量, “質(zhì)量 ”“形象、 ”和 “價(jià)格
13、”為自變量,作線性回歸分析。利用SPSS軟件的回歸分析,得到回歸方程如下:用戶滿意度0.008 形象 0.645 質(zhì)量 0.221 價(jià)格對于SIM 手機(jī)來說,質(zhì)量對其用戶滿意度的貢獻(xiàn)比較大,質(zhì)量每提高1 分,用戶滿意度將提高0.645分;其次是價(jià)格,用戶對價(jià)格的評(píng)價(jià)每提高1 分,其滿意度將提高 0.221分;而形象對產(chǎn)品用戶滿意度的貢獻(xiàn)相對較小,形象每提高1 分,用戶滿意度僅提高0.008分。方程各檢驗(yàn)指標(biāo)及含義如下:指標(biāo)顯著性水平意義“質(zhì)量 ”和 “形象 ”解釋了89 的R20.89“用戶滿意度”的變化程度F248.53回歸方程的線性0.001關(guān)系顯著T(形象)0.001.000“形象 ”變
14、量對回歸方程幾乎沒有貢獻(xiàn)T(質(zhì)量)13.93“質(zhì)量 ”對回歸方0.001程有很大貢獻(xiàn)T(價(jià)格)5.00“價(jià)格 ”對回歸方0.001程有很大貢獻(xiàn)從方程的檢驗(yàn)指標(biāo)來看,“形象 ”對整個(gè)回歸方程的貢獻(xiàn)不大,應(yīng)予以刪除。所以重新做 “用戶滿意度”與 “質(zhì)量 、”“價(jià)格 ”的回歸方程如下:用戶滿意度0.645 質(zhì)量 0.221 價(jià)格對于SIM 手機(jī)來說,質(zhì)量對其用戶滿意度的貢獻(xiàn)比較大,質(zhì)量每提高1 分,用戶滿意度將提高0.645分;用戶對價(jià)格的評(píng)價(jià)每提高1 分,其滿意度將提高0.221分(在本示例中,因?yàn)椤靶蜗?”對方程幾乎沒有貢獻(xiàn),所以得到的方程與前面的回歸方程系數(shù)差不多) 。方程各檢驗(yàn)指標(biāo)及含義如下
15、:指標(biāo)顯著性水平意義“質(zhì)量 ”和 “形象 ”解釋了89 的R0.89“用戶滿意度”的變化程度F374.69回歸方程的線性0.001關(guān)系顯著T(質(zhì)量)15.15“質(zhì)量 ”對回歸方0.001程有很大貢獻(xiàn)T(價(jià)格)5.06“價(jià)格 ”對回歸方0.001程有很大貢獻(xiàn)判別分析 編輯本段1、定義判別分析 又稱 “分辨法 ”, 是在分類確定的條件下,根據(jù)某一研究對象的各種特征值判別其類型歸屬問題的一種多變量統(tǒng)計(jì)分析方法。其基本原理是按照一定的判別準(zhǔn)則,建立一個(gè)或多個(gè)判別函數(shù),用研究對象的大量資料確定判別函數(shù)中的待定系數(shù),并計(jì)算判別指標(biāo)。據(jù)此即可確定某一樣本屬于何類。 編輯本段2、分類根據(jù)判別中的組數(shù),可以分為
16、兩組判別分析和多組判別分析;根據(jù)判別函數(shù)的形式,可以分為線性判別和非線性判別;根據(jù)判別式處理變量的方法不同,可以分為逐步判別、序貫判別等;根據(jù)判別標(biāo)準(zhǔn)不同,可以分為距離判別、Fisher判別、 Bayes判別法等 編輯本段3、應(yīng)用在氣候分類、農(nóng)業(yè)區(qū)劃、土地類型劃分中有著廣泛的應(yīng)用。在市場調(diào)研中,一般根據(jù)事先確定的因變量(例如產(chǎn)品的主要用戶、普通用戶和非用戶、自有房屋或租賃、電視觀眾和非電視觀眾)找出相應(yīng)處理的區(qū)別特性。在判別分析中,因變量為類別數(shù)據(jù),有多少類別就有多少類別處理組;自變量通常為可度量數(shù)據(jù)。通過判別分析,可以建立能夠最大限度的區(qū)分因變量類別的函數(shù),考查自變量的組間差異是否顯著,判斷
17、那些自變量對組間差異貢獻(xiàn)最大,評(píng)估分類的程度,根據(jù)自變量的值將樣本歸類。系統(tǒng)聚類分析是一門多元統(tǒng)計(jì)分類法,根據(jù)多種地學(xué)要素對地理實(shí)體進(jìn)行劃分類別的方法。對不同的要素劃分類別往往反映不同目標(biāo)的等級(jí)序列,如土地分等定級(jí)、水土流失強(qiáng)度分級(jí)等。系統(tǒng)聚類的步驟一般是首先根據(jù)一批地理數(shù)據(jù)或指標(biāo)找出能度量這些數(shù)據(jù)或指標(biāo)之間相似程度的統(tǒng)計(jì)量;然后以統(tǒng)計(jì)量作為劃分類型的依據(jù),把一些相似程度大的站點(diǎn)(或樣品)首先聚合為一類,而把另一些相似程度較小的站點(diǎn)(或樣品)聚合為另一類,直到所有的站點(diǎn)(或樣品)都聚合完畢,最后根據(jù)各類之間的親疏關(guān)系,逐步畫成一張完整的分類系統(tǒng)圖,又稱譜系圖。其相似程度由距離或者相似系數(shù)定義。
18、進(jìn)行類別合并的準(zhǔn)則是使得類間差異最大,而類內(nèi)差異最小。特點(diǎn):事先無須知道分類對象的分類結(jié)構(gòu),而只需要一批地理數(shù)據(jù);然后選好分類統(tǒng)計(jì)量,并按一定的方法步驟進(jìn)行計(jì)算;最后便能自然地、客觀地得到一張完整的分類系統(tǒng)圖。相關(guān)分析目錄 隱藏 相關(guān)分析定義相關(guān)分析的分類相關(guān)分析與回歸分析的關(guān)系復(fù)相關(guān) 編輯本段相關(guān)分析定義相關(guān)分析(correlationanalysis),相關(guān)分析是研究現(xiàn)象之間是否存在某種依存關(guān)系,并對具體有依存關(guān)系的現(xiàn)象探討其相關(guān)方向以及相關(guān)程度,是研究隨機(jī)變量之間的相關(guān)關(guān)系的一種統(tǒng)計(jì)方法。相關(guān)關(guān)系是一種非確定性的關(guān)系,例如,以X 和 Y 分別記一個(gè)人的身高和體重,或分別記每公頃施肥量與每
19、公頃小麥產(chǎn)量,則X 與 Y 顯然有關(guān)系,而又沒有確切到可由其中的一個(gè)去精確地決定另一個(gè)的程度,這就是相關(guān)關(guān)系。 編輯本段相關(guān)分析的分類1 、線性相關(guān)分析:研究兩個(gè)變量間線性關(guān)系的程度。用相關(guān)系數(shù)r 來描述。-正相關(guān):如果x,y變化的方向一致,如身高與體重的關(guān)系,r0 ;一般地,|r|0.95存在顯著性相關(guān); |r| 0.高8度相關(guān); 0.5 |r|0.8 中度相關(guān); 0.3 |r|0.5 低度相關(guān);|r|0.3關(guān)系極弱,認(rèn)為不相關(guān)負(fù)相關(guān):如果x,y變化的方向相反,如吸煙與肺功能的關(guān)系,r0 ;無線性相關(guān):r=0 。如果變量Y 與X 間是函數(shù)關(guān)系,則r=1或r=-1;如果變量Y 與X 間是統(tǒng)計(jì)關(guān)
20、系,則 -1r 樣本均數(shù)排序- 計(jì)算 q 值 - 查 q 界值表判斷結(jié)果。2 、多個(gè)實(shí)驗(yàn)組與一個(gè)對照組均數(shù)間兩兩比較多個(gè)實(shí)驗(yàn)組與一個(gè)對照組均數(shù)間兩兩比較,若目的是減小第II 類錯(cuò)誤,最好選用最小顯著差法(LSD法);若目的是減小第I 類錯(cuò)誤,最好選用新復(fù)極差法,前者查t界值表,后者查q 界值表。 編輯本段 方差分析的基本思想基本思想:通過分析研究中不同來源的變異對總變異的貢獻(xiàn)大小,從而確定可控因素對研究結(jié)果影響力的大小。下面我們用一個(gè)簡單的例子來說明方差分析的基本思想:如某克山病區(qū)測得11 例克山病患者和13 名健康人的血磷值(mmol/L )如下:患者: 0.841.051.201.201.
21、391.531.671.801.872.072.11健康人: 0.540.640.640.750.760.811.161.201.341.351.481.561.87問該地克山病患者與健康人的血磷值是否不同?從以上資料可以看出,24個(gè)患者與健康人的血磷值各不相同,如果用離均差平方和( SS )描述其圍繞總均數(shù)的變異情況,則總變異有以下兩個(gè)來源:組內(nèi)變異,即由于隨機(jī)誤差的原因使得各組內(nèi)部的血磷值各不相等;組間變異,即由于克山病的影響使得患者與健康人組的血磷值均數(shù)大小不等。而且: SS 總 =SS 組間 +SS 組內(nèi)v 總 =v 組間 +v 組內(nèi)如果用均方(即自由度v 去除離均差平方和的商)代替離
22、均差平方和以消除各組樣本數(shù)不同的影響,則方差分析就是用組內(nèi)均方去除組間均方的商(即F值)與1相比較, 若 F 值接近1,則說明各組均數(shù)間的差異沒有統(tǒng)計(jì)學(xué)意義,若 F 值遠(yuǎn)大于1 ,則說明各組均數(shù)間的差異有統(tǒng)計(jì)學(xué)意義。實(shí)際應(yīng)用中檢驗(yàn)假設(shè)成立條件下F 值大于特定值的概率可通過查閱F 界值表(方差分析用)獲得。 編輯本段 方差分析的分類及舉例一、單因素方差分析(一)單因素方差分析概念理解步驟是用來研究一個(gè)控制變量的不同水平是否對觀測變量產(chǎn)生了顯著影響。這里,由于僅研究單個(gè)因素對觀測變量的影響,因此稱為單因素方差分析。例如,分析不同施肥量是否給農(nóng)作物產(chǎn)量帶來顯著影響,考察地區(qū)差異是否影響婦女的生育率,
23、研究學(xué)歷對工資收入的影響等。這些問題都可以通過單因素方差分析得到答案。單因素方差分析的第一步是明確觀測變量和控制變量。例如,上述問題中的觀測變量分別是農(nóng)作物產(chǎn)量、婦女生育率、工資收入;控制變量分別為施肥量、地區(qū)、學(xué)歷。單因素方差分析的第二步是剖析觀測變量的方差。方差分析認(rèn)為:觀測變量值得變動(dòng)會(huì)受控制變量和隨機(jī)變量兩方面的影響。據(jù)此,單因素方差分析將觀測變量總的離差平方和分解為組間離差平方和和組內(nèi)離差平方和兩部分,用數(shù)學(xué)形式表述為:SST=SSA+SSE。單因素方差分析的第三步是通過比較觀測變量總離差平方和各部分所占的比例,推斷控制變量是否給觀測變量帶來了顯著影響。(二)單因素方差分析原理總結(jié)容
24、易理解:在觀測變量總離差平方和中,如果組間離差平方和所占比例較大,則說明觀測變量的變動(dòng)主要是由控制變量引起的,可以主要由控制變量來解釋,控制變量給觀測變量帶來了顯著影響;反之,如果組間離差平方和所占比例小,則說明觀測變量的變動(dòng)不是主要由控制變量引起的,不可以主要由控制變量來解釋,控制變量的不同水平?jīng)]有給觀測變量帶來顯著影響,觀測變量值的變動(dòng)是由隨機(jī)變量因素引起的。(三)單因素方差分析基本步驟? 1 、提出原假設(shè): H0 無差異; H1 有顯著差異? 2、選擇檢驗(yàn)統(tǒng)計(jì)量:方差分析采用的檢驗(yàn)統(tǒng)計(jì)量是F 統(tǒng)計(jì)量,即 F 值檢驗(yàn)。? 3、計(jì)算檢驗(yàn)統(tǒng)計(jì)量的觀測值和概率P 值:該步驟的目的就是計(jì)算檢驗(yàn)統(tǒng)計(jì)
25、量的觀測值和相應(yīng)的概率P 值。? 4 、給定顯著性水平,并作出決策(四)單因素方差分析的進(jìn)一步分析在完成上述單因素方差分析的基本分析后,可得到關(guān)于控制變量是否對觀測變量造成顯著影響的結(jié)論,接下來還應(yīng)做其他幾個(gè)重要分析,主要包括方差齊性檢驗(yàn)、多重比較檢驗(yàn)。1 、方差齊性檢驗(yàn)是對控制變量不同水平下各觀測變量總體方差是否相等進(jìn)行檢驗(yàn)。前面提到, 控制變量不同各水平下觀測變量總體方差無顯著差異是方差分析的前提要求。如果沒有滿足這個(gè)前提要求,就不能認(rèn)為各總體分布相同。因此,有必要對方差是否齊性進(jìn)行檢驗(yàn)。SPSS單因素方差分析中,方差齊性檢驗(yàn)采用了方差同質(zhì)性(homogeneityofvariance )
26、檢驗(yàn)方法,其原假設(shè)是:各水平下觀測變量總體的方差無顯著差異。2 、多重比較檢驗(yàn)單因素方差分析的基本分析只能判斷控制變量是否對觀測變量產(chǎn)生了顯著影響。如果控制變量確實(shí)對觀測變量產(chǎn)生了顯著影響,進(jìn)一步還應(yīng)確定控制變量的不同水平對觀測變量的影響程度如何,其中哪個(gè)水平的作用明顯區(qū)別于其他水平,哪個(gè)水平的作用是不顯著的,等等。例如,如果確定了不同施肥量對農(nóng)作物的產(chǎn)量有顯著影響,那么還需要了解10公斤、 20 公斤、 30 公斤肥料對農(nóng)作物產(chǎn)量的影響幅度是否有差異,其中哪種施肥量水平對提高農(nóng)作物產(chǎn)量的作用不明顯,哪種施肥量水平最有利于提高產(chǎn)量等。掌握了這些重要的信息就能夠幫助人們制定合理的施肥方案,實(shí)現(xiàn)低
27、投入高產(chǎn)出。多重比較檢驗(yàn)利用了全部觀測變量值,實(shí)現(xiàn)對各個(gè)水平下觀測變量總體均值的逐對比較。 由于多重比較檢驗(yàn)問題也是假設(shè)檢驗(yàn)問題,因此也遵循假設(shè)檢驗(yàn)的基本步驟。介紹幾種常用檢驗(yàn)統(tǒng)計(jì)量的構(gòu)造方法( 1)LSD 方法LSD 方法稱為最小顯著性差異(LeastSignificantDifference)法。最小顯著性差異法的字畫就體現(xiàn)了其檢驗(yàn)敏感性高的特點(diǎn),即水平間的均值只要存在一定程度的微小差異就可能被檢驗(yàn)出來。正是如此,它利用全部觀測變量值,而非僅使用某兩組的數(shù)據(jù)。LSD 方法適用于各總體方差相等的情況,但它并沒有對犯一類錯(cuò)誤的概率問題加以有效控制。( 2 ) S-N-K方法S-N-K方法是一種
28、有效劃分相似性子集的方法。該方法適合于各水平觀測值個(gè)數(shù)相等的情況,3 、其他檢驗(yàn)( 1 )先驗(yàn)對比檢驗(yàn)在多重比較檢驗(yàn)中,如果發(fā)現(xiàn)某些水平與另外一些水平的均值差距顯著,如有五個(gè)水平,其中x1 、 x2 、 x3 與 x4 、 x5 的均值有顯著差異,就可以進(jìn)一步分析比較這兩組總的均值是否存在顯著差異,即1/3(x1+x2+x3)與 1/2(x4+x5)是否有顯著差異。這種事先指定各均值的系數(shù),再對其線性組合進(jìn)行檢驗(yàn)的分析方法稱為先驗(yàn)對比檢驗(yàn)。通過先驗(yàn)對比檢驗(yàn)?zāi)軌蚋_地掌握各水平間或各相似性子集間均值的差異程度。( 2 )趨勢檢驗(yàn)當(dāng)控制變量為定序變量時(shí),趨勢檢驗(yàn)?zāi)軌蚍治鲭S著控制變量水平的變化,觀
29、測變量值變化的總體趨勢是怎樣的,是呈現(xiàn)線性變化趨勢,還是呈二次、三次等多項(xiàng)式變化。通過趨勢檢驗(yàn),能夠幫助人們從另一個(gè)角度把握控制變量不同水平對觀測變量總體作用的程度。二、多因素方差分析(一)多因素方差分析基本思想多因素方差分析用來研究兩個(gè)及兩個(gè)以上控制變量是否對觀測變量產(chǎn)生顯著影響。這里,由于研究多個(gè)因素對觀測變量的影響,因此稱為多因素方差分析。多因素方差分析不僅能夠分析多個(gè)因素對觀測變量的獨(dú)立影響,更能夠分析多個(gè)控制因素的交互作用能否對觀測變量的分布產(chǎn)生顯著影響,進(jìn)而最終找到利于觀測變量的最優(yōu)組合。例如:分析不同品種、不同施肥量對農(nóng)作物產(chǎn)量的影響時(shí),可將農(nóng)作物產(chǎn)量作為觀測變量,品種和施肥量作
30、為控制變量。利用多因素方差分析方法,研究不同品種、不同施肥量是如何影響農(nóng)作物產(chǎn)量的,并進(jìn)一步研究哪種品種與哪種水平的施肥量是提高農(nóng)作物產(chǎn)量的最優(yōu)組合。(二)多因素方差分析的其他功能1 、均值檢驗(yàn)在 SPSS 中,利用多因素方差分析功能還能夠?qū)Ω骺刂谱兞坎煌较掠^測變量的均值是否存在顯著差異進(jìn)行比較,實(shí)現(xiàn)方式有兩種,即多重比較檢驗(yàn)和對比檢驗(yàn)。多重比較檢驗(yàn)的方法與單因素方差分析類似。 對比檢驗(yàn)采用的是單樣本 t 檢驗(yàn)的方法,它將控制變量不同水平下的觀測變量值看做來自不同總體的樣本, 并依次檢驗(yàn)這些總體的均值是否與某個(gè)指定的檢驗(yàn)值存在顯著差異。 其中,檢驗(yàn)值可以指定為以下幾種:觀測變量的均值(De
31、viation) ;第一水平或最后一個(gè)水平上觀測變量的均值(前一水平上觀測變量的均值(Difference) ;后一水平上觀測變量的均值(Helmert )。Simple) ;2 、控制變量交互作用的圖形分析控制變量的交互作用可以通過圖形直觀分析。(三)多因素方差分析的進(jìn)一步分析在上述案例中,已經(jīng)對廣告形式、地區(qū)對銷售額的影響進(jìn)行了多因素方差分析,建立了飽和模型。由分析可知:廣告形式與地區(qū)的交互作用不顯著,先進(jìn)一步嘗試非飽和模型,并進(jìn)行均值比較分析、交互作用圖形分析。1 、建立非飽和模型2 、均值比較分析3 、控制變量交互作用的圖形分析三、協(xié)方差分析(一)協(xié)方差分析基本思想通過上述的分析可以看到,不論是單因素方差分析還是多因素方差分析,控制因素都是可控的,其各個(gè)水平可以通過人為的努力得到控制和確定。但在許多實(shí)際問題中,有些控制因素很難人為控制,但它們的不同水平確實(shí)對觀測變量產(chǎn)生了較為顯著的影響。例如,在研究農(nóng)作物產(chǎn)量問題時(shí),如果僅考察不同施肥量、品種對農(nóng)作物產(chǎn)量的影響,不考慮不同地塊等因素而進(jìn)行方差分析,顯然是不全面的。因?yàn)槭聦?shí)上有些地塊可能有利于農(nóng)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 勞務(wù)合同和技術(shù)承包
- 個(gè)人勞務(wù)分包合同簡本
- 綠化護(hù)坡施工方案
- 產(chǎn)品測評(píng)表-產(chǎn)品用戶反饋收集
- 生物化學(xué)分析實(shí)驗(yàn)技術(shù)練習(xí)題集
- 商場餐飲經(jīng)營商鋪?zhàn)赓U合同
- 農(nóng)民宅基地轉(zhuǎn)讓合同
- 臨汾低溫冷庫施工方案
- 杭州室內(nèi)球場施工方案
- 鋁合金飛廊及蓋板施工方案
- 高中通用技術(shù)人教高二下冊目錄新型抽紙盒-
- 畜牧場經(jīng)營管理
- 課程思政示范課程申報(bào)書(測繪基礎(chǔ))
- ALeader 阿立得 ALD515使用手冊
- 神華陜西國華錦界電廠三期工程環(huán)評(píng)報(bào)告
- 飛行員航空知識(shí)手冊
- GB/Z 19848-2005液壓元件從制造到安裝達(dá)到和控制清潔度的指南
- GB/T 34936-2017光伏發(fā)電站匯流箱技術(shù)要求
- GB/T 12618.4-2006開口型平圓頭抽芯鉚釘51級(jí)
- 紅金大氣商務(wù)風(fēng)領(lǐng)導(dǎo)歡迎會(huì)PPT通用模板
- 學(xué)前教育學(xué)00383-歷年真題-試卷
評(píng)論
0/150
提交評(píng)論