




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、數(shù)據(jù)統(tǒng)計(jì)與分析技術(shù)數(shù)據(jù)統(tǒng)計(jì)與分析技術(shù)w1.1 數(shù)據(jù)的排序w1.2 數(shù)據(jù)的轉(zhuǎn)置w1.3 數(shù)據(jù)的拆分w1.4 數(shù)據(jù)文件的合并w1.5 數(shù)據(jù)的選擇w1.6 數(shù)據(jù)的加權(quán)w1.7 數(shù)據(jù)的轉(zhuǎn)換w2.1 基本數(shù)學(xué)模型w2.2 頻數(shù)分析過程w2.3 數(shù)據(jù)描述過程w2.4 數(shù)據(jù)探察過程w2.5 列聯(lián)表分析過程w3.1 分組平均數(shù)的比較w3.2 單一樣本t檢驗(yàn)w3.3 獨(dú)立樣本t檢驗(yàn)w3.4 配對樣本t檢驗(yàn)w4.1 相關(guān)系數(shù)w4.2 偏相關(guān)系數(shù)w4.3 距離分析w5.1 線性回歸w5.2 曲線回歸非 參 數(shù) 檢 驗(yàn)w6.1 非參數(shù)檢驗(yàn)概述w6.2 單樣本檢驗(yàn) w6.3 獨(dú)立樣本差異的顯著性檢驗(yàn)w6.4 相關(guān)樣本差
2、異的顯著性檢驗(yàn) 方 差 分 析w7.1 方差分析概述w7.2 方差分析的基本步驟w7.3 單因素方差分析w7.4 多因素方差分析w7.5 協(xié)方差分析聚類分析和判別分析w8.1 聚類分析和判別分析過程概述w8.2 快速樣本聚類過程w8.3 分層聚類分析w8.4 判別分析主成分分析和因子分析w9. 1 主成分分析 w9. 2 因子分析時(shí)間序列分析w10.1 指數(shù)平滑法w10.2 季節(jié)分解法w10.3 自回歸法w10.4 自回歸綜合移動平均模型Bye ByeBye數(shù)據(jù)的排序1. 在主菜單中單擊Data菜單選項(xiàng),打開該菜單條;2.單擊Sort Cases選項(xiàng),打開對話框; 3. 在左邊窗口選定變量名,
3、再用箭頭按鈕, 將變量轉(zhuǎn)到Sort by 窗口中; 4.在Sort Order方框中,選擇排序方式。 數(shù)據(jù)的排序數(shù)據(jù)的排序?qū)υ捒驅(qū)υ捒驍?shù)據(jù)的轉(zhuǎn)置1. 在主菜單中單擊Data菜單選項(xiàng),打開該菜單條;2.單擊Transpose選項(xiàng),打開對話框; 3.在左邊窗口選定變量名,再用箭頭按鈕,將變量轉(zhuǎn)到Transpose窗口中; 4. 單擊“OK”按鈕,確認(rèn)后,生成新的數(shù)據(jù)文件。 數(shù)據(jù)的轉(zhuǎn)置數(shù)據(jù)的轉(zhuǎn)置對話框?qū)υ捒驍?shù)據(jù)的拆分1. 在主菜單中單擊Data菜單選項(xiàng),打開該菜單條;2.單擊Split File選項(xiàng),打開對話框; 3.選擇進(jìn)行拆分的方式; 4.在左邊窗口選定變量名,用中間箭頭按鈕,將變量轉(zhuǎn)到Grou
4、ps Based on窗口中;5.注意拆分前的排序,選擇兩種方式。 數(shù)據(jù)的拆分?jǐn)?shù)據(jù)的拆分對話框?qū)υ捒驍?shù)據(jù)文件合并1. 樣本合并(橫向拼接)DataMerge FilesAdd Cases2.變量合并(縱向拼接)DataMerge Files Add Variable 數(shù)據(jù)的選擇1. 根據(jù)邏輯關(guān)系表達(dá)式選擇數(shù)據(jù)2.隨機(jī)選取數(shù)據(jù)3.在給定范圍內(nèi)選擇數(shù)據(jù) 4.用過濾器變量選擇數(shù)據(jù)數(shù)據(jù)的加權(quán)1.加權(quán)(Weight)是一種通過人為方法來調(diào)節(jié)樣本或數(shù)據(jù)大小的方法,在資料輸入、樣本分析和科學(xué)評價(jià)中經(jīng)常起到舉足輕重的作用。2.加權(quán)有兩種情況:對變量的值加權(quán)對個(gè)案加權(quán) 對話框數(shù)據(jù)的加權(quán)數(shù)據(jù)的加權(quán)對話框?qū)υ捒驍?shù)據(jù)
5、的轉(zhuǎn)換1. 利用Compute功能選項(xiàng)轉(zhuǎn)換數(shù)據(jù)2. 利用Count功能選項(xiàng)轉(zhuǎn)換數(shù)據(jù)3. 利用Recode功能選項(xiàng)轉(zhuǎn)換數(shù)據(jù)4. 利用Automatic Recode功能選項(xiàng)轉(zhuǎn)換數(shù)據(jù) 5. 利用隨機(jī)數(shù)種子轉(zhuǎn)換數(shù)據(jù)基本數(shù)學(xué)模型1. 1.描述集中趨勢的統(tǒng)計(jì)量描述集中趨勢的統(tǒng)計(jì)量: :算術(shù)平均數(shù)算術(shù)平均數(shù) 調(diào)和平均數(shù)調(diào)和平均數(shù) 幾何平均數(shù)幾何平均數(shù)眾數(shù)眾數(shù) 中位數(shù)中位數(shù)2.2.描述離散趨勢的統(tǒng)計(jì)量描述離散趨勢的統(tǒng)計(jì)量極差極差 平均差平均差 標(biāo)準(zhǔn)差(方差)標(biāo)準(zhǔn)差(方差) 標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤 3.3.描述分布特征的統(tǒng)計(jì)量描述分布特征的統(tǒng)計(jì)量偏度偏度 峰度峰度 算術(shù)平均數(shù)算術(shù)平均數(shù) 算術(shù)平均數(shù)等于所有樣本數(shù)據(jù)的總和
6、除以數(shù)據(jù)個(gè)數(shù)。算術(shù)平均值是描述樣本數(shù)據(jù)中心趨勢最常用的統(tǒng)計(jì)量。在分組條件下,其公式為:niiniiiffXX11標(biāo)準(zhǔn)差(方差)標(biāo)準(zhǔn)差(方差) 標(biāo)準(zhǔn)差()與方差(2 )是反映數(shù)據(jù)離散趨勢最常用的統(tǒng)計(jì)量。在分組條件下,方差的公式為:niiniiiffXX1122)(標(biāo)準(zhǔn)差是方差方差的算術(shù)平方根。頻數(shù)分析過程該過程可計(jì)算數(shù)據(jù)資料的各種該過程可計(jì)算數(shù)據(jù)資料的各種描述統(tǒng)計(jì)指標(biāo)、給出變量簡單頻數(shù)描述統(tǒng)計(jì)指標(biāo)、給出變量簡單頻數(shù)分布表、繪制幾種變量分布圖。分布表、繪制幾種變量分布圖。Analyze Descriptive Statistics Frequencies出現(xiàn)對話框頻數(shù)分析過程對話框統(tǒng)計(jì)量選擇對話框
7、統(tǒng)計(jì)量選擇對話框 數(shù)據(jù)描述過程該過程計(jì)算數(shù)據(jù)資料的各種描該過程計(jì)算數(shù)據(jù)資料的各種描述統(tǒng)計(jì)指標(biāo),但不給出分布圖。述統(tǒng)計(jì)指標(biāo),但不給出分布圖。Analyze Descriptive Statistics Descriptives出現(xiàn)對話框數(shù)據(jù)描述過程對話框Options對話框 數(shù)據(jù)探察過程探索性數(shù)據(jù)分析是指對數(shù)據(jù)的初步考察,探索性數(shù)據(jù)分析是指對數(shù)據(jù)的初步考察,由描述統(tǒng)計(jì)指標(biāo)和直觀的圖形組成。包括檢由描述統(tǒng)計(jì)指標(biāo)和直觀的圖形組成。包括檢查數(shù)據(jù)錯(cuò)誤、描述整體或分組數(shù)據(jù)的數(shù)量特查數(shù)據(jù)錯(cuò)誤、描述整體或分組數(shù)據(jù)的數(shù)量特征和分布特征,假設(shè)檢驗(yàn),奇異值辨認(rèn)等。征和分布特征,假設(shè)檢驗(yàn),奇異值辨認(rèn)等。Analyze
8、 Descriptive Statistics Explore 出現(xiàn)對話框數(shù)據(jù)探察過程對話框列聯(lián)表分析過程列聯(lián)表是按兩個(gè)標(biāo)志對一組觀察值進(jìn)行交列聯(lián)表是按兩個(gè)標(biāo)志對一組觀察值進(jìn)行交叉分組所得到的頻數(shù)分布表,表中列出同時(shí)聯(lián)叉分組所得到的頻數(shù)分布表,表中列出同時(shí)聯(lián)系于橫行和縱行某特定標(biāo)志名稱的觀察值數(shù)目,系于橫行和縱行某特定標(biāo)志名稱的觀察值數(shù)目,在表的右邊欄列出各行頻數(shù)的合計(jì),在表的底在表的右邊欄列出各行頻數(shù)的合計(jì),在表的底行列出各列頻數(shù)的合計(jì),在兩者交叉處,即表行列出各列頻數(shù)的合計(jì),在兩者交叉處,即表的右下角,列出頻數(shù)總計(jì)。的右下角,列出頻數(shù)總計(jì)。Analyze Descriptive Stati
9、stics Crosstabs 出現(xiàn)對話框列聯(lián)表分析過程對話框平均數(shù)分析該過程主要用于分組計(jì)算各統(tǒng)該過程主要用于分組計(jì)算各統(tǒng)計(jì)指標(biāo),也可以進(jìn)行單因素隨機(jī)設(shè)計(jì)指標(biāo),也可以進(jìn)行單因素隨機(jī)設(shè)計(jì)方差分析和線性檢驗(yàn)。計(jì)方差分析和線性檢驗(yàn)。Analyze Compare Means Means 出現(xiàn)對話框平均數(shù)分析對話框OptionsOptions對話框?qū)υ捒?單一樣本t檢驗(yàn)Analyze Compare Means One Sample T Test 出現(xiàn)對話框 該過程用于檢驗(yàn)樣本平均數(shù)與總體平均數(shù)之間是否存在差異。 單一樣本t檢驗(yàn)對話框獨(dú)立樣本t檢驗(yàn)Analyze Compare Means Inde
10、pendent-Sample T test 出現(xiàn)對話框 該過程用于檢驗(yàn)兩個(gè)獨(dú)立樣本的平均數(shù)之間是否存在差異。 獨(dú)立樣本t檢驗(yàn)對話框獨(dú)立樣本 獨(dú)立樣本(Independent Sample)是指兩個(gè)樣本彼此獨(dú)立,沒有任何關(guān)聯(lián)。例如實(shí)驗(yàn)組與控制組、男生組與女生組、高收入組與低收入組、大學(xué)數(shù)學(xué)系與物理系等。但這里的獨(dú)立樣本是廣義的獨(dú)立,僅是指非關(guān)聯(lián)變量。兩獨(dú)立的樣本各接受相同的測量,研究者的興趣在比較兩批樣本群在測量結(jié)果總體上是否存在差異。獨(dú)立樣本中,所有觀測都是獨(dú)立的,即具體個(gè)別樣本的順序可以變化的,與變量無關(guān)。 配對樣本t檢驗(yàn)Analyze Compare Means Paired-Sample
11、 T test 出現(xiàn)對話框 該過程用于檢驗(yàn)兩個(gè)配對樣本的平均數(shù)之間是否存在差異。 配對樣本t檢驗(yàn)對話框配對樣本 配對樣本(Paired Sample)或相關(guān)樣本(Correlated Sample),指兩個(gè)樣本的觀測值之間彼此有關(guān)聯(lián),如同一批被試者接受兩種實(shí)驗(yàn)條件,即同一批觀測對象接受兩種不同的測量。對于此類樣本,研究者所感興趣的是二次測量之間是否存在差異。如實(shí)驗(yàn)前和實(shí)驗(yàn)后的測量,即具體個(gè)別樣本的順序不可以變化的。相關(guān)分析相關(guān)分析 相關(guān)分析是研究兩變量之間的關(guān)系。相關(guān)模型包括皮爾遜(Pearson)、斯皮爾曼(Spearman)和肯特爾(Kendall)三種子模型。相關(guān)模型要求X、Y變量都是隨
12、機(jī)變量,并都呈正態(tài)分布。滿足上述正態(tài)分布的定量數(shù)據(jù)可用Pearson相關(guān)模型。對于定序、計(jì)數(shù)數(shù)據(jù)、對于不滿足正態(tài)分布的數(shù)據(jù),則非參數(shù)檢驗(yàn)?zāi)P停碨pearman和Kendall相關(guān)模型。相關(guān)分析相關(guān)分析相關(guān)過程調(diào)用:AnalyzeCorrelate Bivariate:PearsonPearson相關(guān)模型相關(guān)模型 Pearson相關(guān)系數(shù)計(jì)算公式:22)()()(YYXXYYXXriiii r是最常用的相關(guān)系數(shù)偏相關(guān)系數(shù)偏相關(guān)系數(shù) 多個(gè)變量之間的相關(guān)關(guān)系是錯(cuò)綜復(fù)雜的,任何兩個(gè)變量之間都有簡單相關(guān)關(guān)系,而這種相關(guān)關(guān)系中夾雜了其他變量所帶來的影響。固定其他因素,而計(jì)算某兩個(gè)因素之間的相關(guān)系數(shù)稱為偏相
13、關(guān)系數(shù)。偏相關(guān)系數(shù)偏相關(guān)系數(shù)相關(guān)過程調(diào)用:AnalyzeCorrelate Partial:距離分析距離分析 對于更復(fù)雜數(shù)據(jù)資料之間的關(guān)系,可利用距離分析來進(jìn)行研究。距離分析通過計(jì)算各樣本點(diǎn)之間的距離,來觀測樣本之間的相似或不相似程度,從而可進(jìn)一步進(jìn)行聚類分析、因子分析和多維分析。一元線性回歸多元線性回歸可化為線性回歸的非線性回歸 多元回歸的方法多元回歸的方法線性回歸過程調(diào)用:AnalyzeRegression Linear Regressionx:可控制或可精確觀測得到的數(shù)據(jù)的變量;:可控制或可精確觀測得到的數(shù)據(jù)的變量;Y:與:與x具有相關(guān)關(guān)系的隨機(jī)變量。具有相關(guān)關(guān)系的隨機(jī)變量。xi (i=
14、1, 2, , n)yi (i=1, 2, , n)數(shù)據(jù)對(樣本值):數(shù)據(jù)對(樣本值):(xi, yi) i=1, 2, , n 散點(diǎn)圖散點(diǎn)圖(Scatter Graph)假定假定Y與與x具有線性相關(guān)關(guān)系:具有線性相關(guān)關(guān)系:(xi, yi)bxaY其中,其中, 是數(shù)學(xué)期望為是數(shù)學(xué)期望為0的隨機(jī)變量,的隨機(jī)變量,假假設(shè)設(shè) 滿足正態(tài)分布,于是:滿足正態(tài)分布,于是:bxaYEx1, x2, , xr:r個(gè)可控制或可精確觀測得到的數(shù)據(jù)的變量;個(gè)可控制或可精確觀測得到的數(shù)據(jù)的變量;Y:與:與x1, x2, , xr具有相關(guān)關(guān)系的隨機(jī)變量。具有相關(guān)關(guān)系的隨機(jī)變量。假定假定Y與與x1, x2, , xr具有
15、線性相關(guān)關(guān)系:具有線性相關(guān)關(guān)系:rrxbxbxbbY.22110其中,其中, 是數(shù)學(xué)期望為是數(shù)學(xué)期望為0的隨機(jī)誤差,且滿足正態(tài)分布。的隨機(jī)誤差,且滿足正態(tài)分布。對于對于n組樣本觀察值(組樣本觀察值(nr):):xi1, xi2, , xir (i=1, 2, , n) yi (i=1, 2, , n)多元線性回歸模型為:多元線性回歸模型為:niExbxbxbbyiiirriii,.,2,10.22110其中,其中, i互不相關(guān)?;ゲ幌嚓P(guān)。1. Enter (全回歸法)2. Stepwise (逐步回歸法)3. Remove(剔除法)4. Backward(向后回歸法)5. Forward(向前
16、回歸法)引入自變量的顯著性水平引入自變量的顯著性水平 1剔除自變量的顯著性水平剔除自變量的顯著性水平 2對不在方程中的對不在方程中的自變量能否引入?自變量能否引入?對已在方程中的對已在方程中的自變量能否剔除?自變量能否剔除?能能否否能能否否buayxuxbay得到令,1buavyvxuxbay得到1,11令方法:變量替換方法:變量替換bxaey 若若a0,則令,則令v=lny,得到:,得到:bxav ln若若a0,則令,則令v=lny,u=lnx,得到(,得到(a0情況類推):情況類推):buav lnxbaylog令令u=logx,得到:,得到:buay令令v=logy,得到:,得到:bxa
17、ylogbxavxbayloglog令令u=logx, v=logy,得到:,得到:buavxbeay1令:令:yveux1得到:得到:buav 客觀實(shí)現(xiàn)中各因素之間呈現(xiàn)線性關(guān)系的現(xiàn)象并不很多,更多的是呈現(xiàn)曲線關(guān)系,這時(shí)應(yīng)采用非線性回歸分析。非線性回歸模型包括兩種形式:一是可線性化的,如二次曲線模型、對數(shù)模型等;一是不可線性化的,如邏輯曲線模型。 SPSS提供了擬合各種常用曲線模型的功能。線性回歸過程調(diào)用:AnalyzeRegression Curve EstimationLinear(線性模型)Linear(線性模型)Quadratic(二次曲線模型)Quadratic(二次曲線模型)Com
18、pound(復(fù)合曲線模型)Compound(復(fù)合曲線模型)Growth(增長曲線模型)Growth(增長曲線模型)Logarithmic(對數(shù)模型)Logarithmic(對數(shù)模型) Cubic(三次曲線模型)Cubic(三次曲線模型)S(S型曲線模型)S(S型曲線模型)Exponential(指數(shù)模型)Exponential(指數(shù)模型)Inverse(雙曲線模型)Inverse(雙曲線模型)Power(冪函數(shù)模型)Power(冪函數(shù)模型)Logistic(邏輯曲線模型)Logistic(邏輯曲線模型)非參數(shù)檢驗(yàn)概述非參數(shù)檢驗(yàn)概述 非參數(shù)檢驗(yàn)的著眼點(diǎn)不是總體參數(shù),而是總體的分布情況,即研究目標(biāo)
19、總體的分布是否與已知理論分布相同,或者各樣本所在總體的分布位置,形狀是否相同。由于這一類方法并不涉及總體參數(shù),因而被稱為非參數(shù)方法。非參數(shù)檢驗(yàn)概述非參數(shù)檢驗(yàn)概述Nonparametric Tests 菜單提供八種非參數(shù)檢驗(yàn)的分析方法,分為兩類:1. 分布類型檢驗(yàn)方法Chi-Square過程;檢驗(yàn)二項(xiàng)分類變量分布的Binomial過程;檢驗(yàn)樣本序列隨機(jī)性的Runs過程及檢驗(yàn)樣本是否服從各種常用分布的l-Sample K-S過程。 2. 分布位置檢驗(yàn)方法獨(dú)立樣本分布位置檢驗(yàn)的2 、K Independent Samples過程;相關(guān)樣本分布位置檢驗(yàn)的2、 K Related Samples過程。單
20、樣本檢驗(yàn)單樣本檢驗(yàn)1. 卡方檢驗(yàn)(Chi-Square) 2. 二項(xiàng)分布檢驗(yàn)(Binomial) 3. 游程檢驗(yàn)(Runs) 4. 單樣本K-S檢驗(yàn)(1-Sample K-S) 卡方檢驗(yàn)屬于擬合優(yōu)度型檢驗(yàn),適用于具有明顯分類特征的某種數(shù)據(jù),用來檢驗(yàn)屬于某一類別的對象的個(gè)數(shù)與根據(jù)零假設(shè)所得期望數(shù)目之間是否有顯著差異,進(jìn)行檢驗(yàn)時(shí),需要構(gòu)造統(tǒng)計(jì)量:kiiiiEEO122)( 二項(xiàng)檢驗(yàn)屬于擬合優(yōu)度檢驗(yàn),適用于數(shù)據(jù)只能劃分為兩類的總體。二項(xiàng)檢驗(yàn)是檢驗(yàn)是否認(rèn)為從樣本中觀察到的兩類比例來自具有指定P的總體。 游程檢驗(yàn)有游程最大長度檢驗(yàn)和游程總個(gè)數(shù)檢驗(yàn)兩種檢驗(yàn)方法,SPSS采用的是游程總個(gè)數(shù)檢驗(yàn)方法,用該法可
21、以檢驗(yàn)一組樣本數(shù)據(jù)是否來自同一總體(或差異不明顯服從同一分布),即考察按隨機(jī)順序得到的一組樣本的觀測值是否表現(xiàn)出足夠的隨機(jī)性。 K-S檢驗(yàn)是一種擬合優(yōu)度檢驗(yàn),研究的是樣本觀察值的分布和設(shè)定的理論分布間符合程度的問題,通過對兩個(gè)分布差異的分析確定是否有理由認(rèn)為樣本的觀察結(jié)果來自所設(shè)定的理論分布總體。單樣本K-S檢驗(yàn)中的理論分布可為正態(tài)分布、均勻分布、泊松分布、指數(shù)分布。獨(dú)立樣本差異的顯著性檢驗(yàn)獨(dú)立樣本差異的顯著性檢驗(yàn) SPSS提供了檢驗(yàn)兩個(gè)或多個(gè)獨(dú)立樣本所屬的總體分布位置/形狀是否相同的功能,具體說,2 Independent Samples 過程提供了四種檢驗(yàn)兩個(gè)獨(dú)立樣本所屬總體分布是否相同的
22、方法,K Independent Samples 過程提供了兩種檢驗(yàn)多個(gè)獨(dú)立樣本所屬總體分布是否相同的方法。相關(guān)樣本差異的顯著性檢驗(yàn)相關(guān)樣本差異的顯著性檢驗(yàn) SPSS提供了檢驗(yàn)兩個(gè)或多個(gè)相關(guān)樣本所屬的總體分布位置/形狀是否相同的功能,具體說,2 Related Samples 過程提供了三種檢驗(yàn)兩個(gè)相關(guān)樣本所屬總體分布是否相同的方法,K Related Samples 過程提供了兩種檢驗(yàn)多個(gè)相關(guān)樣本所屬總體分布是否相同的方法。方差分析 如果要檢驗(yàn)兩個(gè)總體的均值是否相等,我們可以用t檢驗(yàn)。當(dāng)要檢驗(yàn)多個(gè)總體的均值是否相等,則需要采用方差分析。 方差分析是通過對誤差的分析研究來判斷多個(gè)正態(tài)總體均值是
23、否相等的一種統(tǒng)計(jì)方法。其優(yōu)點(diǎn)是實(shí)用、有效,可以節(jié)省時(shí)間。方差分析方差分析的三個(gè)條件()被檢驗(yàn)的各總體均服從正態(tài)分布;()各總體的方差皆相等;()從每一個(gè)總體中所抽出的樣本是隨機(jī)且獨(dú)立的。方差分析方差分析的分類方差分析按所涉及因素涉及因素的多少可分為:單因素方差分析雙因素方差分析多因素方差分析方差分析的基本步驟()將各不同水平間的總離差分成兩個(gè)部分()將各不同水平間的總離差分成兩個(gè)部分組間差異和組內(nèi)差異組間差異和組內(nèi)差異()構(gòu)造檢驗(yàn)統(tǒng)計(jì)量()構(gòu)造檢驗(yàn)統(tǒng)計(jì)量F= MSR / MSEF= MSR / MSE()判斷()判斷在零假設(shè)為真時(shí),在零假設(shè)為真時(shí),F(xiàn) F(k-l),(n-k)(k-l),(n-
24、k)的的F F分布。分布。若各樣本平均數(shù)的差異很大,則分子組間差異會隨之若各樣本平均數(shù)的差異很大,則分子組間差異會隨之變大,而變大,而F F值也隨之變大,故值也隨之變大,故F F檢驗(yàn)是右尾檢驗(yàn)。檢驗(yàn)是右尾檢驗(yàn)。當(dāng)檢驗(yàn)統(tǒng)計(jì)量當(dāng)檢驗(yàn)統(tǒng)計(jì)量F F大于臨界值時(shí)則拒絕原假設(shè)大于臨界值時(shí)則拒絕原假設(shè)。單因素方差分析 單因素方差分析只考慮單個(gè)因素對觀察值是否有影響,比較因素各個(gè)水平下的均值是否相等。相應(yīng)的原假設(shè)H0:各組均值無顯著性差異(在不同因素水平下);備擇假設(shè)H1:各組均值不全相等。SPSS實(shí)現(xiàn)的方法有兩種:方法一 方法二方法一單因素方差分析過程調(diào)用:AnalyzeAnalyzeCompare Mea
25、nsOne-Way ANOVACompare MeansOne-Way ANOVA方法二AnalyzeGeneral Linear ModelUnivariateAnalyzeGeneral Linear ModelUnivariate 單因素方差分析過程調(diào)用:Univariate Univariate 對話框?qū)υ捒?多因素方差分析 多因素方差分析指研究影響因素為兩個(gè)或兩個(gè)以上時(shí),因素對因變量的影響是否顯著。 另外,分析時(shí)還需要考慮影響因素之間是否有交互作用。 多因素方差分析多因素方差分析過程調(diào)用:AnalyzeGeneral Linear ModelUnivariateAnalyzeGene
26、ral Linear ModelUnivariate 協(xié)方差分析因素 當(dāng)因變量是定量的,自變量中既有定性也有定量變量時(shí),則常選用介于方差分析和線性回歸分析之間的方法協(xié)方差分析。 在協(xié)方差分析中,選為定量變量的自變量稱為協(xié)變量,并要求協(xié)變量間相互獨(dú)立,與定性因素間無交互作用。 協(xié)方差分析因素協(xié)方差分析過程調(diào)用:AnalyzeGeneral Linear ModelUnivariateAnalyzeGeneral Linear ModelUnivariate 聚類分析和判別分析過程概述聚類分析和判別分析過程概述 聚類分析是研究物以類聚問題的一種有效方法,它將一批樣本數(shù)據(jù)按照其性質(zhì)上的相近程度,在沒
27、有先驗(yàn)知識的情況下客觀進(jìn)行分類,該方法被視為是一種探索性的分析方法。 判別分析是一種有效的分類方法,分析時(shí)各類的特征是事先已知,即根據(jù)判別,將新樣本劃分到不同的組中去。分類形成后相同的類就是一個(gè)具有相近個(gè)體的集合,不同類之間具有明顯的區(qū)別。聚類分析和判別分析過程概述聚類分析和判別分析過程概述SPSS的Classify菜單共包括三個(gè)主要過程:1)快速聚類(K-Means Cluster)是非系統(tǒng)聚類法中最常用的K-均值聚類法,只能用于對樣本的快速聚類。2)分層聚類(Hierarchical Cluster)提供了全面而強(qiáng)大的聚類分析功能,可以對多種數(shù)據(jù)類型進(jìn)行樣本或變量的聚類分析。3)判別分析(
28、Discriminant)提供了全面的判別分析功能??焖贅颖揪垲愡^程快速樣本聚類過程 快速樣本聚類(Quick C1uster),也稱逐步聚類或動態(tài)聚類,其基本思想是:開始按照一定方法選取一批凝聚點(diǎn)(聚心),其次讓樣本向最近的聚心凝聚形成初始分類,然后按最近距離原則修改不合理的分類,直到合理為止。該方法適合于大樣本的Q型聚類分析。根據(jù)經(jīng)驗(yàn),若樣本容量大于100,則可以考慮使用這種方法。快速樣本聚類過程快速樣本聚類過程界面界面快速樣本聚類過程快速樣本聚類過程結(jié)果結(jié)果Cluster MembershipA314.361B211.785C39.014D27.993E216.415F19.718G11
29、0.541H215.366I317.500J24.082K312.162L313.769M49.682N49.682O28.819P314.361Q112.693R29.860S213.540T212.910Case Number1234567891011121314151617181920COMPANYClusterDistance分層聚類分析分層聚類分析分層聚類分析(Hierarchical Cluster Analysis),也叫系統(tǒng)聚類分析,是聚類分析中應(yīng)用最廣泛的一種方法。其聚類過程是:開始把參與聚類的每個(gè)樣本(或變量)各視為一類,然后根據(jù)兩類之間的距離或相似性逐步合并,直到所有的樣
30、本(或變量)合并為一個(gè)大類為止。分層聚類分析分層聚類分析界面界面分層聚類分析分層聚類分析結(jié)果結(jié)果1 1Vertical IcicleXXXXXXXXXXXXXXXX XXXXXXXXXXXXXX XXXXX XXXXXXXX XXXXX XXXXX XX XXXXX X XXX XX X XXX X XXX XX X XXX X X X XNumber of clusters1234567Armchair Enthusiast United States France South Korea Russia China Romania ItalyCase分層聚類分析分層聚類分析結(jié)果結(jié)果2 2判別
31、分析判別分析 判別分析在分析之前就應(yīng)該明確所研究的變量共有幾個(gè)類別,該分析方法的目的就是從現(xiàn)有已知類別的樣本數(shù)據(jù)中,利用某種技術(shù)建立起一個(gè)判別函數(shù),以后再有未知類別的數(shù)據(jù)進(jìn)入,就利用建立的函數(shù)來判斷其類別。判別分析判別分析步驟步驟(1)選擇自變量及組變量,并計(jì)算各組單變量描述統(tǒng)計(jì)量,對判別分析所要求的前提假定進(jìn)行統(tǒng)計(jì)檢驗(yàn)。(2)推導(dǎo)判別系數(shù),給出標(biāo)準(zhǔn)化或末標(biāo)準(zhǔn)化的典則判別函數(shù)系數(shù),并對函數(shù)顯著性進(jìn)行檢驗(yàn);(3)建立Fisher線性判別模型,根據(jù)Bayes規(guī)則或Fisher規(guī)則進(jìn)行判別分組;(4)進(jìn)行樣本回判分析,分析判別函數(shù)的結(jié)果;(5)輸出結(jié)果,結(jié)合研究對象的實(shí)際情況分析輸出結(jié)果,作出結(jié)論。
32、判別分析判別分析界面界面判別分析判別分析結(jié)果結(jié)果dis_1: 將所有變量都加入進(jìn)行分析dis_2: 用逐步選擇判別進(jìn)行分析主成分分析 主成分分析從解釋變量的方差出發(fā),假設(shè)變量的方差能完全被主成分所解釋;而因子模型是從解釋變量之間的相關(guān)關(guān)系出發(fā),假設(shè)觀察變量之間的相關(guān)能完全被公因子解釋。 主成分分析法是一種實(shí)用的多元統(tǒng)計(jì)分析方法,它能夠?qū)⒋罅俊⒎睆?fù)的原始指標(biāo)、數(shù)據(jù)簡化為少量的綜合指標(biāo),同時(shí)使這少量指標(biāo)盡可能地包合原指標(biāo)群中的信息資料。這些綜合指標(biāo)能夠更好地反映各樣本之間的主要差別,而且在統(tǒng)計(jì)意義上是相互獨(dú)立。主成分分析主成分分析過程調(diào)用:AnalyzeAnalyzeData ReductionData ReductionFactorFactor因子分析 因子分析的基本思想是將實(shí)測的多個(gè)指標(biāo),用少數(shù)幾個(gè)潛在的指標(biāo)(因子)的線性組合來表示,因子分析的主要應(yīng)用有兩
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年上半年安徽馬鞍山日報(bào)社招聘工作人員6人易考易錯(cuò)模擬試題(共500題)試卷后附參考答案
- 2025年上半年安徽池州市疾病預(yù)制保健中心招考易考易錯(cuò)模擬試題(共500題)試卷后附參考答案
- 2025年上半年安徽明光市事業(yè)單位招聘(145人)易考易錯(cuò)模擬試題(共500題)試卷后附參考答案
- 2025年上半年安徽合肥廬陽區(qū)法院政府購買服務(wù)崗招聘10人易考易錯(cuò)模擬試題(共500題)試卷后附參考答案
- 2025年上半年安徽合肥交通投資控股限公司招聘5人易考易錯(cuò)模擬試題(共500題)試卷后附參考答案
- 2025年上半年安徽六安市裕安區(qū)區(qū)直部分事業(yè)單位招考23人易考易錯(cuò)模擬試題(共500題)試卷后附參考答案
- 2025年上半年寧波市江東地稅局招考編外用工易考易錯(cuò)模擬試題(共500題)試卷后附參考答案
- 2025年故障實(shí)驗(yàn)臺項(xiàng)目可行性研究報(bào)告
- 2024遼寧沈陽市城市建設(shè)投資集團(tuán)有限公司所屬二級企業(yè)沈陽客運(yùn)集團(tuán)有限公司招聘筆試參考題庫附帶答案詳解
- 2024廣西華芯振邦半導(dǎo)體有限公司招聘44人筆試參考題庫附帶答案詳解
- who實(shí)驗(yàn)室生物安全手冊
- 劇毒和易制爆?;窂臉I(yè)人員安全責(zé)任書
- 交管12123駕駛學(xué)法免分題庫(學(xué)法減分200題完整版)
- GB/T 21671-2018基于以太網(wǎng)技術(shù)的局域網(wǎng)(LAN)系統(tǒng)驗(yàn)收測試方法
- 經(jīng)鼻腸梗阻導(dǎo)管護(hù)理課件
- 《基于杜邦分析法的企業(yè)財(cái)務(wù)分析國內(nèi)外文獻(xiàn)綜述》
- 外墻蜘蛛人施工方案
- 海洋工程裝備技術(shù)專業(yè)人才培養(yǎng)方案(高職)
- 教科版三年級科學(xué)下冊 《各種各樣的運(yùn)動》 教學(xué)課件
- 浙江杭州余杭區(qū)余杭街道招考聘用編外人員16人(必考題)模擬卷及答案
- 腹腔穿刺術(shù)(僅供參考)課件
評論
0/150
提交評論