




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
數(shù)據(jù)分析與SPSS軟件應(yīng)用全套可編輯PPT課件第1章數(shù)據(jù)分析及SPSS軟件概述.pptx第2章數(shù)據(jù)的獲取與管理.pptx 第3章描述統(tǒng)計(jì)分析及SPSS實(shí)現(xiàn).pptx 第4章參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn).pptx 第5章方差分析及SPSS實(shí)現(xiàn).pptx 第6章非參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn).pptx 第7章相關(guān)分析及SPSS實(shí)現(xiàn).pptx 第8章回歸分析及SPSS實(shí)現(xiàn).pptx 第9章聚類(lèi)分析、判別分析及SPSS實(shí)現(xiàn).pptx第10章因子分析及SPSS實(shí)現(xiàn).pptx 數(shù)據(jù)分析與SPSS軟件應(yīng)用主講人:主要內(nèi)容第1章數(shù)據(jù)分析與SPSS軟件概述第2章數(shù)據(jù)的獲取與管理第3章描述統(tǒng)計(jì)及SPSS實(shí)現(xiàn)第4章參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)第5章方差分析及SPSS實(shí)現(xiàn)第6章非參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)第7章相關(guān)分析及SPSS實(shí)現(xiàn)第8章回歸分析及SPSS實(shí)現(xiàn)第9章聚類(lèi)分析、判別分析及SPSS實(shí)現(xiàn)第10章因子分析及SPSS實(shí)現(xiàn)第1章數(shù)據(jù)分析與SPSS軟件概述第1章數(shù)據(jù)分析與SPSS軟件概述1.1數(shù)據(jù)分析基本概念數(shù)據(jù)的類(lèi)型①定性變量數(shù)據(jù)②定序變量數(shù)據(jù)③定距變量數(shù)據(jù)④定比變量數(shù)據(jù)第1章數(shù)據(jù)分析與SPSS軟件概述1.2數(shù)據(jù)分析基本流程
1.2.1項(xiàng)目計(jì)劃1.2.2數(shù)據(jù)獲取與準(zhǔn)備1.2.3概括性描述統(tǒng)計(jì)分析
1.2.4探索性統(tǒng)計(jì)推斷1.2.5統(tǒng)計(jì)模型精準(zhǔn)分析1.2.6結(jié)果報(bào)告數(shù)據(jù)分析基本流程研究問(wèn)題、研究對(duì)象等數(shù)據(jù)搜集、數(shù)據(jù)清理基本描述統(tǒng)計(jì)分析探索分析、方差分析、相關(guān)分析等多變量模型、多元統(tǒng)計(jì)模型等分析報(bào)告項(xiàng)目計(jì)劃數(shù)據(jù)獲取與準(zhǔn)備概括性統(tǒng)計(jì)分析探索性統(tǒng)計(jì)分析統(tǒng)計(jì)模型精準(zhǔn)分析結(jié)果報(bào)告第1章數(shù)據(jù)分析與SPSS軟件概述1.3
數(shù)據(jù)分析方法基本方法
1.描述統(tǒng)計(jì)分析方法
2.統(tǒng)計(jì)推斷方法
3.多變量模型分析方法
4.多元統(tǒng)計(jì)分析方法5.其他:神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、貝葉斯網(wǎng)絡(luò)等第1章數(shù)據(jù)分析與SPSS軟件概述1.4常用數(shù)據(jù)分析軟件介紹
1.SPSS
2.SAS3.R4.其他:Stata、Python、Excel等第1章數(shù)據(jù)分析與SPSS軟件概述1.5SPSS軟件介紹1.基本特點(diǎn)①界面友好、操作簡(jiǎn)單②方法與模型豐富③數(shù)據(jù)轉(zhuǎn)換便捷④圖表功能強(qiáng)大第1章數(shù)據(jù)分析與SPSS軟件概述2.模塊結(jié)構(gòu)①共有12個(gè)模塊。②SPSSBase模塊是必需的。③其他模塊自由選擇。
第1章數(shù)據(jù)分析與SPSS軟件概述3.軟件安裝4.運(yùn)行方式①批處理方式②完全窗口菜單運(yùn)行方式③程序運(yùn)行方式第1章數(shù)據(jù)分析與SPSS軟件概述5.軟件界面①數(shù)據(jù)編輯窗口第1章數(shù)據(jù)分析與SPSS軟件概述②結(jié)果輸出窗口
第1章數(shù)據(jù)分析與SPSS軟件概述③語(yǔ)句窗口
第2章數(shù)據(jù)的獲取與管理第2章數(shù)據(jù)的獲取與管理
2.1數(shù)據(jù)的獲取及軟件實(shí)現(xiàn)2.1.1變量的定義
⑴變量名稱(chēng)
命名規(guī)則※變量名必須以字母、漢字或字符@開(kāi)頭,其他字符可以是任何字母、數(shù)字或_、@、#、$等符號(hào)。第2章數(shù)據(jù)的獲取與管理
※變量最后一個(gè)字符不能是句號(hào)?!荒苁褂每瞻鬃址蚱渌厥庾址ㄈ纭?!”、“?”等)。※變量命名必須唯一,不能有兩個(gè)相同的變量名?!赟PSS中不區(qū)分大小寫(xiě)?!鵖PSS的保留字(如ALL、AND、WITH、OR等)不能作為變量的名稱(chēng)。第2章數(shù)據(jù)的獲取與管理
⑵變量類(lèi)型數(shù)字型;逗號(hào);點(diǎn);科學(xué)計(jì)數(shù)法;日期;美元;定制貨幣;字符串;受限數(shù)字。第2章數(shù)據(jù)的獲取與管理
⑶變量長(zhǎng)度⑷小數(shù)點(diǎn)位數(shù)⑸變量標(biāo)簽⑹變量值標(biāo)簽⑺缺失值設(shè)置第2章數(shù)據(jù)的獲取與管理
⑻列、對(duì)齊⑼測(cè)量⑽角色第2章數(shù)據(jù)的獲取與管理
2.1.2數(shù)值的直接輸入與保存
1.數(shù)據(jù)的直接輸入“Tab”“Enter”2.數(shù)據(jù)保存
選擇“文件”菜單的“保存”命令,可直接保存為SPSS默認(rèn)的數(shù)據(jù)文件格式(*.sav);選擇“文件”菜單的“另存為”命令。
第2章數(shù)據(jù)的獲取與管理
2.1.3外部數(shù)據(jù)文件的讀入1.讀取Excel數(shù)據(jù)文件2.讀取文本數(shù)據(jù)文件
包括自由格式和固定格式文本數(shù)據(jù)文件第2章數(shù)據(jù)的獲取與管理
2.1.4數(shù)據(jù)文件的合并——“添加個(gè)案”1.數(shù)據(jù)文件的縱向合并“數(shù)據(jù)”—“合并文件”—“添加個(gè)案”2.數(shù)據(jù)文件的橫向合并——“添加變量”“數(shù)據(jù)”—“合并文件”—“添加變量”第2章數(shù)據(jù)的獲取與管理
2.1.5數(shù)據(jù)文件的拆分
“數(shù)據(jù)”—“拆分文件”
用戶(hù)一旦設(shè)置了分組,那么此后的所有分析都將按這種分組進(jìn)行,除非取消數(shù)據(jù)分組的命令。第2章數(shù)據(jù)的獲取與管理
2.2數(shù)據(jù)的清理2.2.1數(shù)據(jù)的尋找、增加和刪除1.數(shù)據(jù)的尋找2.數(shù)據(jù)增加和刪除第2章數(shù)據(jù)的獲取與管理2.2.2變量集的設(shè)置和使用1.設(shè)置變量集“實(shí)用程序”—“定義變量集”2.使用變量集“實(shí)用程序”—“使用變量集”第2章數(shù)據(jù)的獲取與管理2.3數(shù)據(jù)的轉(zhuǎn)換與軟件實(shí)現(xiàn)2.3.1數(shù)據(jù)排序1.個(gè)案排序“數(shù)據(jù)”—“個(gè)案排序”—“個(gè)案排序”對(duì)話(huà)框
該操作下,原有的個(gè)案排列順序被更改。第2章數(shù)據(jù)的獲取與管理2.
個(gè)案排秩
“轉(zhuǎn)換”—“個(gè)案排秩”—“個(gè)案排秩”對(duì)話(huà)框
該操作下,原個(gè)案的排列順序沒(méi)有變化,只是新建一個(gè)變量名為“R*”的變量,用于放置秩值。第2章數(shù)據(jù)的獲取與管理2.3.2新變量的產(chǎn)生“轉(zhuǎn)換”—“計(jì)算變量”2.3.3設(shè)置加權(quán)變量“數(shù)據(jù)”—“個(gè)案加權(quán)”第2章數(shù)據(jù)的獲取與管理2.3.4變量編碼重新編碼為相同變量“轉(zhuǎn)換”—“重新編碼為相同變量”。
該編碼方式下,原始變量的數(shù)值會(huì)發(fā)生變動(dòng)。第2章數(shù)據(jù)的獲取與管理2.重新編碼為不同變量“轉(zhuǎn)換”—“重新編碼為不同變量”。
該種編碼方式下,原指標(biāo)值并未改變,只是生成了新的變量,用以存放編碼值。
第2章數(shù)據(jù)的獲取與管理2.4數(shù)據(jù)的整理與軟件實(shí)現(xiàn)2.4.1數(shù)據(jù)的分類(lèi)匯總“數(shù)據(jù)”—“匯總”1.需要指定分類(lèi)變量和匯總變量。2.根據(jù)分類(lèi)變量的若干不同取值將個(gè)案數(shù)據(jù)分成若干類(lèi),并對(duì)每類(lèi)個(gè)案計(jì)算匯總變量的描述統(tǒng)計(jì)量。3.將分類(lèi)匯總計(jì)算結(jié)果保存到一個(gè)文件中。第2章數(shù)據(jù)的獲取與管理第2章數(shù)據(jù)的獲取與管理2.4.2個(gè)案子集的選取“數(shù)據(jù)”—“選擇個(gè)案”
個(gè)案選擇方式--個(gè)案挑選條件--輸出方式第2章數(shù)據(jù)的獲取與管理2.4.3缺失值替代“轉(zhuǎn)換”—“替換缺失值”
替換變量與新變量設(shè)置—選擇替換方法第3章描述統(tǒng)計(jì)分析及SPSS實(shí)現(xiàn)第3章描述統(tǒng)計(jì)分析及SPSS實(shí)現(xiàn)3.1連續(xù)變量描述統(tǒng)計(jì)分析3.1.1集中趨勢(shì)描述1.均值2.中位數(shù)3.眾數(shù)第3章描述統(tǒng)計(jì)分析及SPSS實(shí)現(xiàn)3.1.2離散趨勢(shì)描述1.方差和標(biāo)準(zhǔn)差2.全距3.分位數(shù)4.均值標(biāo)準(zhǔn)誤第3章描述統(tǒng)計(jì)分析及SPSS實(shí)現(xiàn)3.1.3分布狀態(tài)1.偏度2.峰度第3章描述統(tǒng)計(jì)分析及SPSS實(shí)現(xiàn)3.標(biāo)準(zhǔn)化Z分?jǐn)?shù)及其線(xiàn)性轉(zhuǎn)換Z分?jǐn)?shù)計(jì)算表達(dá)式:T變換表達(dá)式:T=10Z+50第3章描述統(tǒng)計(jì)分析及SPSS實(shí)現(xiàn)“分析”菜單—“描述統(tǒng)計(jì)”項(xiàng)—“描述”命令第3章描述統(tǒng)計(jì)分析及SPSS實(shí)現(xiàn)3.1.4深入探索分析第一,檢查數(shù)據(jù)是否有錯(cuò)誤。
—奇異值、影響點(diǎn)或錯(cuò)誤數(shù)據(jù)。第二,獲得數(shù)據(jù)分布特征。
—
檢驗(yàn)數(shù)據(jù)是否符合正態(tài)分布第三,對(duì)數(shù)據(jù)規(guī)律的初步觀察。
—分組變量之間的方差齊性問(wèn)題。第3章描述統(tǒng)計(jì)分析及SPSS實(shí)現(xiàn)“分析”菜單—“描述統(tǒng)計(jì)”項(xiàng)—“探索”命令第3章描述統(tǒng)計(jì)分析及SPSS實(shí)現(xiàn)第3章描述統(tǒng)計(jì)分析及SPSS實(shí)現(xiàn)3.2分類(lèi)變量描述統(tǒng)計(jì)分析3.2.1交叉列聯(lián)分析
1.列出交叉分組下的頻數(shù)分布
2.分析兩個(gè)變量之間是否具有獨(dú)立性或一定的相關(guān)性。第3章描述統(tǒng)計(jì)分析及SPSS實(shí)現(xiàn)⑴卡方統(tǒng)計(jì)量⑵相關(guān)系數(shù)列聯(lián)系數(shù):
ψ系數(shù):第3章描述統(tǒng)計(jì)分析及SPSS實(shí)現(xiàn)“分析”菜單—“描述統(tǒng)計(jì)”子菜單—“交叉表”命令第3章描述統(tǒng)計(jì)分析及SPSS實(shí)現(xiàn)第3章描述統(tǒng)計(jì)分析及SPSS實(shí)現(xiàn)3.2.2多選項(xiàng)分析
多選項(xiàng)問(wèn)題,就是一個(gè)問(wèn)題的答案都是順序變量或名義變量,并且允許選擇的答案可以有多種組合。
多選項(xiàng)問(wèn)題分解(編碼方案)的方法有兩種。1.多選項(xiàng)二分法
多選項(xiàng)二分法將每個(gè)可能的答案設(shè)置為一個(gè)SPSS變量,變量的取值為0或1,0表示沒(méi)選中,1表示選中。第3章描述統(tǒng)計(jì)分析及SPSS實(shí)現(xiàn)2.多選項(xiàng)分類(lèi)法
多選項(xiàng)分類(lèi)法首先估計(jì)多選項(xiàng)問(wèn)題可能出現(xiàn)的答案?jìng)€(gè)數(shù)。根據(jù)答案?jìng)€(gè)數(shù)設(shè)置變量個(gè)數(shù),SPSS變量的取值為備選答案的代碼,常用數(shù)字1,2,3…表示不同的備選答案。
編碼設(shè)置完成后,通過(guò)設(shè)置變量集和分析變量集來(lái)實(shí)現(xiàn)多選擇問(wèn)題的頻數(shù)分析和交叉列聯(lián)分析。第3章描述統(tǒng)計(jì)分析及SPSS實(shí)現(xiàn)“分析”菜單—“描述統(tǒng)計(jì)”子菜單—“交叉表”命令樣本ID蘋(píng)果小米華為榮耀OPPOVIVO三星01√
√√
02√
√
√
03√√√
04√
√
√05√
√√
06
√√√
07√
√√
08√
√√
09√
√
√
10√√
√
11
√
√√
12
√
√√
13√
√√
14
√√√
15√
√√
16√
√
√
17√
√√18
√√√19
√
√
√20√
√
√第3章描述統(tǒng)計(jì)分析及SPSS實(shí)現(xiàn)第3章描述統(tǒng)計(jì)分析及SPSS實(shí)現(xiàn)二分法分析過(guò)程:設(shè)置變量集第3章描述統(tǒng)計(jì)分析及SPSS實(shí)現(xiàn)二分法分析過(guò)程—應(yīng)用變量集第3章描述統(tǒng)計(jì)分析及SPSS實(shí)現(xiàn)多分法分析過(guò)程—設(shè)置變量集多分法分析過(guò)程—使用變量集與二分法相同。第4章參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)第4章參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)4.1Means過(guò)程
MEANS過(guò)程計(jì)算原理
平均值計(jì)算過(guò)程是SPSS計(jì)算各種基本描述統(tǒng)計(jì)量的過(guò)程。第4章參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)
用戶(hù)可以指定一個(gè)或多個(gè)變量作為分組變量。如果分組變量為多個(gè),還應(yīng)指定這些分組變量之間的層次關(guān)系。層次關(guān)系可以是同層次的或多層次的。
同層次意味著將按照各分組變量的不同取值分別對(duì)個(gè)案進(jìn)行分組;
多層次表示將首先按第一分組變量分組,然后對(duì)各個(gè)分組下的個(gè)案按照第二組分組變量進(jìn)行分組。第4章參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)“分析”菜單—“比較平均值”子菜單—“平均值”命令第4章參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)
第4章參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)
第4章參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)“分析”菜單—“比較平均值”子菜單—“單樣本T檢驗(yàn)”命令第4章參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)
第4章參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)
第4章參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)(1)兩總體方差未知且相同情況下,T統(tǒng)計(jì)量計(jì)算公式為第4章參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)(2)兩總體方差未知且不同情況下,T統(tǒng)計(jì)量計(jì)算公式為第4章參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)
第4章參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)“分析”菜單—“比較平均值”子菜單—“獨(dú)立樣本T檢驗(yàn)”命令第4章參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)第4章參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)結(jié)果解讀:
首先判斷兩樣本組的方差是否相同,為“萊文方差等同性檢驗(yàn)”部分。本例中F統(tǒng)計(jì)量值為0.110,相伴概率為0.742,不能拒絕方差相等的假設(shè),兩所學(xué)校學(xué)生的成績(jī)方差無(wú)顯著差異;
其次進(jìn)行兩樣本組均值比較。在方差相等的驗(yàn)證前提下,采用“平均值等同性t檢驗(yàn)”部分第一行“假定等方差”的T檢驗(yàn)結(jié)果。T統(tǒng)計(jì)量為-0.318,相伴概率為0.752,不能拒絕T檢驗(yàn)的零假設(shè),兩個(gè)學(xué)校學(xué)生成績(jī)均值不存在顯著差異。第4章參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)4.4兩配對(duì)樣本T檢驗(yàn)1.零假設(shè)
常見(jiàn)的配對(duì)樣本情況有4種:①同一研究對(duì)象分別給予兩種不同處理的效果比較;②兩配對(duì)對(duì)象分別給予兩種不同處理的效果比較;③同一研究對(duì)象處理前后的效果比較;④兩配對(duì)對(duì)象(一個(gè)接受處理,一個(gè)不接受處理)的效果比較。第4章參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)
第4章參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)2.
T檢驗(yàn)統(tǒng)計(jì)量構(gòu)建
首先求出每對(duì)觀察值的差值,得到差值序列;然后對(duì)差值求均值;最后檢驗(yàn)差值序列的均值,即平均差是否與零有顯著差異。
計(jì)算的公式和單樣本T檢驗(yàn)中的公式完全相同。第4章參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)
第4章參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)“分析”菜單—“比較平均值”子菜單—“成對(duì)樣本T檢驗(yàn)”命令第4章參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)第4章參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)結(jié)果解讀:
訓(xùn)練前后體重差值序列的平均值分別為10.06,計(jì)算出的T統(tǒng)計(jì)值分別為12.934,其相伴概率分別為0.000,小于顯著性水平0.05,因此拒絕T檢驗(yàn)的零假設(shè),即訓(xùn)練后受試群體的體重都有了明顯的變化。第5章方差分析及SPSS實(shí)現(xiàn)第5章方差分析及SPSS實(shí)現(xiàn)5.1單因素方差分析5.1.1適用條件①控制變量不同水平下的樣本是隨機(jī)的。②控制變量不同水平下的樣本是相互獨(dú)立的。③控制變量不同水平下的樣本來(lái)自正態(tài)分布的總體。④控制變量不同水平下的樣本方差相同。第5章方差分析及SPSS實(shí)現(xiàn)5.1.2F統(tǒng)計(jì)量構(gòu)建
F統(tǒng)計(jì)量的構(gòu)建原理即是數(shù)據(jù)變異,即數(shù)據(jù)總變異平方和的拆解。將所有樣本變量值總的變異平方和記為SST,將其分解為兩個(gè)部分:
一部分是由控制變量引起的變異平方和,記為SSA(組間BetweenGroups離差平方和)
另一部分隨機(jī)變量引起的變異平方和,記為SSE(組內(nèi)WithinGroups離差平方和)第5章方差分析及SPSS實(shí)現(xiàn)
第5章方差分析及SPSS實(shí)現(xiàn)F統(tǒng)計(jì)量是平均組間平方和與平均組內(nèi)平方和的比,計(jì)算公式為
如果控制變量的不同水平對(duì)觀察變量有顯著影響,那么觀察變量的組間離差平方和必然大,F(xiàn)值也就比較大;相反,如果控制變量的不同水平?jīng)]有對(duì)觀察變量造成顯著影響,那么組內(nèi)離差平方和影響就會(huì)比較大,F(xiàn)值就比較小。第5章方差分析及SPSS實(shí)現(xiàn)
第5章方差分析及SPSS實(shí)現(xiàn)“分析”菜單—“比較平均值”子菜單—“單因素ANOVA檢驗(yàn)”命令第5章方差分析及SPSS實(shí)現(xiàn)第5章方差分析及SPSS實(shí)現(xiàn)5.2多因素方差分析5.2.1適用條件
多因素方差分析對(duì)各個(gè)總體的方差相等的前提假設(shè)是放松的,但是一般要求多控制變量交叉作用下的單元格內(nèi)至少有3個(gè)觀測(cè)值。第5章方差分析及SPSS實(shí)現(xiàn)5.2.2F統(tǒng)計(jì)量構(gòu)建
多因素方差分析將觀察變量總的離差平方和分解為3個(gè)部分。
①多個(gè)控制變量單獨(dú)作用引起的平方和。
②多個(gè)控制變量交互作用引起的離差平方和。
③其他隨機(jī)因素引起的離差平方和第5章方差分析及SPSS實(shí)現(xiàn)
第5章方差分析及SPSS實(shí)現(xiàn)r為第一個(gè)控制變量的取值個(gè)數(shù)(觀察水平個(gè)數(shù));s為第二個(gè)控制變量的取值個(gè)數(shù);
l為每個(gè)組合重復(fù)試驗(yàn)次數(shù),共有r×s個(gè)取值組合;第5章方差分析及SPSS實(shí)現(xiàn)
第5章方差分析及SPSS實(shí)現(xiàn)
第5章方差分析及SPSS實(shí)現(xiàn)“分析”菜單—“一般線(xiàn)性模型”子菜單—“單變量”命令第5章方差分析及SPSS實(shí)現(xiàn)第5章方差分析及SPSS實(shí)現(xiàn)第5章方差分析及SPSS實(shí)現(xiàn)5.3協(xié)方差分析5.3.1適用條件
協(xié)方差分析是將那些很難控制的因素作為協(xié)變量,在排除協(xié)變量影響的條件下,分析控制變量對(duì)觀察變量的影響。
協(xié)方差分析要求協(xié)變量應(yīng)是連續(xù)數(shù)值型,多個(gè)協(xié)變量間互相獨(dú)立,且與控制變量之間也沒(méi)有交互影響。第5章方差分析及SPSS實(shí)現(xiàn)
第5章方差分析及SPSS實(shí)現(xiàn)5.3.3判別規(guī)則及結(jié)果解讀
如果F控制變量的相伴概率小于或等于顯著性水平,則控制變量的不同水平對(duì)觀察變量產(chǎn)生顯著的影響;如果F協(xié)變量的相伴概率小于或等于顯著性水平,則協(xié)變量的不同水平對(duì)觀察變量產(chǎn)生顯著的影響。第5章方差分析及SPSS實(shí)現(xiàn)在“分析”菜單—“一般線(xiàn)性模型”子菜單—“單變量”命令—添加協(xié)變量第5章方差分析及SPSS實(shí)現(xiàn)
控制變量血尿酸分類(lèi)對(duì)觀察變量總膽固醇的離差平方和為0.465,均方為0.232,對(duì)應(yīng)的F值和相伴概率分別為0.460和0.632,說(shuō)明剔除協(xié)變量影響后,血尿酸等級(jí)仍對(duì)總膽固醇無(wú)顯著影響第6章非參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)第6章非參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)6.1兩配對(duì)樣本的非參數(shù)檢驗(yàn)6.1.1適用條件
兩個(gè)樣本應(yīng)是配對(duì)的。6.1.2檢驗(yàn)方法
SPSS中有以下3種兩配對(duì)樣本非參數(shù)檢驗(yàn)方法。第6章非參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)
第6章非參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)1.麥克尼馬爾變化顯著性檢驗(yàn)通過(guò)對(duì)表中b和c的研究,計(jì)算得到二項(xiàng)分布的概率值。第二組樣本01第一組樣本0ab1cd第6章非參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)
第6章非參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)
第6章非參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)
第6章非參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)
第6章非參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)“分析”菜單—“非參數(shù)檢驗(yàn)”子菜單—“舊對(duì)話(huà)框”—“2個(gè)相關(guān)樣本”命令第6章非參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)6.2多配對(duì)樣本的非參數(shù)檢驗(yàn)6.2.1適用條件
多配對(duì)樣本非參數(shù)檢驗(yàn)是對(duì)多個(gè)匹配樣本的總體分布是否存在顯著性差異進(jìn)行統(tǒng)計(jì)分析。6.2.2檢驗(yàn)方法
SPSS提供3種多配對(duì)樣本非參數(shù)檢驗(yàn)方法。第6章非參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)
第6章非參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)
第6章非參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)
第6章非參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)
第6章非參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)
第6章非參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)
第6章非參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)“分析”菜單—“非參數(shù)檢驗(yàn)”子菜單—“舊對(duì)話(huà)框”—“K個(gè)相關(guān)樣本”命令第6章非參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)6.3兩獨(dú)立樣本的非參數(shù)檢驗(yàn)6.2.1適用條件
兩獨(dú)立樣本的非參數(shù)檢驗(yàn)是在對(duì)總體分布不很了解的情況下,通過(guò)分析樣本數(shù)據(jù),推斷樣本來(lái)自的兩個(gè)獨(dú)立總體分布是否存在顯著差異。6.2.2檢驗(yàn)方法
SPSS提供了4種非參數(shù)檢驗(yàn)方法。第6章非參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)
第6章非參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)
SPSS將計(jì)算出U統(tǒng)計(jì)量值,然后依據(jù)曼-惠特尼分布表給出對(duì)應(yīng)的相伴概率值。同時(shí),SPSS還計(jì)算近似服從正態(tài)分布的Z統(tǒng)計(jì)量和對(duì)應(yīng)的相伴概率值。
在樣本個(gè)數(shù)小于30時(shí),應(yīng)以U統(tǒng)計(jì)量的相伴概率值作為判斷標(biāo)準(zhǔn),在樣本個(gè)數(shù)大于30時(shí),屬于大樣本情況下,應(yīng)以Z統(tǒng)計(jì)量的相伴概率值作為判斷標(biāo)準(zhǔn)。第6章非參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)
第6章非參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)
第6章非參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)
第6章非參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)
兩獨(dú)立樣本的極端檢驗(yàn)計(jì)算跨度和截頭跨度。如果跨度或截頭跨度很小,則表明兩個(gè)樣本數(shù)據(jù)無(wú)法充分混合,可以認(rèn)為實(shí)驗(yàn)樣本存在極端反應(yīng)。
SPSS自動(dòng)計(jì)算跨度和截頭跨度,依據(jù)分布表給出對(duì)應(yīng)的相伴概率值。第6章非參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)“分析”菜單—“非參數(shù)檢驗(yàn)”子菜單—“舊對(duì)話(huà)框”—“2個(gè)獨(dú)立樣本”命令第6章非參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)6.4多獨(dú)立樣本的非參數(shù)檢驗(yàn)6.4.1適用條件
多獨(dú)立樣本非參數(shù)檢驗(yàn)分析樣本數(shù)據(jù)是推斷樣本來(lái)自的多個(gè)獨(dú)立總體分布是否存在顯著差異。SPSS多獨(dú)立樣本非參數(shù)檢驗(yàn)一般推斷多個(gè)獨(dú)立總體的均值或中位數(shù)是否存在顯著差異。6.4.2檢驗(yàn)方法
SPSS提供了3種多獨(dú)立樣本的非參數(shù)檢驗(yàn)方法。第6章非參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)
第6章非參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)1組樣本2組樣本K組樣本大于共同中位數(shù)的數(shù)目小于等于共同中位數(shù)的數(shù)目第6章非參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)
第6章非參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)
第6章非參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)
SPSS首先計(jì)算觀察的J-T統(tǒng)計(jì)量,以3組樣本為例,SPSS還按照(1,2,3)(1,3,2),(2,1,3),(2,3,1),(3,1,2),(3,2,1)的順序計(jì)算所有的J-T統(tǒng)計(jì)量,并求出這些J-T統(tǒng)計(jì)量的均值、標(biāo)準(zhǔn)化均值和標(biāo)準(zhǔn)差。
SPSS將J-T檢驗(yàn)臨界值表給出J-T統(tǒng)計(jì)量對(duì)應(yīng)的相伴概率值。第6章非參數(shù)檢驗(yàn)及SPSS實(shí)現(xiàn)“分析”菜單—“非參數(shù)檢驗(yàn)”子菜單—“舊對(duì)話(huà)框”—“K個(gè)獨(dú)立樣本”命令第7章相關(guān)分析及SPSS實(shí)現(xiàn)第7章相關(guān)分析及SPSS實(shí)現(xiàn)7.1二元變量相關(guān)分析7.1.1散點(diǎn)圖和相關(guān)系數(shù)1.散點(diǎn)圖第7章相關(guān)分析及SPSS實(shí)現(xiàn)
第7章相關(guān)分析及SPSS實(shí)現(xiàn)
第7章相關(guān)分析及SPSS實(shí)現(xiàn)7.1.2二元定距變量相關(guān)分析
二元定距變量的相關(guān)分析是指通過(guò)計(jì)算定距變量間兩兩相關(guān)的相關(guān)系數(shù),對(duì)兩個(gè)定距變量之間兩兩相關(guān)的程度進(jìn)行分析。
皮爾遜簡(jiǎn)單相關(guān)系數(shù)用來(lái)衡量定距變量間的線(xiàn)性關(guān)系,公式為第7章相關(guān)分析及SPSS實(shí)現(xiàn)
第7章相關(guān)分析及SPSS實(shí)現(xiàn)
第7章相關(guān)分析及SPSS實(shí)現(xiàn)
第7章相關(guān)分析及SPSS實(shí)現(xiàn)
第7章相關(guān)分析及SPSS實(shí)現(xiàn)散點(diǎn)圖繪制:“圖形”菜單—“舊對(duì)話(huà)框”子菜單—“散點(diǎn)圖/點(diǎn)圖”命令第7章相關(guān)分析及SPSS實(shí)現(xiàn)相關(guān)系數(shù)推斷:“分析”菜單—“相關(guān)”子菜單—“雙變量”命令第7章相關(guān)分析及SPSS實(shí)現(xiàn)7.2偏相關(guān)分析7.2.1偏相關(guān)系數(shù)
偏相關(guān)分析是指當(dāng)兩個(gè)變量同時(shí)與其他變量相關(guān)時(shí),將其他變量的影響剔除,只分析另外兩個(gè)變量之間相關(guān)程度的過(guò)程。
偏相關(guān)分析的工具是偏相關(guān)系數(shù)。第7章相關(guān)分析及SPSS實(shí)現(xiàn)
第7章相關(guān)分析及SPSS實(shí)現(xiàn)
第7章相關(guān)分析及SPSS實(shí)現(xiàn)“分析”菜單—“相關(guān)”子菜單—“偏相關(guān)”命令第8章回歸分析及SPSS實(shí)現(xiàn)第8章回歸分析及SPSS實(shí)現(xiàn)
第8章回歸分析及SPSS實(shí)現(xiàn)
第8章回歸分析及SPSS實(shí)現(xiàn)
第8章回歸分析及SPSS實(shí)現(xiàn)
第8章回歸分析及SPSS實(shí)現(xiàn)
第8章回歸分析及SPSS實(shí)現(xiàn)
第8章回歸分析及SPSS實(shí)現(xiàn)8.1.2多元線(xiàn)性回歸分析
研究在線(xiàn)性相關(guān)條件下,兩個(gè)或兩個(gè)以上自變量對(duì)一個(gè)因變量的數(shù)量變化關(guān)系,稱(chēng)為多元線(xiàn)性回歸分析。1.基本概念
第8章回歸分析及SPSS實(shí)現(xiàn)
第8章回歸分析及SPSS實(shí)現(xiàn)
第8章回歸分析及SPSS實(shí)現(xiàn)
第8章回歸分析及SPSS實(shí)現(xiàn)
第8章回歸分析及SPSS實(shí)現(xiàn)
第8章回歸分析及SPSS實(shí)現(xiàn)
第8章回歸分析及SPSS實(shí)現(xiàn)
第8章回歸分析及SPSS實(shí)現(xiàn)
第8章回歸分析及SPSS實(shí)現(xiàn)(4)多重共線(xiàn)性檢驗(yàn)
一般地設(shè)計(jì)矩陣中解釋變量間會(huì)存在三種關(guān)系:
完全共線(xiàn)性,變量之間相關(guān)系數(shù)為1;
不存在共線(xiàn)性,變量間相關(guān)系數(shù)為0,
不完全共線(xiàn)性,變量間存在不等于0的相關(guān)系數(shù)。
多重共線(xiàn)性是一個(gè)容忍度的問(wèn)題,當(dāng)多重共線(xiàn)性嚴(yán)重到影響了模型的估計(jì)和形式時(shí),就需要做相應(yīng)的處理。第8章回歸分析及SPSS實(shí)現(xiàn)
第8章回歸分析及SPSS實(shí)現(xiàn)
第8章回歸分析及SPSS實(shí)現(xiàn)
第8章回歸分析及SPSS實(shí)現(xiàn)
若特征值較小并接近于0,說(shuō)明變量間存在很高的相關(guān)性,這是繼續(xù)觀察同一維度(序號(hào))的特征值所對(duì)應(yīng)的變量方差比例,方差比例越大的變量,引起多重共線(xiàn)性的可能越大。
若診斷出引起多重共線(xiàn)性問(wèn)題的自變量后,可采用直接刪除該自變量,或?qū)ψ宰兞窟M(jìn)行形態(tài)轉(zhuǎn)變等方法來(lái)消除共線(xiàn)性問(wèn)題。第8章回歸分析及SPSS實(shí)現(xiàn)“分析”菜單—“回歸”子菜單—“線(xiàn)性”命令第8章回歸分析及SPSS實(shí)現(xiàn)第8章回歸分析及SPSS實(shí)現(xiàn)8.2非線(xiàn)性回歸分析
在實(shí)際問(wèn)題中,變量之間的相關(guān)關(guān)系往往而是非線(xiàn)性的,因而不能用線(xiàn)性回歸方程來(lái)描述它們之間的相關(guān)關(guān)系,而要采用適當(dāng)?shù)姆蔷€(xiàn)性回歸分析。非線(xiàn)性回歸問(wèn)題大多數(shù)可以轉(zhuǎn)化為線(xiàn)性回歸問(wèn)題來(lái)求解,即根據(jù)經(jīng)驗(yàn)或者繪制散點(diǎn)圖,選擇適當(dāng)?shù)姆蔷€(xiàn)性回歸方程,通過(guò)變量置換,把非線(xiàn)性回歸方程化為線(xiàn)性回歸方程,并用線(xiàn)性回歸分析中采用的方法來(lái)確定各回歸系數(shù)的值,并對(duì)各系數(shù)進(jìn)行顯著性檢驗(yàn)。第8章回歸分析及SPSS實(shí)現(xiàn)
第8章回歸分析及SPSS實(shí)現(xiàn)SPSS提供了11種曲線(xiàn)回歸估計(jì)模型,包括一元線(xiàn)性函數(shù):二次函數(shù):復(fù)合函數(shù):生長(zhǎng)函數(shù):對(duì)數(shù)函數(shù):三次函數(shù):第8章回歸分析及SPSS實(shí)現(xiàn)S形曲線(xiàn):指數(shù)函數(shù):逆函數(shù):冪函數(shù):Logistic函數(shù):
第8章回歸分析及SPSS實(shí)現(xiàn)
第8章回歸分析及SPSS實(shí)現(xiàn)
第8章回歸分析及SPSS實(shí)現(xiàn)8.2.3多項(xiàng)式函數(shù)曲線(xiàn)回歸
多項(xiàng)式模型在非線(xiàn)性回歸分析中占有重要的地位。因?yàn)楦鶕?jù)級(jí)數(shù)展開(kāi)的原理,任何曲線(xiàn)、曲面、超曲面的問(wèn)題,在一定的范圍內(nèi)都能夠用多項(xiàng)式任意逼近。所以,當(dāng)因變量與自變量之間的確實(shí)關(guān)系未知時(shí),可以用適當(dāng)冪次的多項(xiàng)式來(lái)近似反映。第8章回歸分析及SPSS實(shí)現(xiàn)
第8章回歸分析及SPSS實(shí)現(xiàn)
第8章回歸分析及SPSS實(shí)現(xiàn)
第8章回歸分析及SPSS實(shí)現(xiàn)1.“圖形”菜單—“舊對(duì)話(huà)框”子菜單—“散點(diǎn)圖/點(diǎn)圖”—“簡(jiǎn)單散點(diǎn)圖”2.“分析”菜單—“回歸”子菜單—“曲線(xiàn)估算”第8章回歸分析及SPSS實(shí)現(xiàn)第8章回歸分析及SPSS實(shí)現(xiàn)8.3Logistic回歸分析
可用于處理定性因變量的統(tǒng)計(jì)分析方法有:判別分析、Probit分析、Logistic回歸分析和對(duì)數(shù)線(xiàn)性模型等。在社會(huì)科學(xué)中,應(yīng)用最多的是Logistic回歸分析。
Logistic回歸分析根據(jù)因變量取值類(lèi)別不同,可以分為二元Logistic回歸和多分類(lèi)Logistic回歸。二元Logistic回歸模型中因變量只能取兩個(gè)值1、0(虛擬因變量),而多元Logistic回歸模型中因變量可以取多個(gè)值。本節(jié)將只討論二元Logistic回歸,并簡(jiǎn)稱(chēng)Logistic回歸。第8章回歸分析及SPSS實(shí)現(xiàn)
第8章回歸分析及SPSS實(shí)現(xiàn)
第8章回歸分析及SPSS實(shí)現(xiàn)
第8章回歸分析及SPSS實(shí)現(xiàn)
第8章回歸分析及SPSS實(shí)現(xiàn)2.?dāng)M合優(yōu)度統(tǒng)計(jì)量Logistic回歸的擬合優(yōu)度統(tǒng)計(jì)量計(jì)算公式為預(yù)測(cè)值01正確分類(lèi)比例觀測(cè)值0n00n01f01n10n11f1總計(jì)ff第8章回歸分析及SPSS實(shí)現(xiàn)
第8章回歸分析及SPSS實(shí)現(xiàn)
第8章回歸分析及SPSS實(shí)現(xiàn)
第8章回歸分析及SPSS實(shí)現(xiàn)
最后根據(jù)自由度為8的卡方分布計(jì)算其伴隨概率并對(duì)Logistic模型進(jìn)行檢驗(yàn)。如果該伴隨概率值小于給定的顯著性水平,則拒絕因變量的觀測(cè)值與模型預(yù)測(cè)值不存在差異的零假設(shè),表明模型的預(yù)測(cè)值與觀測(cè)值存在顯著差異。第8章回歸分析及SPSS實(shí)現(xiàn)
第8章回歸分析及SPSS實(shí)現(xiàn)SPSS軟件沒(méi)有給出Logistic回歸的標(biāo)準(zhǔn)化回歸系數(shù),如果要考慮每個(gè)自變量在回歸方程中的重要性,不妨直接比較Wald統(tǒng)計(jì)量的大小(或伴隨概率),Wald統(tǒng)計(jì)量大者(或伴隨概率小者)顯著性高,也就更重要。(3)做出統(tǒng)計(jì)推斷第8章回歸分析及SPSS實(shí)現(xiàn)
“分析”菜單—“回歸”子菜單—“二元Logistic”命令第8章回歸分析及SPSS實(shí)現(xiàn)第8章回歸分析及SPSS實(shí)現(xiàn)8.4含虛擬變量的回歸分析8.4.1適用條件
在實(shí)際問(wèn)題的研究中,經(jīng)常會(huì)碰到一些非數(shù)量型的變量,由于受到這些定性因素影響,不同質(zhì)屬性下回歸模型的參數(shù)不再是固定不變的。這時(shí)就需要將這些定性變量納入到回歸模型中,從而準(zhǔn)確的描述經(jīng)濟(jì)變量之間的關(guān)系。第8章回歸分析及SPSS實(shí)現(xiàn)8.4.2虛擬變量構(gòu)建
在回歸分析中,對(duì)一些自變量是定性變量的先作數(shù)量化處理,處理的方法是引進(jìn)只取“0”和“1”兩個(gè)值的0?1型虛擬自變量。當(dāng)某一屬性出現(xiàn)時(shí),虛擬變量取值為“1”,否則取值為“0”。第8章回歸分析及SPSS實(shí)現(xiàn)
如果在回歸模型中需要引入多個(gè)0?1型虛擬變量D時(shí),虛擬變量的個(gè)數(shù)應(yīng)按下列原則來(lái)確定:對(duì)于包含一個(gè)具有k種特征或狀態(tài)的質(zhì)因素的回歸模型,如果回歸模型不帶常數(shù)項(xiàng),則需引入k個(gè)0?1型虛擬變量D;如果有常數(shù)項(xiàng),則只需引入k?1個(gè)0?1型虛擬變量D。當(dāng)k=2時(shí),只需要引入一個(gè)0?1型虛擬變量D。第8章回歸分析及SPSS實(shí)現(xiàn)(1)自變量中只含一個(gè)定性變量,且這個(gè)定性變量下有k個(gè)水平。
若虛擬變量以加法方式進(jìn)入模型,基準(zhǔn)模型不包含截距項(xiàng)時(shí),需要引入k個(gè)0-1虛擬變量,最終線(xiàn)性回歸模型如下
基準(zhǔn)模型包含截距項(xiàng)時(shí),需要引入k-1個(gè)0-1虛擬變量,最終線(xiàn)性回歸模型如下第8章回歸分析及SPSS實(shí)現(xiàn)(2)自變量中含多個(gè)定性變量時(shí)。
當(dāng)一個(gè)回歸模型中含有多個(gè)定性變量,每個(gè)定性向量下包含不同水平數(shù)時(shí),不僅靠考量單個(gè)定性變量的影響,而且要考慮定性變量之間的交互作用。
例如:兩個(gè)定性變量,每個(gè)定性變量下均有2個(gè)水平,則線(xiàn)性回歸模型中只需引入兩個(gè)虛擬變量,則以加法模型建立的線(xiàn)性回歸模型如下:第8章回歸分析及SPSS實(shí)現(xiàn)8.4.3虛擬變量的引入方式1.加法模式
加法模式下引入虛擬變量,則虛擬變量下不同水平之間的變化只體現(xiàn)在截距項(xiàng)。
例如,模型中只有1個(gè)定性變量,該定性變量下只有2個(gè)水平時(shí),只需引入1個(gè)虛擬變量,則加法模式下,引入虛擬變量的回歸方程為:第8章回歸分析及SPSS實(shí)現(xiàn)當(dāng)D=0時(shí),回歸方程為當(dāng)D=1時(shí),回歸方程為2.乘法模式
乘法模式下引入虛擬變量,則虛擬變量下不同水平之間的變化不僅體現(xiàn)在截距項(xiàng)上,還體現(xiàn)在自變量的斜率上。第8章回歸分析及SPSS實(shí)現(xiàn)
例如,模型中只有1個(gè)定性變量,該定性變量下只有2個(gè)水平時(shí),只需引入1個(gè)虛擬變量,則乘法模式下,引入虛擬變量的回歸方程為當(dāng)D=0時(shí),回歸方程為當(dāng)D=1時(shí),回歸方程為第8章回歸分析及SPSS實(shí)現(xiàn)第一步:設(shè)置虛擬變量第二步:“分析”菜單—“回歸”子菜單—“線(xiàn)性”命令第8章回歸分析及SPSS實(shí)現(xiàn)第9章聚類(lèi)分析、判別分析及SPSS實(shí)現(xiàn)第9章聚類(lèi)分析、判別分析及SPSS實(shí)現(xiàn)9.1系統(tǒng)聚類(lèi)分析9.1.1樣本間親疏程度測(cè)量方法
樣本數(shù)據(jù)之間的親疏程度主要通過(guò)樣本之間的距離或樣本間的相關(guān)系數(shù)來(lái)度量。SPSS根據(jù)變量數(shù)據(jù)類(lèi)型的不同,分別提供了相似性(即相關(guān)系數(shù))和不相似性(即距離)兩種方式測(cè)度樣本間親疏程度。第9章聚類(lèi)分析、判別分析及SPSS實(shí)現(xiàn)1.連續(xù)變量的樣本不相似性(距離)測(cè)度方法
樣本若有k個(gè)變量,則可以將樣本看成是一個(gè)k維的空間的一個(gè)點(diǎn),樣本和樣本之間的距離就是k維空間點(diǎn)和點(diǎn)之間的距離,這反映了樣本之間的親疏程度。聚類(lèi)時(shí),距離相近的樣本屬于一個(gè)類(lèi),距離遠(yuǎn)的樣本屬于不同類(lèi)。第9章聚類(lèi)分析、判別分析及SPSS實(shí)現(xiàn)(1)歐氏距離(Euclid)
歐氏距離是樣本各個(gè)變量值之差平方和的平方根。(2)歐氏距離平方(SEuclid)
歐氏距離平方是各樣本每個(gè)變量值之差的平方和。第9章聚類(lèi)分析、判別分析及SPSS實(shí)現(xiàn)(3)切比雪夫距離(Chebychev)
切比雪夫距離是各樣本所有變量值之差絕對(duì)值中的最大值。(4)塊距離(Block)
塊距離是各樣本所有變量值之差絕對(duì)值的總和、第9章聚類(lèi)分析、判別分析及SPSS實(shí)現(xiàn)(5)明可夫斯基距離(Minkowski)
明可夫斯基距離是各樣本所有變量值之差絕對(duì)值的p次方的總和,再求p次方根。(6)用戶(hù)定制距離(Customized)
用戶(hù)定制距離是各樣本所有變量值之差絕對(duì)值的p次方的總和,再求q次方根。第9章聚類(lèi)分析、判別分析及SPSS實(shí)現(xiàn)2.連續(xù)變量的樣本相似性(相關(guān)系數(shù))測(cè)度方法
連續(xù)變量親疏程度的度量,除了上面的各種距離外,還可以計(jì)算其他統(tǒng)計(jì)指標(biāo)。如皮爾遜相關(guān)系數(shù)、余弦相似度(Cosine)等。
余弦相似度將樣本各變量看作
維空間向量,然后計(jì)算各個(gè)向量間夾角的余弦。第9章聚類(lèi)分析、判別分析及SPSS實(shí)現(xiàn)
第9章聚類(lèi)分析、判別分析及SPSS實(shí)現(xiàn)9.1.2類(lèi)間親疏程度測(cè)量方法
根據(jù)樣本聚類(lèi)的過(guò)程和原理,在對(duì)任意兩個(gè)樣本測(cè)度完距離之后,就會(huì)形成小類(lèi),其后進(jìn)行的聚類(lèi)步驟,就會(huì)涉及到樣本數(shù)據(jù)與小類(lèi)、小類(lèi)與小類(lèi)之間的親疏程度測(cè)度方法。所謂小類(lèi),是在聚類(lèi)過(guò)程中根據(jù)樣本之間親疏程度形成的中間類(lèi)。第9章聚類(lèi)分析、判別分析及SPSS實(shí)現(xiàn)(1)最近鄰元素法
以當(dāng)前某個(gè)樣本與已經(jīng)形成小類(lèi)中的各樣本距離的最小值作為當(dāng)前樣本與該小類(lèi)之間的距離。(2)最遠(yuǎn)鄰元素法
以當(dāng)前某個(gè)樣本與已經(jīng)形成小類(lèi)中的各樣本距離的最大值作為當(dāng)前樣本與該小類(lèi)之間的距離。(3)組間鏈接法
兩個(gè)小類(lèi)之間的距離為兩個(gè)小類(lèi)內(nèi)所有樣本間的平均距離。第9章聚類(lèi)分析、判別分析及SPSS實(shí)現(xiàn)(4)組內(nèi)鏈接法
對(duì)所有樣本對(duì)的距離求平均值,包括小類(lèi)之間的樣本對(duì)、小類(lèi)內(nèi)的樣本對(duì)。(5)質(zhì)心聚類(lèi)法
將兩小類(lèi)間的距離定義成兩小類(lèi)重心間的距離。每一小類(lèi)的重心就是該類(lèi)中所有樣本在各個(gè)變量上的均值代表點(diǎn)。(6)瓦爾德法
在聚類(lèi)過(guò)程中,使小類(lèi)內(nèi)各個(gè)樣本的歐氏距離總平方和增加最小的兩小類(lèi)合并成一類(lèi)。第9章聚類(lèi)分析、判別分析及SPSS實(shí)現(xiàn)9.1.3Q型聚類(lèi)和R型聚類(lèi)
層次聚類(lèi)分析有兩種形式,一種是對(duì)樣本(個(gè)案)進(jìn)行分類(lèi),稱(chēng)為Q型聚類(lèi),它使具有共同特點(diǎn)的樣本聚齊在一起,以便對(duì)不同類(lèi)的樣本進(jìn)行分析;
另一種是對(duì)研究對(duì)象的觀察變量進(jìn)行分類(lèi),稱(chēng)為R型聚類(lèi)。它使具有共同特征的變量聚在一起,以便從不同類(lèi)中分別選出具有代表性的變量作分析,從而減少分析變量的個(gè)數(shù)。第9章聚類(lèi)分析、判別分析及SPSS實(shí)現(xiàn)“分析”菜單—“分類(lèi)”子菜單—“系統(tǒng)聚類(lèi)”第9章聚類(lèi)分析、判別分析及SPSS實(shí)現(xiàn)第9章聚類(lèi)分析、判別分析及SPSS實(shí)現(xiàn)9.2快速聚類(lèi)分析9.2.1適用條件
快速聚類(lèi)分析是由用戶(hù)指定類(lèi)別數(shù)的大樣本資料的逐步聚類(lèi)分析。它先對(duì)數(shù)據(jù)進(jìn)行初始分類(lèi),然后逐步調(diào)整,得到最終分類(lèi)。第9章聚類(lèi)分析、判別分析及SPSS實(shí)現(xiàn)
快速聚類(lèi)分析也以距離為樣本間親疏程度的標(biāo)志。系統(tǒng)聚類(lèi)可以對(duì)不同的聚類(lèi)類(lèi)數(shù)產(chǎn)生一系列的聚類(lèi)解,而快速聚類(lèi)只能產(chǎn)生固定類(lèi)數(shù)的聚類(lèi)解,類(lèi)數(shù)需要用戶(hù)事先指定。
在快速聚類(lèi)分析中,用戶(hù)可以自己指定初始的類(lèi)中心點(diǎn)。如果用戶(hù)的經(jīng)驗(yàn)比較豐富,則可以指定比較合理的初始類(lèi)中心點(diǎn)。否則,需要增加迭代的次數(shù),以保證最終聚類(lèi)結(jié)果的準(zhǔn)確性。第9章聚類(lèi)分析、判別分析及SPSS實(shí)現(xiàn)9.2.2迭代原理和過(guò)程
快速聚類(lèi)分析基本原理和迭代步驟如下:(1)首先需要用戶(hù)指定聚類(lèi)成多少類(lèi)(k類(lèi))。(2)然后SPSS確定k個(gè)類(lèi)的初始類(lèi)中心點(diǎn)。SPSS會(huì)根據(jù)樣本數(shù)據(jù)的實(shí)際情況,選擇k個(gè)由代表性的樣本數(shù)據(jù)作為初始類(lèi)中心。初始類(lèi)中心也可以由用戶(hù)自行指定,需要指定K組樣本數(shù)據(jù)作為初始類(lèi)中心點(diǎn)。第9章聚類(lèi)分析、判別分析及SPSS實(shí)現(xiàn)(3)計(jì)算所有樣本數(shù)據(jù)點(diǎn)到k個(gè)類(lèi)中心點(diǎn)的歐氏距離。SPSS按照距k個(gè)類(lèi)中心點(diǎn)距離最短原則,把所有樣本分派到各中心點(diǎn)所在的類(lèi)中,形成一個(gè)新的k類(lèi),完成一次迭代過(guò)程。(4)SPSS重新確定k個(gè)類(lèi)的中心點(diǎn)。SPSS計(jì)算每個(gè)類(lèi)中各個(gè)變量的變量值均值,并以均值點(diǎn)作為新的類(lèi)中心點(diǎn)。(5)重復(fù)上面的兩步計(jì)算過(guò)程,直到達(dá)到指定的迭代次數(shù)或終止迭代的判斷要求為止。第9章聚類(lèi)分析、判別分析及SPSS實(shí)現(xiàn)“分析”菜單—“分類(lèi)”子菜單—“K-均值聚類(lèi)”第9章聚類(lèi)分析、判別分析及SPSS實(shí)現(xiàn)第9章聚類(lèi)分析、判別分析及SPSS實(shí)現(xiàn)9.3判別分析
判別分析是一種比較常用的分類(lèi)分析方法,它先根據(jù)已知類(lèi)別的事物的性質(zhì),利用某種技術(shù)建立函數(shù)式,然后對(duì)未知類(lèi)別的新事物進(jìn)行判斷以將之歸入已知的類(lèi)別。
判別分析的用處很廣,除了對(duì)個(gè)案進(jìn)行已有類(lèi)別的歸類(lèi)判斷外,還可利用判別分析來(lái)對(duì)聚類(lèi)分析結(jié)果的準(zhǔn)確性進(jìn)行檢驗(yàn)。第9章聚類(lèi)分析、判別分析及SPSS實(shí)現(xiàn)9.3.1前提假設(shè)①預(yù)測(cè)變量服從正態(tài)分布。②預(yù)測(cè)變量之間沒(méi)有顯著的相關(guān)。③預(yù)測(cè)變量的平均值和方差不相關(guān)。④預(yù)測(cè)變量應(yīng)是連續(xù)變量,因變量(類(lèi)別或組別)是間斷變量。⑤兩個(gè)預(yù)測(cè)變量之間的相關(guān)性在不同類(lèi)中是一樣的。第9章聚類(lèi)分析、判別分析及SPSS實(shí)現(xiàn)在分析的各個(gè)階段應(yīng)把握如下的原則。
①事前組別(類(lèi))的分類(lèi)標(biāo)準(zhǔn)(作為判別分析的因變量)要盡可能準(zhǔn)確和可靠,否則會(huì)影響判別函數(shù)的準(zhǔn)確性,從而影響判別分析的效果。
②所分析的自變量應(yīng)是因變量的重要影響因素,應(yīng)該挑選既有重要特性又有區(qū)別能力的變量,達(dá)到以最少變量而有高辨別能力的目標(biāo)。
③初始分析的數(shù)目不能太少。第9章聚類(lèi)分析、判別分析及SPSS實(shí)現(xiàn)9.3.2判別函數(shù)構(gòu)建SPSS通過(guò)判別分析,自動(dòng)建立的判別函數(shù)(組)為其中,k為判別函數(shù)組中判別函數(shù)的個(gè)數(shù),為函數(shù)min(#類(lèi)別數(shù)?1,#預(yù)測(cè)變量數(shù))的值,即列別數(shù)?1和預(yù)測(cè)變量數(shù)兩個(gè)值之中的較小者。第9章聚類(lèi)分析、判別分析及SPSS實(shí)現(xiàn)
這些判別函數(shù)是各個(gè)獨(dú)立預(yù)測(cè)變量的線(xiàn)性組合。程序自動(dòng)選擇第一個(gè)判別函數(shù),以盡可能多地區(qū)別各個(gè)類(lèi),然后再選擇和第一個(gè)判別函數(shù)獨(dú)立的第二個(gè)判別函數(shù),盡可能多地提供判別能力。程序?qū)凑者@種方式,提供剩下的判別函數(shù)。判別函數(shù)的個(gè)數(shù)為k。第9章聚類(lèi)分析、判別分析及SPSS實(shí)現(xiàn)“分析”菜單—“分類(lèi)”子菜單—“判別式”命令第9章聚類(lèi)分析、判別分析及SPSS實(shí)現(xiàn)第10章因子分析及SPSS實(shí)現(xiàn)第10章因子分析及SPSS實(shí)現(xiàn)10.1適用條件
因子分析是從眾多的原始變量中構(gòu)造出少數(shù)幾個(gè)具有代表意義的因子變量,這里面有一個(gè)潛在的要求,即原有變量之間要具有比較強(qiáng)的相關(guān)性。如果原有變量之間不存在較強(qiáng)的相關(guān)關(guān)系,那么就無(wú)法從中綜合出能反映某些變量共同特性的少數(shù)公共因子變量來(lái)。因此,在因子分析時(shí),需要對(duì)原有變量作相關(guān)分析。第10章因子分析
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 財(cái)務(wù)管理b卷試題及答案
- 2019-2025年消防設(shè)施操作員之消防設(shè)備高級(jí)技能考前沖刺模擬試卷A卷含答案
- 2019-2025年消防設(shè)施操作員之消防設(shè)備中級(jí)技能考試題庫(kù)
- 工程熱力學(xué)應(yīng)用測(cè)試及答案
- 農(nóng)業(yè)現(xiàn)代化種植標(biāo)準(zhǔn)化體系建設(shè)方案
- 客戶(hù)咨詢(xún)與需求記錄表
- 傳統(tǒng)文化在初中英語(yǔ)課中深度融入教案
- 儀器設(shè)備使用說(shuō)明及維護(hù)保養(yǎng)指導(dǎo)書(shū)
- 美容美發(fā)服務(wù)安全責(zé)任協(xié)議書(shū)
- 《小學(xué)數(shù)學(xué)幾何圖形識(shí)別與性質(zhì)理解教學(xué)方案》
- 臺(tái)區(qū)智能融合終端通用技術(shù)規(guī)范2022
- 備用圖標(biāo)庫(kù)(以便表達(dá)不同主題)
- 教科版二年級(jí)科學(xué)上冊(cè)《書(shū)的歷史》教案
- 中轉(zhuǎn)倉(cāng)庫(kù)管理制度
- 新規(guī)重慶市律師服務(wù)收費(fèi)指導(dǎo)標(biāo)準(zhǔn)出臺(tái)
- 工程部SOP(標(biāo)準(zhǔn)操作手冊(cè))
- 人教版(2019)高中英語(yǔ)必修第二冊(cè):Unit5Music單元測(cè)試(含答案與解析)
- 21級(jí)全新版大學(xué)進(jìn)階英語(yǔ)2 國(guó)際班 教案
- 圖解心經(jīng)心得整理分享PPT課件
- 武漢市第五醫(yī)院重離子治療中心項(xiàng)目可行性研究報(bào)告
- (完整版)學(xué)生課堂學(xué)習(xí)自我評(píng)價(jià)表
評(píng)論
0/150
提交評(píng)論