版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
應(yīng)用統(tǒng)計(jì)軟件
第5章基本統(tǒng)計(jì)分析應(yīng)用統(tǒng)計(jì)軟件
第5章基本統(tǒng)計(jì)分析應(yīng)用統(tǒng)計(jì)軟件第5章基本統(tǒng)計(jì)分析課件第5章SPSS基本統(tǒng)計(jì)分析引入頻數(shù)分析描述分析探索性分析交叉分組下的頻數(shù)分析比率分析第5章SPSS基本統(tǒng)計(jì)分析引入引入意義:基礎(chǔ),能使分析者掌握數(shù)據(jù)的基本統(tǒng)計(jì)特征,把握數(shù)據(jù)的總體分布形態(tài)。內(nèi)容:編制單變量的頻數(shù)分布表計(jì)算單個(gè)變量的描述統(tǒng)計(jì)量以及不同分組下的描述統(tǒng)計(jì)量其他探索性分析數(shù)據(jù)的多選項(xiàng)分析實(shí)現(xiàn)方式:1數(shù)值計(jì)算;2圖形繪制。引入意義:基礎(chǔ),能使分析者掌握數(shù)據(jù)的基本統(tǒng)計(jì)特征,把握數(shù)據(jù)的5.1頻數(shù)分析目的基本任務(wù)基本操作擴(kuò)展功能應(yīng)用舉例5.1頻數(shù)分析目的目的了解變量取值的狀況,對(duì)把握數(shù)據(jù)的分布特征非常有用例如:?jiǎn)柧碚{(diào)查對(duì)被訪問(wèn)者的總?cè)藬?shù)、年齡特點(diǎn)、職業(yè)特點(diǎn)等進(jìn)行分析和總結(jié)通過(guò)分析,能夠在一定程度上反映樣本是否具有總體代表性,抽樣是否存在系統(tǒng)偏差等,并以此證明以后相關(guān)問(wèn)題分析的代表性和可信性。目的基本任務(wù)第一、編制頻數(shù)分布表頻數(shù)Frequency、百分比percent、有效百分比validpercent、累計(jì)百分比cumulativepercent
第二、繪制常用統(tǒng)計(jì)圖條形圖barchart、餅圖piechart、直方圖histograms基本任務(wù)第一、編制頻數(shù)分布表基本操作analyze—descriptivestatistics—frequencies分析—描述統(tǒng)計(jì)—頻率基本操作analyze—descriptivestatis擴(kuò)展功能第一、計(jì)算分位數(shù)(percentilevalues)將所有數(shù)據(jù)按升序排序后平均等分為n份,分位點(diǎn)依次是1/n,2/n,…,n-1/n;分位數(shù)刻劃了變量的取值分布狀態(tài)分位數(shù)差是一種描述數(shù)據(jù)離散程度的方式。第二、計(jì)算其他基本描述統(tǒng)計(jì)量集中趨勢(shì)、離散程度、分布形態(tài)等基本統(tǒng)計(jì)量擴(kuò)展功能第一、計(jì)算分位數(shù)(percentilevalues應(yīng)用舉例利用居民儲(chǔ)蓄調(diào)查數(shù)據(jù)進(jìn)行頻數(shù)分析,有以下兩個(gè)分析目標(biāo)。目標(biāo)一:分析儲(chǔ)戶的戶口和職業(yè)的基本情況;目標(biāo)二:分析儲(chǔ)戶一次存取金額的分布,并對(duì)城鎮(zhèn)儲(chǔ)戶和農(nóng)村儲(chǔ)戶進(jìn)行比較。分析應(yīng)用舉例利用居民儲(chǔ)蓄調(diào)查數(shù)據(jù)進(jìn)行頻數(shù)分析,有以下兩個(gè)分析目標(biāo)目標(biāo)一:戶口和職業(yè)的分析目標(biāo)一:兩個(gè)變量是名義變量,可通過(guò)基本頻數(shù)分析實(shí)現(xiàn);主意:職業(yè)變量分類較多,為使顯示一目了然,最好排序下。format目標(biāo)一:戶口和職業(yè)的分析目標(biāo)一:兩個(gè)變量是名義變量,可通過(guò)基應(yīng)用統(tǒng)計(jì)軟件第5章基本統(tǒng)計(jì)分析課件應(yīng)用統(tǒng)計(jì)軟件第5章基本統(tǒng)計(jì)分析課件應(yīng)用統(tǒng)計(jì)軟件第5章基本統(tǒng)計(jì)分析課件目標(biāo)二:目標(biāo)二:涉及的變量是定距型變量,需要分別對(duì)不同戶口的儲(chǔ)戶進(jìn)行分析。存取金額數(shù)據(jù)直接采用頻數(shù)分析不利于把握,考慮用數(shù)據(jù)分組的功能對(duì)數(shù)據(jù)分組然后再編制頻數(shù)分析表;進(jìn)行數(shù)據(jù)拆分,并分別對(duì)不同戶口的存取金額計(jì)算四分位數(shù),通過(guò)比較四分位數(shù)來(lái)比較兩者分布上的差異。注意事項(xiàng)目標(biāo)二:目標(biāo)二:涉及的變量是定距型變量,需要分別對(duì)不同戶口的注意事項(xiàng)數(shù)據(jù)分組,先排序,然后得出最大值100001,最小值1,樣本容量為282,這里為了簡(jiǎn)化,可以分為5組;分組為:500以下、500—2000、2000—35003500—5000、5000以上;頻數(shù)分析計(jì)算所有樣本的存取金額的四分位數(shù),然后按戶口進(jìn)行拆分,重新計(jì)算四分位數(shù),并比較結(jié)果。注意事項(xiàng)數(shù)據(jù)分組,先排序,然后得出最大值100001,最小值應(yīng)用統(tǒng)計(jì)軟件第5章基本統(tǒng)計(jì)分析課件應(yīng)用統(tǒng)計(jì)軟件第5章基本統(tǒng)計(jì)分析課件應(yīng)用統(tǒng)計(jì)軟件第5章基本統(tǒng)計(jì)分析課件課本上案例P72課本上案例P72應(yīng)用統(tǒng)計(jì)軟件第5章基本統(tǒng)計(jì)分析課件5.2描述統(tǒng)計(jì)分析基本描述統(tǒng)計(jì)量基本操作應(yīng)用舉例5.2描述統(tǒng)計(jì)分析基本描述統(tǒng)計(jì)量基本描述統(tǒng)計(jì)量三類1、刻畫(huà)集中趨勢(shì)centraltendency2、刻畫(huà)離散程度dispersion3、刻畫(huà)分布形態(tài)distribution基本描述統(tǒng)計(jì)量三類1刻畫(huà)集中趨勢(shì)的描述統(tǒng)計(jì)量1均值(mean)2中位數(shù)(median)3眾數(shù)(mode):一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)據(jù)值4均值標(biāo)準(zhǔn)誤(standarderrorformean)描述樣本均值與總體均值之間平均差異程度的統(tǒng)計(jì)量。1刻畫(huà)集中趨勢(shì)的描述統(tǒng)計(jì)量1均值(mean)2、刻畫(huà)離散程度的描述統(tǒng)計(jì)量樣本標(biāo)準(zhǔn)差(SD,standarddeviation)樣本方差variance全距(range):也稱為極差,是數(shù)據(jù)最大值與最小值之間的絕對(duì)差。2、刻畫(huà)離散程度的描述統(tǒng)計(jì)量樣本標(biāo)準(zhǔn)差(SD,stan3、刻畫(huà)分布形態(tài)的描述統(tǒng)計(jì)量主要指數(shù)據(jù)分布是否對(duì)稱,偏斜程度如何,分布陡緩程度等。偏度(Skewness):描述變量取值分布形態(tài)對(duì)稱性的統(tǒng)計(jì)量。峰度(Kurtosis):描述變量取值分布形態(tài)陡緩程度的統(tǒng)計(jì)量。3、刻畫(huà)分布形態(tài)的描述統(tǒng)計(jì)量主要指數(shù)據(jù)分布是否對(duì)稱,偏斜程度偏度(skewness)對(duì)稱分布偏度為0,偏度大于0,有一條長(zhǎng)尾拖在右邊,表示右偏或者正偏,否則為左偏或者負(fù)偏。偏度(skewness)對(duì)稱分布偏度為0,偏度大于0,有一條峰度(kurtosis)
標(biāo)準(zhǔn)正態(tài)分布峰度為0,峰度大于0,表示尖峰,否則為平峰。峰度(kurtosis)標(biāo)準(zhǔn)正態(tài)分布峰度為0,峰度大于0,基本操作Analyze-descriptivestatistics-descriptive分析—描述統(tǒng)計(jì)—描述基本操作Analyze-descriptivestatis應(yīng)用舉例居民儲(chǔ)蓄調(diào)查數(shù)據(jù),對(duì)一次存取款金額變量計(jì)算基本描述統(tǒng)計(jì)量。目標(biāo)一:計(jì)算存取款金額的基本描述統(tǒng)計(jì)量,并分別對(duì)城鎮(zhèn)儲(chǔ)戶和農(nóng)村儲(chǔ)戶進(jìn)行比較;目標(biāo)二:分析儲(chǔ)戶一次存取款的數(shù)量是否存在不均衡現(xiàn)象。應(yīng)用舉例居民儲(chǔ)蓄調(diào)查數(shù)據(jù),對(duì)一次存取款金額變量計(jì)算基本描述統(tǒng)
分析目標(biāo)一中,首先按照戶口對(duì)數(shù)據(jù)進(jìn)行拆分,然后計(jì)算變量的基本描述統(tǒng)計(jì)量。分析目標(biāo)一中,首先按照戶口對(duì)數(shù)據(jù)進(jìn)行拆分,然后計(jì)算變量的基分析看到農(nóng)村儲(chǔ)戶和城鎮(zhèn)儲(chǔ)戶的偏度都大于0,且農(nóng)村的傾斜程度更大,因?yàn)?.948>4.293,右偏由此可見(jiàn),城鎮(zhèn)儲(chǔ)戶和農(nóng)村儲(chǔ)戶中的大部分人一次存取款金額都低于平均水平,且農(nóng)村儲(chǔ)戶表現(xiàn)的更加明顯。分析看到農(nóng)村儲(chǔ)戶和城鎮(zhèn)儲(chǔ)戶的偏度都大于0,且農(nóng)村的傾斜程度更分析二目標(biāo)二中,分析是否存在不均衡現(xiàn)象,可以從分析金額是否有大量異常值入手,根據(jù)3西格瑪原則,3個(gè)標(biāo)準(zhǔn)差之外的變量值為異常值,可通過(guò)數(shù)據(jù)的標(biāo)準(zhǔn)化處理來(lái)判斷。在窗口中選savesvaluesasvariables,自動(dòng)計(jì)算保存標(biāo)準(zhǔn)化值,結(jié)果保存在一個(gè)新變量中分析二目標(biāo)二中,分析是否存在不均衡現(xiàn)象,可以從分析金額是否有應(yīng)用統(tǒng)計(jì)軟件第5章基本統(tǒng)計(jì)分析課件分析二然后可對(duì)新變量排序?yàn)g覽取值情況,若發(fā)現(xiàn)異常值存在,則分三組進(jìn)行頻數(shù)分析,異常值組大于理論值0.3%就認(rèn)為存在一定的不均衡現(xiàn)象。本組為2.1,認(rèn)為存在一定的不均衡現(xiàn)象分析二然后可對(duì)新變量排序?yàn)g覽取值情況,若發(fā)現(xiàn)異常值存在,則分5.3探索分析目的:除了計(jì)算基本的統(tǒng)計(jì)量外還給出一些簡(jiǎn)單的檢驗(yàn)結(jié)果和圖形箱圖、莖葉圖有助于用戶進(jìn)一步分析數(shù)據(jù)檢查數(shù)據(jù)是否有誤檢查數(shù)據(jù)的分布特征
返回5.3探索分析目的:返回箱圖
返回箱圖返回莖葉圖
返回莖葉圖返回箱圖與Spreadvslevel圖(a)
返回箱圖與Spreadvslevel圖(a)返回案例給定1969-1971美國(guó)一家銀行的474名雇員情況的數(shù)據(jù)變量:當(dāng)前工資、受教育水平、工作經(jīng)歷、種族、職務(wù)等級(jí)等。按性別對(duì)當(dāng)前工資進(jìn)行探索分析?案例給定1969-1971美國(guó)一家銀行的474名雇員情況的數(shù)數(shù)據(jù)探索主對(duì)話框
返回?cái)?shù)據(jù)探索主對(duì)話框返回選擇描述統(tǒng)計(jì)量對(duì)話框
返回選擇描述統(tǒng)計(jì)量對(duì)話框返回統(tǒng)計(jì)圖對(duì)話框
返回統(tǒng)計(jì)圖對(duì)話框返回實(shí)例輸出之一:觀測(cè)量摘要表
返回實(shí)例輸出之一:觀測(cè)量摘要表返回salary變量的描述統(tǒng)計(jì)量
返回salary變量的描述統(tǒng)計(jì)量返回變量的極端值
返回變量的極端值返回?cái)?shù)據(jù)正態(tài)分布檢驗(yàn)結(jié)果
返回?cái)?shù)據(jù)正態(tài)分布檢驗(yàn)結(jié)果返回方差齊性檢驗(yàn)結(jié)果
返回方差齊性檢驗(yàn)結(jié)果返回
按照性別分組后的CurrentSalary的莖葉圖
返回按照性別分組后的CurrentSalary的莖葉男、女組薪水?dāng)?shù)據(jù)的箱圖
返回男、女組薪水?dāng)?shù)據(jù)的箱圖返回5.4交叉分組下的頻數(shù)分析目的基本任務(wù)操作應(yīng)用舉例列聯(lián)表分析的其他方法5.4交叉分組下的頻數(shù)分析目的目的頻數(shù)分析能掌握單個(gè)變量的數(shù)據(jù)分布,實(shí)際不僅要了解單變量的分布特征,還要分析多個(gè)變量不同取值下的分布掌握多變量的聯(lián)合分布特征,進(jìn)而分析變量之間的相互影響和關(guān)系例子居民儲(chǔ)蓄問(wèn)題,需要掌握不同特征的儲(chǔ)戶群(戶口、職業(yè))對(duì)調(diào)查問(wèn)題的態(tài)度,分析儲(chǔ)戶特征和調(diào)查問(wèn)題之間是否存在一定的關(guān)聯(lián)性。交叉分組下的頻數(shù)分析又稱列聯(lián)表分析目的頻數(shù)分析能掌握單個(gè)變量的數(shù)據(jù)分布,實(shí)際不僅要了解單變量的兩大基本任務(wù)根據(jù)收集到的樣本數(shù)據(jù),產(chǎn)生二維或多維
交叉列聯(lián)表;在交叉列聯(lián)表基礎(chǔ)之上,對(duì)兩兩變量間是否存在一定的相關(guān)性進(jìn)行分析。兩大基本任務(wù)根據(jù)收集到的樣本數(shù)據(jù),產(chǎn)生二維或多維交叉列聯(lián)表定義兩個(gè)或兩個(gè)以上的變量交叉分組后形成的頻數(shù)分布表行變量(row)、列變量(column)、層變量(layer)包括觀測(cè)頻數(shù)、行百分比、列百分比、總百分比交叉列聯(lián)表定義交叉列聯(lián)表行列變量間關(guān)系的分析目的分析行變量和列變量之間是否有聯(lián)系和聯(lián)系的緊密程度如何舉例分析年齡或職稱與工資的關(guān)系(極端)交叉列聯(lián)表行列變量間關(guān)系的分析目的分析一般情況下,觀測(cè)頻數(shù)分散在列聯(lián)表的各個(gè)單元格中,不容易發(fā)現(xiàn)行列變量間關(guān)系借助非參數(shù)檢驗(yàn)方法和度量變量間相關(guān)程度的統(tǒng)計(jì)量等手段進(jìn)行分析通常方法:卡方檢驗(yàn)和相關(guān)性檢驗(yàn)分析一般情況下,觀測(cè)頻數(shù)分散在列聯(lián)表的各個(gè)單元格中,不容易發(fā)卡方檢驗(yàn)建立零假設(shè)列聯(lián)表分析中行列變量相互獨(dú)立構(gòu)造統(tǒng)計(jì)量與臨界值進(jìn)行比較注意事項(xiàng)卡方檢驗(yàn)建立零假設(shè)統(tǒng)計(jì)量期望頻數(shù)(expectedcount)期望頻數(shù)與總體的分布一致,即,他的分布反映的是行列變量互不相關(guān)下的分布,反映了行列變量間的相互獨(dú)立關(guān)系各單元格期望頻數(shù)公式Pearson卡方統(tǒng)計(jì)量公式統(tǒng)計(jì)量期望頻數(shù)(expectedcount)Pearson臨界值比較給定顯著性水平查表若則存在相關(guān)關(guān)系若則相互不相關(guān)臨界值比較給定顯著性水平注意卡方統(tǒng)計(jì)量觀測(cè)值大小取決于觀測(cè)頻數(shù)與期望頻數(shù)的總離差,離差越大,實(shí)際分布與期望分布的差距越大,表明行列變量間越相關(guān),近似服從卡方分布列聯(lián)表中不應(yīng)有期望頻數(shù)小于1的單元格,或不應(yīng)有大量的期望頻數(shù)小于5的單元格,因?yàn)槠谕l數(shù)偏小大量存在,卡方統(tǒng)計(jì)量無(wú)疑會(huì)存在偏大趨勢(shì),易拒絕零假設(shè),此時(shí)可以采用似然率卡方檢驗(yàn)等方法修正由定義知道,卡方值會(huì)隨著樣本容量的增加而增大,有必要對(duì)原卡方值進(jìn)行修正,以剔除樣本量的影響注意卡方統(tǒng)計(jì)量觀測(cè)值大小取決于觀測(cè)頻數(shù)與期望頻數(shù)的總離差,離基本操作Analyze-descriptivestatistics-crosstabs分析—描述統(tǒng)計(jì)—列聯(lián)表基本操作Analyze-descriptivestatis應(yīng)用舉例利用居民儲(chǔ)蓄調(diào)查數(shù)據(jù)進(jìn)行分析目標(biāo)一:分析城鎮(zhèn)和農(nóng)村儲(chǔ)戶對(duì)“未來(lái)兩年內(nèi)收入狀況的變化趨勢(shì)”是否持相同的態(tài)度目標(biāo)二:分析城鎮(zhèn)和農(nóng)村儲(chǔ)戶對(duì)儲(chǔ)蓄是否合算的認(rèn)同是否一致應(yīng)用舉例利用居民儲(chǔ)蓄調(diào)查數(shù)據(jù)進(jìn)行分析分析目標(biāo)一:列聯(lián)表行變量為戶口,列變量為未來(lái)收入,輸出各種百分比,期望頻數(shù),剩余,顯示分布柱形圖,卡方檢驗(yàn)一致性分析。目標(biāo)二:行變量為戶口,列變量為什么合算分析目標(biāo)一:列聯(lián)表行變量為戶口,列變量為未來(lái)收入,輸出各種百應(yīng)用統(tǒng)計(jì)軟件第5章基本統(tǒng)計(jì)分析課件小于0.05顯著當(dāng)期望頻數(shù)小時(shí),用小于0.05當(dāng)期望頻數(shù)小時(shí),用明顯城鎮(zhèn)未來(lái)認(rèn)為收入減少的比增加的多,而農(nóng)村的認(rèn)為未來(lái)收入增加的比減少的多,不一致。明顯城鎮(zhèn)未來(lái)認(rèn)為收入減少的比增加的多,而農(nóng)村的認(rèn)為未來(lái)收入增應(yīng)用統(tǒng)計(jì)軟件第5章基本統(tǒng)計(jì)分析課件不能夠拒絕看法一致的結(jié)論。不能夠拒絕看法一致的結(jié)論。列聯(lián)表分析的其他方法針對(duì)其他測(cè)度變量間相關(guān)關(guān)系的檢驗(yàn)方法適合兩定類變量的方法(nominal)適合兩定序變量(ordinal)適用一定類變量與一定距變量的方法其他方法列聯(lián)表分析的其他方法針對(duì)其他測(cè)度變量間相關(guān)關(guān)系的檢驗(yàn)方法適合兩定類變量的方法(nominal)列聯(lián)系數(shù)Phi系數(shù)Gramer’sv系數(shù)這些方法都是從pearson卡方派生出來(lái)的,將樣本量的影響減至最小適合兩定類變量的方法(nominal)列聯(lián)系數(shù)適合兩定序變量(ordinal)這些方法都是圍繞“同序?qū)?shù)”和“異序?qū)?shù)”展開(kāi)若同序?qū)?shù)占多數(shù),則認(rèn)為兩變量正相關(guān)P為同序?qū)?shù),Q為異序?qū)?shù)gamma系數(shù)常用于2*2列聯(lián)表Kendall’stau-b系數(shù)常用于方形列聯(lián)表Kendall’stau-c系數(shù)常用于任意格數(shù)列聯(lián)表范圍都是[-1,+1]適合兩定序變量(ordinal)這些方法都是圍繞“同序?qū)?shù)”同序?qū)?shù)和異序?qū)?shù)例如學(xué)歷和收入均為定序變量,取值越大學(xué)歷和收入越高,如果學(xué)歷和收入具有正相關(guān)關(guān)系,則學(xué)歷數(shù)據(jù)按照升序排序后,對(duì)應(yīng)的收入取值也完全按照升序排列,但一般不可能完全如此。引入同序?qū)?shù)P,和異序?qū)?shù)Q,兩變量按照X自然升序排列后,Y序列中后面有一個(gè)變量值大于前面的一個(gè)變量值,則記為一個(gè)同序?qū)?,反之為異序?qū)?。同序?qū)?shù)和異序?qū)?shù)例如同序?qū)?shù)和異序?qū)?shù)上表中同序?qū)τ校?3)(24)(25)(34)(35)(12)(14)(15)(24)(25)(45),P=11,異序?qū)Γ?1)(31)(32),Q=3,其余在收入上取值相同的稱為同分對(duì)。若同序?qū)φ级鄶?shù),則認(rèn)為變量為正相關(guān),否則為負(fù)相關(guān),若彼此相差不大,則認(rèn)為變量無(wú)線性關(guān)系。同序?qū)?shù)和異序?qū)?shù)上表中同序?qū)τ校?3)(24)(25)(3定類、定序及其他一定類、一定距變量核心思想基于單因素方差分析ETA系數(shù)取值范圍[0,1]其他方法若行列變量均是定距,可以通過(guò)相關(guān)系數(shù)測(cè)度,輸出pearson和spearman相關(guān)系數(shù)取值范圍[-1,+1]Kappa,risk,rr都是醫(yī)學(xué)分析中的指標(biāo)定類、定序及其他一定類、一定距變量多選項(xiàng)分析目的操作應(yīng)用舉例多選項(xiàng)分析目的目的針對(duì)問(wèn)卷調(diào)查中的多選項(xiàng)問(wèn)題的例子某地區(qū)高三學(xué)生的高考志愿居民儲(chǔ)蓄調(diào)查問(wèn)卷調(diào)查分析的一般步驟多選項(xiàng)問(wèn)題的分解利用頻數(shù)分析或交叉分組進(jìn)行分析目的針對(duì)問(wèn)卷調(diào)查中的多選項(xiàng)問(wèn)題的SPSS變量名變量名標(biāo)簽變量值V1報(bào)考北大嗎0/1V2報(bào)考清華嗎0/1V3報(bào)考人大嗎0/1V4報(bào)考南開(kāi)嗎0/1V5報(bào)考復(fù)旦嗎0/1多選項(xiàng)二分法舉例SPSS變量名變量名標(biāo)簽變量值V1報(bào)考北大嗎0/1V2報(bào)考清SPSS變量名變量名標(biāo)簽變量值V1志愿一1/2/3/4/5V2志愿二1/2/3/4/5V3志愿三1/2/3/4/5多選項(xiàng)分類法舉例SPSS變量名變量名標(biāo)簽變量值V1志愿一1/2/3/4/5V多選項(xiàng)問(wèn)題分解問(wèn)題:對(duì)一個(gè)多選項(xiàng)問(wèn)題僅設(shè)置一個(gè)變量在數(shù)據(jù)處理和分析中行不通兩種方法第一多選項(xiàng)二分法將多選項(xiàng)問(wèn)題中每個(gè)答案設(shè)為一個(gè)變量,每個(gè)變量值只取01,表示選擇該答案與否第二多選項(xiàng)分類法首先估計(jì)最多可能出現(xiàn)的答案?jìng)€(gè)數(shù),然后把每個(gè)答案設(shè)置為一個(gè)變量選擇關(guān)鍵:應(yīng)考慮具體問(wèn)題和目標(biāo),避免信息丟失的前提下,減少稀疏數(shù)據(jù)。多選項(xiàng)問(wèn)題分解問(wèn)題:對(duì)一個(gè)多選項(xiàng)問(wèn)題僅設(shè)置一個(gè)變量在數(shù)據(jù)處理頻數(shù)分析問(wèn)題這些分析方法在處理多選項(xiàng)問(wèn)題存在不足例如高考志愿,采用多選項(xiàng)分類法合理,但是只能夠得到志愿一、二、三的學(xué)校報(bào)考情況,卻不能夠得到各學(xué)校的報(bào)考情況頻數(shù)分析問(wèn)題操作首先將多選項(xiàng)問(wèn)題分解成若干問(wèn)題,設(shè)置若干變量定義多項(xiàng)選擇變量集Analyze-multipleresponse-definesets頻數(shù)分析Analyze-multipleresponse-frequencies交叉分組分析Analyze-multipleresponse-crosstabs操作首先將多選項(xiàng)問(wèn)題分解成若干問(wèn)題,設(shè)置若干變量應(yīng)用舉例利用居民儲(chǔ)蓄調(diào)查數(shù)據(jù)目標(biāo)一:分析儲(chǔ)戶的儲(chǔ)蓄目的目標(biāo)二:分析不同年齡段儲(chǔ)戶的儲(chǔ)蓄目的分析依據(jù)多選項(xiàng)分類法分解成三個(gè)問(wèn)題定義多選項(xiàng)變量集x,作頻數(shù)分析對(duì)不同年齡段進(jìn)行交叉分組頻數(shù)分析應(yīng)用舉例利用居民儲(chǔ)蓄調(diào)查數(shù)據(jù)應(yīng)用統(tǒng)計(jì)軟件第5章基本統(tǒng)計(jì)分析課件應(yīng)用統(tǒng)計(jì)軟件第5章基本統(tǒng)計(jì)分析課件應(yīng)用統(tǒng)計(jì)軟件第5章基本統(tǒng)計(jì)分析課件應(yīng)用統(tǒng)計(jì)軟件第5章基本統(tǒng)計(jì)分析課件應(yīng)用統(tǒng)計(jì)軟件第5章基本統(tǒng)計(jì)分析課件應(yīng)用統(tǒng)計(jì)軟件第5章基本統(tǒng)計(jì)分析課件應(yīng)用統(tǒng)計(jì)軟件第5章基本統(tǒng)計(jì)分析課件應(yīng)用統(tǒng)計(jì)軟件第5章基本統(tǒng)計(jì)分析課件應(yīng)用統(tǒng)計(jì)軟件第5章基本統(tǒng)計(jì)分析課件應(yīng)用統(tǒng)計(jì)軟件第5章基本統(tǒng)計(jì)分析課件應(yīng)用統(tǒng)計(jì)軟件第5章基本統(tǒng)計(jì)分析課件應(yīng)用統(tǒng)計(jì)軟件第5章基本統(tǒng)計(jì)分析課件5.5比率分析目的主要指標(biāo)操作應(yīng)用案例5.5比率分析目的目的用于對(duì)兩變量間變量值比率變化的描述分析,適用于定距型變量例子分析各地區(qū)保險(xiǎn)業(yè)務(wù)的保費(fèi)收入占全部業(yè)務(wù)保費(fèi)收入的比例情況分析男女出生比例目的用于對(duì)兩變量間變量值比率變化的描述分析,適用于定距型變量主要指標(biāo)集中趨勢(shì)wm(weightedmean)離散程度aad(averageabsolutedeviation)cod(coefficientofdispersion)prd(price-relateddifferential)cov(meancentered)cov(mediancentered)主要指標(biāo)集中趨勢(shì)應(yīng)用統(tǒng)計(jì)軟件第5章基本統(tǒng)計(jì)分析課件操作Analyze-descriptivestatistics-ratio分子變量Numerator分母變量denominator操作Analyze-descriptivestatisti應(yīng)用舉例根據(jù)1999年各地區(qū)保險(xiǎn)業(yè)務(wù)情況數(shù)據(jù)分析各地區(qū)財(cái)產(chǎn)保險(xiǎn)業(yè)務(wù)的保費(fèi)收入占全部業(yè)務(wù)保費(fèi)收入的比例情況應(yīng)用舉例根據(jù)1999年各地區(qū)保險(xiǎn)業(yè)務(wù)情況數(shù)據(jù)應(yīng)用統(tǒng)計(jì)軟件第5章基本統(tǒng)計(jì)分析課件應(yīng)用統(tǒng)計(jì)軟件第5章基本統(tǒng)計(jì)分析課件應(yīng)用統(tǒng)計(jì)軟件第5章基本統(tǒng)計(jì)分析課件分析總之,在各自治區(qū)中,財(cái)產(chǎn)險(xiǎn)的收入所占的比例較高,高于全國(guó)平均水平但其發(fā)展水平差異較大。分析總之,在各自治區(qū)中,財(cái)產(chǎn)險(xiǎn)的收入所占的比例較高,高于全國(guó)應(yīng)用統(tǒng)計(jì)軟件
第5章基本統(tǒng)計(jì)分析應(yīng)用統(tǒng)計(jì)軟件
第5章基本統(tǒng)計(jì)分析應(yīng)用統(tǒng)計(jì)軟件第5章基本統(tǒng)計(jì)分析課件第5章SPSS基本統(tǒng)計(jì)分析引入頻數(shù)分析描述分析探索性分析交叉分組下的頻數(shù)分析比率分析第5章SPSS基本統(tǒng)計(jì)分析引入引入意義:基礎(chǔ),能使分析者掌握數(shù)據(jù)的基本統(tǒng)計(jì)特征,把握數(shù)據(jù)的總體分布形態(tài)。內(nèi)容:編制單變量的頻數(shù)分布表計(jì)算單個(gè)變量的描述統(tǒng)計(jì)量以及不同分組下的描述統(tǒng)計(jì)量其他探索性分析數(shù)據(jù)的多選項(xiàng)分析實(shí)現(xiàn)方式:1數(shù)值計(jì)算;2圖形繪制。引入意義:基礎(chǔ),能使分析者掌握數(shù)據(jù)的基本統(tǒng)計(jì)特征,把握數(shù)據(jù)的5.1頻數(shù)分析目的基本任務(wù)基本操作擴(kuò)展功能應(yīng)用舉例5.1頻數(shù)分析目的目的了解變量取值的狀況,對(duì)把握數(shù)據(jù)的分布特征非常有用例如:?jiǎn)柧碚{(diào)查對(duì)被訪問(wèn)者的總?cè)藬?shù)、年齡特點(diǎn)、職業(yè)特點(diǎn)等進(jìn)行分析和總結(jié)通過(guò)分析,能夠在一定程度上反映樣本是否具有總體代表性,抽樣是否存在系統(tǒng)偏差等,并以此證明以后相關(guān)問(wèn)題分析的代表性和可信性。目的基本任務(wù)第一、編制頻數(shù)分布表頻數(shù)Frequency、百分比percent、有效百分比validpercent、累計(jì)百分比cumulativepercent
第二、繪制常用統(tǒng)計(jì)圖條形圖barchart、餅圖piechart、直方圖histograms基本任務(wù)第一、編制頻數(shù)分布表基本操作analyze—descriptivestatistics—frequencies分析—描述統(tǒng)計(jì)—頻率基本操作analyze—descriptivestatis擴(kuò)展功能第一、計(jì)算分位數(shù)(percentilevalues)將所有數(shù)據(jù)按升序排序后平均等分為n份,分位點(diǎn)依次是1/n,2/n,…,n-1/n;分位數(shù)刻劃了變量的取值分布狀態(tài)分位數(shù)差是一種描述數(shù)據(jù)離散程度的方式。第二、計(jì)算其他基本描述統(tǒng)計(jì)量集中趨勢(shì)、離散程度、分布形態(tài)等基本統(tǒng)計(jì)量擴(kuò)展功能第一、計(jì)算分位數(shù)(percentilevalues應(yīng)用舉例利用居民儲(chǔ)蓄調(diào)查數(shù)據(jù)進(jìn)行頻數(shù)分析,有以下兩個(gè)分析目標(biāo)。目標(biāo)一:分析儲(chǔ)戶的戶口和職業(yè)的基本情況;目標(biāo)二:分析儲(chǔ)戶一次存取金額的分布,并對(duì)城鎮(zhèn)儲(chǔ)戶和農(nóng)村儲(chǔ)戶進(jìn)行比較。分析應(yīng)用舉例利用居民儲(chǔ)蓄調(diào)查數(shù)據(jù)進(jìn)行頻數(shù)分析,有以下兩個(gè)分析目標(biāo)目標(biāo)一:戶口和職業(yè)的分析目標(biāo)一:兩個(gè)變量是名義變量,可通過(guò)基本頻數(shù)分析實(shí)現(xiàn);主意:職業(yè)變量分類較多,為使顯示一目了然,最好排序下。format目標(biāo)一:戶口和職業(yè)的分析目標(biāo)一:兩個(gè)變量是名義變量,可通過(guò)基應(yīng)用統(tǒng)計(jì)軟件第5章基本統(tǒng)計(jì)分析課件應(yīng)用統(tǒng)計(jì)軟件第5章基本統(tǒng)計(jì)分析課件應(yīng)用統(tǒng)計(jì)軟件第5章基本統(tǒng)計(jì)分析課件目標(biāo)二:目標(biāo)二:涉及的變量是定距型變量,需要分別對(duì)不同戶口的儲(chǔ)戶進(jìn)行分析。存取金額數(shù)據(jù)直接采用頻數(shù)分析不利于把握,考慮用數(shù)據(jù)分組的功能對(duì)數(shù)據(jù)分組然后再編制頻數(shù)分析表;進(jìn)行數(shù)據(jù)拆分,并分別對(duì)不同戶口的存取金額計(jì)算四分位數(shù),通過(guò)比較四分位數(shù)來(lái)比較兩者分布上的差異。注意事項(xiàng)目標(biāo)二:目標(biāo)二:涉及的變量是定距型變量,需要分別對(duì)不同戶口的注意事項(xiàng)數(shù)據(jù)分組,先排序,然后得出最大值100001,最小值1,樣本容量為282,這里為了簡(jiǎn)化,可以分為5組;分組為:500以下、500—2000、2000—35003500—5000、5000以上;頻數(shù)分析計(jì)算所有樣本的存取金額的四分位數(shù),然后按戶口進(jìn)行拆分,重新計(jì)算四分位數(shù),并比較結(jié)果。注意事項(xiàng)數(shù)據(jù)分組,先排序,然后得出最大值100001,最小值應(yīng)用統(tǒng)計(jì)軟件第5章基本統(tǒng)計(jì)分析課件應(yīng)用統(tǒng)計(jì)軟件第5章基本統(tǒng)計(jì)分析課件應(yīng)用統(tǒng)計(jì)軟件第5章基本統(tǒng)計(jì)分析課件課本上案例P72課本上案例P72應(yīng)用統(tǒng)計(jì)軟件第5章基本統(tǒng)計(jì)分析課件5.2描述統(tǒng)計(jì)分析基本描述統(tǒng)計(jì)量基本操作應(yīng)用舉例5.2描述統(tǒng)計(jì)分析基本描述統(tǒng)計(jì)量基本描述統(tǒng)計(jì)量三類1、刻畫(huà)集中趨勢(shì)centraltendency2、刻畫(huà)離散程度dispersion3、刻畫(huà)分布形態(tài)distribution基本描述統(tǒng)計(jì)量三類1刻畫(huà)集中趨勢(shì)的描述統(tǒng)計(jì)量1均值(mean)2中位數(shù)(median)3眾數(shù)(mode):一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)據(jù)值4均值標(biāo)準(zhǔn)誤(standarderrorformean)描述樣本均值與總體均值之間平均差異程度的統(tǒng)計(jì)量。1刻畫(huà)集中趨勢(shì)的描述統(tǒng)計(jì)量1均值(mean)2、刻畫(huà)離散程度的描述統(tǒng)計(jì)量樣本標(biāo)準(zhǔn)差(SD,standarddeviation)樣本方差variance全距(range):也稱為極差,是數(shù)據(jù)最大值與最小值之間的絕對(duì)差。2、刻畫(huà)離散程度的描述統(tǒng)計(jì)量樣本標(biāo)準(zhǔn)差(SD,stan3、刻畫(huà)分布形態(tài)的描述統(tǒng)計(jì)量主要指數(shù)據(jù)分布是否對(duì)稱,偏斜程度如何,分布陡緩程度等。偏度(Skewness):描述變量取值分布形態(tài)對(duì)稱性的統(tǒng)計(jì)量。峰度(Kurtosis):描述變量取值分布形態(tài)陡緩程度的統(tǒng)計(jì)量。3、刻畫(huà)分布形態(tài)的描述統(tǒng)計(jì)量主要指數(shù)據(jù)分布是否對(duì)稱,偏斜程度偏度(skewness)對(duì)稱分布偏度為0,偏度大于0,有一條長(zhǎng)尾拖在右邊,表示右偏或者正偏,否則為左偏或者負(fù)偏。偏度(skewness)對(duì)稱分布偏度為0,偏度大于0,有一條峰度(kurtosis)
標(biāo)準(zhǔn)正態(tài)分布峰度為0,峰度大于0,表示尖峰,否則為平峰。峰度(kurtosis)標(biāo)準(zhǔn)正態(tài)分布峰度為0,峰度大于0,基本操作Analyze-descriptivestatistics-descriptive分析—描述統(tǒng)計(jì)—描述基本操作Analyze-descriptivestatis應(yīng)用舉例居民儲(chǔ)蓄調(diào)查數(shù)據(jù),對(duì)一次存取款金額變量計(jì)算基本描述統(tǒng)計(jì)量。目標(biāo)一:計(jì)算存取款金額的基本描述統(tǒng)計(jì)量,并分別對(duì)城鎮(zhèn)儲(chǔ)戶和農(nóng)村儲(chǔ)戶進(jìn)行比較;目標(biāo)二:分析儲(chǔ)戶一次存取款的數(shù)量是否存在不均衡現(xiàn)象。應(yīng)用舉例居民儲(chǔ)蓄調(diào)查數(shù)據(jù),對(duì)一次存取款金額變量計(jì)算基本描述統(tǒng)
分析目標(biāo)一中,首先按照戶口對(duì)數(shù)據(jù)進(jìn)行拆分,然后計(jì)算變量的基本描述統(tǒng)計(jì)量。分析目標(biāo)一中,首先按照戶口對(duì)數(shù)據(jù)進(jìn)行拆分,然后計(jì)算變量的基分析看到農(nóng)村儲(chǔ)戶和城鎮(zhèn)儲(chǔ)戶的偏度都大于0,且農(nóng)村的傾斜程度更大,因?yàn)?.948>4.293,右偏由此可見(jiàn),城鎮(zhèn)儲(chǔ)戶和農(nóng)村儲(chǔ)戶中的大部分人一次存取款金額都低于平均水平,且農(nóng)村儲(chǔ)戶表現(xiàn)的更加明顯。分析看到農(nóng)村儲(chǔ)戶和城鎮(zhèn)儲(chǔ)戶的偏度都大于0,且農(nóng)村的傾斜程度更分析二目標(biāo)二中,分析是否存在不均衡現(xiàn)象,可以從分析金額是否有大量異常值入手,根據(jù)3西格瑪原則,3個(gè)標(biāo)準(zhǔn)差之外的變量值為異常值,可通過(guò)數(shù)據(jù)的標(biāo)準(zhǔn)化處理來(lái)判斷。在窗口中選savesvaluesasvariables,自動(dòng)計(jì)算保存標(biāo)準(zhǔn)化值,結(jié)果保存在一個(gè)新變量中分析二目標(biāo)二中,分析是否存在不均衡現(xiàn)象,可以從分析金額是否有應(yīng)用統(tǒng)計(jì)軟件第5章基本統(tǒng)計(jì)分析課件分析二然后可對(duì)新變量排序?yàn)g覽取值情況,若發(fā)現(xiàn)異常值存在,則分三組進(jìn)行頻數(shù)分析,異常值組大于理論值0.3%就認(rèn)為存在一定的不均衡現(xiàn)象。本組為2.1,認(rèn)為存在一定的不均衡現(xiàn)象分析二然后可對(duì)新變量排序?yàn)g覽取值情況,若發(fā)現(xiàn)異常值存在,則分5.3探索分析目的:除了計(jì)算基本的統(tǒng)計(jì)量外還給出一些簡(jiǎn)單的檢驗(yàn)結(jié)果和圖形箱圖、莖葉圖有助于用戶進(jìn)一步分析數(shù)據(jù)檢查數(shù)據(jù)是否有誤檢查數(shù)據(jù)的分布特征
返回5.3探索分析目的:返回箱圖
返回箱圖返回莖葉圖
返回莖葉圖返回箱圖與Spreadvslevel圖(a)
返回箱圖與Spreadvslevel圖(a)返回案例給定1969-1971美國(guó)一家銀行的474名雇員情況的數(shù)據(jù)變量:當(dāng)前工資、受教育水平、工作經(jīng)歷、種族、職務(wù)等級(jí)等。按性別對(duì)當(dāng)前工資進(jìn)行探索分析?案例給定1969-1971美國(guó)一家銀行的474名雇員情況的數(shù)數(shù)據(jù)探索主對(duì)話框
返回?cái)?shù)據(jù)探索主對(duì)話框返回選擇描述統(tǒng)計(jì)量對(duì)話框
返回選擇描述統(tǒng)計(jì)量對(duì)話框返回統(tǒng)計(jì)圖對(duì)話框
返回統(tǒng)計(jì)圖對(duì)話框返回實(shí)例輸出之一:觀測(cè)量摘要表
返回實(shí)例輸出之一:觀測(cè)量摘要表返回salary變量的描述統(tǒng)計(jì)量
返回salary變量的描述統(tǒng)計(jì)量返回變量的極端值
返回變量的極端值返回?cái)?shù)據(jù)正態(tài)分布檢驗(yàn)結(jié)果
返回?cái)?shù)據(jù)正態(tài)分布檢驗(yàn)結(jié)果返回方差齊性檢驗(yàn)結(jié)果
返回方差齊性檢驗(yàn)結(jié)果返回
按照性別分組后的CurrentSalary的莖葉圖
返回按照性別分組后的CurrentSalary的莖葉男、女組薪水?dāng)?shù)據(jù)的箱圖
返回男、女組薪水?dāng)?shù)據(jù)的箱圖返回5.4交叉分組下的頻數(shù)分析目的基本任務(wù)操作應(yīng)用舉例列聯(lián)表分析的其他方法5.4交叉分組下的頻數(shù)分析目的目的頻數(shù)分析能掌握單個(gè)變量的數(shù)據(jù)分布,實(shí)際不僅要了解單變量的分布特征,還要分析多個(gè)變量不同取值下的分布掌握多變量的聯(lián)合分布特征,進(jìn)而分析變量之間的相互影響和關(guān)系例子居民儲(chǔ)蓄問(wèn)題,需要掌握不同特征的儲(chǔ)戶群(戶口、職業(yè))對(duì)調(diào)查問(wèn)題的態(tài)度,分析儲(chǔ)戶特征和調(diào)查問(wèn)題之間是否存在一定的關(guān)聯(lián)性。交叉分組下的頻數(shù)分析又稱列聯(lián)表分析目的頻數(shù)分析能掌握單個(gè)變量的數(shù)據(jù)分布,實(shí)際不僅要了解單變量的兩大基本任務(wù)根據(jù)收集到的樣本數(shù)據(jù),產(chǎn)生二維或多維
交叉列聯(lián)表;在交叉列聯(lián)表基礎(chǔ)之上,對(duì)兩兩變量間是否存在一定的相關(guān)性進(jìn)行分析。兩大基本任務(wù)根據(jù)收集到的樣本數(shù)據(jù),產(chǎn)生二維或多維交叉列聯(lián)表定義兩個(gè)或兩個(gè)以上的變量交叉分組后形成的頻數(shù)分布表行變量(row)、列變量(column)、層變量(layer)包括觀測(cè)頻數(shù)、行百分比、列百分比、總百分比交叉列聯(lián)表定義交叉列聯(lián)表行列變量間關(guān)系的分析目的分析行變量和列變量之間是否有聯(lián)系和聯(lián)系的緊密程度如何舉例分析年齡或職稱與工資的關(guān)系(極端)交叉列聯(lián)表行列變量間關(guān)系的分析目的分析一般情況下,觀測(cè)頻數(shù)分散在列聯(lián)表的各個(gè)單元格中,不容易發(fā)現(xiàn)行列變量間關(guān)系借助非參數(shù)檢驗(yàn)方法和度量變量間相關(guān)程度的統(tǒng)計(jì)量等手段進(jìn)行分析通常方法:卡方檢驗(yàn)和相關(guān)性檢驗(yàn)分析一般情況下,觀測(cè)頻數(shù)分散在列聯(lián)表的各個(gè)單元格中,不容易發(fā)卡方檢驗(yàn)建立零假設(shè)列聯(lián)表分析中行列變量相互獨(dú)立構(gòu)造統(tǒng)計(jì)量與臨界值進(jìn)行比較注意事項(xiàng)卡方檢驗(yàn)建立零假設(shè)統(tǒng)計(jì)量期望頻數(shù)(expectedcount)期望頻數(shù)與總體的分布一致,即,他的分布反映的是行列變量互不相關(guān)下的分布,反映了行列變量間的相互獨(dú)立關(guān)系各單元格期望頻數(shù)公式Pearson卡方統(tǒng)計(jì)量公式統(tǒng)計(jì)量期望頻數(shù)(expectedcount)Pearson臨界值比較給定顯著性水平查表若則存在相關(guān)關(guān)系若則相互不相關(guān)臨界值比較給定顯著性水平注意卡方統(tǒng)計(jì)量觀測(cè)值大小取決于觀測(cè)頻數(shù)與期望頻數(shù)的總離差,離差越大,實(shí)際分布與期望分布的差距越大,表明行列變量間越相關(guān),近似服從卡方分布列聯(lián)表中不應(yīng)有期望頻數(shù)小于1的單元格,或不應(yīng)有大量的期望頻數(shù)小于5的單元格,因?yàn)槠谕l數(shù)偏小大量存在,卡方統(tǒng)計(jì)量無(wú)疑會(huì)存在偏大趨勢(shì),易拒絕零假設(shè),此時(shí)可以采用似然率卡方檢驗(yàn)等方法修正由定義知道,卡方值會(huì)隨著樣本容量的增加而增大,有必要對(duì)原卡方值進(jìn)行修正,以剔除樣本量的影響注意卡方統(tǒng)計(jì)量觀測(cè)值大小取決于觀測(cè)頻數(shù)與期望頻數(shù)的總離差,離基本操作Analyze-descriptivestatistics-crosstabs分析—描述統(tǒng)計(jì)—列聯(lián)表基本操作Analyze-descriptivestatis應(yīng)用舉例利用居民儲(chǔ)蓄調(diào)查數(shù)據(jù)進(jìn)行分析目標(biāo)一:分析城鎮(zhèn)和農(nóng)村儲(chǔ)戶對(duì)“未來(lái)兩年內(nèi)收入狀況的變化趨勢(shì)”是否持相同的態(tài)度目標(biāo)二:分析城鎮(zhèn)和農(nóng)村儲(chǔ)戶對(duì)儲(chǔ)蓄是否合算的認(rèn)同是否一致應(yīng)用舉例利用居民儲(chǔ)蓄調(diào)查數(shù)據(jù)進(jìn)行分析分析目標(biāo)一:列聯(lián)表行變量為戶口,列變量為未來(lái)收入,輸出各種百分比,期望頻數(shù),剩余,顯示分布柱形圖,卡方檢驗(yàn)一致性分析。目標(biāo)二:行變量為戶口,列變量為什么合算分析目標(biāo)一:列聯(lián)表行變量為戶口,列變量為未來(lái)收入,輸出各種百應(yīng)用統(tǒng)計(jì)軟件第5章基本統(tǒng)計(jì)分析課件小于0.05顯著當(dāng)期望頻數(shù)小時(shí),用小于0.05當(dāng)期望頻數(shù)小時(shí),用明顯城鎮(zhèn)未來(lái)認(rèn)為收入減少的比增加的多,而農(nóng)村的認(rèn)為未來(lái)收入增加的比減少的多,不一致。明顯城鎮(zhèn)未來(lái)認(rèn)為收入減少的比增加的多,而農(nóng)村的認(rèn)為未來(lái)收入增應(yīng)用統(tǒng)計(jì)軟件第5章基本統(tǒng)計(jì)分析課件不能夠拒絕看法一致的結(jié)論。不能夠拒絕看法一致的結(jié)論。列聯(lián)表分析的其他方法針對(duì)其他測(cè)度變量間相關(guān)關(guān)系的檢驗(yàn)方法適合兩定類變量的方法(nominal)適合兩定序變量(ordinal)適用一定類變量與一定距變量的方法其他方法列聯(lián)表分析的其他方法針對(duì)其他測(cè)度變量間相關(guān)關(guān)系的檢驗(yàn)方法適合兩定類變量的方法(nominal)列聯(lián)系數(shù)Phi系數(shù)Gramer’sv系數(shù)這些方法都是從pearson卡方派生出來(lái)的,將樣本量的影響減至最小適合兩定類變量的方法(nominal)列聯(lián)系數(shù)適合兩定序變量(ordinal)這些方法都是圍繞“同序?qū)?shù)”和“異序?qū)?shù)”展開(kāi)若同序?qū)?shù)占多數(shù),則認(rèn)為兩變量正相關(guān)P為同序?qū)?shù),Q為異序?qū)?shù)gamma系數(shù)常用于2*2列聯(lián)表Kendall’stau-b系數(shù)常用于方形列聯(lián)表Kendall’stau-c系數(shù)常用于任意格數(shù)列聯(lián)表范圍都是[-1,+1]適合兩定序變量(ordinal)這些方法都是圍繞“同序?qū)?shù)”同序?qū)?shù)和異序?qū)?shù)例如學(xué)歷和收入均為定序變量,取值越大學(xué)歷和收入越高,如果學(xué)歷和收入具有正相關(guān)關(guān)系,則學(xué)歷數(shù)據(jù)按照升序排序后,對(duì)應(yīng)的收入取值也完全按照升序排列,但一般不可能完全如此。引入同序?qū)?shù)P,和異序?qū)?shù)Q,兩變量按照X自然升序排列后,Y序列中后面有一個(gè)變量值大于前面的一個(gè)變量值,則記為一個(gè)同序?qū)?,反之為異序?qū)?。同序?qū)?shù)和異序?qū)?shù)例如同序?qū)?shù)和異序?qū)?shù)上表中同序?qū)τ校?3)(24)(25)(34)(35)(12)(14)(15)(24)(25)(45),P=11,異序?qū)Γ?1)(31)(32),Q=3,其余在收入上取值相同的稱為同分對(duì)。若同序?qū)φ级鄶?shù),則認(rèn)為變量為正相關(guān),否則為負(fù)相關(guān),若彼此相差不大,則認(rèn)為變量無(wú)線性關(guān)系。同序?qū)?shù)和異序?qū)?shù)上表中同序?qū)τ校?3)(24)(25)(3定類、定序及其他一定類、一定距變量核心思想基于單因素方差分析ETA系數(shù)取值范圍[0,1]其他方法若行列變量均是定距,可以通過(guò)相關(guān)系數(shù)測(cè)度,輸出pearson和spearman相關(guān)系數(shù)取值范圍[-1,+1]Kappa,risk,rr都是醫(yī)學(xué)分析中的指標(biāo)定類、定序及其他一定類、一定距變量多選項(xiàng)分析目的操作應(yīng)用舉例多選項(xiàng)分析目的目的針對(duì)問(wèn)卷調(diào)查中的多選項(xiàng)問(wèn)題的例子某地區(qū)高三學(xué)生的高考志愿居民儲(chǔ)蓄調(diào)查問(wèn)卷調(diào)查分析的一般步驟多選項(xiàng)問(wèn)題的分解利用頻數(shù)分析或交叉分組進(jìn)行分析目的針對(duì)問(wèn)卷調(diào)查中的多選項(xiàng)問(wèn)題的SPSS變量名變量名標(biāo)簽變量值V1報(bào)考北大嗎0/1V2報(bào)考清華嗎0/1V3報(bào)考
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025中國(guó)機(jī)械科學(xué)研究總院集團(tuán)限公司總部招聘5人高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2025下半年青海事業(yè)單位聯(lián)考考試筆試高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2025下半年江蘇南通市市政和園林局直屬事業(yè)單位招聘4人高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2025下半年安徽當(dāng)涂縣事業(yè)單位招聘工作人員高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2025下半年吉林松原長(zhǎng)嶺縣公開(kāi)招聘高校畢業(yè)生帶編入伍7人高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2025上海煙草集團(tuán)限責(zé)任公司天津卷煙廠春季招聘41人高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2025上半年黑龍江大慶市事業(yè)單位招聘工作人員257人歷年高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2025上半年四川省廣元市朝天區(qū)事業(yè)單位招聘26人歷年高頻重點(diǎn)提升(共500題)附帶答案詳解
- 屋頂隔熱泡沫混凝土施工合同
- 農(nóng)家樂(lè)環(huán)境保護(hù)與可持續(xù)發(fā)展辦法
- 單位檔案安全檢查記錄表
- 【概率論在生活中的應(yīng)用5000字(論文)】
- 緩沖罐操作規(guī)程
- 地雷基本知識(shí)課件
- 幼兒教育-個(gè)別幼兒教育記錄表.文檔
- (高清版)DZT 0338.4-2020 固體礦產(chǎn)資源量估算規(guī)程 第4部分 SD法
- 婦產(chǎn)科學(xué) (安康職業(yè)技術(shù)學(xué)院)智慧樹(shù)知到期末考試答案2024年
- 2023年心理咨詢技能考試題庫(kù)(含答案)
- 湖南省湘潭市湘潭縣2023-2024學(xué)年八年級(jí)上學(xué)期期末考試物理試題
- 【培訓(xùn)課件】醫(yī)療技術(shù)準(zhǔn)入制度培訓(xùn)-醫(yī)療技術(shù)管理
- 2022-2023學(xué)年江蘇省連云港市九年級(jí)(上)期末數(shù)學(xué)試卷(含詳細(xì)答案解析)
評(píng)論
0/150
提交評(píng)論