應(yīng)用統(tǒng)計(jì)學(xué)統(tǒng)計(jì)描述_第1頁(yè)
應(yīng)用統(tǒng)計(jì)學(xué)統(tǒng)計(jì)描述_第2頁(yè)
應(yīng)用統(tǒng)計(jì)學(xué)統(tǒng)計(jì)描述_第3頁(yè)
應(yīng)用統(tǒng)計(jì)學(xué)統(tǒng)計(jì)描述_第4頁(yè)
應(yīng)用統(tǒng)計(jì)學(xué)統(tǒng)計(jì)描述_第5頁(yè)
已閱讀5頁(yè),還剩83頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

應(yīng)用統(tǒng)計(jì)學(xué)統(tǒng)計(jì)描述第一頁(yè),共八十八頁(yè),2022年,8月28日

在數(shù)據(jù)收集、整理完畢后,進(jìn)行深入統(tǒng)計(jì)分析之前,首要的工作就是去了解這個(gè)數(shù)據(jù)的整體情況,隨后考慮作深入的推斷。用少量數(shù)字(描述指標(biāo))概括大量原始數(shù)字,對(duì)數(shù)據(jù)進(jìn)行描述的統(tǒng)計(jì)方法即為描述性統(tǒng)計(jì)分析。統(tǒng)計(jì)描述

連續(xù)變量的統(tǒng)計(jì)描述

分類變量的統(tǒng)計(jì)描述第二頁(yè),共八十八頁(yè),2022年,8月28日集中趨勢(shì)的描述指標(biāo)

算術(shù)均數(shù):適合單峰和基本對(duì)稱的分布

中位數(shù):適用于任意分布類型

截尾均數(shù):數(shù)據(jù)中有極端值,用截尾均數(shù)更好

幾何均數(shù):適用于原始數(shù)據(jù)分布不對(duì)稱,但經(jīng)過對(duì)數(shù)轉(zhuǎn)換后呈對(duì)稱分布的資料

眾數(shù)(Mode):樣本數(shù)據(jù)中出現(xiàn)頻次最大的那個(gè)數(shù)字

調(diào)和均數(shù)(H):較少使用,觀察值x倒數(shù)之均數(shù)的倒數(shù),常用于完成的工作量相等而所用時(shí)間不同,求平均速度的情況第三頁(yè),共八十八頁(yè),2022年,8月28日

全距大體了解數(shù)據(jù)的分布范圍,用于預(yù)備性檢查

方差和標(biāo)準(zhǔn)差適用于正態(tài)分布

百分位數(shù)如中位數(shù)(P50)、四分位數(shù)(P25、P50、P75)

四分位間距即P75-P25,適用于任意分布類型,不受極端值影響

變異系數(shù)(CV)

S/,適用于測(cè)量尺度相差太大或數(shù)據(jù)量綱不同時(shí),比較兩組數(shù)據(jù)離散程度的大小離散趨勢(shì)的描述指標(biāo)第四頁(yè),共八十八頁(yè),2022年,8月28日SPSS的許多模塊均可完成統(tǒng)計(jì)描述的任務(wù),除各種用于統(tǒng)計(jì)推斷的過程會(huì)附帶進(jìn)行相關(guān)的統(tǒng)計(jì)描述外,SPSS還專門提供了幾個(gè)用于連續(xù)變量統(tǒng)計(jì)描述的過程,均集中于Analyze-DescriptiveStatistics子菜單中。

Frequencies過程Descriptives過程

Explore過程

Ratio過程第五頁(yè),共八十八頁(yè),2022年,8月28日Frequencies:產(chǎn)生原始數(shù)據(jù)的頻數(shù)表,并能計(jì)算各種百分?jǐn)?shù),并可繪制頻數(shù)圖,如連續(xù)型變量的直方圖,或分類變量的餅圖或條圖。下面以demo.sav為例,對(duì)人群的年齡數(shù)據(jù)(age)進(jìn)行描述。Frequencies過程第六頁(yè),共八十八頁(yè),2022年,8月28日

若無變量標(biāo)簽,則列表框中只顯示變量名

對(duì)話框中,從左邊變量列表中選擇要分析的變量,放入右邊的Variables(變量)列表中至少一個(gè)變量選入后,OK按鈕才可使用Frequencies過程變量標(biāo)簽變量名第七頁(yè),共八十八頁(yè),2022年,8月28日

鼠標(biāo)右鍵單擊變量,可以獲得更多變量信息

選擇下拉按鈕,顯示所有定義的值標(biāo)簽Frequencies過程第八頁(yè),共八十八頁(yè),2022年,8月28日:表示該變量為數(shù)值型變量:表示該變量為字符型變量,且右下角的<表示短字符,即變量長(zhǎng)度<=8位Frequencies過程第九頁(yè),共八十八頁(yè),2022年,8月28日Statistics:設(shè)定要分析的統(tǒng)計(jì)量分位數(shù)值集中趨勢(shì)離散趨勢(shì)分布指標(biāo)若數(shù)據(jù)為組中值,將其選中本例選擇四分位數(shù)和5%、95%分位數(shù)Frequencies過程第十頁(yè),共八十八頁(yè),2022年,8月28日本例選中繪制直方圖圖表類型:箱式圖、餅圖、直方圖等Frequencies過程Charts:設(shè)定要繪制的統(tǒng)計(jì)圖第十一頁(yè),共八十八頁(yè),2022年,8月28日Format:在SPSS對(duì)話框中,用于設(shè)定結(jié)果文件中的數(shù)據(jù)格式,通常默認(rèn)即可。數(shù)據(jù)排序方式多變量分析時(shí)的顯示方式設(shè)定組別超過n組時(shí)不顯示表格Frequencies過程第十二頁(yè),共八十八頁(yè),2022年,8月28日

通過大綱視圖可以快速定位各項(xiàng)結(jié)果例如:點(diǎn)擊大綱視圖上的Histogram,則可快速定位至

age的頻數(shù)直方圖Frequencies過程第十三頁(yè),共八十八頁(yè),2022年,8月28日分析結(jié)果(1)統(tǒng)計(jì)量

人群年齡無缺失值,四分位數(shù)為33歲、41歲、51歲,即人群中有1/4小于33歲,1/2小于41歲,1/4大于51歲。另外,90%的人在24~64歲之間。Frequencies過程第十四頁(yè),共八十八頁(yè),2022年,8月28日Frequencies過程分析結(jié)果(2)頻數(shù)表Frequency:頻數(shù)Percent:百分比=當(dāng)前頻數(shù)/總數(shù)(包括缺失值)ValidPercent:有效百分比=當(dāng)前頻數(shù)/有效總數(shù)(不包括缺失值)CumulativePercent:累積百分比=累積頻數(shù)/有效總數(shù)(不包括缺失值)第十五頁(yè),共八十八頁(yè),2022年,8月28日Frequencies過程分析結(jié)果(3)頻數(shù)直方圖第十六頁(yè),共八十八頁(yè),2022年,8月28日Descriptive:一般性統(tǒng)計(jì)描述,相對(duì)于Frequencies,它不能繪制統(tǒng)計(jì)圖,所能計(jì)算的統(tǒng)計(jì)量也較少,適用于對(duì)服從正態(tài)分布的連續(xù)型變量進(jìn)行描繪。同樣以demo.sav為例,對(duì)人群的年齡數(shù)據(jù)(age)進(jìn)行描述。Descriptives過程第十七頁(yè),共八十八頁(yè),2022年,8月28日

單擊中間的箭頭,可以實(shí)現(xiàn)變量從一張表移入另一張表,現(xiàn)將變量age移入右邊variable列表中Descriptives過程第十八頁(yè),共八十八頁(yè),2022年,8月28日Options:設(shè)定要分析的統(tǒng)計(jì)量及數(shù)據(jù)的顯示順序本例選擇:均數(shù)、標(biāo)準(zhǔn)差、最大值、最小值、峰度系數(shù)、偏度系數(shù)等Descriptives過程第十九頁(yè),共八十八頁(yè),2022年,8月28日

人群年齡的最小值為18歲,最大值為77歲,均數(shù)42.06歲,標(biāo)準(zhǔn)差12.29歲,偏度系數(shù)0.299,峰度系數(shù)-0.602,基本近似正態(tài)。Descriptives過程分析結(jié)果描述性統(tǒng)計(jì)量第二十頁(yè),共八十八頁(yè),2022年,8月28日Explore:對(duì)連續(xù)型資料分布不清楚時(shí)的探索性分析,可以分類別進(jìn)行描述(Frequencies和Descriptives不行),計(jì)算多種描述統(tǒng)計(jì)量,給出各種統(tǒng)計(jì)圖,進(jìn)行簡(jiǎn)單參數(shù)估計(jì)。以demo.sav為例,對(duì)男女性(gender)的年齡(age)分別進(jìn)行描述。Explore過程第二十一頁(yè),共八十八頁(yè),2022年,8月28日要進(jìn)行分析的應(yīng)變量:age分類變量:genderExplore過程第二十二頁(yè),共八十八頁(yè),2022年,8月28日點(diǎn)估計(jì)中的穩(wěn)健估計(jì):M估計(jì)極端值百分位數(shù)一般描述

默認(rèn)情況下,選擇的是Descriptives,本例選擇默認(rèn)Explore過程第二十三頁(yè),共八十八頁(yè),2022年,8月28日箱式圖用于正態(tài)性檢驗(yàn)的Q-Q圖莖葉圖直方圖Levene’s方差齊性檢驗(yàn)選項(xiàng)Explore過程第二十四頁(yè),共八十八頁(yè),2022年,8月28日

缺失值的設(shè)置,一般默認(rèn)即可Explore過程第二十五頁(yè),共八十八頁(yè),2022年,8月28日

本例無缺失值,有效人數(shù)女性3179人,男性3221人Explore過程分析結(jié)果(1)缺失值報(bào)告第二十六頁(yè),共八十八頁(yè),2022年,8月28日

現(xiàn)僅對(duì)女性的分析結(jié)果依次解釋,查看詳情Explore過程分析結(jié)果(2)統(tǒng)計(jì)量第二十七頁(yè),共八十八頁(yè),2022年,8月28日集中趨勢(shì)指標(biāo)、離散趨勢(shì)指標(biāo)分布特征指標(biāo)、參數(shù)估計(jì)Explore過程分析結(jié)果第二十八頁(yè),共八十八頁(yè),2022年,8月28日

集中趨勢(shì)指標(biāo):3179名女性的平均年齡為41.74歲(Mean),去掉兩側(cè)各5%的極端值后,截尾均數(shù)為41.45歲(5%TrimmedMean),中位數(shù)41.00歲(Median),本例上述三指標(biāo)值基本相同,可推測(cè)數(shù)據(jù)應(yīng)當(dāng)是對(duì)稱分布的。Explore過程

離散趨勢(shì)指標(biāo):年齡的方差為142.988歲2(Variance),其平方根即標(biāo)準(zhǔn)差為11.958歲(Std.Deviation)。全部女性中最小的18歲(Minimum),最大的76歲(Maximum)。兩者之差即全距58歲(Range),中間一半女性的年齡差即四分位數(shù)間距17歲(InterquartileRange)。第二十九頁(yè),共八十八頁(yè),2022年,8月28日

分布特征指標(biāo):表明數(shù)據(jù)偏離正態(tài)分布程度的偏度系數(shù)(Skewness)為0.327,峰度系數(shù)(Kurtosis)為-0.534。偏度系數(shù)大于0為正偏態(tài),峰度系數(shù)小于0表明峰比正態(tài)低,本例偏度和峰度系數(shù)均接近0,因此認(rèn)為近似正態(tài)分布。

參數(shù)估計(jì):均數(shù)(Mean)的標(biāo)準(zhǔn)誤(Std.Error)為0.212歲,相應(yīng)的總體均數(shù)95%可信區(qū)間(95%ConfidenceIntervalforMean)為41.32~42.15歲,表明有95%的可能性認(rèn)為該區(qū)間包含了總體均數(shù)。Explore過程第三十頁(yè),共八十八頁(yè),2022年,8月28日Explore過程分析結(jié)果(3)莖葉圖第三十一頁(yè),共八十八頁(yè),2022年,8月28日Explore過程分析結(jié)果(4)箱式圖最小值:18歲最大值:76歲四分位間距:17歲第三十二頁(yè),共八十八頁(yè),2022年,8月28日Ratio:功能較特殊,用于對(duì)兩個(gè)連續(xù)性變量計(jì)算相對(duì)比指標(biāo),它可以計(jì)算一系列非常專業(yè)的相對(duì)比描述指標(biāo),相對(duì)而言使用面較窄,在此不詳述。Ratio過程第三十三頁(yè),共八十八頁(yè),2022年,8月28日SPSS的許多分析過程均可完成統(tǒng)計(jì)描述的任務(wù),還專門提供了用于分類變量統(tǒng)計(jì)描述的過程,均集中于Analyze-DescriptiveStatistics子菜單中。

Frequencies過程

Crosstabs過程第三十四頁(yè),共八十八頁(yè),2022年,8月28日Frequencies:主要針對(duì)分類輸出頻數(shù)表,從而得到頻數(shù)、百分?jǐn)?shù)、累計(jì)百分比,給出原始頻數(shù)表,眾數(shù),條圖,餅圖等。以demo.sav為例,分別對(duì)人群的教育水平(ed)、職業(yè)滿意度(jobsat)進(jìn)行描述。Frequencies過程第三十五頁(yè),共八十八頁(yè),2022年,8月28日6400人的教育水平和職業(yè)滿意度的數(shù)據(jù)都是完整的,無缺失值。Frequencies過程分析結(jié)果(1)缺失值報(bào)告第三十六頁(yè),共八十八頁(yè),2022年,8月28日Frequencies過程分析結(jié)果(2)頻數(shù)表第三十七頁(yè),共八十八頁(yè),2022年,8月28日Crosstabs:用于輸出交叉列聯(lián)表,以demo.sav為例,描述人群的婚姻情況marital(0、1)、退休狀況retire(0、1)的交叉頻數(shù)分布Crosstabs過程第三十八頁(yè),共八十八頁(yè),2022年,8月28日用于分類變量統(tǒng)計(jì)推斷時(shí)的參數(shù)設(shè)定,此例暫不使用Crosstabs過程行變量:ed列變量:jubocat第三十九頁(yè),共八十八頁(yè),2022年,8月28日Cells:在SPSS對(duì)話框中,對(duì)于單元格要顯示的參數(shù)進(jìn)行設(shè)定合計(jì)百分位數(shù)殘差非整權(quán)重設(shè)置Crosstabs過程第四十頁(yè),共八十八頁(yè),2022年,8月28日6400人的婚姻狀況和退休狀況的數(shù)據(jù)都是完整的,無缺失值。Crosstabs過程分析結(jié)果(1)缺失值報(bào)告第四十一頁(yè),共八十八頁(yè),2022年,8月28日

婚姻狀況(行)和退休狀況(列)的交叉表Crosstabs過程分析結(jié)果(2)交叉表行百分比列百分比第四十二頁(yè),共八十八頁(yè),2022年,8月28日交叉分組下的頻數(shù)分析Crosstabs過程應(yīng)用

目的:掌握多變量的聯(lián)合分布特征,分析變量間的關(guān)系。功能:產(chǎn)生描述多變量聯(lián)合分布的列聯(lián)表比較兩個(gè)(或以上)樣本率或比例差異(卡方檢驗(yàn))變量間的關(guān)聯(lián)度分析第四十三頁(yè),共八十八頁(yè),2022年,8月28日1、變量關(guān)系概述變量間的關(guān)系:有關(guān)與無關(guān)。有關(guān):如果一個(gè)變量的取值發(fā)生變化,另外一個(gè)變量的取值也相應(yīng)發(fā)生變化無關(guān):如果一個(gè)變量的變化不引起另一個(gè)變量的變化。第四十四頁(yè),共八十八頁(yè),2022年,8月28日性別與四級(jí)英語考試通過率的相關(guān)統(tǒng)計(jì)表述:結(jié)果顯示,當(dāng)性別取值不同時(shí),通過率變量的取值并未發(fā)生變化,因此性別與考試通過率無關(guān)。自變量的不同取值在因變量上無差異,兩變量無關(guān)。自變量的不同取值在因變量上有差異,兩變量有關(guān)。因變量自變量第四十五頁(yè),共八十八頁(yè),2022年,8月28日表述:統(tǒng)計(jì)結(jié)果顯示,當(dāng)性別取值不同時(shí),收入變量的取值發(fā)生了變化,因此性別與月收入有關(guān)。自變量因變量第四十六頁(yè),共八十八頁(yè),2022年,8月28日2、雙變量關(guān)系的統(tǒng)計(jì)類型第四十七頁(yè),共八十八頁(yè),2022年,8月28日觀測(cè)頻數(shù)行變量列邊緣分布行邊緣分布列變量期望頻數(shù)列聯(lián)表的格式第四十八頁(yè),共八十八頁(yè),2022年,8月28日列聯(lián)分析——行列變量間的關(guān)系

兩變量是否相互獨(dú)立。兩變量是否有共變趨勢(shì)。一變量的變化多大程度上能由另一變量的變化來解釋。第四十九頁(yè),共八十八頁(yè),2022年,8月28日卡方測(cè)量的原理:卡方測(cè)量用來考察兩變量是否獨(dú)立(無關(guān))。其原理是根據(jù)這一概率定理:若兩變量無關(guān),則兩變量中聯(lián)合事件發(fā)生的概率應(yīng)等于各自獨(dú)立發(fā)生的概率乘積。在列聯(lián)表中,這一定理就具體轉(zhuǎn)化為:若兩變量無關(guān),則兩變量中條件概率應(yīng)等于各自邊緣概率的乘積。反之,則兩變量有關(guān),或兩變量不獨(dú)立。第五十頁(yè),共八十八頁(yè),2022年,8月28日由此可見,期望值與觀察值的差距越大,說明兩變量越不獨(dú)立,也就越相關(guān)。因此,Pearson卡方的表達(dá)式如下:當(dāng)為四格表時(shí),卡方的取值在0~∞之間??ǚ街翟酱?,行列變量的關(guān)聯(lián)性越強(qiáng)。第五十一頁(yè),共八十八頁(yè),2022年,8月28日列聯(lián)表的產(chǎn)生:

Analyze-DescriptiveStatistics-Crosstabs第五十二頁(yè),共八十八頁(yè),2022年,8月28日界面說明【Rows】:用于選擇行*列表中的行變量?!綜olumns】:用于選擇行*列表中的列變量?!綥ayer】:層變量。【Displayclusteredbarcharts】:顯示復(fù)式條圖。【Suppresstable】:不輸出行*列表?!綞xact】:針對(duì)2*2以上的行*列表設(shè)定計(jì)算確切概率的方法。注:安裝SPSS時(shí)除非特別選定,否則Exact模塊一般不安裝。第五十三頁(yè),共八十八頁(yè),2022年,8月28日列聯(lián)表所研究的問題城鎮(zhèn)和農(nóng)村的儲(chǔ)戶收入水平狀況相同嗎?行變量:戶口列變量:月收入不同年齡段的儲(chǔ)戶對(duì)物價(jià)水平的看法一致嗎?行變量:年齡段列變量:物價(jià)水平城鄉(xiāng)儲(chǔ)戶認(rèn)為存錢合算的比例是否相同?行變量:戶口列變量:什么合算第五十四頁(yè),共八十八頁(yè),2022年,8月28日回答城鄉(xiāng)儲(chǔ)戶收入水平是否相同的問題,需要引入卡方檢驗(yàn)。第五十五頁(yè),共八十八頁(yè),2022年,8月28日1、卡方檢驗(yàn)步驟提出假設(shè)H0:行、列變量獨(dú)立(對(duì)立假設(shè)為?)計(jì)算檢驗(yàn)統(tǒng)計(jì)量(卡方統(tǒng)計(jì)量服從(r-1)*(c-1)個(gè)自由度的卡方分布)確定檢驗(yàn)水平與界值結(jié)果判斷:查界值表、看P值大小第五十六頁(yè),共八十八頁(yè),2022年,8月28日卡方檢驗(yàn)操作:Statistics選項(xiàng)第五十七頁(yè),共八十八頁(yè),2022年,8月28日【Cells】:用于定義列聯(lián)表單元格中需要計(jì)算的指標(biāo):Counts:是否輸出實(shí)際觀察數(shù)(Observed)和理論數(shù)(Expected);Percentages:是否輸出行百分?jǐn)?shù)(Row)、列百分?jǐn)?shù)(Column)以及合計(jì)百分?jǐn)?shù)(Total);Residuals:選擇殘差的顯示方式;【Format】:用于選擇行變量是升序還是降序排列。第五十八頁(yè),共八十八頁(yè),2022年,8月28日結(jié)果:城鄉(xiāng)儲(chǔ)戶的收入水平?jīng)]有明顯差異。第五十九頁(yè),共八十八頁(yè),2022年,8月28日Pearson卡方值的影響因素實(shí)際頻數(shù)與期望頻數(shù)之差期望頻數(shù)的大小列聯(lián)表的單元格子數(shù)樣本量大小第六十頁(yè),共八十八頁(yè),2022年,8月28日2、卡方檢驗(yàn)的校正自由度為1時(shí),期望頻數(shù)均大于5:連續(xù)性校正(ContinuityCorrection)20%的單元格期望頻數(shù)小于5:似然比卡方檢驗(yàn)(LikelihoodRatio)T<5andn<40或T<1時(shí):確切概率法(Fisher‘sExactTest)第六十一頁(yè),共八十八頁(yè),2022年,8月28日例1:城鎮(zhèn)對(duì)象感到存錢合算的比例是否高于農(nóng)村對(duì)象?第六十二頁(yè),共八十八頁(yè),2022年,8月28日第六十三頁(yè),共八十八頁(yè),2022年,8月28日例2:城鄉(xiāng)儲(chǔ)戶對(duì)“未來收入的變化趨勢(shì)”的態(tài)度是否相同第六十四頁(yè),共八十八頁(yè),2022年,8月28日第六十五頁(yè),共八十八頁(yè),2022年,8月28日3、行列變量的關(guān)聯(lián)度分析該關(guān)聯(lián)度類似于參數(shù)檢驗(yàn)中相關(guān)系數(shù)的含義,取值多在(-1,1)區(qū)間可描述行列變量的關(guān)聯(lián)強(qiáng)度,多數(shù)是對(duì)Pearson卡方測(cè)量值進(jìn)行的修正。為兩變量相關(guān)研究中的非參數(shù)方法,卡方檢驗(yàn)中的關(guān)聯(lián)度分析不太常用。第六十六頁(yè),共八十八頁(yè),2022年,8月28日3.1、兩定類變量的關(guān)聯(lián)度列聯(lián)系數(shù)(Contingencycoefficient):取值0~1,其取值隨著行列數(shù)的增加而增大Phi系數(shù):取值-1~1,適用于四格表,對(duì)樣本量進(jìn)行了修正V系數(shù):取值0~1,對(duì)樣本量和行列數(shù)進(jìn)行修正;四格表時(shí),等于Phi系數(shù)第六十七頁(yè),共八十八頁(yè),2022年,8月28日例:居民儲(chǔ)蓄調(diào)查中了解城鄉(xiāng)戶口與“買東西還是存錢合算”的關(guān)聯(lián)度第六十八頁(yè),共八十八頁(yè),2022年,8月28日3.2、兩定序變量的關(guān)聯(lián)度同序?qū)?shù)(P)、異序?qū)?shù)(Q):當(dāng)一個(gè)變量為升序排列時(shí),另一變量序列中有后面的一個(gè)變量值大于前面的一個(gè)變量值,則記為一個(gè)同序?qū)?;否則為異序?qū)?。Kendall’stau-b:行列數(shù)相等時(shí)Kendall’stau-c:任意列聯(lián)表Gamma系數(shù):四格表檢驗(yàn)第六十九頁(yè),共八十八頁(yè),2022年,8月28日例3:居民收入水平與對(duì)物價(jià)水平評(píng)價(jià)的關(guān)聯(lián)度第七十頁(yè),共八十八頁(yè),2022年,8月28日評(píng)價(jià)關(guān)聯(lián)度主要看Value值大小。第七十一頁(yè),共八十八頁(yè),2022年,8月28日3.3、其他關(guān)聯(lián)度一個(gè)定類變量,一個(gè)定距變量的關(guān)聯(lián)度:Eta系數(shù),類似方差分析的非參數(shù)檢驗(yàn)兩定距變量(或定序變量)的關(guān)聯(lián)度:相關(guān)(Correlations):計(jì)算Pearson和Spearman相關(guān)系數(shù)第七十二頁(yè),共八十八頁(yè),2022年,8月28日4、配對(duì)計(jì)數(shù)資料的卡方檢驗(yàn)例子:海爾公司的市場(chǎng)調(diào)查數(shù)據(jù):對(duì)每個(gè)消費(fèi)者調(diào)查兩個(gè)問題:1、是否購(gòu)買過海爾冰箱(是、否)?2、是否購(gòu)買過海爾洗衣機(jī)(是、否)?問1:海爾冰箱和洗衣機(jī)的購(gòu)買率是否有差別?問2:每位消費(fèi)者對(duì)海爾冰箱和洗衣機(jī)的購(gòu)買一致性程度如何?第七十三頁(yè),共八十八頁(yè),2022年,8月28日第七十四頁(yè),共八十八頁(yè),2022年,8月28日4、配對(duì)計(jì)數(shù)資料的卡方檢驗(yàn)McNemar:配對(duì)計(jì)數(shù)資料的卡方檢驗(yàn)。零假設(shè)為兩變量的陽性率無差別Kappa一致性檢驗(yàn):系數(shù)取值-1~1。測(cè)量同一觀測(cè)對(duì)象在兩變量(兩變量服從二項(xiàng)分布)上取值的一致性程度。其絕對(duì)值越接近1,說明一致性程度越高。一般來說:系數(shù)>=0.7,一致性程度較高;0.4~0.7,一致性程度一般;<0.4,一致性較弱第七十五頁(yè),共八十八頁(yè),2022年,8月28日第七十六頁(yè),共八十八頁(yè),2022年,8月28日第七十七頁(yè),共八十八頁(yè),2022年,8月28日例:兩種方法同時(shí)檢測(cè)患者乙肝抗體的陽性率兩種方法的陽性率有無差別??jī)煞N方法的檢測(cè)情況是否一致?第七十八頁(yè),共八十八頁(yè),2022年,8月28日五、多選項(xiàng)分析目的:解決問卷設(shè)計(jì)中的多選項(xiàng)問題的分析多選項(xiàng)分析步驟:先將多選項(xiàng)問題分解,分解方法(是否丟失信息、是否易于分析):二分法:把每個(gè)選項(xiàng)均轉(zhuǎn)為二分類變量有序分類法:把該問題按順序轉(zhuǎn)為多個(gè)問題再進(jìn)行頻數(shù)分析第七十九頁(yè),共八十八頁(yè),2022年,8月28日例子:高考志愿調(diào)查

請(qǐng)按順序選擇你想報(bào)考的三所大學(xué)北大清華人大北師大北京理工大學(xué)北外第一

第二

第三

第八十頁(yè),共八十八頁(yè),2022年,8月28日二分法分解你報(bào)考北大嗎?1、是2、否你報(bào)考清華嗎?1、是2、否你報(bào)考北師大嗎?1、是2、否你報(bào)考北外嗎?1、是2、否你報(bào)考人大嗎?1、是

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論