第四章3基本統(tǒng)計(jì)分析課件_第1頁(yè)
第四章3基本統(tǒng)計(jì)分析課件_第2頁(yè)
第四章3基本統(tǒng)計(jì)分析課件_第3頁(yè)
第四章3基本統(tǒng)計(jì)分析課件_第4頁(yè)
第四章3基本統(tǒng)計(jì)分析課件_第5頁(yè)
已閱讀5頁(yè),還剩77頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

探索性數(shù)據(jù)分析調(diào)用此過(guò)程可產(chǎn)生所有個(gè)案或不同分組個(gè)案的綜合統(tǒng)計(jì)量及圖形,提供各種不同的統(tǒng)計(jì)量與描述作圖,可進(jìn)行數(shù)據(jù)篩查,發(fā)現(xiàn)奇異值,描述性分析,假設(shè)檢驗(yàn)及不同分組個(gè)案的特征描述可幫助用戶(hù)決定選擇哪種統(tǒng)計(jì)方法進(jìn)行數(shù)據(jù)分析,選擇將數(shù)據(jù)轉(zhuǎn)換成正態(tài)方法及是否使用非參數(shù)目的探索性數(shù)據(jù)分析調(diào)用此過(guò)程可產(chǎn)生所有個(gè)案或不同分組目的按Analyze--DescriptiveStatistics--Explore順序單擊,打開(kāi)Explore主對(duì)話(huà)框?;静僮靼碅nalyze--DescriptiveStatisti選擇一個(gè)或多個(gè)變量進(jìn)入Dependent框作為因變量此作為分組變量,可以是字符變量,對(duì)因變量的分析將按該變量的觀(guān)測(cè)值進(jìn)行分組分析??捎卸鄠€(gè)分組變量,這時(shí)會(huì)按多個(gè)變量的交叉組合進(jìn)行分組。該框中的變量作為個(gè)案標(biāo)識(shí)符可同時(shí)輸出基本統(tǒng)計(jì)量和圖形只輸出基本統(tǒng)計(jì)量只輸出圖形Explore主對(duì)話(huà)框選擇一個(gè)或多個(gè)變量進(jìn)入Dependent框作為因變量此作為分輸出基本統(tǒng)計(jì)量均值的置信區(qū)間,可鍵入1—99%的任意值,根據(jù)該值算出置信區(qū)間的上下限。給出中心趨勢(shì)的的穩(wěn)健最大似然估計(jì)量,當(dāng)數(shù)據(jù)分布均勻,且兩尾較長(zhǎng),或當(dāng)數(shù)據(jù)中存在極端值時(shí),可給出比均值或中位數(shù)更合理的估計(jì)。輸出最大和最小的5個(gè)數(shù),且在輸出窗口中加以標(biāo)明。輸出5%、10%、25%、50%、75%、90%和95%的百分位數(shù)。Statistics對(duì)話(huà)框輸出基本統(tǒng)計(jì)量給出中心趨勢(shì)的的穩(wěn)健最大似然估計(jì)量,當(dāng)數(shù)據(jù)分布只有指定分組變量才有效,可輸出分布—水平圖,同時(shí)輸出回歸直線(xiàn)斜率以及對(duì)方差的Levene’s檢驗(yàn)不輸出分布—水平圖功效估計(jì)根據(jù)在Power參數(shù)框中指定的變換對(duì)原始數(shù)據(jù)進(jìn)行變換。不對(duì)數(shù)據(jù)進(jìn)行轉(zhuǎn)換Explore欄中Plots對(duì)話(huà)框箱型圖每一個(gè)因變量生成一個(gè)箱形圖所有因變量生成一個(gè)箱形圖不顯示任何箱形圖生成莖葉圖,為默認(rèn)生成直方圖輸出帶檢驗(yàn)的正態(tài)圖只有指定分組變量才有效,可輸出分布—水平圖,同時(shí)輸出回歸直線(xiàn)確定缺失值的處置:因變量或分組變量中帶有缺失值的觀(guān)測(cè)量都將在分析過(guò)程中被剔除。在分析過(guò)程中剔除此分析中含缺失值個(gè)案。分組變量的缺失值被單獨(dú)分為一組,在結(jié)果中產(chǎn)生一個(gè)附加分類(lèi)。Explore欄中Options對(duì)話(huà)框確定缺失值的處置:Explore欄中Options對(duì)話(huà)框?qū)嵗齝hild.sav,根據(jù)因子變量性別對(duì)身高進(jìn)行探索性數(shù)據(jù)分析EXAMINEVARIABLES=x5BYx2/PLOTBOXPLOTSTEMLEAF/COMPAREGROUP/STATISTICSDESCRIPTIVES/CINTERVAL95/MISSINGLISTWISE/NOTOTAL.實(shí)例child.sav,根據(jù)因子變量性別對(duì)EXAMINE檢驗(yàn)列聯(lián)表分析列聯(lián)表相關(guān)性測(cè)度檢驗(yàn)列聯(lián)表分析列聯(lián)表相關(guān)性測(cè)度數(shù)據(jù)的類(lèi)型與列聯(lián)分析數(shù)據(jù)定量數(shù)據(jù)(數(shù)值型數(shù)據(jù))定性數(shù)據(jù)(品質(zhì)數(shù)據(jù))離散數(shù)據(jù)連續(xù)數(shù)據(jù)列聯(lián)分析數(shù)據(jù)的類(lèi)型與列聯(lián)分析數(shù)據(jù)定量數(shù)據(jù)定性數(shù)據(jù)離散數(shù)據(jù)連續(xù)數(shù)據(jù)列定性數(shù)據(jù)定性變量的結(jié)果表現(xiàn)為類(lèi)別例如:性別(男,女)各類(lèi)別用符號(hào)或數(shù)字代碼來(lái)測(cè)度使用定類(lèi)或定序尺度你吸煙嗎?1.是;2.否你贊成還是反對(duì)這一改革方案?1.贊成;2.反對(duì)對(duì)定性數(shù)據(jù)的描述和分析通常使用列聯(lián)表可使用檢驗(yàn)定性數(shù)據(jù)定性變量的結(jié)果表現(xiàn)為類(lèi)別列聯(lián)表

(例題分析)一分公司二分公司三分公司四分公司合計(jì)贊成該方案68755779279反對(duì)該方案32753331141合計(jì)10012090110420【例】一個(gè)集團(tuán)公司在四個(gè)不同的地區(qū)設(shè)有分公司,現(xiàn)該集團(tuán)公司欲進(jìn)行一項(xiàng)改革,此項(xiàng)改革可能涉及到各分公司的利益,故采用抽樣調(diào)查方式,從四個(gè)分公司共抽取420個(gè)樣本單位(人),了解職工對(duì)此項(xiàng)改革的看法,調(diào)查結(jié)果如下表列聯(lián)表

(例題分析)一分公司二分公司三分公司四分公司合計(jì)贊成列聯(lián)表按多個(gè)(兩個(gè)或兩個(gè)以上)變量的不同取值對(duì)不同情形進(jìn)行劃分,也即劃分不同的行或列。用以分行的變量稱(chēng)為行(row)變量,和用以分列的變量則稱(chēng)為列(column)變量。表格中間各行變量和列變量不同取值的交匯處,就是這種情形出現(xiàn)的頻數(shù)或計(jì)數(shù)(count)。列聯(lián)表中行變量和列變量的個(gè)數(shù)稱(chēng)為列聯(lián)表的維數(shù)。二維的列聯(lián)表又稱(chēng)為交叉表(crosstable)。三維或三維以上的列聯(lián)表叫做高維列聯(lián)表。列聯(lián)表

(contingencytable)列聯(lián)表按多個(gè)(兩個(gè)或兩個(gè)以上)變量的不同取值對(duì)不同情形進(jìn)行劃列聯(lián)表中每個(gè)行變量或列變量又有兩個(gè)或更多的不同取值,這些取值常稱(chēng)為水平(level)。每一種不同的水平組合就代表一種不同的情形。列聯(lián)表

(contingencytable)列聯(lián)表中每個(gè)行變量或列變量又有兩個(gè)或更多的不同取值,這些取值列聯(lián)表的結(jié)構(gòu)

(22列聯(lián)表)列(cj)合計(jì)j=1j=2i=1f11f12f11+f12i=2f21f22f21+f22合計(jì)f11+f21f12+f22n列(cj)行(ri)列聯(lián)表的結(jié)構(gòu)

(22列聯(lián)表)列(cj)合計(jì)j=列聯(lián)表的結(jié)構(gòu)

(r

c列聯(lián)表的一般表示)列(cj)合計(jì)j=1j=2…i=1f11f12…r1i=2f21f22…r2:::::合計(jì)c1c2…n列(cj)行(ri)fij表示第i行第j列的觀(guān)察頻數(shù)列聯(lián)表的結(jié)構(gòu)

(rc列聯(lián)表的一般表示)列(cj)合計(jì)關(guān)于某項(xiàng)政策調(diào)查的結(jié)果觀(guān)點(diǎn):贊成觀(guān)點(diǎn):反對(duì)低收入中等收入高收入低收入中等收入高收入男201055810女25157279高維列聯(lián)表關(guān)于某項(xiàng)政策調(diào)查的結(jié)果觀(guān)點(diǎn):贊成觀(guān)點(diǎn):反對(duì)低收入中等收入高收觀(guān)察值的分布邊緣分布行邊緣分布行觀(guān)察值的合計(jì)數(shù)的分布例如,贊成改革方案的共有279人,反對(duì)改革方案的141人列邊緣分布列觀(guān)察值的合計(jì)數(shù)的分布例如,四個(gè)分公司接受調(diào)查的人數(shù)分別為100人,120人,90人,110人條件分布與條件頻數(shù)變量X條件下變量Y的分布,或在變量Y條件下變量X的分布每個(gè)具體的觀(guān)察值稱(chēng)為條件頻數(shù)觀(guān)察值的分布邊緣分布觀(guān)察值的分布

(圖示)一分公司二分公司三分公司四分公司合計(jì)贊成該方案68755779279反對(duì)該方案32753331141合計(jì)10012090110420行邊緣分布列邊緣分布條件頻數(shù)觀(guān)察值的分布

(圖示)一分公司二分公司三分公司四分公司合計(jì)贊百分比分布

(概念要點(diǎn))條件頻數(shù)反映了數(shù)據(jù)的分布,但不適合對(duì)比為在相同的基數(shù)上進(jìn)行比較,可以計(jì)算相應(yīng)的百分比,稱(chēng)為百分比分布行百分比:行的每一個(gè)觀(guān)察頻數(shù)除以相應(yīng)的行合計(jì)數(shù)(fij

/ri)列百分比:列的每一個(gè)觀(guān)察頻數(shù)除以相應(yīng)的列合計(jì)數(shù)(fij

/cj)總百分比:每一個(gè)觀(guān)察值除以觀(guān)察值的總個(gè)數(shù)(fij

/n)百分比分布

(概念要點(diǎn))條件頻數(shù)反映了數(shù)據(jù)的分布,但不適合對(duì)期望頻數(shù)的分布假定行變量和列變量是獨(dú)立的一個(gè)實(shí)際頻數(shù)fij

的期望頻數(shù)eij

,是總頻數(shù)的個(gè)數(shù)n乘以該實(shí)際頻數(shù)fij

落入第i行和第j列的概率,即期望頻數(shù)的分布假定行變量和列變量是獨(dú)立的

統(tǒng)計(jì)量用于檢驗(yàn)列聯(lián)表中變量間擬合優(yōu)度和獨(dú)立性用于測(cè)定兩個(gè)分類(lèi)變量之間的相關(guān)程度

計(jì)算公式為統(tǒng)計(jì)量用于檢驗(yàn)列聯(lián)表中變量間擬合優(yōu)度和獨(dú)立性列聯(lián)表中的相關(guān)測(cè)量一.

相關(guān)系數(shù)列聯(lián)相關(guān)系數(shù)

V相關(guān)系數(shù)列聯(lián)表中的相關(guān)測(cè)量一.相關(guān)系數(shù)

相關(guān)系數(shù)

(correlationcoefficient)測(cè)度22列聯(lián)表中數(shù)據(jù)相關(guān)程度對(duì)于22列聯(lián)表,

系數(shù)的值在0~1之間

相關(guān)系數(shù)計(jì)算公式為相關(guān)系數(shù)

(correlationcoefficie列聯(lián)相關(guān)系數(shù)

(coefficientofcontingency)用于測(cè)度大于22列聯(lián)表中數(shù)據(jù)的相關(guān)程度計(jì)算公式為C的取值范圍是0C<1C=0表明列聯(lián)表中的兩個(gè)變量獨(dú)立C的數(shù)值大小取決于列聯(lián)表的行數(shù)和列數(shù),并隨行數(shù)和列數(shù)的增大而增大根據(jù)不同行和列的列聯(lián)表計(jì)算的列聯(lián)系數(shù)不便于比較列聯(lián)相關(guān)系數(shù)

(coefficientofcontingV相關(guān)系數(shù)

(Vcorrelationcoefficient)計(jì)算公式為

V的取值范圍是0V1

V=0表明列聯(lián)表中的兩個(gè)變量獨(dú)立

V=1表明列聯(lián)表中的兩個(gè)變量完全相關(guān)不同行和列的列聯(lián)表計(jì)算的列聯(lián)系數(shù)不便于比較當(dāng)列聯(lián)表中有一維為2,min[(r-1),(c-1)]=1,此時(shí)V=V相關(guān)系數(shù)

(Vcorrelationcoeffici、C、V的比較同一個(gè)列聯(lián)表,、C、V的結(jié)果會(huì)不同不同的列聯(lián)表,、C、V的結(jié)果也不同在對(duì)不同列聯(lián)表變量之間的相關(guān)程度進(jìn)行比較時(shí),不同列聯(lián)表中的行與行、列與列的個(gè)數(shù)要相同,并且采用同一種系數(shù)、C、V的比較同一個(gè)列聯(lián)表,、C、V的結(jié)果會(huì)不同操作步驟按Analyze--DescriptiveStatistics--Crosstabs順序打開(kāi)Crosstabs主對(duì)話(huà)框。操作步驟按Analyze--DescriptiveSt該框中的變量作為分布表中的行變量,該框中的變量作為控制變量,決定頻數(shù)分布表中的層,可有多個(gè)控制變量顯示每一組中各變量的分類(lèi)條形圖。只輸出統(tǒng)計(jì)量,不輸出多維列聯(lián)表。Crosstabs對(duì)話(huà)框該框中的變量作為分布表中的列變量,exact精確檢驗(yàn)該框中的變量作為分布表中的行變量,該框中的變量作為控制變量,卡方檢驗(yàn)計(jì)算相關(guān)系數(shù):Pearson相關(guān)系數(shù)和Spearman相關(guān)系數(shù)適用于定類(lèi)變量的統(tǒng)計(jì)量:相關(guān)性檢驗(yàn)適用于連兩定序變量,相關(guān)性檢驗(yàn)適用于一定類(lèi)一定距變量:用于檢驗(yàn)相關(guān)性Statistics對(duì)話(huà)框內(nèi)部一致性系數(shù),用于檢驗(yàn)兩個(gè)評(píng)估人對(duì)同一對(duì)象的評(píng)估是否具有一致系。相對(duì)危險(xiǎn)度,檢驗(yàn)?zāi)呈录l(fā)生和某因子之間的關(guān)系進(jìn)行兩個(gè)相關(guān)的二值變量的非參數(shù)檢驗(yàn)進(jìn)行一個(gè)二值因素變量和一個(gè)二值響應(yīng)變量的獨(dú)立性檢驗(yàn)??ǚ綑z驗(yàn)計(jì)算相關(guān)系數(shù):適用于定類(lèi)變量的統(tǒng)計(jì)量:相關(guān)性檢驗(yàn)適用Crosstabs的CellDisplay對(duì)話(huà)框選擇在列聯(lián)表中輸出的統(tǒng)計(jì)量,包括觀(guān)測(cè)量數(shù)、百分比、殘差輸出觀(guān)測(cè)量的實(shí)際數(shù)量如果行和列變量在統(tǒng)計(jì)上是獨(dú)立的或不相關(guān)的,那么會(huì)在單元格中輸出期望的觀(guān)測(cè)值的數(shù)量。輸出單元格中觀(guān)測(cè)量的數(shù)目占整行全部觀(guān)測(cè)量數(shù)目的百分比輸出單元格中觀(guān)測(cè)值的數(shù)目占整列全部觀(guān)測(cè)量數(shù)目的百分比輸出單元格中觀(guān)測(cè)量的數(shù)目占全部觀(guān)測(cè)量數(shù)目的百分比計(jì)算非標(biāo)準(zhǔn)化殘差計(jì)算標(biāo)準(zhǔn)化殘差計(jì)算調(diào)整后殘差Crosstabs的CellDisplay對(duì)話(huà)框選擇在列TableFormat對(duì)話(huà)框決定各行的排列順序:各行的排列按升序各行的排列按降序TableFormat對(duì)話(huà)框決定各行的排列順序:實(shí)例分析CROSSTABS/TABLES=a13BYa14/FORMAT=AVALUETABLES/CELLS=COUNT/COUNTROUNDCELL.對(duì)居民儲(chǔ)蓄調(diào)查數(shù)據(jù).sav建立列聯(lián)表,分析戶(hù)口和職業(yè)的關(guān)系

實(shí)例分析CROSSTABS對(duì)居民儲(chǔ)蓄調(diào)查數(shù)據(jù).sav建立列聯(lián)為了探討吸煙與慢性支氣管炎有無(wú)關(guān)系,調(diào)查了339人,情況如下:(數(shù)據(jù)為:吸煙與支氣管炎.sav)患慢性支氣管炎未患慢性支氣管炎吸煙43162不吸煙13121實(shí)例分析為了探討吸煙與慢性支氣管炎有無(wú)關(guān)患慢性支氣管炎未患慢在Data菜單中選WeightCases…項(xiàng),打開(kāi)WeightCases對(duì)話(huà)框。WeightCasesby,再將變量x3選入FrequenceVariable框,單擊OK完成加權(quán)。按Analyze--DescriptiveStatistics--Crootabs順序打開(kāi)Crootabs主對(duì)話(huà)框。將x1變量選入Row框作為行變量,將x2變量選入Column框作為列變量。打開(kāi)Statistics對(duì)話(huà)框,選中Chi-square、Contingencycoefficient和PhiandCramer’sV復(fù)選框,單擊Continue返回。單擊Cell按鈕,打開(kāi)Celldisplay對(duì)話(huà)框,選中observed和Expected復(fù)選框,單擊Continue返回;單擊OK。1操作步驟:實(shí)例分析在Data菜單中選WeightCases…項(xiàng),打開(kāi)Weig

統(tǒng)計(jì)摘要表,列出觀(guān)測(cè)量有效值個(gè)數(shù)、缺失值個(gè)數(shù)和總的個(gè)數(shù)。從列聯(lián)表中可看出,吸煙人中患病者有43人,比期望值33.9大,不吸煙人中患病者只有13人,比期望值22.1小。

輸出結(jié)果如下表:表吸煙與患病統(tǒng)計(jì)摘要表2輸出結(jié)果及分析統(tǒng)計(jì)摘要表,列出觀(guān)測(cè)量有效值個(gè)數(shù)、缺失值個(gè)數(shù)和表吸煙與患病列聯(lián)表表卡方檢驗(yàn)表吸煙與患病列聯(lián)表表卡方檢驗(yàn)

卡方檢驗(yàn)表中可看出,Chi-Square值為7.469,顯著值為0.006<0.05,應(yīng)否定零假設(shè),即認(rèn)為吸煙與患慢性支氣管炎是不獨(dú)立的。由于使用卡方檢驗(yàn)要求每個(gè)單元格頻數(shù)不少于5,當(dāng)條件不滿(mǎn)足時(shí),還可用Fisher精確檢驗(yàn)。其雙側(cè)檢驗(yàn)顯著值為0.007。對(duì)稱(chēng)性測(cè)量表表明,變量間相關(guān)關(guān)系弱,不應(yīng)拒絕原假設(shè)表對(duì)稱(chēng)性檢驗(yàn)表卡方檢驗(yàn)表中可看出,Chi-Square值為練習(xí)2為了解住房條件對(duì)婆媳關(guān)系的影響,對(duì)600戶(hù)家庭進(jìn)行調(diào)查,見(jiàn)婆媳關(guān)系與住房條件.sav問(wèn)住房條件與婆媳有無(wú)關(guān)系?婆媳關(guān)系住房條件差一般好緊張577860一般458763和睦4845117練習(xí)2為了解住房條件對(duì)婆媳關(guān)系的影響,婆媳關(guān)系練習(xí)2為了解住房條件對(duì)婆媳關(guān)系的影響,對(duì)600戶(hù)家庭進(jìn)行調(diào)查,見(jiàn)婆媳關(guān)系與住房條件.sav問(wèn)住房條件與婆媳有無(wú)關(guān)系?WEIGHTBY頻數(shù).CROSSTABS/TABLES=婆媳關(guān)系BY住房條件/FORMAT=AVALUETABLES/STATISTIC=CHISQCCPHICORR/CELLS=COUNTEXPECTEDROWCOLUMNTOTAL/COUNTROUNDCELL.練習(xí)2為了解住房條件對(duì)婆媳關(guān)系的影響,WEIGHT1:居民儲(chǔ)蓄調(diào)查數(shù)據(jù)分析儲(chǔ)戶(hù)存(取)款金額的基本描述統(tǒng)計(jì)量,并對(duì)城市儲(chǔ)戶(hù)和農(nóng)村儲(chǔ)戶(hù)進(jìn)行比較.作業(yè)11:居民儲(chǔ)蓄調(diào)查數(shù)據(jù)作業(yè)1作業(yè)2某班42名男女同學(xué)全部參加大學(xué)英語(yǔ)4級(jí)水平考試,男生合格2人,不合格26人,女生合格6人,不合格8人,問(wèn)男女生在英語(yǔ)學(xué)習(xí)水平上有無(wú)顯著差別?將以上結(jié)果保存為word文件,并對(duì)結(jié)果作出統(tǒng)計(jì)分析,要寫(xiě)明第幾次作業(yè).作業(yè)2某班42名男女同學(xué)全部參加大學(xué)英語(yǔ)將以上結(jié)果保存為探索性數(shù)據(jù)分析調(diào)用此過(guò)程可產(chǎn)生所有個(gè)案或不同分組個(gè)案的綜合統(tǒng)計(jì)量及圖形,提供各種不同的統(tǒng)計(jì)量與描述作圖,可進(jìn)行數(shù)據(jù)篩查,發(fā)現(xiàn)奇異值,描述性分析,假設(shè)檢驗(yàn)及不同分組個(gè)案的特征描述可幫助用戶(hù)決定選擇哪種統(tǒng)計(jì)方法進(jìn)行數(shù)據(jù)分析,選擇將數(shù)據(jù)轉(zhuǎn)換成正態(tài)方法及是否使用非參數(shù)目的探索性數(shù)據(jù)分析調(diào)用此過(guò)程可產(chǎn)生所有個(gè)案或不同分組目的按Analyze--DescriptiveStatistics--Explore順序單擊,打開(kāi)Explore主對(duì)話(huà)框。基本操作按Analyze--DescriptiveStatisti選擇一個(gè)或多個(gè)變量進(jìn)入Dependent框作為因變量此作為分組變量,可以是字符變量,對(duì)因變量的分析將按該變量的觀(guān)測(cè)值進(jìn)行分組分析??捎卸鄠€(gè)分組變量,這時(shí)會(huì)按多個(gè)變量的交叉組合進(jìn)行分組。該框中的變量作為個(gè)案標(biāo)識(shí)符可同時(shí)輸出基本統(tǒng)計(jì)量和圖形只輸出基本統(tǒng)計(jì)量只輸出圖形Explore主對(duì)話(huà)框選擇一個(gè)或多個(gè)變量進(jìn)入Dependent框作為因變量此作為分輸出基本統(tǒng)計(jì)量均值的置信區(qū)間,可鍵入1—99%的任意值,根據(jù)該值算出置信區(qū)間的上下限。給出中心趨勢(shì)的的穩(wěn)健最大似然估計(jì)量,當(dāng)數(shù)據(jù)分布均勻,且兩尾較長(zhǎng),或當(dāng)數(shù)據(jù)中存在極端值時(shí),可給出比均值或中位數(shù)更合理的估計(jì)。輸出最大和最小的5個(gè)數(shù),且在輸出窗口中加以標(biāo)明。輸出5%、10%、25%、50%、75%、90%和95%的百分位數(shù)。Statistics對(duì)話(huà)框輸出基本統(tǒng)計(jì)量給出中心趨勢(shì)的的穩(wěn)健最大似然估計(jì)量,當(dāng)數(shù)據(jù)分布只有指定分組變量才有效,可輸出分布—水平圖,同時(shí)輸出回歸直線(xiàn)斜率以及對(duì)方差的Levene’s檢驗(yàn)不輸出分布—水平圖功效估計(jì)根據(jù)在Power參數(shù)框中指定的變換對(duì)原始數(shù)據(jù)進(jìn)行變換。不對(duì)數(shù)據(jù)進(jìn)行轉(zhuǎn)換Explore欄中Plots對(duì)話(huà)框箱型圖每一個(gè)因變量生成一個(gè)箱形圖所有因變量生成一個(gè)箱形圖不顯示任何箱形圖生成莖葉圖,為默認(rèn)生成直方圖輸出帶檢驗(yàn)的正態(tài)圖只有指定分組變量才有效,可輸出分布—水平圖,同時(shí)輸出回歸直線(xiàn)確定缺失值的處置:因變量或分組變量中帶有缺失值的觀(guān)測(cè)量都將在分析過(guò)程中被剔除。在分析過(guò)程中剔除此分析中含缺失值個(gè)案。分組變量的缺失值被單獨(dú)分為一組,在結(jié)果中產(chǎn)生一個(gè)附加分類(lèi)。Explore欄中Options對(duì)話(huà)框確定缺失值的處置:Explore欄中Options對(duì)話(huà)框?qū)嵗齝hild.sav,根據(jù)因子變量性別對(duì)身高進(jìn)行探索性數(shù)據(jù)分析EXAMINEVARIABLES=x5BYx2/PLOTBOXPLOTSTEMLEAF/COMPAREGROUP/STATISTICSDESCRIPTIVES/CINTERVAL95/MISSINGLISTWISE/NOTOTAL.實(shí)例child.sav,根據(jù)因子變量性別對(duì)EXAMINE檢驗(yàn)列聯(lián)表分析列聯(lián)表相關(guān)性測(cè)度檢驗(yàn)列聯(lián)表分析列聯(lián)表相關(guān)性測(cè)度數(shù)據(jù)的類(lèi)型與列聯(lián)分析數(shù)據(jù)定量數(shù)據(jù)(數(shù)值型數(shù)據(jù))定性數(shù)據(jù)(品質(zhì)數(shù)據(jù))離散數(shù)據(jù)連續(xù)數(shù)據(jù)列聯(lián)分析數(shù)據(jù)的類(lèi)型與列聯(lián)分析數(shù)據(jù)定量數(shù)據(jù)定性數(shù)據(jù)離散數(shù)據(jù)連續(xù)數(shù)據(jù)列定性數(shù)據(jù)定性變量的結(jié)果表現(xiàn)為類(lèi)別例如:性別(男,女)各類(lèi)別用符號(hào)或數(shù)字代碼來(lái)測(cè)度使用定類(lèi)或定序尺度你吸煙嗎?1.是;2.否你贊成還是反對(duì)這一改革方案?1.贊成;2.反對(duì)對(duì)定性數(shù)據(jù)的描述和分析通常使用列聯(lián)表可使用檢驗(yàn)定性數(shù)據(jù)定性變量的結(jié)果表現(xiàn)為類(lèi)別列聯(lián)表

(例題分析)一分公司二分公司三分公司四分公司合計(jì)贊成該方案68755779279反對(duì)該方案32753331141合計(jì)10012090110420【例】一個(gè)集團(tuán)公司在四個(gè)不同的地區(qū)設(shè)有分公司,現(xiàn)該集團(tuán)公司欲進(jìn)行一項(xiàng)改革,此項(xiàng)改革可能涉及到各分公司的利益,故采用抽樣調(diào)查方式,從四個(gè)分公司共抽取420個(gè)樣本單位(人),了解職工對(duì)此項(xiàng)改革的看法,調(diào)查結(jié)果如下表列聯(lián)表

(例題分析)一分公司二分公司三分公司四分公司合計(jì)贊成列聯(lián)表按多個(gè)(兩個(gè)或兩個(gè)以上)變量的不同取值對(duì)不同情形進(jìn)行劃分,也即劃分不同的行或列。用以分行的變量稱(chēng)為行(row)變量,和用以分列的變量則稱(chēng)為列(column)變量。表格中間各行變量和列變量不同取值的交匯處,就是這種情形出現(xiàn)的頻數(shù)或計(jì)數(shù)(count)。列聯(lián)表中行變量和列變量的個(gè)數(shù)稱(chēng)為列聯(lián)表的維數(shù)。二維的列聯(lián)表又稱(chēng)為交叉表(crosstable)。三維或三維以上的列聯(lián)表叫做高維列聯(lián)表。列聯(lián)表

(contingencytable)列聯(lián)表按多個(gè)(兩個(gè)或兩個(gè)以上)變量的不同取值對(duì)不同情形進(jìn)行劃列聯(lián)表中每個(gè)行變量或列變量又有兩個(gè)或更多的不同取值,這些取值常稱(chēng)為水平(level)。每一種不同的水平組合就代表一種不同的情形。列聯(lián)表

(contingencytable)列聯(lián)表中每個(gè)行變量或列變量又有兩個(gè)或更多的不同取值,這些取值列聯(lián)表的結(jié)構(gòu)

(22列聯(lián)表)列(cj)合計(jì)j=1j=2i=1f11f12f11+f12i=2f21f22f21+f22合計(jì)f11+f21f12+f22n列(cj)行(ri)列聯(lián)表的結(jié)構(gòu)

(22列聯(lián)表)列(cj)合計(jì)j=列聯(lián)表的結(jié)構(gòu)

(r

c列聯(lián)表的一般表示)列(cj)合計(jì)j=1j=2…i=1f11f12…r1i=2f21f22…r2:::::合計(jì)c1c2…n列(cj)行(ri)fij表示第i行第j列的觀(guān)察頻數(shù)列聯(lián)表的結(jié)構(gòu)

(rc列聯(lián)表的一般表示)列(cj)合計(jì)關(guān)于某項(xiàng)政策調(diào)查的結(jié)果觀(guān)點(diǎn):贊成觀(guān)點(diǎn):反對(duì)低收入中等收入高收入低收入中等收入高收入男201055810女25157279高維列聯(lián)表關(guān)于某項(xiàng)政策調(diào)查的結(jié)果觀(guān)點(diǎn):贊成觀(guān)點(diǎn):反對(duì)低收入中等收入高收觀(guān)察值的分布邊緣分布行邊緣分布行觀(guān)察值的合計(jì)數(shù)的分布例如,贊成改革方案的共有279人,反對(duì)改革方案的141人列邊緣分布列觀(guān)察值的合計(jì)數(shù)的分布例如,四個(gè)分公司接受調(diào)查的人數(shù)分別為100人,120人,90人,110人條件分布與條件頻數(shù)變量X條件下變量Y的分布,或在變量Y條件下變量X的分布每個(gè)具體的觀(guān)察值稱(chēng)為條件頻數(shù)觀(guān)察值的分布邊緣分布觀(guān)察值的分布

(圖示)一分公司二分公司三分公司四分公司合計(jì)贊成該方案68755779279反對(duì)該方案32753331141合計(jì)10012090110420行邊緣分布列邊緣分布條件頻數(shù)觀(guān)察值的分布

(圖示)一分公司二分公司三分公司四分公司合計(jì)贊百分比分布

(概念要點(diǎn))條件頻數(shù)反映了數(shù)據(jù)的分布,但不適合對(duì)比為在相同的基數(shù)上進(jìn)行比較,可以計(jì)算相應(yīng)的百分比,稱(chēng)為百分比分布行百分比:行的每一個(gè)觀(guān)察頻數(shù)除以相應(yīng)的行合計(jì)數(shù)(fij

/ri)列百分比:列的每一個(gè)觀(guān)察頻數(shù)除以相應(yīng)的列合計(jì)數(shù)(fij

/cj)總百分比:每一個(gè)觀(guān)察值除以觀(guān)察值的總個(gè)數(shù)(fij

/n)百分比分布

(概念要點(diǎn))條件頻數(shù)反映了數(shù)據(jù)的分布,但不適合對(duì)期望頻數(shù)的分布假定行變量和列變量是獨(dú)立的一個(gè)實(shí)際頻數(shù)fij

的期望頻數(shù)eij

,是總頻數(shù)的個(gè)數(shù)n乘以該實(shí)際頻數(shù)fij

落入第i行和第j列的概率,即期望頻數(shù)的分布假定行變量和列變量是獨(dú)立的

統(tǒng)計(jì)量用于檢驗(yàn)列聯(lián)表中變量間擬合優(yōu)度和獨(dú)立性用于測(cè)定兩個(gè)分類(lèi)變量之間的相關(guān)程度

計(jì)算公式為統(tǒng)計(jì)量用于檢驗(yàn)列聯(lián)表中變量間擬合優(yōu)度和獨(dú)立性列聯(lián)表中的相關(guān)測(cè)量一.

相關(guān)系數(shù)列聯(lián)相關(guān)系數(shù)

V相關(guān)系數(shù)列聯(lián)表中的相關(guān)測(cè)量一.相關(guān)系數(shù)

相關(guān)系數(shù)

(correlationcoefficient)測(cè)度22列聯(lián)表中數(shù)據(jù)相關(guān)程度對(duì)于22列聯(lián)表,

系數(shù)的值在0~1之間

相關(guān)系數(shù)計(jì)算公式為相關(guān)系數(shù)

(correlationcoefficie列聯(lián)相關(guān)系數(shù)

(coefficientofcontingency)用于測(cè)度大于22列聯(lián)表中數(shù)據(jù)的相關(guān)程度計(jì)算公式為C的取值范圍是0C<1C=0表明列聯(lián)表中的兩個(gè)變量獨(dú)立C的數(shù)值大小取決于列聯(lián)表的行數(shù)和列數(shù),并隨行數(shù)和列數(shù)的增大而增大根據(jù)不同行和列的列聯(lián)表計(jì)算的列聯(lián)系數(shù)不便于比較列聯(lián)相關(guān)系數(shù)

(coefficientofcontingV相關(guān)系數(shù)

(Vcorrelationcoefficient)計(jì)算公式為

V的取值范圍是0V1

V=0表明列聯(lián)表中的兩個(gè)變量獨(dú)立

V=1表明列聯(lián)表中的兩個(gè)變量完全相關(guān)不同行和列的列聯(lián)表計(jì)算的列聯(lián)系數(shù)不便于比較當(dāng)列聯(lián)表中有一維為2,min[(r-1),(c-1)]=1,此時(shí)V=V相關(guān)系數(shù)

(Vcorrelationcoeffici、C、V的比較同一個(gè)列聯(lián)表,、C、V的結(jié)果會(huì)不同不同的列聯(lián)表,、C、V的結(jié)果也不同在對(duì)不同列聯(lián)表變量之間的相關(guān)程度進(jìn)行比較時(shí),不同列聯(lián)表中的行與行、列與列的個(gè)數(shù)要相同,并且采用同一種系數(shù)、C、V的比較同一個(gè)列聯(lián)表,、C、V的結(jié)果會(huì)不同操作步驟按Analyze--DescriptiveStatistics--Crosstabs順序打開(kāi)Crosstabs主對(duì)話(huà)框。操作步驟按Analyze--DescriptiveSt該框中的變量作為分布表中的行變量,該框中的變量作為控制變量,決定頻數(shù)分布表中的層,可有多個(gè)控制變量顯示每一組中各變量的分類(lèi)條形圖。只輸出統(tǒng)計(jì)量,不輸出多維列聯(lián)表。Crosstabs對(duì)話(huà)框該框中的變量作為分布表中的列變量,exact精確檢驗(yàn)該框中的變量作為分布表中的行變量,該框中的變量作為控制變量,卡方檢驗(yàn)計(jì)算相關(guān)系數(shù):Pearson相關(guān)系數(shù)和Spearman相關(guān)系數(shù)適用于定類(lèi)變量的統(tǒng)計(jì)量:相關(guān)性檢驗(yàn)適用于連兩定序變量,相關(guān)性檢驗(yàn)適用于一定類(lèi)一定距變量:用于檢驗(yàn)相關(guān)性Statistics對(duì)話(huà)框內(nèi)部一致性系數(shù),用于檢驗(yàn)兩個(gè)評(píng)估人對(duì)同一對(duì)象的評(píng)估是否具有一致系。相對(duì)危險(xiǎn)度,檢驗(yàn)?zāi)呈录l(fā)生和某因子之間的關(guān)系進(jìn)行兩個(gè)相關(guān)的二值變量的非參數(shù)檢驗(yàn)進(jìn)行一個(gè)二值因素變量和一個(gè)二值響應(yīng)變量的獨(dú)立性檢驗(yàn)??ǚ綑z驗(yàn)計(jì)算相關(guān)系數(shù):適用于定類(lèi)變量的統(tǒng)計(jì)量:相關(guān)性檢驗(yàn)適用Crosstabs的CellDisplay對(duì)話(huà)框選擇在列聯(lián)表中輸出的統(tǒng)計(jì)量,包括觀(guān)測(cè)量數(shù)、百分比、殘差輸出觀(guān)測(cè)量的實(shí)際數(shù)量如果行和列變量在統(tǒng)計(jì)上是獨(dú)立的或不相關(guān)的,那么會(huì)在單元格中輸出期望的觀(guān)測(cè)值的數(shù)量。輸出單元格中觀(guān)測(cè)量的數(shù)目占整行全部觀(guān)測(cè)量數(shù)目的百分比輸出單元格中觀(guān)測(cè)值的數(shù)目占整列全部觀(guān)測(cè)量數(shù)目的百分比輸出單元格中觀(guān)測(cè)量的數(shù)目占全部觀(guān)測(cè)量數(shù)目的百分比計(jì)算非標(biāo)準(zhǔn)化殘差計(jì)算標(biāo)準(zhǔn)化殘差計(jì)算調(diào)整后殘差Crosstabs的CellDisplay對(duì)話(huà)框選擇在列TableFormat對(duì)話(huà)框決定各行的排列順序:各行的排列按升序各行的排列按降序TableFormat對(duì)話(huà)框決定各行的排列順序:實(shí)例分析CROSSTABS/TABLES=a13BYa14/FORMAT=AVALUETABLES/CELLS=COUNT/COUNTROUNDCELL.對(duì)居民儲(chǔ)蓄調(diào)查數(shù)據(jù).sav建立列聯(lián)表,分析戶(hù)口和職業(yè)的關(guān)系

實(shí)例分析CROSSTABS對(duì)居民儲(chǔ)蓄調(diào)查數(shù)據(jù).sav建立列聯(lián)為了探討吸煙與慢性支氣管炎有無(wú)關(guān)系,調(diào)查了339人,情況如下:(數(shù)據(jù)為:吸煙與支氣管炎.sav)患慢性支氣管炎未患慢性支氣管炎吸煙43162不吸煙13121實(shí)例分析為了探討吸煙與慢性支氣管炎有無(wú)關(guān)患慢性支氣管炎未患慢在Data菜單中選WeightCases…項(xiàng),打開(kāi)WeightCases對(duì)話(huà)框。WeightCasesby,再將變量x3選入FrequenceVariable框,單擊OK完成加權(quán)。按Analyze--DescriptiveStatistics--

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論