版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
SPSS統(tǒng)計(jì)分析方法及應(yīng)用第四章
SPSS基本統(tǒng)計(jì)分析2023/10/251河北工大廊坊分校經(jīng)濟(jì)系周玉江統(tǒng)計(jì)分析的目的在于研究總體特征。但是,由于各種各樣的原因,我們能夠得到的往往只能是從總體中隨機(jī)抽取的一部分觀察對(duì)象,他們構(gòu)成了樣本,只有通過對(duì)樣本的研究,我們才能對(duì)總體的實(shí)際情況作出可能的推斷。因此描述性統(tǒng)計(jì)分析是統(tǒng)計(jì)分析的第一步,做好這一步是進(jìn)行正確統(tǒng)計(jì)推斷的先決條件。通過描述性統(tǒng)計(jì)分析可以大致了解數(shù)據(jù)的分布類型和特點(diǎn)、數(shù)據(jù)分布的集中趨勢(shì)和離散程度,或?qū)?shù)據(jù)進(jìn)行初步的探索性分析(包括檢查數(shù)據(jù)是否有錯(cuò)誤,對(duì)數(shù)據(jù)分布特征和規(guī)律進(jìn)行初步觀察)。
2023/10/252河北工大廊坊分校經(jīng)濟(jì)系周玉江1.頻數(shù)分析通過對(duì)數(shù)據(jù)的加工整理,計(jì)算出數(shù)據(jù)的分布特征;用表格和常用的統(tǒng)計(jì)圖形,直觀的展示數(shù)據(jù)的分布特點(diǎn)。我們進(jìn)行了儲(chǔ)蓄存款的問卷調(diào)查,其中涉及工作種類、不同年齡層次等和存款之間的關(guān)系,如何進(jìn)行分析呢?原始數(shù)據(jù)往往是雜亂無章的,看不出任何規(guī)律。例如下面某個(gè)居民小區(qū)短期存款數(shù)據(jù)?;镜慕y(tǒng)計(jì)分析:對(duì)搜集到的原始數(shù)據(jù)進(jìn)行概括和描述,而不試圖推斷已存在數(shù)據(jù)之外的任何事情。包括:1)頻數(shù)分析的基本指標(biāo)2023/10/253河北工大廊坊分校經(jīng)濟(jì)系周玉江居民小區(qū)短期存款數(shù)據(jù)(百元)2023/10/254河北工大廊坊分校經(jīng)濟(jì)系周玉江數(shù)據(jù)排序后很容易看出,存款額的最小值300,最大值649,全距349。若分成7個(gè)組,組距50,其結(jié)果如下表。通過統(tǒng)計(jì)分組,我們得到了存款額在各個(gè)區(qū)間取值個(gè)數(shù)的序列。通過該序列企業(yè)對(duì)小區(qū)的存款分布有了清楚認(rèn)識(shí)。2023/10/255河北工大廊坊分校經(jīng)濟(jì)系周玉江(1)頻數(shù)將雜亂無章的原始數(shù)據(jù)按照某一規(guī)則進(jìn)行分組,每一組中數(shù)據(jù)的個(gè)數(shù)稱為頻數(shù)。將各個(gè)組及對(duì)應(yīng)的頻數(shù)所形成的序列稱為頻數(shù)分布。頻數(shù)與樣本總數(shù)之比稱為百分比或頻率;頻數(shù)與有效樣本數(shù)之比稱為有效百分比或有效頻率。這里的有效樣本,是剔除了缺失值的樣本。(2)百分比(頻率)與有效百分比2023/10/256河北工大廊坊分校經(jīng)濟(jì)系周玉江(3)累計(jì)頻率其中fi為變量在第i個(gè)區(qū)間取值的個(gè)數(shù)。顯然,0≤頻數(shù)≤1。為了討論問題的方便,有時(shí)還希望知道連續(xù)的多個(gè)區(qū)間中變量取值個(gè)數(shù)占樣本總數(shù)的比例。頻率逐級(jí)累加所得到的值稱為累加頻數(shù)或累加百分比。2)頻數(shù)分析的基本操作(1)定類變量數(shù)據(jù)的頻數(shù)分析例2023/10/257河北工大廊坊分校經(jīng)濟(jì)系周玉江(2)頻數(shù)分析步驟分析:顯然,戶口和職業(yè)都是定類變量,直接按變量的取值所形成的自動(dòng)分組直接統(tǒng)計(jì)頻數(shù)。A)將“居民儲(chǔ)蓄存款調(diào)查數(shù)據(jù).sav”數(shù)據(jù)集打開。B)
分析描述性統(tǒng)計(jì)頻率,彈出頻數(shù)分析的對(duì)話框,數(shù)據(jù)集中的所有變量均出現(xiàn)在左邊的列表框中。例1:對(duì)于居民儲(chǔ)蓄存款調(diào)查數(shù)據(jù),對(duì)儲(chǔ)戶的戶口結(jié)構(gòu)和職業(yè)結(jié)構(gòu)分別進(jìn)行分析,前者給出餅圖,后者給出條形圖.2023/10/258河北工大廊坊分校經(jīng)濟(jì)系周玉江條形圖和直方圖的不同條形圖:1.用條形的長度表示各類別頻數(shù)的多少,其寬度(表示類別)是固定的;2.各矩形通常是分開排列的;3.主要用于展示分類數(shù)據(jù)。直方圖:1.用面積表示各組頻數(shù)的多少,矩形的高度表示每一組的頻數(shù)密度,寬度表示各組的組距;2.由于分組數(shù)據(jù)具有連續(xù)性,各矩形通常是連續(xù)排列;3.主要用于展示數(shù)值型數(shù)據(jù)。2023/10/259河北工大廊坊分校經(jīng)濟(jì)系周玉江D)
【統(tǒng)計(jì)量】按鈕,輸出的描述統(tǒng)計(jì)量C)將變量戶口移入變量窗口。可以同時(shí)對(duì)多個(gè)變量進(jìn)行頻數(shù)分析,只要將其移入變量窗口即可?!驐l形圖,適用于定序和定類變量的分析。條形圖的縱坐標(biāo)可以是頻數(shù),也可以是頻率。E)
【圖形】按鈕,輸出圖形的格式設(shè)置定距變量一般用直方圖表示,而定序及定類變量則用條形圖或餅圖表示。2023/10/2510河北工大廊坊分校經(jīng)濟(jì)系周玉江◎餅圖適合所有變量。餅圖是圓內(nèi)扇形的面積表示頻數(shù)變化的圖形,主要用于表現(xiàn)數(shù)據(jù)的結(jié)構(gòu)與組成。其中扇形面積的大小,既可以表現(xiàn)頻數(shù)的大小,也可以表現(xiàn)頻率的大小?!蛑狈綀D,適用于定距數(shù)量。直方圖之間無間隔,可以在直方圖上附加正態(tài)分布曲線,便于數(shù)據(jù)正態(tài)分布的比較。操作:本例只適合選擇條形圖。□圖表值,縱軸可以選擇為頻率,也可選擇為百分比。操作:選擇縱軸為頻數(shù)。2023/10/2511河北工大廊坊分校經(jīng)濟(jì)系周玉江F)
【格式】按鈕,輸出頻數(shù)表及頻數(shù)圖的格式設(shè)置注意:按變量值排序,僅對(duì)定距變量有效。如果定類變量選擇了直方圖,這里的排序設(shè)置無效。操作:選擇輸出的頻數(shù)按降序排列。B)多變量表輸出格式◎比較變量:
將多個(gè)變量結(jié)果對(duì)比輸出?!虬醋兞拷M織輸出:多個(gè)變量的統(tǒng)計(jì)結(jié)果分別輸出。本模塊適用于同時(shí)計(jì)算多個(gè)變量的頻數(shù)時(shí)的輸出選擇。2023/10/2512河北工大廊坊分校經(jīng)濟(jì)系周玉江如果分類數(shù)多于n,則禁止輸出頻數(shù)分布表。默認(rèn)值為10.本例的類為2,不用設(shè)置本條。利用同樣的方法,計(jì)算變量職稱的頻數(shù)分析,只是輸出圖形時(shí)選擇條形圖。C)
排除具有多個(gè)類別的表2023/10/2513河北工大廊坊分校經(jīng)濟(jì)系周玉江(3)變量“戶口”頻數(shù)分析輸出結(jié)果樣本數(shù)量居民儲(chǔ)蓄被調(diào)查者戶口結(jié)構(gòu)2023/10/2514河北工大廊坊分校經(jīng)濟(jì)系周玉江2023/10/2515河北工大廊坊分校經(jīng)濟(jì)系周玉江(4)儲(chǔ)蓄存款調(diào)查問卷職稱變量頻數(shù)分析例儲(chǔ)蓄存款被調(diào)查者的職稱結(jié)構(gòu)分布表2023/10/2516河北工大廊坊分校經(jīng)濟(jì)系周玉江儲(chǔ)蓄存款被調(diào)查者的職業(yè)結(jié)構(gòu)頻數(shù)降序排列分布圖2023/10/2517河北工大廊坊分校經(jīng)濟(jì)系周玉江2023/10/2518河北工大廊坊分校經(jīng)濟(jì)系周玉江條圖(BarCharts)餅圖(PieCharts)直方圖(Histograms)2023/10/2519河北工大廊坊分校經(jīng)濟(jì)系周玉江(5)結(jié)論的簡單分析本次調(diào)查的樣本總量為313,有效樣本313,其中城鎮(zhèn)客戶223人,占總數(shù)的71.2%;農(nóng)村客戶90人,占總數(shù)的28.8%.城鎮(zhèn)客戶明顯多于農(nóng)村客戶。本次調(diào)查者的職業(yè)分布是:商業(yè)服務(wù)業(yè)最多,達(dá)到總儲(chǔ)戶的23%;其次是一般農(nóng)戶,如果加上果農(nóng)、菜農(nóng),將達(dá)到總儲(chǔ)戶的18.5%,構(gòu)成了儲(chǔ)蓄存款的生力軍。因此,這兩個(gè)職業(yè)是銀行部門的主要客戶及服務(wù)對(duì)象,因此有必要制定相應(yīng)服務(wù)政策予以支持與傾斜。A)
客戶的城鄉(xiāng)結(jié)構(gòu)分析B)
客戶的職業(yè)結(jié)構(gòu)分析2023/10/2520河北工大廊坊分校經(jīng)濟(jì)系周玉江3)定距數(shù)量的組距分組頻數(shù)分析例例2:根據(jù)居民儲(chǔ)蓄存款調(diào)查數(shù)據(jù),分析儲(chǔ)戶一次性存款的數(shù)量分布。這里的問題是對(duì)一次性存款數(shù)量進(jìn)行頻數(shù)分析。由于一次性存款是數(shù)量標(biāo)志,是連續(xù)型變量,不可能對(duì)每一個(gè)數(shù)據(jù)進(jìn)行分析,需要計(jì)算存款數(shù)量的極差,然后分組,對(duì)組中數(shù)據(jù)的頻數(shù)進(jìn)行分析:a)
將存款金額數(shù)據(jù)分成五組:500以下、500~2000、2000~3500、3500~5000、5000以上。b)
對(duì)分組后的數(shù)據(jù)序列進(jìn)行頻數(shù)分析。(1)儲(chǔ)戶一次性存款數(shù)量的分析思路2023/10/2521河北工大廊坊分校經(jīng)濟(jì)系周玉江(2)對(duì)一次性存款數(shù)據(jù)進(jìn)行分組對(duì)一次性存款進(jìn)行分組,確定每一個(gè)數(shù)據(jù)屬于的組。a)點(diǎn)擊轉(zhuǎn)換重新編碼成不同變量,彈出分組設(shè)置對(duì)話框。b)在左邊的變量列表中,選擇“存款金額”移入數(shù)字變量列表中。c)
在輸出變量的變量名稱文本框中輸入s,用于存放生成的分組變量。點(diǎn)擊按鈕【更改】后,數(shù)字變量列表欄目出現(xiàn)操作:a5(存款數(shù)量)→sd)
點(diǎn)擊按鈕【舊值和新值】,進(jìn)入組區(qū)間對(duì)應(yīng)的2023/10/2522河北工大廊坊分校經(jīng)濟(jì)系周玉江操作:設(shè)置區(qū)間對(duì)應(yīng)值:小于500→1,500~2000→2,2000~3500→3,3500~5000→4,大于5000→5。設(shè)置界面見下頁圖。設(shè)置完成后點(diǎn)擊【繼續(xù)】按鈕,回到變量設(shè)置界面。e)點(diǎn)擊【OK】按鈕,完成分組設(shè)置,這時(shí)數(shù)據(jù)編輯窗口的數(shù)據(jù)集中增加了分組序列s。a)
分析描述性統(tǒng)計(jì)頻率,彈出頻數(shù)分析的對(duì)話框,數(shù)據(jù)集中的所有變量均出現(xiàn)在左邊的列表框中。組值對(duì)話框。(3)對(duì)分組變量s進(jìn)行頻數(shù)分析的實(shí)現(xiàn)2023/10/2523河北工大廊坊分校經(jīng)濟(jì)系周玉江操作:
將分組變量s移入Variable列表框中。b)點(diǎn)擊【圖表】按鈕,設(shè)置圖形2023/10/2524河北工大廊坊分校經(jīng)濟(jì)系周玉江
□
附加正太分布曲線。操作:選c)設(shè)置輸出格式?!虬搭l數(shù)升序排序操作:選d)點(diǎn)擊【OK】按鈕,完成頻數(shù)的計(jì)算與作圖。a)從輸出的頻數(shù)表可以看出,被調(diào)查者的近一半(48.6%)一次性存款:在500元以下,在2000~3500的客戶為4.8%最少,而大于5000的達(dá)到了9.8%。b)從圖形可以看出,頻數(shù)并不是標(biāo)準(zhǔn)的正態(tài)分布,附加的正態(tài)分布曲線明顯右偏,即一次存款的金額偏低的占較大比例,也有少數(shù)金額偏高的儲(chǔ)戶?!蜉敵鲋狈綀D,適用于數(shù)量標(biāo)志。(4)儲(chǔ)戶一次性存款數(shù)量的結(jié)構(gòu)分析2023/10/2525河北工大廊坊分校經(jīng)濟(jì)系周玉江一次性存款在500元以下。c)一次性存款金額偏少的存款客戶更多一些。一次性存款超過5000元的儲(chǔ)戶也有相當(dāng)?shù)谋壤?023/10/2526河北工大廊坊分校經(jīng)濟(jì)系周玉江2023/10/2527河北工大廊坊分校經(jīng)濟(jì)系周玉江利用SPSS的頻數(shù)分析計(jì)算出所有樣本的存款金額的四分位數(shù);然后,按照戶口類型對(duì)數(shù)據(jù)進(jìn)行拆分,并重新計(jì)算分位數(shù),分別得到城鎮(zhèn)和農(nóng)村戶口儲(chǔ)戶戶口的存款金額的四分位數(shù)。各分位數(shù)的計(jì)算結(jié)果如下表所示:2023/10/2528河北工大廊坊分校經(jīng)濟(jì)系周玉江2023/10/2529河北工大廊坊分校經(jīng)濟(jì)系周玉江
從第一張表中我們可以看出,有25%的人一次存款金額在134元以下,50%的人在600元以下,75%的人在1500元以下。這些數(shù)據(jù)更加證實(shí)了金額呈右偏分布的結(jié)論。下面一張表表明:城鎮(zhèn)儲(chǔ)戶有223人,一次存款金額的四分位數(shù)差分別是700(900-200)元和1600(2500-900)元;農(nóng)村儲(chǔ)戶有90人,一次存款金額的四分位數(shù)差分2023/10/2530河北工大廊坊分校經(jīng)濟(jì)系周玉江2.描述性統(tǒng)計(jì)描述統(tǒng)計(jì)是統(tǒng)計(jì)分析的基礎(chǔ),它包括數(shù)據(jù)的收集、整理、顯示,對(duì)數(shù)據(jù)中有用信息的提取和分析,通常用一些描述統(tǒng)計(jì)量來進(jìn)行分析。集中趨勢(shì)的特征值:算術(shù)平均數(shù)、調(diào)和平均數(shù)、幾何平均數(shù)、眾數(shù)、中位數(shù)等。其中均數(shù)適用于正態(tài)分布和對(duì)稱分布資料,中位數(shù)適用于所有分布類型的資料。離散趨勢(shì)的特征值:全距、內(nèi)距、平均差、方差、標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)誤、離散系數(shù)等。其中標(biāo)準(zhǔn)差、方差適用于正態(tài)分布資料,標(biāo)準(zhǔn)誤實(shí)際上反映了樣本均數(shù)的波動(dòng)程度。
分布特征值:偏態(tài)系數(shù)、峰度系數(shù)、他們反映了數(shù)據(jù)偏離正態(tài)分布的程度。2023/10/2531河北工大廊坊分校經(jīng)濟(jì)系周玉江操作過程SPSS的【描述】命令專門用于計(jì)算各種描述統(tǒng)計(jì)性統(tǒng)計(jì)量。選擇菜單【分析】→【描述統(tǒng)計(jì)】→【描述】
2023/10/2532河北工大廊坊分校經(jīng)濟(jì)系周玉江2023/10/2533河北工大廊坊分校經(jīng)濟(jì)系周玉江3.探索性分析調(diào)用此過程可對(duì)變量進(jìn)行更為深入詳盡的描述性統(tǒng)計(jì)分析,故稱之為探索分析。它在一般描述性統(tǒng)計(jì)指標(biāo)的基礎(chǔ)上,增加有關(guān)數(shù)據(jù)其他特征的文字與圖形描述,顯得更加細(xì)致與全面,對(duì)數(shù)據(jù)分析更進(jìn)一步。探索分析一般通過數(shù)據(jù)文件在分組與不分組的情況下獲得常用統(tǒng)計(jì)量和圖形。一般以圖形方式輸出,直觀幫助研究者確定奇異值、影響點(diǎn)、還可以進(jìn)行假設(shè)檢驗(yàn),以及確定研究者要使用的某種統(tǒng)計(jì)方式是否合適。在打開的數(shù)據(jù)文件上,選擇如下命令:選擇菜單“【分析】—>【描述統(tǒng)計(jì)】—>【探索】”,打開對(duì)話框。2023/10/2534河北工大廊坊分校經(jīng)濟(jì)系周玉江更確切地說:目的:對(duì)數(shù)據(jù)進(jìn)行初步考察用途:◎計(jì)算整體或分組數(shù)據(jù)的描述性統(tǒng)計(jì)指標(biāo)◎輸出描述性統(tǒng)計(jì)圖:莖葉圖、直方圖、箱式圖◎正態(tài)性檢驗(yàn)、方差齊性檢驗(yàn)◎檢查數(shù)據(jù)的錯(cuò)誤,辨認(rèn)奇異值2023/10/2535河北工大廊坊分校經(jīng)濟(jì)系周玉江2023/10/2536河北工大廊坊分校經(jīng)濟(jì)系周玉江因變量列表:待分析的變量名稱,例如將存款金額作為研究變量。因子列表:從源變量框中選擇一個(gè)或多個(gè)變量進(jìn)入因子列表,分組變量可以將數(shù)據(jù)按照該觀察值進(jìn)行分組分析。標(biāo)準(zhǔn)個(gè)案:在源變量表中指定一個(gè)變量作為觀察值的標(biāo)識(shí)變量。在輸出欄中,選擇兩者都,表示輸出圖形及描述統(tǒng)計(jì)量。選擇【統(tǒng)計(jì)量】按鈕,選擇想要計(jì)算的描述統(tǒng)計(jì)量。如圖所示2023/10/2537河北工大廊坊分校經(jīng)濟(jì)系周玉江對(duì)所要計(jì)算的變量的頻數(shù)分布及其統(tǒng)計(jì)量值作圖打開“Plots對(duì)話框”,出現(xiàn)如下圖:1、輸出圖形:箱式圖、莖葉圖、直方圖
2、正態(tài)性檢驗(yàn)及圖示
3、Levene方差齊性檢驗(yàn)2023/10/2538河北工大廊坊分校經(jīng)濟(jì)系周玉江缺失值處理
1、某觀測(cè)在所選擇的變量中有缺失值時(shí),該觀測(cè)不參與全部分析
2、僅在與該變量有關(guān)的分析中視為缺失值
3、缺失值做為一個(gè)組別輸出2023/10/2539河北工大廊坊分校經(jīng)濟(jì)系周玉江例:居民儲(chǔ)蓄調(diào)查描述城鄉(xiāng)居民存取款金額的差別檢查存取款金額的離群點(diǎn)和極端值對(duì)存取款金額進(jìn)行正態(tài)性檢驗(yàn)和方差齊性檢驗(yàn),以便進(jìn)一步選擇分析方法。2023/10/2540河北工大廊坊分校經(jīng)濟(jì)系周玉江2023/10/2541河北工大廊坊分校經(jīng)濟(jì)系周玉江2023/10/2542河北工大廊坊分校經(jīng)濟(jì)系周玉江樣本量n<=50時(shí),2023/10/2543河北工大廊坊分校經(jīng)濟(jì)系周玉江莖葉圖自左向右可以分為3大部分:頻數(shù)、莖(Stem)和葉(Leaf)。莖表示數(shù)值的整數(shù)部分,葉表示數(shù)值的小數(shù)部分。每行的莖和每個(gè)葉組成的數(shù)字相加再乘以莖寬(StemWidth),即莖葉所表示的實(shí)際數(shù)值的近似值。2023/10/2544河北工大廊坊分校經(jīng)濟(jì)系周玉江2023/10/2545河北工大廊坊分校經(jīng)濟(jì)系周玉江2023/10/2546河北工大廊坊分校經(jīng)濟(jì)系周玉江箱式圖是在剔除了變量的極端值、離群點(diǎn)后計(jì)算統(tǒng)計(jì)量并繪制的。中間的黑粗線為中位數(shù),紅框?yàn)樗姆治婚g距的范圍,上下兩個(gè)細(xì)線為最大、最小值。
2023/10/2547河北工大廊坊分校經(jīng)濟(jì)系周玉江4.交叉分組下的頻數(shù)分析目的:交叉分組下的頻數(shù)分析又稱列聯(lián)表分析。通過前面的頻數(shù)分析能夠掌握單個(gè)變量的數(shù)據(jù)分布情況,在實(shí)際分析中,不僅要了解單個(gè)變量的分布特征,還要分析多個(gè)變量不同取值下的分布,進(jìn)而分析變量之間的相互影響和關(guān)系。對(duì)于這種涉及兩個(gè)或兩個(gè)以上變量分布情況的研究通常要利用交叉分組下的頻數(shù)分析來完成?;救蝿?wù):(1)根據(jù)收集到的樣本數(shù)據(jù),產(chǎn)生二維或多維交叉列聯(lián)表;(2)在交叉列聯(lián)表的基礎(chǔ)上,對(duì)兩兩變量間是否存在一定的相關(guān)性進(jìn)行分析。(1)目的與基本任務(wù)2023/10/2548河北工大廊坊分校經(jīng)濟(jì)系周玉江(2)交叉列聯(lián)表的主要內(nèi)容編制交叉列聯(lián)表是交叉分組下頻數(shù)分析的第一個(gè)任務(wù)。交叉列聯(lián)表是兩個(gè)或兩個(gè)以上的變量交叉分組后形成的頻數(shù)分布表。例:職工基本情況數(shù)據(jù)按職稱和文化程度編制的二維交叉列聯(lián)表(見下頁表):2023/10/2549河北工大廊坊分校經(jīng)濟(jì)系周玉江觀測(cè)頻數(shù)行變量列邊緣分布行邊緣分布列變量期望頻數(shù)列聯(lián)表的格式2023/10/2550河北工大廊坊分校經(jīng)濟(jì)系周玉江上表中的性別變量稱為行變量(Row),文化程度稱為列變量(Column)。行標(biāo)題和列標(biāo)題分別是兩個(gè)變量的變量值(或分組值)。表格中間是觀測(cè)頻數(shù)(ObservedCounts)和各種百分比。16名職工中,本科、??啤⒏咧?、初中的人數(shù)分別為4,4,5,3,構(gòu)成的分布稱為交叉列聯(lián)表的列邊緣分布;男職工、女職工的人數(shù)分別為12,4,構(gòu)成的分布稱為交叉列聯(lián)表的行邊緣分布;4個(gè)本科學(xué)歷職工中男女的人數(shù)分別是4,0,這些頻數(shù)構(gòu)成的分布稱為條件分布,即在行變量(列變量)取值條件下的列變量(行變量)的分布。2023/10/2551河北工大廊坊分校經(jīng)濟(jì)系周玉江
在交叉列聯(lián)表中,除了頻數(shù)外還引進(jìn)了各種百分比。例如表中第一行中的33.3%,25%,16.7%,25%分別是男職工12人中各學(xué)歷人數(shù)所占的比例,稱為行百分比(Rowpercentage),一行的百分比總和為100%;表中第一列的100%,0%分別是本科學(xué)歷4人中男女人數(shù)所占的比例,稱為列百分比(Columnpercentage),一列的列百分比總和為100%,表中的25%,25%,31.3%,18.8%等分別是總?cè)藬?shù)16人中各交叉組中人數(shù)所占的百分比,稱為總百分比(Totalpercentage),所有格子中的總百分比之和也為100%。2023/10/2552河北工大廊坊分校經(jīng)濟(jì)系周玉江分析---描述性統(tǒng)計(jì)---交叉表(3)交叉分組下的頻數(shù)分析的基本操作顯示每一組中各變量的分類條形圖。只輸出統(tǒng)計(jì)量,不輸出多維列聯(lián)表。該框中的變量作為控制變量,決定頻數(shù)分布表中的層,可有多個(gè)控制變量。該框中的變量作為分布表中的行變量和列變量。2023/10/2553河北工大廊坊分校經(jīng)濟(jì)系周玉江(1)如果進(jìn)行二維列聯(lián)表分析,則將行變量選擇到行框中,將列變量選擇到列框中。如果行和列框中有多個(gè)變量名,SPSS會(huì)將行列變量一一配對(duì)后產(chǎn)生多張二維列聯(lián)表。如果進(jìn)行三維或多維列聯(lián)表分析,則將其他變量作為控制變量選到層框中。多控制變量間可以是同層次的,也可以是逐層疊加的,可通過上一張或下一張按鈕確定控制變量間的層次關(guān)系。(2)選擇復(fù)式條形圖選項(xiàng),指定繪制各變量交叉分組下頻數(shù)分布條形圖。取消表格表示不輸出列聯(lián)表,在僅分析行列變量間關(guān)系時(shí)可選擇該選項(xiàng)。(3)單擊單元格按鈕指定列聯(lián)表單元格中的輸出內(nèi)容,窗口如下:2023/10/2554河北工大廊坊分校經(jīng)濟(jì)系周玉江2023/10/2555河北工大廊坊分校經(jīng)濟(jì)系周玉江(4)交叉列聯(lián)表行列變量間關(guān)系的分析
對(duì)交叉列聯(lián)表中的行變量和列變量之間關(guān)系進(jìn)行分析是交叉分組下頻數(shù)分析的第二個(gè)任務(wù)。為了理解行、列變量之間的關(guān)系,可以從分析兩個(gè)極端的例子出發(fā):
①年齡與工資收入的交叉列聯(lián)表(一)2023/10/2556河北工大廊坊分校經(jīng)濟(jì)系周玉江②年齡與工資收入交叉列聯(lián)表(二)
表一中表示年齡與工資收入呈正相關(guān)關(guān)系,表二表示年齡與工資收入呈負(fù)相關(guān)關(guān)系。但大多數(shù)情況下,觀測(cè)頻數(shù)分散在列聯(lián)表的各個(gè)單元格中,不容易直接發(fā)現(xiàn)行列變量之間的關(guān)系強(qiáng)弱程度,此時(shí)就要借助非參數(shù)檢驗(yàn)方法。通常用的方法是卡方檢驗(yàn)。2023/10/2557河北工大廊坊分校經(jīng)濟(jì)系周玉江卡方測(cè)量的原理:卡方測(cè)量用來考察兩變量是否獨(dú)立(無關(guān))。其原理是根據(jù)這一概率定理:若兩變量無關(guān),則兩變量中聯(lián)合事件發(fā)生的概率應(yīng)等于各自獨(dú)立發(fā)生的概率乘積。在列聯(lián)表中,這一定理就具體轉(zhuǎn)化為:若兩變量無關(guān),則兩變量中條件概率應(yīng)等于各自邊緣概率的乘積。反之,則兩變量有關(guān),或兩變量不獨(dú)立。由此可見,期望值與觀察值的差距越大,說明兩變量越不獨(dú)立,也就越相關(guān)。因此,Pearson卡方的表達(dá)式如下:當(dāng)為四格表時(shí),卡方的取值在0~∞之間??ǚ街翟酱螅辛凶兞康年P(guān)聯(lián)性越強(qiáng)。卡方統(tǒng)計(jì)量觀測(cè)值的大小取決于兩個(gè)因素:第一:列聯(lián)表的單元格子數(shù);第二:觀測(cè)頻數(shù)與期望頻數(shù)的總差值。在列聯(lián)表確定的情況下,卡方統(tǒng)計(jì)量觀測(cè)值的大小取決于觀測(cè)頻數(shù)與期望頻數(shù)的總差值。當(dāng)總差值越大時(shí),卡方值也就越大,實(shí)際分布與期望分布的差距越大,表明行列變量之間越相關(guān);反之表明行列變量之間越獨(dú)立。那么,在統(tǒng)計(jì)上卡
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 環(huán)保型垃圾處理發(fā)電方案
- 酒店電氣負(fù)荷計(jì)算及施工方案
- 海洋工程監(jiān)理方案
- 建筑材料采購合同
- 食品檢測(cè)實(shí)驗(yàn)室耗材供應(yīng)方案
- 步道磚施工進(jìn)度安排方案
- 智能?;繁O(jiān)測(cè)與管理方案
- 宅基地永久買賣合同(2篇)
- 孵化項(xiàng)目合作協(xié)議書(2篇)
- A10學(xué)生數(shù)字化時(shí)代的安全意識(shí)方案
- 代謝相關(guān)(非酒精性)脂肪性肝病防治指南(2024年版)解讀
- 物業(yè)管理服務(wù)勞務(wù)派遣 投標(biāo)方案(技術(shù)方案)
- DL∕T 1475-2015 電力安全工器具配置與存放技術(shù)要求
- 2024年國家保安員資格考試題庫及參考答案(完整版)
- 幼兒園安全教育課件:《過馬路》
- 過橋墊資合同模板
- 個(gè)體戶經(jīng)營章程
- 風(fēng)能發(fā)電的電網(wǎng)接入技術(shù)
- 年回收30萬噸廢塑料PET破碎清洗線建設(shè)項(xiàng)目可行性研究報(bào)告
- 初中語文大單元匯報(bào)課件1
- MOOC 科技英語寫作-西安電子科技大學(xué) 中國大學(xué)慕課答案
評(píng)論
0/150
提交評(píng)論