SPSS分析調(diào)查問卷數(shù)據(jù)的方法.ppt_第1頁
SPSS分析調(diào)查問卷數(shù)據(jù)的方法.ppt_第2頁
SPSS分析調(diào)查問卷數(shù)據(jù)的方法.ppt_第3頁
SPSS分析調(diào)查問卷數(shù)據(jù)的方法.ppt_第4頁
SPSS分析調(diào)查問卷數(shù)據(jù)的方法.ppt_第5頁
已閱讀5頁,還剩79頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

利用SPSS分析調(diào)查問卷數(shù)據(jù),馬青華,問卷數(shù)據(jù)的預(yù)處理,SPSS分析調(diào)查問卷數(shù)據(jù)的方法,當(dāng)我們的調(diào)查問卷在把調(diào)查數(shù)據(jù)拿回來后,我們該做的工作就是用相關(guān)的統(tǒng)計軟件進(jìn)行處理,在此,我們以spss為處理軟件,來簡要說明一下問卷的處理過程,它的過程大致可分為四個過程: 定義變量數(shù)據(jù)錄入統(tǒng)計分析和結(jié)果保存. 下面將從這四個方面來對問卷的處理做詳細(xì)的介紹.,定義變量,大多數(shù)情況下我們需要從頭定義變量,在打開SPSS后,我們可以看到和excel相似的界面,在界面的左下方可以看到Data View, Variable View兩個標(biāo)簽,只需單擊左下方的Variable View標(biāo)簽就可以切換到變量定義界面開始定義新變量。 在表格上方可以看到一個變量要設(shè)置如下幾項(xiàng):name(變量名)、type(變量類型)、width(變量值的寬度)、decimals(小數(shù)位) 、label(變量標(biāo)簽) 、Values(定義具體變量值的標(biāo)簽)、Missing(定義變量缺失值)、Colomns(定義顯示列寬)、Align(定義顯示對齊方式)、Measure(定義變量類型是連續(xù)、有序分類還是無序分類).,調(diào)查問卷中的數(shù)據(jù)編碼和錄入,調(diào)查問卷中的數(shù)據(jù)編碼和錄入,調(diào)查問卷中的數(shù)據(jù)編碼和錄入,調(diào)查問卷中的數(shù)據(jù)編碼和錄入,把一份問卷上面的每一個問題設(shè)為一個變量,這樣一份問卷有多少個問題就要有多少個變量與之對應(yīng),每一個問題的答案即為變量的取值.現(xiàn)在我們以問卷第一個問題為例來說明變量的設(shè)置.為了便于說明,可假設(shè)此題為: 1.請問你的年齡屬于下面哪一個年齡段( )? A:2029 B:3039 C:4049 D:50-59,變量設(shè)置可如下: name即變量名為1,type即類型可根據(jù)答案的類型設(shè)置,答案我們可以用1、2、3、4來代替A、B、C、D,所以我們選擇數(shù)字型的,即選擇Numeric, width寬度為4,decimals即小數(shù)位數(shù)位為0(因?yàn)榇鸢笡]有小數(shù)點(diǎn)),label即變量標(biāo)簽為“年齡段查詢”。Values用于定義具體變量值的標(biāo)簽,單擊Value框右半部的省略號,會彈出變量值標(biāo)簽對話框,在第一個文本框里輸入1,第二個輸入2029,然后單擊添加即可.同樣道理我們可做如下設(shè)置,即1=2029、2=3039、3=4049、4=50-59;Missing,用于定義變量缺失值, 單擊missing框右側(cè)的省略號,會彈出缺失值對話框, 界面上有一列三個單選鈕,默認(rèn)值為最上方的“無缺失值”;第二項(xiàng)為“不連續(xù)缺失值”,最多可以定義3個值;最后一項(xiàng)為“缺失值范圍加可選的一個缺失值”,在此我們不設(shè)置缺省值,所以選中第一項(xiàng)如圖;Colomns,定義顯示列寬,可自己根據(jù)實(shí)際情況設(shè)置;Align,定義顯示對齊方式,有居左、居右、居中三種方式;Measure,定義變量類型是連續(xù)、有序分類還是無序分類。,開放式題型的設(shè)置:諸如你所在的省份是_這樣的填空題即為開放題,設(shè)置這些變量的時候只需要將Value 、Missing兩項(xiàng)不設(shè)置即可.,數(shù)據(jù)錄入:Spss數(shù)據(jù)錄入方式,在spss的數(shù)據(jù)錄入窗口中直接輸入就可以了, 幾點(diǎn)注意事項(xiàng): a. 在數(shù)據(jù)錄入窗口,可看到有一個表格,這個表格中的每一行代表一份問卷,也稱為一個個案. b. 在數(shù)據(jù)錄入窗口中,可看到表格上方出現(xiàn)了1、2、3、4、5.的標(biāo)簽名,這其實(shí)是我們在第一步定義變量中,我們?yōu)閱柧淼拿恳粋€問題取的變量名,即1代表第一題,2代表第二題.以次類推.只需要在變量名下面輸入對應(yīng)問題的答案即可完成問卷的數(shù)據(jù)錄入.比如上述年齡段查詢的例題,如果問卷上勾選了A答案,在1下面輸入1就行了(不要忘記我們通常是用1、2、3、4來代替A、B、C、D的). c.一行代表一份問卷,所以有幾分問卷,就要有幾行的數(shù)據(jù). 在數(shù)據(jù)錄入完成后, 要做的關(guān)鍵部分就是 問卷的統(tǒng)計分析了.,1.讀取SPSS格式的數(shù)據(jù) 2.讀取Excel等格式的數(shù)據(jù) 3.讀取文本數(shù)據(jù)(Fixed和Delimiter) 4.讀取數(shù)據(jù)庫格式數(shù)據(jù)(分如下兩步) (1)配置ODBC (2)在SPSS中通過ODBC和數(shù)據(jù)庫進(jìn)行,Rich.sav,數(shù)據(jù)Rich.xls,數(shù)據(jù)錄入,(rich.sav):福布斯世界富豪排行榜 Rank:排名 Name:姓名 Citizenship:國籍 Region:地區(qū) Age:年齡 NetWorth:凈財富(10億美元) Residence :居住地,問卷調(diào)查數(shù)據(jù)常用的統(tǒng)計分析方法,頻數(shù)分析、描述統(tǒng)計分析和列聯(lián)表分析 這是問卷調(diào)查最基本、最常用的分析方法。頻數(shù)分析是描述統(tǒng)計的初步,分門別類的統(tǒng)計有效樣本量,計算其比重。頻數(shù)分析可以計算的統(tǒng)計量有:分位數(shù)、中位數(shù)、眾數(shù)等,并可以繪制柱狀圖、直方圖、餅圖。,描述統(tǒng)計分析主要是計算一些 基本的統(tǒng)計量,其中比較重要的統(tǒng)計量有均值、方差和標(biāo)準(zhǔn)差、峰度、偏度。,數(shù)據(jù)的描述,在對數(shù)據(jù)進(jìn)行深入加工之前,總應(yīng)該對數(shù)據(jù)有所印象。 可以借助于圖形和簡單的運(yùn)算,來了解數(shù)據(jù)的一些特征。 由于數(shù)據(jù)是從總體中產(chǎn)生的,其特征也反映了總體的特征。對數(shù)據(jù)的描述也是對其總體的一個近似的描述。,1 如何用圖來表示數(shù)據(jù)?,定量變量的圖表示:1.直方圖,對于一個定量變量,比如某個地區(qū)(地區(qū)1)測量了163個高三男生的身高(S3height1.txt)。 用圖形來表示這個數(shù)據(jù),使人們能夠看出這個數(shù)據(jù)的大體分布或“形狀”的一個辦法是畫直方圖(histogram)。 圖1就是利用這個數(shù)據(jù)由SPSS軟件所畫的直方圖。,該圖的橫坐標(biāo)是身高區(qū)間,這里每一格代表5cm的身高范圍(格子寬度因不同的數(shù)據(jù)性質(zhì)或要求而定,這里的格子寬度為5cm),而縱坐標(biāo)為各種身高區(qū)間的身高的頻數(shù)。,直方圖,定量變量的圖表示:2.盒型圖,簡單一些的是盒形圖(boxplot,又稱箱圖、箱線圖、盒子圖)。 圖2的左邊一個是根據(jù)地區(qū)1高三男生的身高數(shù)據(jù)所繪的盒形圖;其右邊的圖代表另一個地區(qū)(地區(qū)2)的高三學(xué)生的身高(height.txt,height.sav,第三章例.xls)。,盒型圖,盒子的中間橫線是數(shù)據(jù)的中位數(shù)(median),封閉盒子的上下兩橫線(邊)為上下四分位數(shù)(點(diǎn));按照SPSS的默認(rèn)選項(xiàng),如果所有樣本中的數(shù)目都在離四分位點(diǎn)1.5倍盒子長度之內(nèi),則線的端點(diǎn)為最大和最小值,否則線長就是1.5倍的盒子長度(盒子長度稱為四分位間距),在其外面的度量單獨(dú)點(diǎn)出,定量變量的圖表示:3.莖葉圖,在直方圖和盒形圖中,很難恢復(fù)數(shù)據(jù)的原貌。而另一種圖:莖葉圖(stem-and-leaf plots)可以恢復(fù)數(shù)據(jù) 以地區(qū)1高三男生身高為例(圖3),莖葉圖既展示了分布形狀又有原始數(shù)據(jù)。它象一片帶有莖的葉子。莖為較大位數(shù)的數(shù)字,葉為較小位數(shù)的數(shù)字。,莖葉圖,其中莖葉圖中莖的單位為10cm,而葉子單位為1cm。比如,由于第一行莖為150cm,因此葉子中的九個數(shù)字001223344代表九個數(shù)目150、150、151、152、152、153、153、154、154cm等。每行左邊有一個頻數(shù)(比如第一行有9個數(shù)目,第二行有17個等等);可以看出最長的一行為從165cm到169cm的一段(有35個數(shù))。,定量變量的圖表示:4.散點(diǎn)圖,數(shù)據(jù)會有兩個變量,如美國男士和女士初婚年限數(shù)據(jù)(marriage.txt)。 該數(shù)據(jù)描述了自1900年到1998年男女第一次婚姻延續(xù)的時間。 這里年份是一個變量,婚姻延續(xù)時間是第二個變量。由于不可能將所有人的婚姻年限都給出來,所以每年就取了一個中間的值(中位數(shù))作為代表。,散點(diǎn)圖,定性變量的圖表示:餅圖,定性變量(或?qū)傩宰兞?,分類變量)不能點(diǎn)出直方圖、散點(diǎn)圖或莖葉圖,但可以描繪出它們各類的比例。 下面用SPSS繪的圖5(餅圖,pie chart)表示了說世界各種主要語言人數(shù)的比例(language.txt).,餅圖,定性變量的圖表示:條形圖,而用同樣數(shù)據(jù)畫的圖6稱為條形圖(bar chart)。 從每一條可以看出講各種語言的實(shí)際人數(shù),而且分別給出了每個語種中母語和日常使用的人數(shù)(在圖中并排放置)。條形圖顯示比例不如餅圖直觀。,條形圖,如何用少量數(shù)字來概括數(shù)據(jù)?,大量的數(shù)字既繁瑣又不直觀;需要對數(shù)據(jù)做人們時間和耐心所允許的簡化 我們可以用 “平均”,“差距”或百分比等來概括大量數(shù)字。 由于定性變量主要是計數(shù),比較簡單,常用的概括就是比例或百分比。下面主要介紹關(guān)于定量變量的數(shù)字描述。,37,小結(jié),例(rich.sav):福布斯世界富豪排行榜 Rank:排名 Name:姓名 Citizenship:國籍 Region:地區(qū) Age:年齡 NetWorth:凈財富(10億美元) Residence :居住地,38,定量變量的圖表示 直方圖 Age, NetWorth SPSS: GraphsInteractiveHistogram,39,橫坐標(biāo) 要研究的變量的取值范圍 格子的寬度因數(shù)據(jù)性質(zhì)而定 縱坐標(biāo) 頻數(shù) 百分比 數(shù)據(jù)分布的簡單描述 單峰/雙峰 對稱/非對稱 數(shù)據(jù)的疏密,40,盒型圖 不同區(qū)域年齡分布 SPSS: GraphsInteractive Boxplot,41,中間橫線 中位數(shù) 封閉盒子的上下兩邊 上下四分位點(diǎn) 線段的端點(diǎn) 最大值,最小值(線長小于1.5倍盒長) 離群點(diǎn)(outlier),極端值(extreme),42,莖葉圖 歐洲區(qū)域富人的年齡 SPSS: AnalyzeDescriptive Statistics Explore,Frequency Stem & Leaf 1.00 Extremes (=22) 2.00 3 . 44 9.00 3 . 789999999 18.00 4 . 000001112333344444 14.00 4 . 55555677789999 27.00 5 . 000011111112223333333344444 22.00 5 . 5555666666777888889999 27.00 6 . 000111111112222222333444444 23.00 6 . 55555566678888888899999 16.00 7 . 0000000111123333 18.00 7 . 555666677888999999 12.00 8 . 000222233344 7.00 8 . 5566899 2.00 9 . 22 1.00 9 . 5 Stem width: 10.00 Each leaf: 1 case(s),43,莖的單位:10歲 葉的單位:1歲 優(yōu)點(diǎn) 還原原始數(shù)據(jù) 類似直方圖顯示數(shù)據(jù)分布 缺點(diǎn) 無法描述大量數(shù)據(jù) 不常用,44,散點(diǎn)圖 兩個定量變量之間的關(guān)系:年齡和財富 SPSS: GraphsInteractive Scatterplot,45,定性變量的圖表示 餅圖 Region SPSS: GraphsInteractive Pie 類別不宜過多,46,條形圖 Region SPSS: GraphsInteractive Bar 不同于直方圖,2 如何用少量數(shù)字來概括數(shù)據(jù)?,可用少量所謂匯總統(tǒng)計量或概括統(tǒng)計量(summary statistic)來描述定量變量的數(shù)據(jù)。 這些數(shù)字是從樣本數(shù)據(jù)得來的,因而也是樣本的函數(shù), 任何樣本的函數(shù),只要不包含總體的未知參數(shù),都稱為統(tǒng)計量(statistic)。 樣本的隨機(jī)性決定統(tǒng)計量的隨機(jī)性(統(tǒng)計量也是隨機(jī)變量),2 如何用少量數(shù)字來概括數(shù)據(jù)?,概括統(tǒng)計量經(jīng)常對應(yīng)于總體的無法觀測到的某些參數(shù)。 這時,統(tǒng)計量可作為這些參數(shù)的估計。一些統(tǒng)計量還可以用來檢驗(yàn)樣本和假設(shè)的總體是否一致。,2 如何用少量數(shù)字來概括數(shù)據(jù)?,注:一些統(tǒng)計量前面有時加上“樣本”二字,以區(qū)別于總體的同名參數(shù)。如“樣本均值”和“樣本標(biāo)準(zhǔn)差”,以區(qū)別于總體均值和總體標(biāo)準(zhǔn)差;但在不會混淆時可以只說“均值”和“標(biāo)準(zhǔn)差”。,數(shù)據(jù)的“位置”,數(shù)據(jù)有位置嗎?,這里三個數(shù)據(jù)的位置一樣嗎?,數(shù)據(jù)的“位置”,“位置”一般是關(guān)于數(shù)據(jù)中某變量觀測值的“中心位置”或者數(shù)據(jù)分布的中心(center或center tendency)。 和這種“位置”有關(guān)的統(tǒng)計量就稱為位置統(tǒng)計量(location statistic)。 位置統(tǒng)計量當(dāng)然不一定都是描述“中心”了,比如后面要講的k百分位數(shù)(或k分位數(shù))。,數(shù)據(jù)的“位置”,最常用的位置統(tǒng)計量就是小學(xué)時所學(xué)到的算術(shù)平均數(shù),它在統(tǒng)計中叫做均值(mean);嚴(yán)格地說叫做樣本均值(sample mean),以區(qū)別于總體均值。 如果記樣本中的觀測值為x1,xn,則樣本均值定義為,(樣本)中位數(shù)(median) 是數(shù)據(jù)按照大小排列之后位于中間的那個數(shù)(如果樣本量為奇數(shù)),或者中間兩個數(shù)目的平均(如果樣本量為偶數(shù))。 由于中位數(shù)不易被極端值影響,所以中位數(shù)比均值穩(wěn)健(robust)。,數(shù)據(jù)的“位置”,上下四分位數(shù)(或分別稱為第一四分位數(shù)和第三四分位數(shù),first quantile, third quantile)則分別位于(按大小排列的)數(shù)據(jù)的上下四分之一的地方。,數(shù)據(jù)的“位置”,數(shù)據(jù)的“位置”,一般地還稱上四分位數(shù)為75百分位數(shù)(75 pecentile,有75的觀測值小于它),下四分位數(shù)為25百分位數(shù)(有25的觀測值小于它)。 一般地,k百分位數(shù)(k-pecentile)意味著有k的觀測值小于它。 如果令a=k%,則k百分位數(shù)也稱為a分位數(shù)(a-quantile)。 樣本中出現(xiàn)最多的數(shù)目,稱為眾數(shù)(mode),數(shù)據(jù)的“尺度”,這兩個數(shù)據(jù)“胖瘦”一樣嗎?,數(shù)據(jù)的“尺度”,數(shù)據(jù)中數(shù)目的分散程度由尺度統(tǒng)計量(scale statistic)來描述。 尺度統(tǒng)計量是描述數(shù)據(jù)散布,即描述集中與分散程度或變化(spread或variability)的度量。,數(shù)據(jù)的“尺度”,從前面兩個高三男生身高數(shù)據(jù)的盒形圖。左邊的數(shù)據(jù)平均要高些,但右邊的數(shù)據(jù)散布范圍要小得多。,統(tǒng)計中有許多尺度統(tǒng)計量。一般來說,數(shù)據(jù)越分散,尺度統(tǒng)計量的值越大。,數(shù)據(jù)的“尺度”,極差(range);就是極大值和極小值之間的差。 前面兩個高三男生身高數(shù)據(jù)的極差分別為50cm和32cm。 盒形圖盒子的長度為兩個四分位數(shù)之差,稱為四分位數(shù)極差或四分位間距(interquantile range);它描述了中間半數(shù)觀測值的散布情況。極差和四分位極差實(shí)際上各自只依賴于兩個值,信息量太少。,數(shù)據(jù)的“尺度”,另一個常用的尺度統(tǒng)計量為(樣本)標(biāo)準(zhǔn)差(standard deviation)。度量樣本中各數(shù)值到均值距離的一種平均。 標(biāo)準(zhǔn)差實(shí)際上是方差(variance)的平方根。如果記樣本中的觀測值為x1,xn,則樣本方差為,數(shù)據(jù)的“尺度”,兩個均值一樣,但右邊的要“胖”些,方差為左邊的一倍,數(shù)據(jù)的標(biāo)準(zhǔn)得分,假定兩個水平類似的班級(一班和二班)上同一門課, 但是由于兩個任課老師的評分標(biāo)準(zhǔn)不同,使得兩個班成績的均值和標(biāo)準(zhǔn)差都不一樣(數(shù)據(jù):grade.txt)。,數(shù)據(jù)的標(biāo)準(zhǔn)得分,一班分?jǐn)?shù)的均值和標(biāo)準(zhǔn)差分別為78.53和9.43,而二班的均值和標(biāo)準(zhǔn)差分別為70.19和7.00。 那么得到90分的一班的張穎是不是比得到82分的二班的劉疏成績更好呢?怎么比較才能合理呢?,數(shù)據(jù)的標(biāo)準(zhǔn)得分,雖然這種均值和標(biāo)準(zhǔn)差不同的數(shù)據(jù)不能夠直接比較,但是可以把它們進(jìn)行標(biāo)準(zhǔn)化,再比較標(biāo)準(zhǔn)化后的數(shù)據(jù)。 一個標(biāo)準(zhǔn)化的方法是把某樣本原始觀測值(亦稱得分,score)和該樣本均值之差除以該樣本的標(biāo)準(zhǔn)差;得到的度量稱為標(biāo)準(zhǔn)得分(standard score,又稱為z-score)。,數(shù)據(jù)的標(biāo)準(zhǔn)得分,即,某觀測值xi的標(biāo)準(zhǔn)得分定義為,數(shù)據(jù)的標(biāo)準(zhǔn)得分,在我們的例子中,張穎的標(biāo)準(zhǔn)得分為(90-78.53)/9.431.22,而劉疏的標(biāo)準(zhǔn)得分為(82-70.19)/71.69。 顯然如果兩個班級平均水平差不多,劉疏的成績應(yīng)該優(yōu)于張穎的成績;這是在標(biāo)準(zhǔn)化之前的數(shù)據(jù)中不易看到的。,可以看出,原始數(shù)據(jù)是在各自的均值附近,而散布也不一樣。但它們的標(biāo)準(zhǔn)得分則在0周圍散布,而且散布也差不多。實(shí)際上,任何樣本經(jīng)過這樣的標(biāo)準(zhǔn)化后,就都變換成均值為0、方差為1的樣本。標(biāo)準(zhǔn)化后不同樣本觀測值的比較只有相對意義,沒有絕對意義。,68,小結(jié),統(tǒng)計量:(statistic) 樣本的函數(shù),不包括總體的未知參數(shù) 隨機(jī)變量(樣本的隨機(jī)性) 作為總體參數(shù)的估計,69,數(shù)據(jù)的位置(location) 樣本均值(sample mean) 中位數(shù)(median):穩(wěn)健 k百分位數(shù)(k-percentile) 眾數(shù)(mode):定性變量,70,SPSS: AnalyzeDescriptive Statistics Explore/Frequencies/Descriptives 例(rich.sav) : Age,71,數(shù)據(jù)的尺度(scale) 極差(range) 四分位數(shù)極差(interquantile range) 方差(variance) 標(biāo)準(zhǔn)差(standard deviation) 標(biāo)準(zhǔn)誤差(standard error),72,SPSS: AnalyzeDescriptive Statistics Explore/Frequencies/Descriptives 例(rich.sav) : Age,73,數(shù)據(jù)的標(biāo)準(zhǔn)得分 樣本原始觀測值與樣本均值之差除以樣本標(biāo)準(zhǔn)差 新樣本:均值0,方差:1 (grade.sav) 數(shù)據(jù)的變換 指數(shù) 對數(shù),74,75,基本背景調(diào)查,樣本量:65 (out o

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論