版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第九章 SPSS軟件應(yīng)用(二)第一節(jié) 描述性統(tǒng)計(jì)分析SPSS統(tǒng)計(jì)分析從基礎(chǔ)到實(shí)踐(第2版)聯(lián)系Email:描述性統(tǒng)計(jì)分析描述性統(tǒng)計(jì)分析是基礎(chǔ)的統(tǒng)計(jì)分析過程。通過描述性統(tǒng)計(jì)分析,可以挖掘出很多統(tǒng)計(jì)量的特征。 Frequencies 頻數(shù)分析表 Descriptive 描述性統(tǒng)計(jì)分析過程 Explore 探索分析過程 Crosstabs 列聯(lián)表分析過程描述性統(tǒng)計(jì)量集中趨勢(shì)離散趨勢(shì)分布情況均值Mean標(biāo)準(zhǔn)差Std.deviatiom偏度Skewness中位數(shù)Median方差Variance峰度Kurtosis眾數(shù)Mode極小值Minimum和Sum極大值Maximum全距Range均值的標(biāo)準(zhǔn)誤差S.
2、E.mean數(shù)據(jù)分布的特征集中趨勢(shì) (位置)偏態(tài)和峰態(tài)(形狀)離中趨勢(shì) (分散程度)均值(Mean):2 眾數(shù)(Mode):出現(xiàn)頻率最高的數(shù)3 中位數(shù)(Median):將數(shù)據(jù)排序后位于正中間 的數(shù)值。適合于所有分布類型的數(shù)據(jù)4 總和(Sum)基本描述統(tǒng)計(jì)量眾數(shù)(mode)出現(xiàn)次數(shù)最多的變量值不受極端值的影響一組數(shù)據(jù)可能沒有眾數(shù)或有幾個(gè)眾數(shù)主要用于分類數(shù)據(jù),也可用于順序數(shù)據(jù)和數(shù)值型數(shù)據(jù)中位數(shù)(median)排序后處于中間位置上的值Me50%50%不受極端值的影響主要用于順序數(shù)據(jù),也可用數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù)各變量值與中位數(shù)的離差絕對(duì)值之和最小,即數(shù)值型數(shù)據(jù)的中位數(shù) (9個(gè)數(shù)據(jù)的算例)【例
3、】:9個(gè)家庭的人均月收入數(shù)據(jù)原始數(shù)據(jù): 1500 750 780 1080 850 960 2000 1250 1630排 序: 750 780 850 960 1080 1250 1500 1630 2000位 置: 1 2 3 4 5 6 7 8 9中位數(shù) 1080數(shù)值型數(shù)據(jù)的中位數(shù) (10個(gè)數(shù)據(jù)的算例)【例】:10個(gè)家庭的人均月收入數(shù)據(jù)排 序: 660 750 780 850 960 1080 1250 1500 1630 2000位 置: 1 2 3 4 5 6 7 8 9 10 數(shù)值型數(shù)據(jù)的四分位數(shù) (9個(gè)數(shù)據(jù)的算例)【例】:9個(gè)家庭的人均月收入數(shù)據(jù)原始數(shù)據(jù): 1500 750 78
4、0 1080 850 960 2000 1250 1630排 序: 750 780 850 960 1080 1250 1500 1630 2000位 置: 1 2 3 4 5 6 7 8 9數(shù)值型數(shù)據(jù)的四分位數(shù) (10個(gè)數(shù)據(jù)的算例)【例】:10個(gè)家庭的人均月收入數(shù)據(jù)排 序: 660 750 780 850 960 1080 1250 1500 1630 2000位 置: 1 2 3 4 5 6 7 8 9 10 均值(數(shù)學(xué)性質(zhì))1.各變量值與均值的離差之和等于零 2. 各變量值與均值的離差平方和最小眾數(shù)、中位數(shù)和均值的關(guān)系左偏分布均值 中位數(shù) 眾數(shù)對(duì)稱分布 均值= 中位數(shù)= 眾數(shù)右偏分布眾數(shù)
5、 中位數(shù)均值眾數(shù)、中位數(shù)和均值的特點(diǎn)和應(yīng)用眾數(shù)不受極端值影響具有不唯一性數(shù)據(jù)分布偏斜程度較大時(shí)應(yīng)用中位數(shù)不受極端值影響數(shù)據(jù)分布偏斜程度較大時(shí)應(yīng)用均值易受極端值影響數(shù)學(xué)性質(zhì)優(yōu)良數(shù)據(jù)對(duì)稱分布或接近對(duì)稱分布時(shí)應(yīng)用離散趨勢(shì)數(shù)據(jù)分布的另一個(gè)重要特征反映各變量值遠(yuǎn)離其中心值的程度(離散程度)從另一個(gè)側(cè)面說明了集中趨勢(shì)測(cè)度值的代表程度不同類型的數(shù)據(jù)有不同的離散程度測(cè)度值標(biāo)準(zhǔn)差(Std Dev):方差(Variance):最小值、最大值(Maxium,Minimum)均值標(biāo)準(zhǔn)誤(S.E.of.Mean): 樣本均值的標(biāo)準(zhǔn)差極差(Range):數(shù)據(jù)最大值減去最小值基本描述統(tǒng)計(jì)量極差(range)一組數(shù)據(jù)的最大值
6、與最小值之差離散程度的最簡(jiǎn)單測(cè)度值易受極端值影響未考慮數(shù)據(jù)的分布7891078910 R = max(xi) - min(xi)計(jì)算公式為偏度系數(shù):Skew ness,當(dāng)分布對(duì)稱時(shí), 偏度系數(shù)為0。當(dāng)偏度系數(shù)為正值, 可以判斷為右偏(正偏),反之,判斷為左偏 (負(fù) 偏)。 基本描述統(tǒng)計(jì)量峰度系數(shù):Kurtosis ,是對(duì)數(shù)據(jù)分布平峰或尖峰程度的測(cè)度。峰度是針對(duì)正態(tài)分布而言的。峰度系數(shù)為0,表明數(shù)據(jù)為正態(tài)分布。若峰度系數(shù)大于0,則數(shù)據(jù)為尖峰分布;反之為平峰分布?;久枋鼋y(tǒng)計(jì)量標(biāo)準(zhǔn)分?jǐn)?shù)(standard score)1. 也稱標(biāo)準(zhǔn)化值2.對(duì)某一個(gè)值在一組數(shù)據(jù)中相對(duì)位置的度量3.可用于判斷一組數(shù)據(jù)是
7、否有離群點(diǎn)4.用于對(duì)變量的標(biāo)準(zhǔn)化處理5. 計(jì)算公式為標(biāo)準(zhǔn)分?jǐn)?shù)(性質(zhì))均值等于02.方差等于1【Descriptive Statistics】子菜單 Frequencies:產(chǎn)生變量值的頻數(shù)分布表,并可計(jì)算常見描述性統(tǒng)計(jì)量和繪制相對(duì)應(yīng)的統(tǒng)計(jì)圖。 Descriptives:計(jì)算一般的描述性統(tǒng)計(jì)量。 Explore:探索性分析,使用戶能夠從大量的分析結(jié)果之中挖掘到所需要的統(tǒng)計(jì)信息。 Crosstabs:對(duì)分類變量進(jìn)行統(tǒng)計(jì)推斷,包括卡方檢驗(yàn)、確切概率等,是SPSS重要的過程。 Ratio:計(jì)算兩個(gè)變量相對(duì)比的統(tǒng)計(jì)量特征。 P-P Plots:繪制P-P圖,檢驗(yàn)數(shù)據(jù)服從的分布情況。 Q-Q Plots:
8、繪制Q-Q圖,檢驗(yàn)數(shù)據(jù)服從的分布情況 頻數(shù)分析Frequencies頻數(shù)分析簡(jiǎn)介 頻數(shù)分析表是描述性統(tǒng)計(jì)中最常用的方法之一,它主要包括以下幾點(diǎn)功能: 1、產(chǎn)生詳細(xì)的頻數(shù)表 2、按要求給出某個(gè)分位點(diǎn) 3、繪制常用的條圖、餅圖等統(tǒng)計(jì)圖 適用范圍:更適用于對(duì)分類變量以及不服從正態(tài)分布的連續(xù)性變量進(jìn)行描述。頻數(shù)分析表一、目的 可對(duì)數(shù)據(jù)按組進(jìn)行歸類整理,形成變量不同水平的頻數(shù)分布表和圖形,對(duì)數(shù)據(jù)的分布趨勢(shì)進(jìn)行初步分析。頻數(shù)分析表二、 Frequencies對(duì)話框簡(jiǎn)介AnalyzeDescriptive StatisticFrequencies【 Variables 】需要分析的變量【 Display f
9、requency tables】 確定是否在結(jié)果中輸出頻數(shù)表。頻數(shù)分析表【Statistics】 描述統(tǒng)計(jì)量。 【 Charts】 統(tǒng)計(jì)圖頻數(shù)分析表Chart Values: 定義是按照頻數(shù)還是按百分比做圖(即影響縱坐標(biāo)刻度)。 【Format】 彈出Format對(duì)話框,用于定義輸出頻數(shù)表的格式。頻數(shù)分析表Multiple Variables單選鈕組 如果選擇了兩個(gè) 以上變量做頻數(shù)表,則 Compare variables 可以將他們的結(jié)果在同一個(gè)頻數(shù)表過程輸出結(jié)果 中顯示,便于互相比較, Organize output by variables 則將結(jié)果在不同的頻數(shù)表過程輸出結(jié)果中顯示。 頻
10、數(shù)分析表Suppress Tables more than: 當(dāng)頻數(shù)表的 分組數(shù)大于下面設(shè)定數(shù)值時(shí)禁止它在結(jié)果中輸出, 這樣可以避免產(chǎn)生巨型表格。實(shí)例例9-1-1基礎(chǔ)統(tǒng)計(jì)分析Descriptive Descriptive簡(jiǎn)介 Descriptive過程是連續(xù)資料統(tǒng)計(jì)描述應(yīng)用最多的一個(gè)過程。 對(duì)變量進(jìn)行描述性統(tǒng)計(jì)分析,計(jì)算并列出一系列相應(yīng)的統(tǒng)計(jì)指標(biāo)。這與其它過程相比并無不同。 這個(gè)過程有一個(gè)特殊的功能,可將原始數(shù)據(jù)轉(zhuǎn)換成標(biāo)準(zhǔn)正態(tài)分布評(píng)分值,并以變量形勢(shì)存入數(shù)據(jù)庫供以后分析。AnalyzeDescriptive StatisticDescriptives基本操作【Save standardized
11、 values as variables】將原始數(shù)據(jù)的標(biāo)準(zhǔn)正態(tài)評(píng)分存為新變量?!綩ptions】Display Order:可以選擇為變量列表順序、字母順序、均數(shù)升序或均數(shù)降序。探索性分析Explore 與前面介紹的兩個(gè)過程相比,【Explore】過程更加強(qiáng)大。它除了可以計(jì)算常見描述性統(tǒng)計(jì)量之外,還可以給出一些簡(jiǎn)單的檢驗(yàn)結(jié)果和圖形,有助于用戶進(jìn)一步地分析數(shù)據(jù)。 適用范圍:對(duì)資料的性質(zhì),分布特點(diǎn)等完全不清楚的時(shí)候探索性數(shù)據(jù)分析調(diào)用此過程可產(chǎn)生所有個(gè)案或不同分組個(gè)案的綜合統(tǒng)計(jì)量及圖形,提供各種不同的統(tǒng)計(jì)量與描述作圖,可進(jìn)行數(shù)據(jù)篩查,發(fā)現(xiàn)奇異值,描述性分析,假設(shè)檢驗(yàn)及不同分組個(gè)案的特征描述可幫助用戶
12、決定選擇哪種統(tǒng)計(jì)方法進(jìn)行數(shù)據(jù)分析, 選擇將數(shù)據(jù)轉(zhuǎn)換成正態(tài)方法及是否使用非參數(shù)目的按Analyze-Descriptive Statistics-Explore 順序單擊,打開 Explore 主對(duì)話框。基本操作選擇一個(gè)或多個(gè)變量進(jìn)入Dependent框作為因變量此作為分組變量,可以是字符變量,對(duì)因變量的分析將按該變量的觀測(cè)值進(jìn)行分組分析??捎卸鄠€(gè)分組變量,這時(shí)會(huì)按多個(gè)變量的交叉組合進(jìn)行分組。該框中的變量作為個(gè)案標(biāo)識(shí)符可同時(shí)輸出基本統(tǒng)計(jì)量和圖形只輸出基本統(tǒng)計(jì)量只輸出圖形Explore 主對(duì)話框輸出基本統(tǒng)計(jì)量 均值的置信區(qū)間,可鍵入199%的任意值,根據(jù)該值算出置信區(qū)間的上下限。給出中心趨勢(shì)的的穩(wěn)
13、健最大似然估計(jì)量,當(dāng)數(shù)據(jù)分布均勻,且兩尾較長(zhǎng),或當(dāng)數(shù)據(jù)中存在極端值時(shí),可給出比均值或中位數(shù)更合理的估計(jì)。輸出最大和最小的5個(gè)數(shù),且在輸出窗口中加以標(biāo)明。輸出5%、10%、25%、50%、75%、90%和95%的百分位數(shù)。Statistics對(duì)話框只有指定分組變量才有效,可輸出分布水平圖,同時(shí)輸出回歸直線斜率以及對(duì)方差的Levenes檢驗(yàn)不輸出分布水平圖功效估計(jì)根據(jù)在Power參數(shù)框中指定的變換對(duì)原始數(shù)據(jù)進(jìn)行變換。不對(duì)數(shù)據(jù)進(jìn)行轉(zhuǎn)換 Explore 欄中Plots對(duì)話框箱型圖每一個(gè)因變量生成一個(gè)箱形圖所有因變量生成一個(gè)箱形圖不顯示任何箱形圖生成莖葉圖,為默認(rèn)生成直方圖輸出帶檢驗(yàn)的正態(tài)圖確定缺失值的
14、處置:因變量或分組變量中帶有缺失值的觀 測(cè)量都將在分析過程中被剔除。在分析過程中剔除此分析中含缺失值 個(gè)案。分組變量的缺失值被單獨(dú)分為一組, 在結(jié)果中產(chǎn)生一個(gè)附加分類。Explore 欄中Options對(duì)話框?qū)嵗?例9-1-2數(shù)據(jù)的類型與列聯(lián)分析數(shù) 據(jù)定量數(shù)據(jù)(數(shù)值型數(shù)據(jù))定性數(shù)據(jù)(品質(zhì)數(shù)據(jù))離散數(shù)據(jù)連續(xù)數(shù)據(jù)列聯(lián)分析列聯(lián)表分析Crosstabs定性數(shù)據(jù)定性變量的結(jié)果表現(xiàn)為類別例如:性別 (男, 女)各類別用符號(hào)或數(shù)字代碼來測(cè)度使用定類或定序尺度你吸煙嗎? 1.是;2.否你贊成還是反對(duì)這一改革方案?1.贊成;2.反對(duì)對(duì)定性數(shù)據(jù)的描述和分析通常使用列聯(lián)表可使用檢驗(yàn) 為了探討吸煙與慢性支氣管炎有無關(guān)
15、 系,調(diào)查了339人,情況如下:患慢性支氣管炎未患慢性支氣管炎吸煙43162不吸煙13121實(shí)例分析列聯(lián)表按多個(gè)(兩個(gè)或兩個(gè)以上)變量的不同取值對(duì)不同情形進(jìn)行劃分,也即劃分不同的行或列。用以分行的變量稱為行(row)變量,和用以分列的變量則稱為列(column)變量。表格中間各行變量和列變量不同取值的交匯處,就是這種情形出現(xiàn)的頻數(shù)或計(jì)數(shù)(count)。列聯(lián)表中行變量和列變量的個(gè)數(shù)稱為列聯(lián)表的維數(shù)。二維的列聯(lián)表又稱為交叉表(cross table)。三維或三維以上的列聯(lián)表叫做高維列聯(lián)表。列聯(lián)表(contingency table)列聯(lián)表中每個(gè)行變量或列變量又有兩個(gè)或更多的不同取值,這些取值常稱為
16、水平(level)。每一種不同的水平組合就代表一種不同的情形。列聯(lián)表(contingency table)列聯(lián)表的結(jié)構(gòu)(2 2 列聯(lián)表)列( cj )合計(jì)j =1j =2i =1f11f12f11+ f12i =2f21f22f21+ f22合計(jì)f11+ f21f12+ f22n列(cj)行 (ri)列聯(lián)表的結(jié)構(gòu)(r c 列聯(lián)表的一般表示)列(cj)合計(jì)j =1j = 2i =1f11f12r1i = 2f21f22r2:合計(jì)c1c2n列(cj)行(ri)fij 表示第 i 行第 j 列的觀察頻數(shù) 統(tǒng)計(jì)量用于檢驗(yàn)列聯(lián)表中變量間擬合優(yōu)度和獨(dú)立性用于測(cè)定兩個(gè)分類變量之間的相關(guān)程度 計(jì)算公式為操作步
17、驟 按Analyze-Descriptive Statistics-Crosstabs 順序打開 Crosstabs 主對(duì)話框。該框中的變量作為分布表中的行變量,該框中的變量作為控制變量,決定頻數(shù)分布表中的層,可有多個(gè)控制變量顯示每一組中各變量的分類條形圖。只輸出統(tǒng)計(jì)量,不輸出多維列聯(lián)表。Crosstabs 對(duì)話框該框中的變量作為分布表中的列變量,exact精確檢驗(yàn)卡方檢驗(yàn)計(jì)算相關(guān)系數(shù):Pearson相關(guān)系數(shù)和 Spearman相關(guān)系數(shù)適用于定類變量的統(tǒng)計(jì)量:相關(guān)性檢驗(yàn)適用于連兩定序變量, 相關(guān)性檢驗(yàn)適用于一定類一定距變量:用于檢驗(yàn)相關(guān)性Statistics 對(duì)話框內(nèi)部一致性系數(shù),用于檢驗(yàn)兩個(gè)評(píng)估人對(duì)同一對(duì)象的評(píng)估是否具有一致系。相對(duì)危險(xiǎn)度,檢驗(yàn)?zāi)呈录l(fā)生和某因子之間的關(guān)系進(jìn)行兩個(gè)相關(guān)的二值變量的非參數(shù)檢驗(yàn)進(jìn)行一個(gè)二值因素變
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度美容美發(fā)行業(yè)品牌推廣與廣告投放合同4篇
- 2025版五金制品研發(fā)、生產(chǎn)與銷售合作協(xié)議2篇
- 2025年度鋁合金門窗維修保養(yǎng)服務(wù)合同模板4篇
- 2025年度高速公路路基采石供應(yīng)合同3篇
- 2025年行政法律文書數(shù)字化處理及輸出合同3篇
- 精準(zhǔn)農(nóng)業(yè)2025年度糧食儲(chǔ)備風(fēng)險(xiǎn)管理與保險(xiǎn)合同3篇
- 二零二五紅酒年份酒定制銷售及品牌合作合同范本3篇
- 二零二五版門窗行業(yè)環(huán)保材料采購合同8篇
- 2025年度鋁窗產(chǎn)品研發(fā)與創(chuàng)新激勵(lì)合同4篇
- 2025年度道路施工勞務(wù)分包合同4篇
- 2024-2025學(xué)年人教版數(shù)學(xué)六年級(jí)上冊(cè) 期末綜合試卷(含答案)
- 收養(yǎng)能力評(píng)分表
- 山東省桓臺(tái)第一中學(xué)2024-2025學(xué)年高一上學(xué)期期中考試物理試卷(拓展部)(無答案)
- 中華人民共和國(guó)保守國(guó)家秘密法實(shí)施條例培訓(xùn)課件
- 管道坡口技術(shù)培訓(xùn)
- 2024年全國(guó)統(tǒng)一高考英語試卷(新課標(biāo)Ⅰ卷)含答案
- 2024年認(rèn)證行業(yè)法律法規(guī)及認(rèn)證基礎(chǔ)知識(shí) CCAA年度確認(rèn) 試題與答案
- 皮膚儲(chǔ)存新技術(shù)及臨床應(yīng)用
- 外研版七年級(jí)英語上冊(cè)《閱讀理解》專項(xiàng)練習(xí)題(含答案)
- 2024年遼寧石化職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)適應(yīng)性測(cè)試題庫必考題
- 上海市復(fù)旦大學(xué)附中2024屆高考沖刺模擬數(shù)學(xué)試題含解析
評(píng)論
0/150
提交評(píng)論