多元統(tǒng)計(jì)分析及SPSS應(yīng)用_第1頁
多元統(tǒng)計(jì)分析及SPSS應(yīng)用_第2頁
多元統(tǒng)計(jì)分析及SPSS應(yīng)用_第3頁
多元統(tǒng)計(jì)分析及SPSS應(yīng)用_第4頁
多元統(tǒng)計(jì)分析及SPSS應(yīng)用_第5頁
已閱讀5頁,還剩35頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

session3

聚類分析

應(yīng)用多元統(tǒng)計(jì)分析及SPSS應(yīng)用

Session3統(tǒng)計(jì)數(shù)據(jù)的收集、整理與描述

當(dāng)前第1頁\共有40頁\編于星期二\20點(diǎn)SessionTopics統(tǒng)計(jì)數(shù)據(jù)的來源

統(tǒng)計(jì)數(shù)據(jù)的收集

統(tǒng)計(jì)數(shù)據(jù)的描述

統(tǒng)計(jì)數(shù)據(jù)的整理

當(dāng)前第2頁\共有40頁\編于星期二\20點(diǎn)統(tǒng)計(jì)數(shù)據(jù)的來源一、統(tǒng)計(jì)數(shù)據(jù)的直接來源來源于管理和研究需要而專門組織的調(diào)查來源于科學(xué)試驗(yàn)的數(shù)據(jù)二、統(tǒng)計(jì)數(shù)據(jù)的間接來源來源于公開出版物的數(shù)據(jù)來源于內(nèi)部調(diào)查的數(shù)據(jù)當(dāng)前第3頁\共有40頁\編于星期二\20點(diǎn)統(tǒng)計(jì)數(shù)據(jù)的收集數(shù)據(jù)的搜集方法詢問調(diào)查訪問調(diào)查觀察實(shí)驗(yàn)電話調(diào)查郵寄調(diào)查觀察電腦輔助座談會(huì)個(gè)別深訪實(shí)驗(yàn)當(dāng)前第4頁\共有40頁\編于星期二\20點(diǎn)訪問調(diào)查

1. 調(diào)查者與被調(diào)查者通過面對(duì)面地交談而獲得資料2. 有標(biāo)準(zhǔn)式訪問和非標(biāo)準(zhǔn)式訪問標(biāo)準(zhǔn)式訪問通常按事先設(shè)計(jì)好的問卷進(jìn)行非標(biāo)準(zhǔn)式訪問事先一般不制作問卷當(dāng)前第5頁\共有40頁\編于星期二\20點(diǎn)郵寄調(diào)查也稱郵寄問卷調(diào)查是一種標(biāo)準(zhǔn)化調(diào)查調(diào)查者與被調(diào)查者沒有直接的語言交流,信息的傳遞依賴于問卷通過某種方式將調(diào)查表或問卷送至某調(diào)查者手中,由被調(diào)查者填寫,然后將問卷寄回指定收集點(diǎn)問卷或表格的發(fā)放方式有郵寄、宣傳媒介傳送、專門場所分發(fā)三種

當(dāng)前第6頁\共有40頁\編于星期二\20點(diǎn)電話調(diào)查調(diào)查者利用電話與被調(diào)查者進(jìn)行語言交流以獲得信息時(shí)效快、成本低問題的數(shù)量不宜過多

您好!我是××調(diào)查公司的調(diào)查員…當(dāng)前第7頁\共有40頁\編于星期二\20點(diǎn)電腦輔助調(diào)查又稱電腦輔助電話調(diào)查電腦與電話相結(jié)合完成調(diào)查的全過程一般需借助專門的軟件進(jìn)行硬件設(shè)備要求較高

當(dāng)前第8頁\共有40頁\編于星期二\20點(diǎn)座談會(huì)1. 也稱集體訪談2. 將一組被調(diào)查者集中在調(diào)查現(xiàn)場,讓他們對(duì)調(diào)查的主題發(fā)表意見以獲得資料3. 參加座談會(huì)的人數(shù)不宜過多,一般為6~10人4. 側(cè)重于定性研究當(dāng)前第9頁\共有40頁\編于星期二\20點(diǎn)個(gè)別深度訪問

一次只有一名受訪者參加、針對(duì)特殊問題的調(diào)查適合于較隱秘的問題,如個(gè)人隱私問題;或較敏感的問題,如政治方面的問題側(cè)重于定性研究當(dāng)前第10頁\共有40頁\編于星期二\20點(diǎn)觀察法1. 就調(diào)查對(duì)象的行動(dòng)和意識(shí),調(diào)查人員邊觀察邊記錄以收集所需信息2. 調(diào)查人員不是強(qiáng)行介入3. 能夠在被調(diào)查者不察覺的情況下獲得資料當(dāng)前第11頁\共有40頁\編于星期二\20點(diǎn)實(shí)驗(yàn)法

1. 在設(shè)定的特殊實(shí)驗(yàn)場所、特殊狀態(tài)下,對(duì)調(diào)查對(duì)象進(jìn)行實(shí)驗(yàn)以獲得所需資料2. 有室內(nèi)實(shí)驗(yàn)法和市場實(shí)驗(yàn)法當(dāng)前第12頁\共有40頁\編于星期二\20點(diǎn)統(tǒng)計(jì)數(shù)據(jù)的間接來源1.公開出版物:《中國統(tǒng)計(jì)年鑒》、《中國統(tǒng)計(jì)摘要》、《中國社會(huì)統(tǒng)計(jì)年鑒》、《中國工業(yè)經(jīng)濟(jì)統(tǒng)計(jì)年鑒》、《中國農(nóng)村統(tǒng)計(jì)年鑒》、《中國人口統(tǒng)計(jì)年鑒》、《中國市場統(tǒng)計(jì)年鑒》、《世界經(jīng)濟(jì)年鑒》、《國外經(jīng)濟(jì)統(tǒng)計(jì)資料》、《世界發(fā)展報(bào)告》……Internet

2.

網(wǎng)絡(luò)中國統(tǒng)計(jì)年鑒2001中國人口統(tǒng)計(jì)年鑒中國市場統(tǒng)計(jì)年鑒世界發(fā)展報(bào)告世界經(jīng)濟(jì)年檢工業(yè)普查數(shù)據(jù)中國統(tǒng)計(jì)出版社當(dāng)前第13頁\共有40頁\編于星期二\20點(diǎn)統(tǒng)計(jì)數(shù)據(jù)的整理一、統(tǒng)計(jì)分組

根據(jù)統(tǒng)計(jì)研究的目的和客觀現(xiàn)象的內(nèi)在特點(diǎn),按某個(gè)標(biāo)(或幾個(gè)標(biāo)志)把被研究的總體劃分為若干個(gè)不同性質(zhì)的組,稱為統(tǒng)計(jì)分組。例:某班學(xué)生按考試成績分組當(dāng)前第14頁\共有40頁\編于星期二\20點(diǎn)二、頻數(shù)分布與頻率分布將數(shù)據(jù)按其分組標(biāo)志進(jìn)行分組的過程,就是頻數(shù)分布和頻率分布形成的過程。表示各組的單位的次數(shù)稱為頻數(shù),各組次數(shù)與總次數(shù)之比稱為頻率。當(dāng)前第15頁\共有40頁\編于星期二\20點(diǎn)二、頻數(shù)分布與頻率分布頻數(shù)分布就是觀察值按其分組標(biāo)志分配在各組內(nèi)的次數(shù),由分組標(biāo)志序列和各組相對(duì)應(yīng)的分布次數(shù)兩個(gè)要素構(gòu)成。由分組標(biāo)志序列和各組相應(yīng)的頻率構(gòu)成頻率分布。當(dāng)前第16頁\共有40頁\編于星期二\20點(diǎn)當(dāng)所觀察的次數(shù)很多,組距很小并且組數(shù)很多時(shí),所繪出的折線圖就會(huì)越來越光滑,逐漸形成一條光滑的曲線,這種曲線即頻數(shù)分布曲線,反映了數(shù)據(jù)的分布規(guī)律。當(dāng)前第17頁\共有40頁\編于星期二\20點(diǎn)三、累積頻數(shù)分布與頻率分布為了統(tǒng)計(jì)分析的需要,有時(shí)要觀察某一數(shù)值以上或某一數(shù)值以下頻數(shù)或頻率之和,這就需要繪出累積頻數(shù)或累計(jì)頻率。在SPSS中對(duì)下數(shù)據(jù)進(jìn)行頻數(shù)(率)分析當(dāng)前第18頁\共有40頁\編于星期二\20點(diǎn)1.定義工人編號(hào)和加工零件數(shù)的變量名分別為NO和X,然后輸入變量NO和X的原始數(shù)據(jù)。當(dāng)前第19頁\共有40頁\編于星期二\20點(diǎn)2.選擇[Analyze]=>[DescriptiveStatistics]=>[Frequencies...],彈出[Frequencies]主對(duì)話框。當(dāng)前第20頁\共有40頁\編于星期二\20點(diǎn)現(xiàn)欲X進(jìn)行頻數(shù)分析,在對(duì)話框左側(cè)的變量列表中選X,單擊按鈕使之進(jìn)入[Variable(s)]列表框,并選擇[DisplayFrequencyTables]顯示頻數(shù)分布表。當(dāng)前第21頁\共有40頁\編于星期二\20點(diǎn)3.可單擊[Format...]按鈕彈出[Frequencies:Format]子對(duì)話框根據(jù)數(shù)值大小按升序從小到大作頻數(shù)分布數(shù)值大小按降序從大到小作頻數(shù)分布頻數(shù)多少按升序從少到多作頻數(shù)分布頻數(shù)多少按降序從多到少作頻數(shù)分布當(dāng)前第22頁\共有40頁\編于星期二\20點(diǎn)4.可單擊[Statistics...]按鈕,彈出[Frequencies:Statistics]子對(duì)話框,并單擊相應(yīng)項(xiàng)目,在作頻數(shù)表分析的基礎(chǔ)上,附帶作各種統(tǒng)計(jì)指標(biāo)的描述,特別是可進(jìn)行任何水平的百分位數(shù)計(jì)算。這里不選。5.可單擊[Charts...]鈕,彈出[Frequencies:Charts]子對(duì)話框,當(dāng)前第23頁\共有40頁\編于星期二\20點(diǎn)用戶可選三種圖形:直條圖(Barchart)、餅圖(PieCharts)和直方圖(Histogram)。這里選擇[Histogram]項(xiàng),并選擇[WithNormalCurve]要求繪制正態(tài)曲線。單擊[Continue]按鈕返回[Frequencies]主對(duì)話框,再單擊[OK]鈕即可得到(累計(jì))頻數(shù)(頻率)分布表和直方圖。當(dāng)前第24頁\共有40頁\編于星期二\20點(diǎn)輸出結(jié)果頻數(shù)(率)分布表當(dāng)前第25頁\共有40頁\編于星期二\20點(diǎn)加工零件數(shù)當(dāng)前第26頁\共有40頁\編于星期二\20點(diǎn)應(yīng)該注意的是,SPSS在未特別指定的情形下,直方圖或頻數(shù)分布表是按照原始數(shù)值逐一作頻數(shù)分布的,這與日常需要的等距分組、且組數(shù)保持在一定數(shù)目的要求不符。在調(diào)用[Frequencies]統(tǒng)計(jì)過程命令之前,可先對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處:已知最小值為84,最大值為128,全距為10,故可要求分成5組,起點(diǎn)為80,組距為10。選擇[Transform]=>[Recode]=>[IntoDifferentVariable...],在彈出的[RecodeIntoDifferentVariable]對(duì)話框中選定X,單擊按鈕使之進(jìn)入[NumericVariable→OutputVariable]列表框,在[OutputVariable]欄的[Name]文本框中輸入x1,單擊[Change]按鈕表示新生成的變量名為x1。單擊[OldandNewValues]按鈕彈出[RecodeIntoDifferentVariable:OldandNewValues]子對(duì)話框,在[OldValue]選項(xiàng)中單擊[Range]項(xiàng),輸入第一個(gè)分組的數(shù)值范圍:80~89,在[Newvalue]欄內(nèi)輸入新值:80,單擊[Add]按鈕.

依此將各組的范圍及對(duì)應(yīng)的新值逐一輸入,最后單擊[Continue]按鈕返回,再單擊[OK]按鈕即完成。系統(tǒng)在原數(shù)據(jù)庫中生成一新變量為x1,這時(shí)再調(diào)用[Frequencies]統(tǒng)計(jì)過程將輸出等距分組且組數(shù)為5的頻數(shù)分布表。當(dāng)前第27頁\共有40頁\編于星期二\20點(diǎn)統(tǒng)計(jì)數(shù)據(jù)的描述作為統(tǒng)計(jì)數(shù)據(jù)的代表值,一個(gè)是分布的中心,反映分布的集中趨勢(shì),另一個(gè)是分布的形狀,反映分布的離散程度。這些代表性的數(shù)量特征值精確地描述出不同的統(tǒng)計(jì)數(shù)據(jù)分布。一、分布的中心眾數(shù)(mode)在正態(tài)分布和一般的偏態(tài)分布中,分布曲線最高點(diǎn)所對(duì)應(yīng)的數(shù)值即是眾數(shù)。如果沒有明顯的最高點(diǎn),眾數(shù)可以不存在。當(dāng)然,如果有兩個(gè)最高點(diǎn),也可以有兩個(gè)眾數(shù)。當(dāng)前第28頁\共有40頁\編于星期二\20點(diǎn)中位數(shù)(median)與分位數(shù)中位數(shù)是數(shù)據(jù)排序后,位置在最中間的數(shù)值。與中位數(shù)相似的還有四分位數(shù)(quartiles)、十分位數(shù)(decile)和百分位數(shù)(percentile)。中位數(shù)是將統(tǒng)計(jì)分布從中間分成相等的兩部分,而四分位數(shù)就是將數(shù)據(jù)分布四等分的三個(gè)數(shù)值,其中中間的四分位數(shù)就是中位數(shù)。十分位數(shù)和百分位數(shù)分別是將數(shù)據(jù)分布十等分和一百等分的數(shù)值。平均數(shù)(均值)(mean)平均數(shù)是數(shù)據(jù)集中趨勢(shì)的最主要測(cè)度值當(dāng)前第29頁\共有40頁\編于星期二\20點(diǎn)三個(gè)中心度量的比較當(dāng)前第30頁\共有40頁\編于星期二\20點(diǎn)二、分布的形狀用于描述數(shù)據(jù)分布形狀即分布關(guān)于其中心的波動(dòng)程度的代表值有:極差、內(nèi)距、方差和標(biāo)準(zhǔn)等,它們描述了分布的離散程度和差異程度。(一)極差(range)極差也稱為全距,是最大值與最小值之間的距離,它是數(shù)據(jù)離散或差異程度的最簡單測(cè)度值,即例如,在前面的數(shù)據(jù)中,極差為128-84=44(件)。顯然,數(shù)據(jù)的離散程度大,極差就越大。極差雖然很容易計(jì)算,但它只告訴我們數(shù)據(jù)分布范圍,至于分布的中間部分是如何變化的則不得而知。而且它受極端值的影響可能是很大的。當(dāng)前第31頁\共有40頁\編于星期二\20點(diǎn)(二)內(nèi)距(Inter-QuartileRange,IQR)內(nèi)距又稱為四分位差,是兩個(gè)四分位數(shù)之差,IQR=高四分位數(shù)—低四分位數(shù)。若內(nèi)距比較小,則說明數(shù)據(jù)比較集中在中位數(shù)附近;反之則比較分散。內(nèi)距常和中位數(shù)一起用來描述一個(gè)定距特別是定序測(cè)量數(shù)據(jù)的分布。(三)方差(variance)和標(biāo)準(zhǔn)差(standarddeviation)方差是離差平方的平均數(shù),即或當(dāng)前第32頁\共有40頁\編于星期二\20點(diǎn)三、偏度與峰度(一)偏度(skewness)所謂偏度是指反映頻數(shù)分布偏態(tài)方向和程度的測(cè)度。在頻數(shù)分布中,最大集中點(diǎn)以上(頻數(shù)曲線圖橫軸上眾數(shù)的右邊)的頻數(shù)占總頻數(shù)的一半多,稱為右偏或正偏。最大集中點(diǎn)以下(頻數(shù)曲線圖橫軸上眾數(shù)的左邊)的頻數(shù)占總頻數(shù)的一半多,稱為左偏或負(fù)偏。偏度的計(jì)算公式為:當(dāng)前第33頁\共有40頁\編于星期二\20點(diǎn)(二)峰度(kurtosis)所謂峰度,是指頻數(shù)分布曲線高峰的形態(tài),即反映分布曲線的尖峭程度的測(cè)度。峰度的計(jì)算公式為當(dāng)β=0時(shí),表示分布的峰度是正態(tài)分布的峰度;當(dāng)β>0時(shí),表示分布曲線的高峰是尖頂高峰;當(dāng)β<0時(shí),表示分布曲線的高峰是平頂高峰。當(dāng)前第34頁\共有40頁\編于星期二\20點(diǎn)四、SPSS操作在SPSS中計(jì)算上例各種指標(biāo)的步驟為:(一)定義加工零件數(shù)的變量名為X,并輸入原始數(shù)據(jù)。(二)選擇[Analyze]=>[DescriptiveStatistics]=>[Descriptives...],打開[Descriptives]主對(duì)話框。當(dāng)前第35頁\共有40頁\編于星期二\20點(diǎn)打開[Descriptives]主對(duì)話框。在主對(duì)話框左邊列表中選定變量X,單擊按鈕使之進(jìn)入[Variables(s)]列表框。當(dāng)前第36頁\共有40頁\編于星期二\20點(diǎn)(三)單擊[Options...]按鈕,打開[Descriptives:Options]子對(duì)話框。選擇均值(Mean)、總和(Sum)、標(biāo)準(zhǔn)差(Std.Deviation)、方差(Variance)、極差(Range)、最小值(Minimum)、最大值(Maximum)、偏度(Skewness)和峰度(Kurtosis),選好后單擊[Continue]按鈕返回[Descriptives]主對(duì)話框,再單擊[OK]按鈕即可得到各種統(tǒng)計(jì)量的計(jì)算結(jié)果。當(dāng)前第37頁\共有40頁\編于星

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論