實(shí)驗(yàn)四描述性統(tǒng)計(jì)分析_第1頁(yè)
實(shí)驗(yàn)四描述性統(tǒng)計(jì)分析_第2頁(yè)
實(shí)驗(yàn)四描述性統(tǒng)計(jì)分析_第3頁(yè)
實(shí)驗(yàn)四描述性統(tǒng)計(jì)分析_第4頁(yè)
實(shí)驗(yàn)四描述性統(tǒng)計(jì)分析_第5頁(yè)
已閱讀5頁(yè),還剩10頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

試驗(yàn)四描述性統(tǒng)計(jì)分析數(shù)據(jù)的特征和測(cè)度數(shù)據(jù)的特征和測(cè)度集中趨勢(shì)離散程度分布的外形異眾比率眾偏態(tài)數(shù)四分位差中位數(shù)方差和標(biāo)準(zhǔn)差均值峰度離散系數(shù)一、集中趨勢(shì)的測(cè)度定類數(shù)據(jù):眾數(shù)定距和定比數(shù)據(jù):均值眾數(shù)、中位數(shù)和均值的比較一組數(shù)據(jù)向其中心值靠攏的傾向和程度測(cè)度集中趨勢(shì)就是查找數(shù)據(jù)一般水平的代表值或中心值不同類型的數(shù)據(jù)用不同的集中趨勢(shì)測(cè)度值數(shù)據(jù)的集中趨勢(shì)測(cè)度值并不適用于低層次的測(cè)量數(shù)據(jù)確定眾數(shù)〔Mode〕1、集中趨勢(shì)的測(cè)度值之一2、消滅次數(shù)最多的變量值3、不受極端值的影響4、可能沒(méi)有眾數(shù)或有幾個(gè)眾數(shù)5、主要用于定類數(shù)據(jù),也可用于定序數(shù)據(jù)和數(shù)值型數(shù)據(jù)中位數(shù)(Median)6、集中趨勢(shì)的測(cè)度值之一7、排序后處于中間位置上的值505050%Me8、不受極端值的影響9、主要用于定序數(shù)據(jù),也可用數(shù)值型數(shù)據(jù),但不能用于定類數(shù)據(jù)10、 各變量值與中位數(shù)的離差確定值之和最小,即四分位數(shù)(Quartiles)集中趨勢(shì)的測(cè)度值之一252525252525QL QM QU不受極端值的影響主要用于定序數(shù)據(jù),也可用于數(shù)值型數(shù)據(jù),但不能用于定類數(shù)據(jù)均值〔Mean〕集中趨勢(shì)的測(cè)度值之一最常用的測(cè)度值一組數(shù)據(jù)的均衡點(diǎn)所在易受極端值的影響用于數(shù)值型數(shù)據(jù),不能用于定類數(shù)據(jù)和定序數(shù)據(jù)眾數(shù)、中位數(shù)和均值的關(guān)系均值中位數(shù)眾數(shù) 均值=中位數(shù)=眾數(shù) 眾數(shù)中位數(shù)均值左偏分布 對(duì)稱分布 右偏分布二、離散程度的測(cè)度定類數(shù)據(jù):異眾比率定序數(shù)據(jù):四分位差定距和定比數(shù)據(jù):方差及標(biāo)準(zhǔn)差異眾比率離散程度的測(cè)度值之一非眾數(shù)組的頻數(shù)占總頻數(shù)的比率僅用于定類數(shù)據(jù)用于衡量眾數(shù)的代表性四分位差離散程度的測(cè)度值之一也稱為內(nèi)距或四分間距上四分位數(shù)與下四分位數(shù)之差QD=QU-QL50%數(shù)據(jù)的離散程度不受極端值的影響用于衡量中位數(shù)的代表性方差和標(biāo)準(zhǔn)差〔VarianceandStd。deviation〕離散程度的測(cè)度值之一最常用的測(cè)度值反映了數(shù)據(jù)的分布反映了各變量值與均值的平均差異為樣本方差或標(biāo)準(zhǔn)差〔kurtosis〕數(shù)據(jù)分布偏斜程度的測(cè)度偏態(tài)系數(shù)=0為對(duì)稱分布偏態(tài)系數(shù)>0為右偏分布偏態(tài)系數(shù)<0為左偏分布峰度(skewness)數(shù)據(jù)分布扁平程度的測(cè)度峰度系數(shù)=3扁平程度適中偏態(tài)系數(shù)<3為扁平分布偏態(tài)系數(shù)>3為尖峰分布三、描述統(tǒng)計(jì)量的軟件實(shí)現(xiàn)1、Excel即可輸出大局部描述統(tǒng)計(jì)量。EXCEL平均122.98標(biāo)準(zhǔn)誤差1.14中值(中位數(shù))123模式(眾數(shù))122標(biāo)準(zhǔn)偏差8.03樣本方差64.43峰值-0.41偏斜度0.00區(qū)域(極差)32最小值107最大值139求和6149計(jì)數(shù)50最大(1)139最小(1)107置信度(95.0%)2.282、SPSSSPSSStatistics面的四個(gè)過(guò)程:Frequencies過(guò)程的特色是產(chǎn)生頻數(shù)表;Descriptives過(guò)程則進(jìn)展一般性的統(tǒng)計(jì)描述;Explore過(guò)程用于對(duì)數(shù)據(jù)概況不清時(shí)的探究性分析;Crosstabs過(guò)程則完成計(jì)數(shù)資料和等級(jí)資料的統(tǒng)計(jì)描述和一般的統(tǒng)計(jì)檢驗(yàn);X2檢驗(yàn)也在其中完成。Frequencies此過(guò)程可以便利地對(duì)數(shù)據(jù)按組進(jìn)展歸類整理,形成各變量的不同水平的頻數(shù)步分析?!維tatistics按鈕】 位數(shù)(Quartiles)、每隔指定百分位輸出當(dāng)前百分位數(shù)(Cutpointsfor (Percentiles),如直P2.5P97.5; (Mean)、中位數(shù)(Median)、眾數(shù)(Mode)、總和(Sum);Dispersion復(fù)選框組用于定義描述離散趨勢(shì)的一組指標(biāo):標(biāo)準(zhǔn)差(Std.deviation)、方差(Variance)(Range)、最小值(Minimum)、最大值(Maximum)、均值標(biāo)準(zhǔn)誤差(S.E.mean);Distribution〔Skewness〕和峰度系數(shù)(Kurtosis); 并且具體數(shù)值是組中值時(shí),選中該復(fù)選框以通知SPSS,免得它犯錯(cuò)誤?!綜hart按鈕】Charttype〔BarHistogram〕,其中直方圖還可以選擇是否加上正態(tài)曲線〔Withnormalcurve〕;ChartValues〔即影響縱坐標(biāo)刻度〕。例4.1利用房?jī)r(jià)原始數(shù)據(jù)圖.Sav繪制頻數(shù)表、直方圖,計(jì)算均數(shù)、標(biāo)準(zhǔn)差、中M、p2.5p97.5。Analyze==>DescriptiveStatistics==>FrequenciesVariablesPriceStatistics鈕:Mean、Std.deviation、MedianContinueChartsBarchartsContinueOK。priceNMeanMedianStd.Deviation

StatisticsValidMissing

1050220.72213.0047.108Percentiles2.5134.1097.5326.35N1050Mean=220.72Median=213.00,標(biāo)準(zhǔn)差STD=47.108,P2.5=134.10,P97.5=326.35。案例1:利用居民儲(chǔ)蓄調(diào)查表數(shù)據(jù)進(jìn)展頻數(shù)分析,實(shí)現(xiàn):目標(biāo)一:分析儲(chǔ)戶的戶口和職業(yè)的根本狀況;頻數(shù)的降序輸出,戶口按餅圖輸出,職業(yè)按條形圖輸出;〔取〕款金額的分布,并對(duì)城鎮(zhèn)儲(chǔ)戶和農(nóng)村儲(chǔ)戶進(jìn)展比較。提示:由于存〔取〕款金額數(shù)據(jù)為定距型變量,直接承受頻數(shù)分析不利于對(duì)〔Transform→Record〕對(duì)數(shù)據(jù)分組后再編制頻數(shù)分布表;〔取位數(shù),并通過(guò)四分位數(shù)比較兩者分布上的差異。Descriptives過(guò)程算術(shù)和、標(biāo)準(zhǔn)差、最大值、最小值等,且可將原始數(shù)據(jù)轉(zhuǎn)換成標(biāo)準(zhǔn)Z分值〔標(biāo)準(zhǔn)正態(tài)評(píng)分值〕并存入數(shù)據(jù)庫(kù)。選擇菜單Analyze==>descriptive==>Descriptives對(duì)話框的界面如下所示:valuesasvariables確定是否將原始數(shù)據(jù)的標(biāo)準(zhǔn)正態(tài)評(píng)分存為變量。案例2:利用居民儲(chǔ)蓄調(diào)查表數(shù)據(jù)計(jì)算根本描述統(tǒng)計(jì)量,實(shí)現(xiàn):〔取〕款金額的根本描述統(tǒng)計(jì)量,并分別對(duì)城鎮(zhèn)儲(chǔ)戶和農(nóng)村儲(chǔ)戶進(jìn)展比較;提示:首先依據(jù)戶口對(duì)數(shù)據(jù)進(jìn)展拆分;〔取〕款的數(shù)量是否存在不均衡現(xiàn)象。提示:可以從分析金額是否有大量特別值入手;SaveStandardizedAsVariables項(xiàng),將自動(dòng)計(jì)算存〔取〕Za5;高金額組〕后進(jìn)展頻數(shù)分析;〔即低特別值組〕和高金額組〔即高特別值組〕的比例,如特別組0.3%,即認(rèn)為存〔取〕款金額存在肯定的不均衡現(xiàn)象。Explore過(guò)程1.檢查數(shù)據(jù)是否有錯(cuò)誤2.數(shù)值的分布特征3.對(duì)數(shù)據(jù)的規(guī)律的初步觀看選擇菜單Analyze==>descriptive==>Explore對(duì)話框的界面如下所示:【Display用于選擇輸出結(jié)果中是否包含統(tǒng)計(jì)描述、統(tǒng)計(jì)圖或兩者均包括?!綝ependentList用于選入需要分析的變量?!綟actorList框】假設(shè)想讓所分析的變量按某種因素取值分組分析,則在這里選入分組變量?!綥abelcasesbyID號(hào)的變量?!維tatisticsStatistics M-estimators復(fù)選框:作中心趨勢(shì)的粗略最大似然確定,輸出四個(gè)不同權(quán)重的最大似然確定數(shù)。OutliersPercentiles5%10%2550%75%9095%位數(shù)。【Plot彈出Plot對(duì)話框,用于選擇所需要的統(tǒng)計(jì)圖。有如下選項(xiàng): (Factorlevelstogether),也可以不分組一起繪制(Depentendstogether),或者不繪制(None)。Descriptive(Stem-and-leaf)和直方圖(Histogram)。 否符合正態(tài)分布的檢驗(yàn)。Spreadvs.LevelwithLeveneTest組間方差齊性檢驗(yàn)?!綩ptions某統(tǒng)計(jì)量時(shí)有缺失值的記錄,或報(bào)告缺失值。StatisticStd.ErrorpriceMean95%ConfidenceLowerIntervalforMeanUpperBoundBound220.72211.61229.844.5975%TrimmedMean219.55Median213.00Variance2219.125Std.Deviation47.108Minimum125Maximum345Range220InterquartileRange65Skewness.473.236Kurtosis-.274.467priceStem&Leaf1.2231.Stem&Leaf1.2231.4551.66677777777777771.888888888889999999992.000000000011112.222222222333332.44444444555552.666667772.88999993.01113.223.003.0016.0020.0014.0014.0013.008.007.004.002.001.00 3.4Stemwidth: 100Eachleaf: 1case(s)以上是莖葉圖,整數(shù)位為莖,小數(shù)位為葉。這樣可以格外直觀的看出數(shù)據(jù)的分布范圍及形態(tài),在國(guó)外格外流行。350300250200150100price以上是箱線圖,中間的黑粗線為均數(shù),紅框?yàn)樗姆治婚g距的范圍,上下兩個(gè)細(xì)線為最大、最小值。案例3:利用居民儲(chǔ)蓄調(diào)查表數(shù)據(jù)分析儲(chǔ)戶存〔取〕款金額的分布狀況。Crosstabs〔列聯(lián)表分析〕Crosstabs特征,進(jìn)而分析變量之間的相互影響和關(guān)系。稱列聯(lián)表分析或穿插分組下的頻數(shù)分析。兩大根本任務(wù):依據(jù)收集到的樣本數(shù)據(jù)編制二維或多維穿插列聯(lián)表;。Crosstabs〔單變量頻數(shù)表〕,該功能由Frequencies穿插列聯(lián)表的卡方檢驗(yàn):檢驗(yàn)行變量和列變量是否獨(dú)立?列變量獨(dú)立;Pearson確定顯著性水平和臨界值;結(jié)論和決策。方法一:假設(shè)卡方的觀測(cè)值大于卡方臨界值,可拒絕零假設(shè);α,拒絕零假設(shè)。SPSSSPSSP 策方式進(jìn)展決策。事實(shí)上,全部的假設(shè)檢驗(yàn)均是這樣進(jìn)展的。例4.2利用下表格數(shù)據(jù),進(jìn)展列聯(lián)表分析。處理愈合未愈合合計(jì)呋喃硝胺54862甲氰咪胍442064合計(jì)9828126量――行變量、列變量和指示每個(gè)格子中頻數(shù)的變量,然后用WeightCases對(duì)CrosstabsX2R、CW,則數(shù)據(jù)集構(gòu)造和命令如下:RCW1.001.0054.001.002.0044.002.001.008.002.002.0020.00Data==>WeightCasesWeightCasesbyFreqencyVariableWOKAnalyze==>DescriptiveStatistics==>CrosstabsRowsRColumnsCStatisticsChi-squareContinueOK從左到右為:檢驗(yàn)統(tǒng)計(jì)量值(Value)、自由度(df)、雙側(cè)近似概率(Asymp.Sig.2-sided)、雙側(cè)準(zhǔn)確概率(ExactSig.2-sided)、單側(cè)準(zhǔn)確概率(ExactSig.1-sided);Chi-Square〕、連續(xù)性校正的卡方值(ContinuityCorrection)、對(duì)數(shù)似然比方法計(jì)算的卡方Fisher‘s(Fisher’sExactTest)、線性相LinearAssociation)、有效記錄數(shù)(NofValidCases)。另外,ContinuityCorrectionPearsonab,表格13.78。因此,這里無(wú)須校正,直接承受第一行的檢驗(yàn)結(jié)果,即X2=6.133,P=0.013,如給定顯著性α0.05,由于卡方的頻率pα,因此拒絕零假設(shè),即認(rèn)為兩組方法治療效果有差異。5,則一般不宜使用卡方檢驗(yàn)。在這種狀況下,可以承受似然率卡方檢驗(yàn)等方法進(jìn)展修正。4.3〔職工數(shù)據(jù)〕.savAnalyze==>DescriptiveStatistics==>Crosstabs;〔zc〕Row(s)框,將列變量文化程度(xl)ColumnDisplayclusteredbarcharts選項(xiàng),指定繪制各變量穿插分tables變量間關(guān)系;CellFormat行變量取值的升序排列;Chi-Square案例4:利用居民儲(chǔ)蓄調(diào)查表數(shù)據(jù)進(jìn)展計(jì)算,實(shí)現(xiàn)以下兩個(gè)目標(biāo):持一樣的態(tài)度;提示:列聯(lián)表的行變量為戶口〔a13〕,列變量為將來(lái)收入狀況〔a3〕,在列全都進(jìn)展分析;目標(biāo)二:分析城鎮(zhèn)和農(nóng)村儲(chǔ)戶對(duì)儲(chǔ)蓄是否合算的認(rèn)同是否全都。提示:該分析中列聯(lián)表的行變量為戶口〔a13〕,列變量為什么合算〔a1〕,在列聯(lián)表的根底上進(jìn)展卡方檢驗(yàn)。補(bǔ)充:多項(xiàng)選擇項(xiàng)分析多項(xiàng)選擇項(xiàng)分析是針對(duì)問(wèn)卷調(diào)查中的多項(xiàng)選擇項(xiàng)問(wèn)題的。SPSSSPSS將多項(xiàng)選擇項(xiàng)問(wèn)題分解;〔前面已講過(guò)〕利用前面講到的頻數(shù)分析或穿插分組下的頻數(shù)分析等方法進(jìn)展分析。多項(xiàng)選擇項(xiàng)頻數(shù)分析或多項(xiàng)選擇項(xiàng)穿插分組下的頻數(shù)分析1將多項(xiàng)選擇項(xiàng)問(wèn)題分解并設(shè)置成多個(gè)變量后,指定這些變量為一個(gè)集合。1Analyze==>MultipleResponse==>Definesets;2Variablesinsetscodedascountedvalue哪組值進(jìn)展分析。SpsscategoriesRangethrough取值的最小值和最大值。4、為多項(xiàng)選擇項(xiàng)變量集命名,系統(tǒng)會(huì)自動(dòng)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論