實(shí)驗(yàn)基本描述統(tǒng)計(jì)_第1頁(yè)
實(shí)驗(yàn)基本描述統(tǒng)計(jì)_第2頁(yè)
實(shí)驗(yàn)基本描述統(tǒng)計(jì)_第3頁(yè)
實(shí)驗(yàn)基本描述統(tǒng)計(jì)_第4頁(yè)
實(shí)驗(yàn)基本描述統(tǒng)計(jì)_第5頁(yè)
已閱讀5頁(yè),還剩83頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

實(shí)驗(yàn)基本描述統(tǒng)計(jì)1第一頁(yè),共八十八頁(yè),編輯于2023年,星期六統(tǒng)計(jì)分析軟件的作用統(tǒng)計(jì)分析是數(shù)據(jù)分析的主要工具完整的數(shù)據(jù)分析過(guò)程包括:數(shù)據(jù)的收集數(shù)據(jù)的整理數(shù)據(jù)的分析統(tǒng)計(jì)學(xué)為數(shù)據(jù)分析過(guò)程提供一套完整的科學(xué)的方法論。統(tǒng)計(jì)分析軟件為數(shù)據(jù)分析提供了實(shí)現(xiàn)手段。2第二頁(yè),共八十八頁(yè),編輯于2023年,星期六統(tǒng)計(jì)軟件的種類(lèi)很多。有些功能齊全,有些價(jià)格便宜;有些容易操作,有些需要更多的實(shí)踐才能掌握。還有些是專(zhuān)門(mén)的軟件,只處理某一類(lèi)統(tǒng)計(jì)問(wèn)題。面對(duì)太多的選擇往往給決策帶來(lái)困難。這里介紹最常見(jiàn)的幾種。統(tǒng)計(jì)軟件3第三頁(yè),共八十八頁(yè),編輯于2023年,星期六幾種常用的統(tǒng)計(jì)軟件典型的統(tǒng)計(jì)軟件SASSPSSMINITABEviewsExcelMINITABSTATISTICAExcelSASSPSS4第四頁(yè),共八十八頁(yè),編輯于2023年,星期六SAS:這是功能非常齊全的軟件;盡管價(jià)格相當(dāng)不菲,許多公司,特別是美國(guó)制藥公司,還是因?yàn)槠涔δ鼙姸嗪湍承┟绹?guó)政府機(jī)構(gòu)認(rèn)可而使用。盡管現(xiàn)在已經(jīng)盡量“通俗化”,但仍然需要一定的訓(xùn)練才可以進(jìn)入。也可以對(duì)它編程;但對(duì)于基本統(tǒng)計(jì)課程則不那么方便。Minitab:這個(gè)軟件是很方便的功能強(qiáng)大而又齊全的軟件,在我國(guó)用的不如SPSS與SAS那么普遍。Eviews:一個(gè)主要處理回歸和時(shí)間序列的軟件。采用計(jì)量經(jīng)濟(jì)學(xué)方法與技術(shù),對(duì)社會(huì)經(jīng)濟(jì)關(guān)系與經(jīng)濟(jì)活動(dòng)的數(shù)量規(guī)律進(jìn)行“觀察”,是一個(gè)得到普遍使用計(jì)量經(jīng)濟(jì)學(xué)軟件包。5第五頁(yè),共八十八頁(yè),編輯于2023年,星期六S-PlusS語(yǔ)言(AT&T貝爾實(shí)驗(yàn)室)的后續(xù)發(fā)展極為強(qiáng)大的統(tǒng)計(jì)功能和繪圖能力應(yīng)用上以理論研究、統(tǒng)計(jì)建模為主需要有較好的數(shù)理統(tǒng)計(jì)背景對(duì)編程能力要求極高Excel凡有MicrosoftOffice的計(jì)算機(jī),基本上都裝有Excel。但要注意,必須裝數(shù)據(jù)分析的功能。隨著問(wèn)題的深入,Excel需要使用函數(shù)。專(zhuān)門(mén)一些的統(tǒng)計(jì)推斷問(wèn)題還需要其他專(zhuān)門(mén)的統(tǒng)計(jì)軟件來(lái)處理。6第六頁(yè),共八十八頁(yè),編輯于2023年,星期六SPSS:很受歡迎;容易操作,輸出漂亮,功能齊全,價(jià)格合理。它也有自己的程序語(yǔ)言,但基本上已經(jīng)“通俗化”。對(duì)于非專(zhuān)業(yè)統(tǒng)計(jì)工作者是很好的選擇。7第七頁(yè),共八十八頁(yè),編輯于2023年,星期六SPSS軟件最初全稱為“社會(huì)科學(xué)統(tǒng)計(jì)軟件包”(StatisticalPackageforthesocialScience);隨著SPSS產(chǎn)品服務(wù)領(lǐng)域的擴(kuò)大和服務(wù)深度的增加,SPSS公司于2000年正式將英文全稱更改為“統(tǒng)計(jì)產(chǎn)品與服務(wù)解決方案”(StatisticalProductandServiceSolutions);如今SPSS已出至版本19.0,而且更名為PASWStatistics。SPSS是一個(gè)集數(shù)據(jù)整理、分析過(guò)程、結(jié)果輸出等功能于一身的組合式軟件包,是數(shù)據(jù)處理和統(tǒng)計(jì)領(lǐng)域的國(guó)際標(biāo)準(zhǔn)軟件之一;SPSSForWindows

是SPSS軟件的Windows版本,它具有清晰、直觀、易學(xué)易用、涵蓋面廣的特點(diǎn)。8第八頁(yè),共八十八頁(yè),編輯于2023年,星期六應(yīng)用統(tǒng)計(jì)軟件進(jìn)行分析的基本過(guò)程弄清分析的目的正確收集待處理和分析的數(shù)據(jù)(目的、影響因素的剔除)弄清統(tǒng)計(jì)概念和統(tǒng)計(jì)含義,知道統(tǒng)計(jì)方法的適用范圍。無(wú)需記憶公式選擇一種或幾種統(tǒng)計(jì)分析方法來(lái)探索性地分析數(shù)據(jù)讀懂計(jì)算機(jī)分析的數(shù)據(jù)結(jié)果,發(fā)現(xiàn)規(guī)律,得出結(jié)論9第九頁(yè),共八十八頁(yè),編輯于2023年,星期六從統(tǒng)計(jì)方法的構(gòu)成分類(lèi)統(tǒng)計(jì)方法描述統(tǒng)計(jì)推斷統(tǒng)計(jì)10第十頁(yè),共八十八頁(yè),編輯于2023年,星期六描述統(tǒng)計(jì):是用圖形、表格和概括性的數(shù)字對(duì)數(shù)據(jù)進(jìn)行描述的統(tǒng)計(jì)方法。內(nèi)容:搜集數(shù)據(jù)整理數(shù)據(jù)顯示數(shù)據(jù)

目的描述數(shù)據(jù)特征找出數(shù)據(jù)的基本規(guī)律02550Q1Q2Q3Q4¥=30s2=10511第十一頁(yè),共八十八頁(yè),編輯于2023年,星期六推斷統(tǒng)計(jì):

研究如何根據(jù)樣本數(shù)據(jù)對(duì)總體進(jìn)行估計(jì)、假設(shè)檢驗(yàn)、預(yù)測(cè)和其他推斷的統(tǒng)計(jì)方法。內(nèi)容參數(shù)估計(jì)假設(shè)檢驗(yàn)?zāi)康膶?duì)總體特征作出推斷可靠性測(cè)度樣本總體12第十二頁(yè),共八十八頁(yè),編輯于2023年,星期六實(shí)驗(yàn)內(nèi)容安排軟件:SPSS18.0目的:掌握統(tǒng)計(jì)軟件的基本應(yīng)用實(shí)驗(yàn)1:數(shù)據(jù)文件管理實(shí)驗(yàn)2:基本的統(tǒng)計(jì)描述實(shí)驗(yàn)3:方差分析實(shí)驗(yàn)4:相關(guān)與回歸分析13第十三頁(yè),共八十八頁(yè),編輯于2023年,星期六實(shí)驗(yàn)1:數(shù)據(jù)文件管理§1.1SPSS系統(tǒng)運(yùn)行管理方式§1.2數(shù)據(jù)管理窗口介紹§1.3數(shù)據(jù)文件的建立與管理實(shí)驗(yàn)?zāi)康模赫莆瘴募膭?chuàng)建和整理,包括數(shù)據(jù)的查詢、數(shù)據(jù)排序、篩選等。14第十四頁(yè),共八十八頁(yè),編輯于2023年,星期六§1.1SPSS系統(tǒng)運(yùn)行管理方式完全窗口菜單運(yùn)行方式是在數(shù)據(jù)編輯窗口和輸出觀察窗口中,通過(guò)選用菜單項(xiàng)中的各種功能和工具欄中的圖標(biāo)按鈕來(lái)完成各項(xiàng)統(tǒng)計(jì)功能的一種運(yùn)行方式特點(diǎn):利用對(duì)話框操作,簡(jiǎn)便直觀,特別適用于初學(xué)者和非專(zhuān)業(yè)人員;對(duì)于某些專(zhuān)業(yè)人員來(lái)說(shuō),可能不能充分滿足其需要。15第十五頁(yè),共八十八頁(yè),編輯于2023年,星期六程序運(yùn)行方式是通過(guò)在Syntax(語(yǔ)句)窗口中直接運(yùn)行編寫(xiě)好的程序來(lái)完成各項(xiàng)統(tǒng)計(jì)功能的運(yùn)行方式特點(diǎn):方便已習(xí)慣使用SPSS語(yǔ)言編寫(xiě)程序的用戶使用;能簡(jiǎn)化某些工作,比如,成批次地處理數(shù)據(jù)、重復(fù)相同的統(tǒng)計(jì)分析過(guò)程等;專(zhuān)業(yè)人員可通過(guò)該運(yùn)行方式,使用某些對(duì)話框操作不能實(shí)現(xiàn)的功能?;旌线\(yùn)行方式是完全窗口菜單運(yùn)行方式和程序運(yùn)行方式的結(jié)合,既能簡(jiǎn)化操作,又可以補(bǔ)充單純窗口運(yùn)行管理的不足。16第十六頁(yè),共八十八頁(yè),編輯于2023年,星期六進(jìn)行統(tǒng)計(jì)分析的基本操作步驟:將數(shù)據(jù)輸入SPSS(定義變量、錄入數(shù)據(jù)等),并存盤(pán);進(jìn)行必要的預(yù)分析(進(jìn)行分布圖、均數(shù)、標(biāo)準(zhǔn)差的描述等),以確定應(yīng)采用的統(tǒng)計(jì)分析方法;按分析目的選用統(tǒng)計(jì)程序,執(zhí)行統(tǒng)計(jì)分析過(guò)程;保存和導(dǎo)出分析結(jié)果。第十七頁(yè),共八十八頁(yè),編輯于2023年,星期六菜單欄常用工具欄數(shù)據(jù)欄當(dāng)前單元格§1.2數(shù)據(jù)管理窗口介紹18第十八頁(yè),共八十八頁(yè),編輯于2023年,星期六File(文件操作)完成文件的調(diào)入,存儲(chǔ),顯示和打印等操作Edit(文件編輯)完成文本或數(shù)據(jù)內(nèi)容的選擇、拷貝、粘貼、尋找和替換等操作19第十九頁(yè),共八十八頁(yè),編輯于2023年,星期六View(窗口外觀控制)完成文本或數(shù)據(jù)內(nèi)容的狀態(tài)欄、工具欄、字體、網(wǎng)格線和數(shù)值標(biāo)簽等功能的操作Data(數(shù)據(jù)管理)完成數(shù)據(jù)變量名稱和格式的定義,數(shù)據(jù)資料的選擇、排序、加權(quán)、數(shù)據(jù)文件的轉(zhuǎn)換、連接和匯總等操作20第二十頁(yè),共八十八頁(yè),編輯于2023年,星期六Transform(數(shù)據(jù)轉(zhuǎn)換)完成數(shù)據(jù)值的計(jì)算、重新編碼和缺失值替代等操作Analyze(統(tǒng)計(jì)分析)完成一系列統(tǒng)計(jì)分析的選擇和應(yīng)用21第二十一頁(yè),共八十八頁(yè),編輯于2023年,星期六Graphs(統(tǒng)計(jì)圖表)完成統(tǒng)計(jì)圖表的建立和編輯Utilities(實(shí)用程序)有關(guān)命令解釋、字體選擇、文件信息、定義輸出標(biāo)題和窗口設(shè)計(jì)等Window(窗口控制)可進(jìn)行窗口的排列、選擇和顯示等操作Help(幫助)幫助文件的調(diào)用、查詢和顯示等22第二十二頁(yè),共八十八頁(yè),編輯于2023年,星期六SPSS數(shù)據(jù)文件是一種有結(jié)構(gòu)的數(shù)據(jù)文件,它包括:文件結(jié)構(gòu)數(shù)據(jù)§1.3數(shù)據(jù)文件的建立與管理23第二十三頁(yè),共八十八頁(yè),編輯于2023年,星期六SPSS數(shù)據(jù)文件中的一列數(shù)據(jù)稱為一個(gè)變量,每個(gè)變量都有一個(gè)名稱,即變量名,變量名是存取SPSS每個(gè)變量的唯一標(biāo)識(shí)。SPSS數(shù)據(jù)文件的結(jié)構(gòu)是對(duì)每個(gè)變量及其相關(guān)屬性的描述。一行數(shù)據(jù)稱為一條個(gè)案(Case)或觀測(cè),所有個(gè)案組成了SPSS數(shù)據(jù)文件的數(shù)據(jù)部分。24第二十四頁(yè),共八十八頁(yè),編輯于2023年,星期六建立SPSS數(shù)據(jù)文件應(yīng)通過(guò)兩大步驟實(shí)現(xiàn):第一步:定義SPSS數(shù)據(jù)文件的結(jié)構(gòu);第二步:輸入分析數(shù)據(jù)。定義SPSS數(shù)據(jù)文件的結(jié)構(gòu);包括:變量名、變量類(lèi)型、變量寬度、變量名標(biāo)簽、變量值標(biāo)簽、缺失值、顯示寬度、顯示的對(duì)齊方式、變量的測(cè)度類(lèi)型等信息。

至少要定義變量名和變量類(lèi)型,其他暫時(shí)設(shè)為默認(rèn)值,待分析需要時(shí)再設(shè)置。25第二十五頁(yè),共八十八頁(yè),編輯于2023年,星期六在數(shù)據(jù)編輯窗口中,單擊“變量視圖”的標(biāo)簽進(jìn)行設(shè)置。變量定義完成后,單擊“數(shù)據(jù)視圖”的標(biāo)簽進(jìn)行具體變量值的錄入。26第二十六頁(yè),共八十八頁(yè),編輯于2023年,星期六數(shù)據(jù)編輯在SPSS中,對(duì)數(shù)據(jù)進(jìn)行基本編輯操作的功能集中在“編輯”和“數(shù)據(jù)”菜單中。移動(dòng)指針到指定序號(hào)的觀測(cè)量

【編輯】——【轉(zhuǎn)至個(gè)案】查找指定變量中的指定數(shù)據(jù)

【編輯】——【查找】插入一個(gè)變量

【編輯】——【插入變量】插入一個(gè)觀測(cè)量

【編輯】——【插入個(gè)案】查看變量信息

【實(shí)用程序】——【變量】27第二十七頁(yè),共八十八頁(yè),編輯于2023年,星期六在數(shù)據(jù)窗口單擊【數(shù)據(jù)】【排列個(gè)案】,打開(kāi)對(duì)話框。觀測(cè)數(shù)據(jù)排序28第二十八頁(yè),共八十八頁(yè),編輯于2023年,星期六在統(tǒng)計(jì)分析中,有時(shí)不需要對(duì)所有的觀測(cè)進(jìn)行分析,可能只對(duì)某些特定的對(duì)象有興趣。利用【數(shù)據(jù)】【選擇個(gè)案】,可以實(shí)現(xiàn)。抽樣(篩選)全部個(gè)案:選擇所有數(shù)據(jù);如果條件滿足:按指定條件選擇數(shù)據(jù)。單擊如果按紐,打開(kāi)選擇個(gè)案:If對(duì)話框,先選擇變量,然后定義條件。29第二十九頁(yè),共八十八頁(yè),編輯于2023年,星期六選擇個(gè)案:If對(duì)話框,先選擇變量,然后定義條件。30第三十頁(yè),共八十八頁(yè),編輯于2023年,星期六抽樣(篩選)隨機(jī)個(gè)案樣本:對(duì)觀察值進(jìn)行隨機(jī)抽樣。單擊樣本按紐,打開(kāi)選擇個(gè)案:隨機(jī)樣本對(duì)話框。如圖所示。在樣本尺寸欄中有兩種選擇方式:一種是大約:即鍵入抽樣比例后由系統(tǒng)隨機(jī)抽樣;另一種是精確:要求輸入從第幾個(gè)觀察值起抽取多少數(shù)據(jù)。31第三十一頁(yè),共八十八頁(yè),編輯于2023年,星期六抽樣(篩選)基于時(shí)間或個(gè)案全距:順序抽樣。單擊范圍按紐,打開(kāi)選擇個(gè)案:范圍對(duì)話框,用戶自行定義從第幾個(gè)觀察值開(kāi)始抽到第幾個(gè)觀察值結(jié)束。使用篩選器變量:用指定變量作過(guò)濾。先選擇一個(gè)變量,系統(tǒng)自動(dòng)在數(shù)據(jù)管理器中將該變量值為0的觀測(cè)單位標(biāo)上刪除記號(hào),系統(tǒng)對(duì)標(biāo)有刪除記號(hào)的觀測(cè)單位不作分析。32第三十二頁(yè),共八十八頁(yè),編輯于2023年,星期六實(shí)驗(yàn)2:基本的統(tǒng)計(jì)描述作為一條普遍的規(guī)則,當(dāng)一批數(shù)據(jù)中的數(shù)據(jù)有20個(gè)左右或者更多的時(shí)候,就應(yīng)該制作表格或者圖表。這樣,數(shù)據(jù)的重要特征就能從表格或者圖表中反映出來(lái)。其目標(biāo)也是提高數(shù)據(jù)分析和數(shù)據(jù)解釋的效率——這是決策過(guò)程的兩個(gè)關(guān)鍵方面。33第三十三頁(yè),共八十八頁(yè),編輯于2023年,星期六在建立了數(shù)據(jù)文件之后,需要對(duì)數(shù)據(jù)作進(jìn)一步的考察,如了解數(shù)據(jù)的基本特征,如數(shù)據(jù)的均值、標(biāo)準(zhǔn)差、四分位點(diǎn),數(shù)據(jù)的分布形態(tài)等,這個(gè)過(guò)程稱為對(duì)數(shù)據(jù)進(jìn)行基本統(tǒng)計(jì)描述。所以說(shuō),數(shù)據(jù)的基本統(tǒng)計(jì)描述的目的是:了解數(shù)據(jù)的基本特征和基本分布形狀,為進(jìn)一步分析做好充分準(zhǔn)備。34第三十四頁(yè),共八十八頁(yè),編輯于2023年,星期六數(shù)值描述分布的形狀集中趨勢(shì)離散程度眾數(shù)中位數(shù)平均值標(biāo)準(zhǔn)誤差方差峰態(tài)標(biāo)準(zhǔn)差全距偏態(tài)35第三十五頁(yè),共八十八頁(yè),編輯于2023年,星期六眾數(shù):在總體中出現(xiàn)次數(shù)最多的那個(gè)標(biāo)志值不受極端值影響具有不惟一性數(shù)據(jù)分布偏斜程度較大時(shí)應(yīng)用中位數(shù):一組排序的數(shù)據(jù)中,在中間位置上的數(shù)據(jù)不受極端值影響數(shù)據(jù)分布偏斜程度較大時(shí)應(yīng)用均值:全部數(shù)據(jù)的算術(shù)平均易受極端值影響數(shù)學(xué)性質(zhì)優(yōu)良數(shù)據(jù)對(duì)稱分布或接近對(duì)稱分布時(shí)應(yīng)用集中趨勢(shì)的測(cè)度值:36第三十六頁(yè),共八十八頁(yè),編輯于2023年,星期六數(shù)據(jù)類(lèi)型和所適用的集中趨勢(shì)測(cè)度值定類(lèi)數(shù)據(jù)定序數(shù)據(jù)數(shù)量數(shù)據(jù)適用的測(cè)度值眾數(shù)*眾數(shù)眾數(shù)中位數(shù)*中位數(shù)均值*幾何平均數(shù)調(diào)和平均數(shù)*表示最適合37第三十七頁(yè),共八十八頁(yè),編輯于2023年,星期六全距:最大值與最小值的差計(jì)算方便,易于理解只考慮兩端數(shù)據(jù),比較粗略方差:離差平方的平均數(shù)準(zhǔn)確反映數(shù)據(jù)的離散程度數(shù)據(jù)離散程度的最常用測(cè)度值標(biāo)準(zhǔn)差:離差平方平均數(shù)的平方根準(zhǔn)確反映數(shù)據(jù)的離散程度具有量綱,實(shí)際意義清楚數(shù)據(jù)離散程度的最常用測(cè)度值離散程度的測(cè)度值:38第三十八頁(yè),共八十八頁(yè),編輯于2023年,星期六數(shù)據(jù)類(lèi)型和所適用的離散程度測(cè)度值定類(lèi)數(shù)據(jù)定序數(shù)據(jù)數(shù)量數(shù)據(jù)適用的測(cè)度值異眾比率*異眾比率異眾比率四分位差*四分位差

極差、平均差方差、標(biāo)準(zhǔn)差*離散系數(shù)*(比較)*表示最適合39第三十九頁(yè),共八十八頁(yè),編輯于2023年,星期六偏態(tài):分布偏斜方向及程度偏態(tài)系數(shù)

SK=0為對(duì)稱分布偏態(tài)系數(shù)SK>0

為右偏分布偏態(tài)系數(shù)SK<0

為左偏分布SK的絕對(duì)值越大,表示偏斜的程度就越大分布的形狀:左偏分布均值

中位數(shù)

眾數(shù)fx右偏分布眾數(shù)

中位數(shù)均值fx40第四十頁(yè),共八十八頁(yè),編輯于2023年,星期六峰度:分布集中趨勢(shì)高峰的形狀峰態(tài)系數(shù)K=0標(biāo)準(zhǔn)正態(tài)分布峰態(tài)系數(shù)K<0為扁平分布峰態(tài)系數(shù)K>0為尖峰分布分布的形狀:扁平分布尖峰分布與標(biāo)準(zhǔn)正態(tài)分布比較!41第四十一頁(yè),共八十八頁(yè),編輯于2023年,星期六1.描述統(tǒng)計(jì)分析2.頻數(shù)分析3.探索分析4.列聯(lián)表5.統(tǒng)計(jì)圖42第四十二頁(yè),共八十八頁(yè),編輯于2023年,星期六1.描述統(tǒng)計(jì)分析描述統(tǒng)計(jì)分析是對(duì)數(shù)據(jù)進(jìn)行基礎(chǔ)性描述的過(guò)程??梢酝ㄟ^(guò)計(jì)算均值、算術(shù)和、標(biāo)準(zhǔn)差、極值、方差、均值、標(biāo)準(zhǔn)誤等統(tǒng)計(jì)量來(lái)描述樣本數(shù)據(jù)的集中趨勢(shì)、離散趨勢(shì)及分布特征;描述統(tǒng)計(jì)分析過(guò)程,可通過(guò)分析對(duì)話框(分析描述統(tǒng)計(jì)描述)來(lái)具體實(shí)現(xiàn)。43第四十三頁(yè),共八十八頁(yè),編輯于2023年,星期六例2.1以某年全國(guó)職工平均工資表為例(SY-11),要求對(duì)其進(jìn)行簡(jiǎn)單的描述統(tǒng)計(jì)分析。具體操作步驟如下:1、首先打開(kāi)數(shù)據(jù)表SY-11,按照分析(Analyze)描述統(tǒng)計(jì)(DescriptivesStatistics)

描述(Descriptives),打開(kāi)對(duì)話框,如圖所示。從左邊源變量中選擇一個(gè)或者幾個(gè)變量進(jìn)入右框中計(jì)算并保存所選變量的標(biāo)準(zhǔn)化值,公式為44第四十四頁(yè),共八十八頁(yè),編輯于2023年,星期六2.單擊選項(xiàng)Options按鈕,打開(kāi)Options對(duì)話框,如圖所示:在此例中選擇按平均值升序項(xiàng),返回主對(duì)話框,單擊OK,在輸出窗口得描述統(tǒng)計(jì)分析輸出表。45第四十五頁(yè),共八十八頁(yè),編輯于2023年,星期六輸出結(jié)果:標(biāo)準(zhǔn)化值46第四十六頁(yè),共八十八頁(yè),編輯于2023年,星期六2.頻數(shù)分析利用頻數(shù)分析可以方便地對(duì)數(shù)據(jù)按組進(jìn)行歸類(lèi)整理;形成各變量的不同水平(分組)的頻數(shù)分布表及圖形,以便對(duì)各變量的數(shù)據(jù)特征和觀測(cè)量的分布狀況有一個(gè)概括的認(rèn)識(shí);47第四十七頁(yè),共八十八頁(yè),編輯于2023年,星期六48第四十八頁(yè),共八十八頁(yè),編輯于2023年,星期六例2.2數(shù)據(jù)文件SY-12是一個(gè)公司職員表,其中有性別、年齡,受教育年限等五個(gè)變量,具體操作如下:

1、打開(kāi)數(shù)據(jù)文件SY-12后,單擊分析描述統(tǒng)計(jì)頻率(Frequencies),打開(kāi)頻數(shù)分析對(duì)話框。2、在左邊的變量框中選中一個(gè)或多個(gè)變量。3、選中顯示頻率表格。49第四十九頁(yè),共八十八頁(yè),編輯于2023年,星期六4、單擊統(tǒng)計(jì)量按鈕,得到對(duì)話框圖。在頻率:統(tǒng)計(jì)量對(duì)話框中選擇要求輸出的統(tǒng)計(jì)量。50第五十頁(yè),共八十八頁(yè),編輯于2023年,星期六5、單擊圖表(Chart)按鈕,得到對(duì)話框圖選擇直方圖51第五十一頁(yè),共八十八頁(yè),編輯于2023年,星期六6、單擊格式(Format)按鈕,得到對(duì)話框圖。本例中均選擇系統(tǒng)默認(rèn)項(xiàng)52第五十二頁(yè),共八十八頁(yè),編輯于2023年,星期六輸出結(jié)果:點(diǎn)擊OK53第五十三頁(yè),共八十八頁(yè),編輯于2023年,星期六從表和直方圖中可以觀察到該公司32歲至47歲之間的人數(shù)最多,占到總?cè)藬?shù)的60%以上。54第五十四頁(yè),共八十八頁(yè),編輯于2023年,星期六3探索分析過(guò)程探索分析是指對(duì)測(cè)得的數(shù)據(jù)進(jìn)行更為深入詳盡的描述性統(tǒng)計(jì)分析。在一般描述性統(tǒng)計(jì)指標(biāo)的基礎(chǔ)上,增加有關(guān)數(shù)據(jù)其他特征的文字與圖形描述,顯得更加細(xì)致與全面,有助于用戶思考對(duì)數(shù)據(jù)進(jìn)行進(jìn)一步分析的方案。目的是:觀察數(shù)據(jù)的分布特征:可通過(guò)繪制箱圖和莖葉圖等圖形直觀地反映數(shù)據(jù)的分布形式和數(shù)據(jù)的一些規(guī)律性,包括考察數(shù)據(jù)中是否存在異常值等。正態(tài)分布檢驗(yàn):檢驗(yàn)數(shù)據(jù)是否服從正態(tài)分布。方差齊性的檢驗(yàn):用Levene檢驗(yàn)比較各組的方差是否相等。55第五十五頁(yè),共八十八頁(yè),編輯于2023年,星期六以數(shù)據(jù)庫(kù)SY-13提供的兩個(gè)班的學(xué)習(xí)成績(jī)數(shù)據(jù)為例,對(duì)兩個(gè)班的數(shù)學(xué)成績(jī)按照性別進(jìn)行數(shù)據(jù)的分布、按照性別檢驗(yàn)其數(shù)學(xué)成績(jī)的方差是否相等。打開(kāi)數(shù)據(jù)庫(kù)SY-13。例2.356第五十六頁(yè),共八十八頁(yè),編輯于2023年,星期六1、單擊分析(Analyze)->描述統(tǒng)計(jì)(Descriptivestatistics)->探索(Explore),打開(kāi)Explore主對(duì)話框。選擇分析變量指定分組變量選擇標(biāo)識(shí)變量從左側(cè)的變量列表中選出分析變量,送入因變量列表欄;選擇因子變量,SPSS會(huì)把所有的觀測(cè)個(gè)體按照因子變量的取值分成若干各組,再分組考察分析變量中的各個(gè)變量,如果不選擇因子變量,SPSS會(huì)對(duì)全部觀測(cè)來(lái)做探索分析。選擇標(biāo)識(shí)變量,當(dāng)輸出涉及到觀測(cè)量時(shí),使用該變量值標(biāo)識(shí)各觀測(cè)量。57第五十七頁(yè),共八十八頁(yè),編輯于2023年,星期六2、單擊統(tǒng)計(jì)量按鈕,打開(kāi)對(duì)話框,選擇統(tǒng)計(jì)輸出量。有四個(gè)選擇項(xiàng),分別是:基本統(tǒng)計(jì)描述。同時(shí)指定均值的置信區(qū)間的置信度,系統(tǒng)默認(rèn)為95%。M-估計(jì)(M估計(jì)在計(jì)算時(shí)對(duì)所有觀測(cè)量賦予權(quán)重,隨觀測(cè)量距分布中心的遠(yuǎn)近而變化);Outliers輸出分析數(shù)據(jù)中五個(gè)最大值和五個(gè)最小值;Percentiles輸出百分?jǐn)?shù)。本例中選擇Descriptives和Outliers后,返回主對(duì)話框。。58第五十八頁(yè),共八十八頁(yè),編輯于2023年,星期六3.單擊繪制按鈕,打開(kāi)對(duì)話框,如圖所示。59第五十九頁(yè),共八十八頁(yè),編輯于2023年,星期六4、單擊選項(xiàng)按紐,打開(kāi)對(duì)話框。可選擇缺失值的處理方式,SPSS提供三種處理方式:剔除帶有缺失值的觀測(cè)量同時(shí)剔除缺失值及與其有成對(duì)關(guān)系的觀測(cè)量輸出頻數(shù)表時(shí)同時(shí)輸出缺失值60第六十頁(yè),共八十八頁(yè),編輯于2023年,星期六5、單擊OK,得到相應(yīng)的輸出結(jié)果。輸出結(jié)果㈠:5%的修正均值:排除掉數(shù)據(jù)分布兩端5%的變量值之后計(jì)算的平均值5%的修正均值:排除掉數(shù)據(jù)分布兩端5%的變量值之后計(jì)算的平均值四分位數(shù)間距61第六十一頁(yè),共八十八頁(yè),編輯于2023年,星期六極端值:按照性別輸出數(shù)學(xué)成績(jī)的五個(gè)最大值及五個(gè)最小值62第六十二頁(yè),共八十八頁(yè),編輯于2023年,星期六正態(tài)分布檢驗(yàn)表

從檢驗(yàn)結(jié)果可以看出,由于假設(shè)檢驗(yàn)的P值均大于0.05,故可以認(rèn)為男女生的數(shù)學(xué)成績(jī)分布都近似地服從正態(tài)分布。輸出結(jié)果㈡:當(dāng)顯著性水平P<0.05時(shí),數(shù)據(jù)就不是正態(tài)分布當(dāng)樣本量小于50時(shí)才比較精確63第六十三頁(yè),共八十八頁(yè),編輯于2023年,星期六莖葉圖輸出結(jié)果(三):64第六十四頁(yè),共八十八頁(yè),編輯于2023年,星期六

按照性別繪制的數(shù)學(xué)成績(jī)的箱圖

(代表變量中間50%的觀測(cè)值)從上面的箱圖中可以得出結(jié)論:女生的數(shù)學(xué)成績(jī)的平均水平比男生低且分散程度小,但有一個(gè)離群值。除了離群值O(距方框上下限超1.5倍盒距)和極值E(距方框上下限超3倍盒距)之外的最大值和最小值上下四分位數(shù)、中位數(shù)65第六十五頁(yè),共八十八頁(yè),編輯于2023年,星期六正態(tài)圖(也可判斷正態(tài)分布,但不能僅僅依靠正態(tài)圖)輸出結(jié)果(四):【探索】命令會(huì)輸出兩種正態(tài)圖:NormalQ-Q圖;DetrendedNormalQ-Q圖;66第六十六頁(yè),共八十八頁(yè),編輯于2023年,星期六正態(tài)分布Q-Q圖上圖中間的斜線是服從正態(tài)分布的標(biāo)準(zhǔn)線。從上面的分布圖中看出,除個(gè)別極端點(diǎn)外,數(shù)據(jù)點(diǎn)都在斜線周?chē)▌?dòng),故可以認(rèn)為女生的數(shù)學(xué)成績(jī)近似服從正態(tài)分布。67第六十七頁(yè),共八十八頁(yè),編輯于2023年,星期六縱坐標(biāo)是期望值(在標(biāo)準(zhǔn)正態(tài)分布下的轉(zhuǎn)換值)68第六十八頁(yè),共八十八頁(yè),編輯于2023年,星期六離散正態(tài)分布圖從上面的離散正態(tài)分布圖中看出,除個(gè)別極端點(diǎn)外,離散點(diǎn)都在±2的周?chē)▌?dòng),故可以認(rèn)為女生的數(shù)學(xué)成績(jī)近似服從正態(tài)分布??v坐標(biāo)是實(shí)際觀測(cè)值與期望值的差69第六十九頁(yè),共八十八頁(yè),編輯于2023年,星期六方差齊性檢驗(yàn)由表得出方差齊性檢驗(yàn)的P值為0.8以上,故認(rèn)為男女生數(shù)學(xué)成績(jī)的方差是相等的。輸出結(jié)果(五):70第七十頁(yè),共八十八頁(yè),編輯于2023年,星期六4列聯(lián)表分析當(dāng)觀察的現(xiàn)象與兩個(gè)因素有關(guān)時(shí),如某種服裝的銷(xiāo)量受價(jià)格和居民收入影響;某種產(chǎn)品的生產(chǎn)成本受原材料價(jià)格和產(chǎn)量的影響等等;交叉列聯(lián)表分析可以比較好的反映出兩個(gè)因素之間有無(wú)關(guān)聯(lián)性,兩因素與現(xiàn)象之間的相關(guān)關(guān)系。

71第七十一頁(yè),共八十八頁(yè),編輯于2023年,星期六數(shù)據(jù)列聯(lián)表分析主要包括兩個(gè)基本任務(wù):根據(jù)收集的樣本數(shù)據(jù),產(chǎn)生二維或多維交叉列聯(lián)表;在此基礎(chǔ)上,對(duì)兩兩變量間是否存在關(guān)聯(lián)性進(jìn)行檢驗(yàn)。變量x是列變量,類(lèi)別數(shù)為c,一般為自變量;變量y是行變量,類(lèi)別數(shù)為r,一般為因變量;72第七十二頁(yè),共八十八頁(yè),編輯于2023年,星期六下面仍然以數(shù)據(jù)SY-13學(xué)生成績(jī)?yōu)槔瑢W(xué)生成績(jī)按照五級(jí)制分等級(jí)后,按照班級(jí)形成數(shù)學(xué)等級(jí)和物理等級(jí)交叉分析表,并考察學(xué)生的物理和數(shù)學(xué)成績(jī)間有無(wú)關(guān)聯(lián)性。73第七十三頁(yè),共八十八頁(yè),編輯于2023年,星期六制作交叉列聯(lián)表的具體操作步驟:1、打開(kāi)數(shù)據(jù)SY-1,單擊分析描述統(tǒng)計(jì)交叉表對(duì)話框。二維列聯(lián)表分析,選擇行、列變量進(jìn)入框中。如進(jìn)行三維以上的列聯(lián)表,可以將其它變量作為控制變量選到層(Layer)框中。多控制變量可以是同層次的也可以是逐層疊加的。此例中選擇數(shù)學(xué)等級(jí)為行變量,物理等級(jí)為列變量,班級(jí)作為控制變量。74第七十四頁(yè),共八十八頁(yè),編輯于2023年,星期六2、單擊單元格(Cell)按紐,打開(kāi)對(duì)話框。在計(jì)數(shù)框中選擇觀察值(系統(tǒng)默認(rèn))或期望頻數(shù);在百分比框內(nèi)選擇行、列及總百分比。在殘差框中選擇輸出殘差。本列中選擇默認(rèn)項(xiàng)觀察值。75第七十五頁(yè),共八十八頁(yè),編輯于2023年,星期六3、單擊格式(Format)按紐,指定列聯(lián)表的輸出排列順序,一般選擇系統(tǒng)默認(rèn)的升序。然后點(diǎn)擊OK,就可得到交叉列聯(lián)表。76第七十六頁(yè),共八十八頁(yè),編輯于2023年,星期六從上表中可以看出,一班中數(shù)學(xué)和物理成績(jī)均為優(yōu)秀者有四人,數(shù)學(xué)不及格的兩人的物理成績(jī)都是及格。77第七十七頁(yè),共八十八頁(yè),編輯于2023年,星期六兩變量關(guān)聯(lián)性檢驗(yàn)(Chi-squareTest卡方檢驗(yàn))卡方檢驗(yàn)是一種非參數(shù)檢驗(yàn)方法。可以用來(lái)檢驗(yàn)兩個(gè)變量因素之間是否有關(guān)聯(lián)關(guān)系。如果要考察學(xué)生的數(shù)學(xué)成績(jī)和物理成績(jī)之間是否有關(guān)聯(lián),相當(dāng)于檢驗(yàn)假設(shè):H0:數(shù)學(xué)成績(jī)和物理成績(jī)之間是相互獨(dú)立的(無(wú)關(guān)聯(lián)關(guān)系);H1:數(shù)學(xué)成績(jī)和物理成績(jī)之間的關(guān)聯(lián)關(guān)系顯著。78第七十八頁(yè),共八十八頁(yè),編輯于2023年,星期六編制列聯(lián)表時(shí)應(yīng)注意的問(wèn)題編制列聯(lián)表時(shí),如果兩個(gè)變量之間不存在因果關(guān)系,行變量和列變量可以隨意指定。在對(duì)三個(gè)及以上變量進(jìn)行列聯(lián)分析時(shí),一般來(lái)說(shuō),每個(gè)單元格至少要有5個(gè)觀測(cè)值才能有說(shuō)服力。列聯(lián)表只是檢驗(yàn)變量之間是否有關(guān)系

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論