版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
實驗基本描述統(tǒng)計1第一頁,共八十八頁,2022年,8月28日統(tǒng)計分析軟件的作用統(tǒng)計分析是數(shù)據(jù)分析的主要工具完整的數(shù)據(jù)分析過程包括:數(shù)據(jù)的收集數(shù)據(jù)的整理數(shù)據(jù)的分析統(tǒng)計學(xué)為數(shù)據(jù)分析過程提供一套完整的科學(xué)的方法論。統(tǒng)計分析軟件為數(shù)據(jù)分析提供了實現(xiàn)手段。2第二頁,共八十八頁,2022年,8月28日統(tǒng)計軟件的種類很多。有些功能齊全,有些價格便宜;有些容易操作,有些需要更多的實踐才能掌握。還有些是專門的軟件,只處理某一類統(tǒng)計問題。面對太多的選擇往往給決策帶來困難。這里介紹最常見的幾種。統(tǒng)計軟件3第三頁,共八十八頁,2022年,8月28日幾種常用的統(tǒng)計軟件典型的統(tǒng)計軟件SASSPSSMINITABEviewsExcelMINITABSTATISTICAExcelSASSPSS4第四頁,共八十八頁,2022年,8月28日SAS:這是功能非常齊全的軟件;盡管價格相當不菲,許多公司,特別是美國制藥公司,還是因為其功能眾多和某些美國政府機構(gòu)認可而使用。盡管現(xiàn)在已經(jīng)盡量“通俗化”,但仍然需要一定的訓(xùn)練才可以進入。也可以對它編程;但對于基本統(tǒng)計課程則不那么方便。Minitab:這個軟件是很方便的功能強大而又齊全的軟件,在我國用的不如SPSS與SAS那么普遍。Eviews:一個主要處理回歸和時間序列的軟件。采用計量經(jīng)濟學(xué)方法與技術(shù),對社會經(jīng)濟關(guān)系與經(jīng)濟活動的數(shù)量規(guī)律進行“觀察”,是一個得到普遍使用計量經(jīng)濟學(xué)軟件包。5第五頁,共八十八頁,2022年,8月28日S-PlusS語言(AT&T貝爾實驗室)的后續(xù)發(fā)展極為強大的統(tǒng)計功能和繪圖能力應(yīng)用上以理論研究、統(tǒng)計建模為主需要有較好的數(shù)理統(tǒng)計背景對編程能力要求極高Excel凡有MicrosoftOffice的計算機,基本上都裝有Excel。但要注意,必須裝數(shù)據(jù)分析的功能。隨著問題的深入,Excel需要使用函數(shù)。專門一些的統(tǒng)計推斷問題還需要其他專門的統(tǒng)計軟件來處理。6第六頁,共八十八頁,2022年,8月28日SPSS:很受歡迎;容易操作,輸出漂亮,功能齊全,價格合理。它也有自己的程序語言,但基本上已經(jīng)“通俗化”。對于非專業(yè)統(tǒng)計工作者是很好的選擇。7第七頁,共八十八頁,2022年,8月28日SPSS軟件最初全稱為“社會科學(xué)統(tǒng)計軟件包”(StatisticalPackageforthesocialScience);隨著SPSS產(chǎn)品服務(wù)領(lǐng)域的擴大和服務(wù)深度的增加,SPSS公司于2000年正式將英文全稱更改為“統(tǒng)計產(chǎn)品與服務(wù)解決方案”(StatisticalProductandServiceSolutions);如今SPSS已出至版本19.0,而且更名為PASWStatistics。SPSS是一個集數(shù)據(jù)整理、分析過程、結(jié)果輸出等功能于一身的組合式軟件包,是數(shù)據(jù)處理和統(tǒng)計領(lǐng)域的國際標準軟件之一;SPSSForWindows是SPSS軟件的Windows版本,它具有清晰、直觀、易學(xué)易用、涵蓋面廣的特點。8第八頁,共八十八頁,2022年,8月28日應(yīng)用統(tǒng)計軟件進行分析的基本過程弄清分析的目的正確收集待處理和分析的數(shù)據(jù)(目的、影響因素的剔除)弄清統(tǒng)計概念和統(tǒng)計含義,知道統(tǒng)計方法的適用范圍。無需記憶公式選擇一種或幾種統(tǒng)計分析方法來探索性地分析數(shù)據(jù)讀懂計算機分析的數(shù)據(jù)結(jié)果,發(fā)現(xiàn)規(guī)律,得出結(jié)論9第九頁,共八十八頁,2022年,8月28日從統(tǒng)計方法的構(gòu)成分類統(tǒng)計方法描述統(tǒng)計推斷統(tǒng)計10第十頁,共八十八頁,2022年,8月28日描述統(tǒng)計:是用圖形、表格和概括性的數(shù)字對數(shù)據(jù)進行描述的統(tǒng)計方法。內(nèi)容:搜集數(shù)據(jù)整理數(shù)據(jù)顯示數(shù)據(jù)
目的描述數(shù)據(jù)特征找出數(shù)據(jù)的基本規(guī)律02550Q1Q2Q3Q4¥=30s2=10511第十一頁,共八十八頁,2022年,8月28日推斷統(tǒng)計:
研究如何根據(jù)樣本數(shù)據(jù)對總體進行估計、假設(shè)檢驗、預(yù)測和其他推斷的統(tǒng)計方法。內(nèi)容參數(shù)估計假設(shè)檢驗?zāi)康膶傮w特征作出推斷可靠性測度樣本總體12第十二頁,共八十八頁,2022年,8月28日實驗內(nèi)容安排軟件:SPSS18.0目的:掌握統(tǒng)計軟件的基本應(yīng)用實驗1:數(shù)據(jù)文件管理實驗2:基本的統(tǒng)計描述實驗3:方差分析實驗4:相關(guān)與回歸分析13第十三頁,共八十八頁,2022年,8月28日實驗1:數(shù)據(jù)文件管理§1.1SPSS系統(tǒng)運行管理方式§1.2數(shù)據(jù)管理窗口介紹§1.3數(shù)據(jù)文件的建立與管理實驗?zāi)康模赫莆瘴募膭?chuàng)建和整理,包括數(shù)據(jù)的查詢、數(shù)據(jù)排序、篩選等。14第十四頁,共八十八頁,2022年,8月28日§1.1SPSS系統(tǒng)運行管理方式完全窗口菜單運行方式是在數(shù)據(jù)編輯窗口和輸出觀察窗口中,通過選用菜單項中的各種功能和工具欄中的圖標按鈕來完成各項統(tǒng)計功能的一種運行方式特點:利用對話框操作,簡便直觀,特別適用于初學(xué)者和非專業(yè)人員;對于某些專業(yè)人員來說,可能不能充分滿足其需要。15第十五頁,共八十八頁,2022年,8月28日程序運行方式是通過在Syntax(語句)窗口中直接運行編寫好的程序來完成各項統(tǒng)計功能的運行方式特點:方便已習(xí)慣使用SPSS語言編寫程序的用戶使用;能簡化某些工作,比如,成批次地處理數(shù)據(jù)、重復(fù)相同的統(tǒng)計分析過程等;專業(yè)人員可通過該運行方式,使用某些對話框操作不能實現(xiàn)的功能?;旌线\行方式是完全窗口菜單運行方式和程序運行方式的結(jié)合,既能簡化操作,又可以補充單純窗口運行管理的不足。16第十六頁,共八十八頁,2022年,8月28日進行統(tǒng)計分析的基本操作步驟:將數(shù)據(jù)輸入SPSS(定義變量、錄入數(shù)據(jù)等),并存盤;進行必要的預(yù)分析(進行分布圖、均數(shù)、標準差的描述等),以確定應(yīng)采用的統(tǒng)計分析方法;按分析目的選用統(tǒng)計程序,執(zhí)行統(tǒng)計分析過程;保存和導(dǎo)出分析結(jié)果。第十七頁,共八十八頁,2022年,8月28日菜單欄常用工具欄數(shù)據(jù)欄當前單元格§1.2數(shù)據(jù)管理窗口介紹18第十八頁,共八十八頁,2022年,8月28日File(文件操作)完成文件的調(diào)入,存儲,顯示和打印等操作Edit(文件編輯)完成文本或數(shù)據(jù)內(nèi)容的選擇、拷貝、粘貼、尋找和替換等操作19第十九頁,共八十八頁,2022年,8月28日View(窗口外觀控制)完成文本或數(shù)據(jù)內(nèi)容的狀態(tài)欄、工具欄、字體、網(wǎng)格線和數(shù)值標簽等功能的操作Data(數(shù)據(jù)管理)完成數(shù)據(jù)變量名稱和格式的定義,數(shù)據(jù)資料的選擇、排序、加權(quán)、數(shù)據(jù)文件的轉(zhuǎn)換、連接和匯總等操作20第二十頁,共八十八頁,2022年,8月28日Transform(數(shù)據(jù)轉(zhuǎn)換)完成數(shù)據(jù)值的計算、重新編碼和缺失值替代等操作Analyze(統(tǒng)計分析)完成一系列統(tǒng)計分析的選擇和應(yīng)用21第二十一頁,共八十八頁,2022年,8月28日Graphs(統(tǒng)計圖表)完成統(tǒng)計圖表的建立和編輯Utilities(實用程序)有關(guān)命令解釋、字體選擇、文件信息、定義輸出標題和窗口設(shè)計等Window(窗口控制)可進行窗口的排列、選擇和顯示等操作Help(幫助)幫助文件的調(diào)用、查詢和顯示等22第二十二頁,共八十八頁,2022年,8月28日SPSS數(shù)據(jù)文件是一種有結(jié)構(gòu)的數(shù)據(jù)文件,它包括:文件結(jié)構(gòu)數(shù)據(jù)§1.3數(shù)據(jù)文件的建立與管理23第二十三頁,共八十八頁,2022年,8月28日SPSS數(shù)據(jù)文件中的一列數(shù)據(jù)稱為一個變量,每個變量都有一個名稱,即變量名,變量名是存取SPSS每個變量的唯一標識。SPSS數(shù)據(jù)文件的結(jié)構(gòu)是對每個變量及其相關(guān)屬性的描述。一行數(shù)據(jù)稱為一條個案(Case)或觀測,所有個案組成了SPSS數(shù)據(jù)文件的數(shù)據(jù)部分。24第二十四頁,共八十八頁,2022年,8月28日建立SPSS數(shù)據(jù)文件應(yīng)通過兩大步驟實現(xiàn):第一步:定義SPSS數(shù)據(jù)文件的結(jié)構(gòu);第二步:輸入分析數(shù)據(jù)。定義SPSS數(shù)據(jù)文件的結(jié)構(gòu);包括:變量名、變量類型、變量寬度、變量名標簽、變量值標簽、缺失值、顯示寬度、顯示的對齊方式、變量的測度類型等信息。
至少要定義變量名和變量類型,其他暫時設(shè)為默認值,待分析需要時再設(shè)置。25第二十五頁,共八十八頁,2022年,8月28日在數(shù)據(jù)編輯窗口中,單擊“變量視圖”的標簽進行設(shè)置。變量定義完成后,單擊“數(shù)據(jù)視圖”的標簽進行具體變量值的錄入。26第二十六頁,共八十八頁,2022年,8月28日數(shù)據(jù)編輯在SPSS中,對數(shù)據(jù)進行基本編輯操作的功能集中在“編輯”和“數(shù)據(jù)”菜單中。移動指針到指定序號的觀測量
【編輯】——【轉(zhuǎn)至個案】查找指定變量中的指定數(shù)據(jù)
【編輯】——【查找】插入一個變量
【編輯】——【插入變量】插入一個觀測量
【編輯】——【插入個案】查看變量信息
【實用程序】——【變量】27第二十七頁,共八十八頁,2022年,8月28日在數(shù)據(jù)窗口單擊【數(shù)據(jù)】【排列個案】,打開對話框。觀測數(shù)據(jù)排序28第二十八頁,共八十八頁,2022年,8月28日在統(tǒng)計分析中,有時不需要對所有的觀測進行分析,可能只對某些特定的對象有興趣。利用【數(shù)據(jù)】【選擇個案】,可以實現(xiàn)。抽樣(篩選)全部個案:選擇所有數(shù)據(jù);如果條件滿足:按指定條件選擇數(shù)據(jù)。單擊如果按紐,打開選擇個案:If對話框,先選擇變量,然后定義條件。29第二十九頁,共八十八頁,2022年,8月28日選擇個案:If對話框,先選擇變量,然后定義條件。30第三十頁,共八十八頁,2022年,8月28日抽樣(篩選)隨機個案樣本:對觀察值進行隨機抽樣。單擊樣本按紐,打開選擇個案:隨機樣本對話框。如圖所示。在樣本尺寸欄中有兩種選擇方式:一種是大約:即鍵入抽樣比例后由系統(tǒng)隨機抽樣;另一種是精確:要求輸入從第幾個觀察值起抽取多少數(shù)據(jù)。31第三十一頁,共八十八頁,2022年,8月28日抽樣(篩選)基于時間或個案全距:順序抽樣。單擊范圍按紐,打開選擇個案:范圍對話框,用戶自行定義從第幾個觀察值開始抽到第幾個觀察值結(jié)束。使用篩選器變量:用指定變量作過濾。先選擇一個變量,系統(tǒng)自動在數(shù)據(jù)管理器中將該變量值為0的觀測單位標上刪除記號,系統(tǒng)對標有刪除記號的觀測單位不作分析。32第三十二頁,共八十八頁,2022年,8月28日實驗2:基本的統(tǒng)計描述作為一條普遍的規(guī)則,當一批數(shù)據(jù)中的數(shù)據(jù)有20個左右或者更多的時候,就應(yīng)該制作表格或者圖表。這樣,數(shù)據(jù)的重要特征就能從表格或者圖表中反映出來。其目標也是提高數(shù)據(jù)分析和數(shù)據(jù)解釋的效率——這是決策過程的兩個關(guān)鍵方面。33第三十三頁,共八十八頁,2022年,8月28日在建立了數(shù)據(jù)文件之后,需要對數(shù)據(jù)作進一步的考察,如了解數(shù)據(jù)的基本特征,如數(shù)據(jù)的均值、標準差、四分位點,數(shù)據(jù)的分布形態(tài)等,這個過程稱為對數(shù)據(jù)進行基本統(tǒng)計描述。所以說,數(shù)據(jù)的基本統(tǒng)計描述的目的是:了解數(shù)據(jù)的基本特征和基本分布形狀,為進一步分析做好充分準備。34第三十四頁,共八十八頁,2022年,8月28日數(shù)值描述分布的形狀集中趨勢離散程度眾數(shù)中位數(shù)平均值標準誤差方差峰態(tài)標準差全距偏態(tài)35第三十五頁,共八十八頁,2022年,8月28日眾數(shù):在總體中出現(xiàn)次數(shù)最多的那個標志值不受極端值影響具有不惟一性數(shù)據(jù)分布偏斜程度較大時應(yīng)用中位數(shù):一組排序的數(shù)據(jù)中,在中間位置上的數(shù)據(jù)不受極端值影響數(shù)據(jù)分布偏斜程度較大時應(yīng)用均值:全部數(shù)據(jù)的算術(shù)平均易受極端值影響數(shù)學(xué)性質(zhì)優(yōu)良數(shù)據(jù)對稱分布或接近對稱分布時應(yīng)用集中趨勢的測度值:36第三十六頁,共八十八頁,2022年,8月28日數(shù)據(jù)類型和所適用的集中趨勢測度值定類數(shù)據(jù)定序數(shù)據(jù)數(shù)量數(shù)據(jù)適用的測度值眾數(shù)*眾數(shù)眾數(shù)中位數(shù)*中位數(shù)均值*幾何平均數(shù)調(diào)和平均數(shù)*表示最適合37第三十七頁,共八十八頁,2022年,8月28日全距:最大值與最小值的差計算方便,易于理解只考慮兩端數(shù)據(jù),比較粗略方差:離差平方的平均數(shù)準確反映數(shù)據(jù)的離散程度數(shù)據(jù)離散程度的最常用測度值標準差:離差平方平均數(shù)的平方根準確反映數(shù)據(jù)的離散程度具有量綱,實際意義清楚數(shù)據(jù)離散程度的最常用測度值離散程度的測度值:38第三十八頁,共八十八頁,2022年,8月28日數(shù)據(jù)類型和所適用的離散程度測度值定類數(shù)據(jù)定序數(shù)據(jù)數(shù)量數(shù)據(jù)適用的測度值異眾比率*異眾比率異眾比率四分位差*四分位差
極差、平均差方差、標準差*離散系數(shù)*(比較)*表示最適合39第三十九頁,共八十八頁,2022年,8月28日偏態(tài):分布偏斜方向及程度偏態(tài)系數(shù)
SK=0為對稱分布偏態(tài)系數(shù)SK>0
為右偏分布偏態(tài)系數(shù)SK<0
為左偏分布SK的絕對值越大,表示偏斜的程度就越大分布的形狀:左偏分布均值
中位數(shù)
眾數(shù)fx右偏分布眾數(shù)
中位數(shù)均值fx40第四十頁,共八十八頁,2022年,8月28日峰度:分布集中趨勢高峰的形狀峰態(tài)系數(shù)K=0標準正態(tài)分布峰態(tài)系數(shù)K<0為扁平分布峰態(tài)系數(shù)K>0為尖峰分布分布的形狀:扁平分布尖峰分布與標準正態(tài)分布比較!41第四十一頁,共八十八頁,2022年,8月28日1.描述統(tǒng)計分析2.頻數(shù)分析3.探索分析4.列聯(lián)表5.統(tǒng)計圖42第四十二頁,共八十八頁,2022年,8月28日1.描述統(tǒng)計分析描述統(tǒng)計分析是對數(shù)據(jù)進行基礎(chǔ)性描述的過程。可以通過計算均值、算術(shù)和、標準差、極值、方差、均值、標準誤等統(tǒng)計量來描述樣本數(shù)據(jù)的集中趨勢、離散趨勢及分布特征;描述統(tǒng)計分析過程,可通過分析對話框(分析描述統(tǒng)計描述)來具體實現(xiàn)。43第四十三頁,共八十八頁,2022年,8月28日例2.1以某年全國職工平均工資表為例(SY-11),要求對其進行簡單的描述統(tǒng)計分析。具體操作步驟如下:1、首先打開數(shù)據(jù)表SY-11,按照分析(Analyze)描述統(tǒng)計(DescriptivesStatistics)
描述(Descriptives),打開對話框,如圖所示。從左邊源變量中選擇一個或者幾個變量進入右框中計算并保存所選變量的標準化值,公式為44第四十四頁,共八十八頁,2022年,8月28日2.單擊選項Options按鈕,打開Options對話框,如圖所示:在此例中選擇按平均值升序項,返回主對話框,單擊OK,在輸出窗口得描述統(tǒng)計分析輸出表。45第四十五頁,共八十八頁,2022年,8月28日輸出結(jié)果:標準化值46第四十六頁,共八十八頁,2022年,8月28日2.頻數(shù)分析利用頻數(shù)分析可以方便地對數(shù)據(jù)按組進行歸類整理;形成各變量的不同水平(分組)的頻數(shù)分布表及圖形,以便對各變量的數(shù)據(jù)特征和觀測量的分布狀況有一個概括的認識;47第四十七頁,共八十八頁,2022年,8月28日48第四十八頁,共八十八頁,2022年,8月28日例2.2數(shù)據(jù)文件SY-12是一個公司職員表,其中有性別、年齡,受教育年限等五個變量,具體操作如下:
1、打開數(shù)據(jù)文件SY-12后,單擊分析描述統(tǒng)計頻率(Frequencies),打開頻數(shù)分析對話框。2、在左邊的變量框中選中一個或多個變量。3、選中顯示頻率表格。49第四十九頁,共八十八頁,2022年,8月28日4、單擊統(tǒng)計量按鈕,得到對話框圖。在頻率:統(tǒng)計量對話框中選擇要求輸出的統(tǒng)計量。50第五十頁,共八十八頁,2022年,8月28日5、單擊圖表(Chart)按鈕,得到對話框圖選擇直方圖51第五十一頁,共八十八頁,2022年,8月28日6、單擊格式(Format)按鈕,得到對話框圖。本例中均選擇系統(tǒng)默認項52第五十二頁,共八十八頁,2022年,8月28日輸出結(jié)果:點擊OK53第五十三頁,共八十八頁,2022年,8月28日從表和直方圖中可以觀察到該公司32歲至47歲之間的人數(shù)最多,占到總?cè)藬?shù)的60%以上。54第五十四頁,共八十八頁,2022年,8月28日3探索分析過程探索分析是指對測得的數(shù)據(jù)進行更為深入詳盡的描述性統(tǒng)計分析。在一般描述性統(tǒng)計指標的基礎(chǔ)上,增加有關(guān)數(shù)據(jù)其他特征的文字與圖形描述,顯得更加細致與全面,有助于用戶思考對數(shù)據(jù)進行進一步分析的方案。目的是:觀察數(shù)據(jù)的分布特征:可通過繪制箱圖和莖葉圖等圖形直觀地反映數(shù)據(jù)的分布形式和數(shù)據(jù)的一些規(guī)律性,包括考察數(shù)據(jù)中是否存在異常值等。正態(tài)分布檢驗:檢驗數(shù)據(jù)是否服從正態(tài)分布。方差齊性的檢驗:用Levene檢驗比較各組的方差是否相等。55第五十五頁,共八十八頁,2022年,8月28日以數(shù)據(jù)庫SY-13提供的兩個班的學(xué)習(xí)成績數(shù)據(jù)為例,對兩個班的數(shù)學(xué)成績按照性別進行數(shù)據(jù)的分布、按照性別檢驗其數(shù)學(xué)成績的方差是否相等。打開數(shù)據(jù)庫SY-13。例2.356第五十六頁,共八十八頁,2022年,8月28日1、單擊分析(Analyze)->描述統(tǒng)計(Descriptivestatistics)->探索(Explore),打開Explore主對話框。選擇分析變量指定分組變量選擇標識變量從左側(cè)的變量列表中選出分析變量,送入因變量列表欄;選擇因子變量,SPSS會把所有的觀測個體按照因子變量的取值分成若干各組,再分組考察分析變量中的各個變量,如果不選擇因子變量,SPSS會對全部觀測來做探索分析。選擇標識變量,當輸出涉及到觀測量時,使用該變量值標識各觀測量。57第五十七頁,共八十八頁,2022年,8月28日2、單擊統(tǒng)計量按鈕,打開對話框,選擇統(tǒng)計輸出量。有四個選擇項,分別是:基本統(tǒng)計描述。同時指定均值的置信區(qū)間的置信度,系統(tǒng)默認為95%。M-估計(M估計在計算時對所有觀測量賦予權(quán)重,隨觀測量距分布中心的遠近而變化);Outliers輸出分析數(shù)據(jù)中五個最大值和五個最小值;Percentiles輸出百分數(shù)。本例中選擇Descriptives和Outliers后,返回主對話框。。58第五十八頁,共八十八頁,2022年,8月28日3.單擊繪制按鈕,打開對話框,如圖所示。59第五十九頁,共八十八頁,2022年,8月28日4、單擊選項按紐,打開對話框??蛇x擇缺失值的處理方式,SPSS提供三種處理方式:剔除帶有缺失值的觀測量同時剔除缺失值及與其有成對關(guān)系的觀測量輸出頻數(shù)表時同時輸出缺失值60第六十頁,共八十八頁,2022年,8月28日5、單擊OK,得到相應(yīng)的輸出結(jié)果。輸出結(jié)果㈠:5%的修正均值:排除掉數(shù)據(jù)分布兩端5%的變量值之后計算的平均值5%的修正均值:排除掉數(shù)據(jù)分布兩端5%的變量值之后計算的平均值四分位數(shù)間距61第六十一頁,共八十八頁,2022年,8月28日極端值:按照性別輸出數(shù)學(xué)成績的五個最大值及五個最小值62第六十二頁,共八十八頁,2022年,8月28日正態(tài)分布檢驗表
從檢驗結(jié)果可以看出,由于假設(shè)檢驗的P值均大于0.05,故可以認為男女生的數(shù)學(xué)成績分布都近似地服從正態(tài)分布。輸出結(jié)果㈡:當顯著性水平P<0.05時,數(shù)據(jù)就不是正態(tài)分布當樣本量小于50時才比較精確63第六十三頁,共八十八頁,2022年,8月28日莖葉圖輸出結(jié)果(三):64第六十四頁,共八十八頁,2022年,8月28日
按照性別繪制的數(shù)學(xué)成績的箱圖
(代表變量中間50%的觀測值)從上面的箱圖中可以得出結(jié)論:女生的數(shù)學(xué)成績的平均水平比男生低且分散程度小,但有一個離群值。除了離群值O(距方框上下限超1.5倍盒距)和極值E(距方框上下限超3倍盒距)之外的最大值和最小值上下四分位數(shù)、中位數(shù)65第六十五頁,共八十八頁,2022年,8月28日正態(tài)圖(也可判斷正態(tài)分布,但不能僅僅依靠正態(tài)圖)輸出結(jié)果(四):【探索】命令會輸出兩種正態(tài)圖:NormalQ-Q圖;DetrendedNormalQ-Q圖;66第六十六頁,共八十八頁,2022年,8月28日正態(tài)分布Q-Q圖上圖中間的斜線是服從正態(tài)分布的標準線。從上面的分布圖中看出,除個別極端點外,數(shù)據(jù)點都在斜線周圍波動,故可以認為女生的數(shù)學(xué)成績近似服從正態(tài)分布。67第六十七頁,共八十八頁,2022年,8月28日縱坐標是期望值(在標準正態(tài)分布下的轉(zhuǎn)換值)68第六十八頁,共八十八頁,2022年,8月28日離散正態(tài)分布圖從上面的離散正態(tài)分布圖中看出,除個別極端點外,離散點都在±2的周圍波動,故可以認為女生的數(shù)學(xué)成績近似服從正態(tài)分布??v坐標是實際觀測值與期望值的差69第六十九頁,共八十八頁,2022年,8月28日方差齊性檢驗由表得出方差齊性檢驗的P值為0.8以上,故認為男女生數(shù)學(xué)成績的方差是相等的。輸出結(jié)果(五):70第七十頁,共八十八頁,2022年,8月28日4列聯(lián)表分析當觀察的現(xiàn)象與兩個因素有關(guān)時,如某種服裝的銷量受價格和居民收入影響;某種產(chǎn)品的生產(chǎn)成本受原材料價格和產(chǎn)量的影響等等;交叉列聯(lián)表分析可以比較好的反映出兩個因素之間有無關(guān)聯(lián)性,兩因素與現(xiàn)象之間的相關(guān)關(guān)系。
71第七十一頁,共八十八頁,2022年,8月28日數(shù)據(jù)列聯(lián)表分析主要包括兩個基本任務(wù):根據(jù)收集的樣本數(shù)據(jù),產(chǎn)生二維或多維交叉列聯(lián)表;在此基礎(chǔ)上,對兩兩變量間是否存在關(guān)聯(lián)性進行檢驗。變量x是列變量,類別數(shù)為c,一般為自變量;變量y是行變量,類別數(shù)為r,一般為因變量;72第七十二頁,共八十八頁,2022年,8月28日下面仍然以數(shù)據(jù)SY-13學(xué)生成績?yōu)槔?,將學(xué)生成績按照五級制分等級后,按照班級形成數(shù)學(xué)等級和物理等級交叉分析表,并考察學(xué)生的物理和數(shù)學(xué)成績間有無關(guān)聯(lián)性。73第七十三頁,共八十八頁,2022年,8月28日制作交叉列聯(lián)表的具體操作步驟:1、打開數(shù)據(jù)SY-1,單擊分析描述統(tǒng)計交叉表對話框。二維列聯(lián)表分析,選擇行、列變量進入框中。如進行三維以上的列聯(lián)表,可以將其它變量作為控制變量選到層(Layer)框中。多控制變量可以是同層次的也可以是逐層疊加的。此例中選擇數(shù)學(xué)等級為行變量,物理等級為列變量,班級作為控制變量。74第七十四頁,共八十八頁,2022年,8月28日2、單擊單元格(Cell)按紐,打開對話框。在計數(shù)框中選擇觀察值(系統(tǒng)默認)或期望頻數(shù);在百分比框內(nèi)選擇行、列及總百分比。在殘差框中選擇輸出殘差。本列中選擇默認項觀察值。75第七十五頁,共八十八頁,2022年,8月28日3、單擊格式(Format)按紐,指定列聯(lián)表的輸出排列順序,一般選擇系統(tǒng)默認的升序。然后點擊OK,就可得到交叉列聯(lián)表。76第七十六頁,共八十八頁,2022年,8月28日從上表中可以看出,一班中數(shù)學(xué)和物理成績均為優(yōu)秀者有四人,數(shù)學(xué)不及格的兩人的物理成績都是及格。77第七十七頁,共八十八頁,2022年,8月28日兩變量關(guān)聯(lián)性檢驗(Chi-squareTest卡方檢驗)卡方檢驗是一種非參數(shù)檢驗方法??梢杂脕頇z驗兩個變量因素之間是否有關(guān)聯(lián)關(guān)系。如果要考察學(xué)生的數(shù)學(xué)成績和物理成績之間是否有關(guān)聯(lián),相當于檢驗假設(shè):H0:數(shù)學(xué)成績和物理成績之間是相互獨立的(無關(guān)聯(lián)關(guān)系);H1:數(shù)學(xué)成績和物理成績之間的關(guān)聯(lián)關(guān)系顯著。78第七十八頁,共八十八頁,2022年,8月28日編制列聯(lián)表時應(yīng)注意的問題編制列聯(lián)表時,如果兩個變量之間不存在因果關(guān)系,行變量和列變量可以隨意指定。在對三個及以上變量進行列聯(lián)分析時,一般來說,每個單元格至少要有5個觀測值才能有說服力。列聯(lián)表只是檢驗變量之間是否有關(guān)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 透析溶血應(yīng)急預(yù)案
- 油漆儲存與運輸安全規(guī)范
- 物流公司員工宿舍管理規(guī)定
- 辦公空間智能化改造合同樣本
- 生產(chǎn)線設(shè)備缺陷管理規(guī)范
- 電力行業(yè)合同管理準則
- 城市公交安全守則
- 郵政快遞員聘用合同范本
- 蕪湖保齡球館租賃合同
- 山東教育設(shè)施建設(shè)合同
- 三年級上冊美術(shù)課件-4前前后后 |人教新課標 (共20張PPT)
- 《城市生態(tài)學(xué)》考試復(fù)習(xí)題庫(含答案)
- 小學(xué)飲食營養(yǎng)與健康班會課件
- 幼兒衛(wèi)生保健 第七章幼兒常見意外事故及急救課件
- 主題班會《反對邪教-從我做起》
- 六年級上冊數(shù)學(xué)課件-7.4 長方體和正方體整理與復(fù)習(xí)丨蘇教版 (共14張PPT)
- 建筑節(jié)能工程竣工驗收報告3篇(施工單位節(jié)能驗收報告)
- 內(nèi)科學(xué)-骨髓增生異常綜合征(MDS)
- 老年助餐服務(wù)工作總結(jié)
- SYB(全)新版最新課件
- 醫(yī)學(xué)研究中安全防護與相關(guān)法規(guī)葉索夫整理
評論
0/150
提交評論