統(tǒng)計分析軟件SPSS詳細教程_第1頁
統(tǒng)計分析軟件SPSS詳細教程_第2頁
統(tǒng)計分析軟件SPSS詳細教程_第3頁
統(tǒng)計分析軟件SPSS詳細教程_第4頁
統(tǒng)計分析軟件SPSS詳細教程_第5頁
已閱讀5頁,還剩10頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

..10.11統(tǒng)計分析軟件&SPSS建立數(shù)據(jù)目錄10.11統(tǒng)計分析軟件&SPSS建立數(shù)據(jù)110.25數(shù)據(jù)加工作圖111.08繪圖解答&描述性分析:22.描述性統(tǒng)計分析:2四格表卡方檢驗:〔檢驗某個連續(xù)變量的分布是否與某種理論分布一致,如是否符合正態(tài)分布2第七章非參數(shù)檢驗21.單樣本的非參數(shù)檢驗2〔1卡方檢驗2〔2二項分布檢驗22.兩獨立樣本的非參數(shù)檢驗23.多獨立樣本的非參數(shù)檢驗24.兩相關樣本的非參數(shù)檢驗25.多相關樣本的非參數(shù)檢驗2第五章均值檢驗與T檢驗21.Means過程〔均值檢驗〔24.單樣本T檢驗25.兩獨立樣本T檢驗26.兩配對樣本T檢驗2第六章方差分析2單因素方差分析:2多因素方差分析:210.25數(shù)據(jù)加工作圖1.Excel中隨機取值:=randbetween<55,99>2.SPSS中新建數(shù)據(jù),一列40個,正態(tài)分布隨機數(shù):先在40那里隨便輸入一個數(shù)表示選擇40個可用的,然后按一下操作步驟:3.排序:個案排秩4.數(shù)據(jù)選?。簲?shù)據(jù)-選擇個案-如果條件滿足:計算新變量:5.頻次分析:分析-統(tǒng)計描述-頻率還原:個案-全部6.加權:還原7.畫圖:11.08繪圖解答&描述性分析:1.課后題:長條圖2.描述性統(tǒng)計分析:頻數(shù)分析:描述性分析:描述性統(tǒng)計分析沒有圖形功能,也不能生成頻數(shù)表,但描述性分析可以將原始數(shù)據(jù)轉換成標準化得分,并以變量形式存入數(shù)據(jù)文件中,以便后續(xù)分析時應用。操作:分析—描述性分析:然后對結果進行篩選,去掉異常值,就得到標準化的數(shù)據(jù):任何形態(tài)的數(shù)據(jù)經(jīng)過Z標準化處理之后就會是正態(tài)分布的<—錯誤!標準化是等比例縮放的,不會改變數(shù)據(jù)的原始分布狀態(tài),探索分析:〔檢驗是否是正態(tài)分布:莖葉圖、箱圖實例:操作:交叉列聯(lián)表〔探索定類型的變量間的相關性:[純數(shù)值的變量用回歸分析,名義變量用交叉分析]操作:實例:四格表卡方檢驗:〔檢驗某個連續(xù)變量的分布是否與某種理論分布一致,如是否符合正態(tài)分布例子:第1步建立數(shù)據(jù)文建:第2步:對數(shù)據(jù)進行預處理;〔給數(shù)據(jù)加權第3步進行卡方檢驗:第4步結果分析P=0.011<0.05,則在5%顯著性水平下拒絕原假設,差異有顯著性意義,即藥物加化療與單用藥物治療癌癥的療效有顯著性差異。如何選sig值:期望值就是T是理論頻數(shù)N是樣本數(shù)量〔合計對應:1選第一個:2選3選配對卡方檢驗:第1步建立數(shù)據(jù)文建:第2步對數(shù)據(jù)進行加權處理第3步進行配對卡方檢驗結果分析:第七章非參數(shù)檢驗使用情況:在總體分布未知的情況下用非參數(shù)檢驗,分布已知用參數(shù)檢驗。1.單樣本的非參數(shù)檢驗〔1卡方檢驗分析步驟第1步提出零假設:卡方檢驗的零假設H0是"總體服從某種理論分布",其對立假設H1是"總體不服從某種理論分布"。第2步選擇檢驗統(tǒng)計量:卡方分布選擇的是Pearson卡方統(tǒng)計量。已證明,當n充分大時,它近似地服從自由度為k-1的卡方分布。第3步計算檢驗統(tǒng)計量的觀測值和概率p值。第4步給出顯著性水平,作出決策。實例:某公司質檢負責人欲了解企業(yè)一年內出現(xiàn)的次品數(shù)是否均勻分布在一周的五個工作日中,隨機抽取了90件次品的原始記錄,其結果如下表,問該企業(yè)一周內出現(xiàn)的次品數(shù)是否均勻分布在一周的五個工作日中?〔工作日12345次品數(shù)251581626第1步分析:由于考慮的是次品是否服從均勻分布的問題,考慮用卡方檢驗。第2步數(shù)據(jù)的組織:數(shù)據(jù)分成兩列,一列是工作日,其變量名為"weekday",另一列是次品數(shù),變量名為"number",輸入數(shù)據(jù)并保存。第3步加權設置:將變量"number"定義為權變量。第4步進行卡方檢驗:第5步主要結果及分析左表是頻數(shù)分布情況表,第二列為實際觀察值出現(xiàn)次數(shù),第三列為理論上每天應出現(xiàn)的次數(shù),第四列為殘差右表是計算的卡方統(tǒng)計量及對應的相伴概率值,由于Sig.=0.014<0.05。說明應拒絕每個工作日出現(xiàn)的次品率相等的原假設。即次品數(shù)出現(xiàn)是不均勻的?!?二項分布檢驗[例7-2]某地某一時期內出生35名嬰兒,其中女性19名〔定Sex=0,男性16名〔定Sex=1。問這個地方出生嬰兒的性別比例與通常的男女性比例〔總體概率約為0.5是否不同?第1步分析:由于性別分為男與女兩種狀態(tài),故應用二項分布檢驗。第2步數(shù)據(jù)的組織:數(shù)據(jù)分成兩列,其變量名為"性別","頻數(shù)"。輸入數(shù)據(jù)并保存。進行加權處理。第3步進行二項分布檢驗:第4步主要結果及分析從上表可知,相伴概率Sig.=0.736>0.05,因此沒有理由拒絕零假設。這說明此地新生兒男女比例與通常的男女比例相同。2.兩獨立樣本的非參數(shù)檢驗[例7-3]某公司希望了解兩種品牌汽油A和B每加侖的行駛里程是否有區(qū)別,表7.15是兩種品牌汽油每加侖的行駛里程數(shù),在顯著性水平=0.05下,判斷兩個品牌間是否存在顯著性差異?A30.428.729.232.531.729.530.831.130.731.8B33.529.830.131.433.830.931.329.632.833第1步分析:由于是兩種品牌的汽油,可以認為是兩個獨立樣本,但行駛里程數(shù)根本不知道服從何種分布,可用兩獨立樣本的非參數(shù)檢驗進行分析。第2步數(shù)據(jù)組織:由于獨立樣本的非參數(shù)檢驗所檢驗的數(shù)據(jù)只有一列,故應將A,B數(shù)據(jù)組織成一列,用另一列來區(qū)分A和B,作分組變量。第3步進行獨立樣本的非參數(shù)檢驗雙尾檢驗的相伴概率為0.151,大于0.05,說明兩種汽油無顯著性差異。兩個相伴概率都大于顯著性水平0.05,因此應接受零假設,認為兩種汽油之間無顯著性差異。Kolmogorov-SmirnovZ值為0.894,相伴概率值為0.400,大于顯著性水平0.05,因此應接受兩種汽油之間無顯著性差異的原假設;根據(jù)游程檢驗計算的Z統(tǒng)計量為-1.149,對應在單尾顯著性概率為0.128,大于顯著性水平,因此應接受兩種汽油之間無顯著性差異的原假設。從以上四種檢驗方法所得到的結果是相同的,即兩種汽油之間無顯著性差異。3.多獨立樣本的非參數(shù)檢驗4.兩相關樣本的非參數(shù)檢驗某企業(yè)提出了一項新工藝,為了檢驗新工藝是否能降低單位成本,隨機抽取16個工人分別用新舊工藝生產產品,測得單位成本資料如下表,請在顯著性水平0.05下檢驗是否新工藝降低了成本?new25121422211722161718192422152223old18171619241928182224223025202421第1步分析:由于是同一批工人和同一批機器,其先后的成本是相關的,同時也不知數(shù)據(jù)的分布情況,故應用兩相關樣本的非參數(shù)檢驗。第2步數(shù)據(jù)組織:數(shù)據(jù)分成兩列,第一列為新工藝的成本,第二列為舊工藝的成本。第3步兩相關樣本的非參數(shù)檢驗:設置如下圖Z統(tǒng)計量為-2.160,相伴概率為0.031,小于顯著水平0.05,故應拒絕原假設,即認為兩樣本不是來自于同一總體,說明有差異,新工藝可省成本。結果分析:Z統(tǒng)計量為-2.160,相伴概率為0.031,小于顯著水平0.05,故應拒絕原假設,即認為兩樣本不是來自于同一總體,說明有差異,新工藝可省成本。其相伴概率為0.021,小于0.05,說明新工藝與舊工藝有顯著性差異,這與Wilxocon檢驗結果是一致的。5.多相關樣本的非參數(shù)檢驗某文藝晚會有5個節(jié)目,共有5個評委參與打分,其數(shù)據(jù)如下表。問這5個評委的判斷標準是否一致。節(jié)目1節(jié)目2節(jié)目3節(jié)目4節(jié)目5評委18.758.258.898.5評委2109.59.58.99.5評委39.69.19.18.59.6評委49.28.58.99.19.4評委59.659.29.19.18.9第1步分析:由于5個評委打分是分別針對同一個節(jié)目,所以數(shù)據(jù)之間具有相關性,同時不知道數(shù)據(jù)所服從的分布,可以采用多相關樣本的非參數(shù)檢驗。第2步數(shù)據(jù)組織:由于是分析的評委之間的評判標準是否一致,故應將每個評委所打的分各分成一列。第3步多相關樣本的非參數(shù)檢驗:結果分析:卡方值為9.102,自由度為4,相伴概率為0.059>0.05,故應認為5個評委打分是一致的??ǚ街禐?.102,自由度為4,相伴概率為0.059>0.05,也應認為5個評委的打分具有一致性,這與Friedman檢驗具有一致性。非參數(shù)檢驗與卡方檢驗比較:卡方檢驗是數(shù)據(jù)總體是服從什么樣的分布〔都是頻次的方式呈現(xiàn)出來的非參數(shù)檢驗是總體分布情況未知第五章均值檢驗與T檢驗參數(shù)檢驗必須說明,他是服從某種分布的實例:1.Means過程〔均值檢驗〔與非參檢驗比較非參檢驗中的二項式檢驗,但是只能是兩個變量。第1步數(shù)據(jù)組織;根據(jù)表5.1生成SPSS數(shù)據(jù)文件,建3個變量:"sex"、"edu"、"num",數(shù)據(jù)文件的部分數(shù)據(jù)如圖5-3所示。3、實例分析第2步打開主對話框;選擇分析→比較均值→均值,打開同圖5-1一樣的均值過程主對話框。第3步確定要進行均值比較的變量;在圖5-1的對話框中,從左邊的候選變量列表框中選擇"人口數(shù)量〔num"變量,移入"因變量列表"文本框中,表示對該變量進行均值比較分析。第4步確定分組變量;分組變量可以有幾層,選擇"性別〔sex"變量作為第一層分組變量,將其移入"自變量列表"文本框中。第5步確定輸出的統(tǒng)計量;單擊圖5-1上的選項…按鈕,彈出如圖所示的子對話框,選擇方差和eta復選框,進行方差分析,單擊繼續(xù)按鈕,返回主對話框。結果分析:此表是性別的單因素方差分析。表中的Sig.值遠大于0.05,說明不同性別受教育的人口數(shù)量沒有顯著性差異。人口數(shù)量與性別的相關性度量表。此時的Eta和Eta方取值都很小,說明性別和受教育的人口數(shù)量的相關性很差,這也和單因素方差分析表的結論是一致的。4.單樣本T檢驗〔它是對總體均值的假設檢驗[例5-2]某生產食鹽的生產線,其生產的袋裝食鹽的標準重量為500g,現(xiàn)隨機抽取10袋,其重量分別為:495,502,508,496,505,499,503,498,505,500。假設數(shù)據(jù)總體呈正態(tài)分布,請檢驗生產線的工作情況。第1步數(shù)據(jù)組織;首先建立SPSS數(shù)據(jù)文件,只需建立一個變量"Weight",錄入相應的數(shù)據(jù)即可。第2步打開主對話框;選擇分析→比較均值→單樣本T檢驗,打開同圖5-3一樣的單樣本T檢驗主對話框。第3步確定要進行T檢驗的變量;在圖5-3所示的對話框中,選擇"Weight"變量作為檢驗變量,移入"檢驗變量"框中。第4步輸入要檢驗的值;在圖5-4的對話框中的"檢驗值"中輸入要檢驗的值,本例應輸入500。單樣本T檢驗結果表,第一行的TestValue為檢驗參數(shù)值500,即用于比較的總體均值,下面從左至右依次為檢驗統(tǒng)計量〔t、自由度〔df、雙尾檢測概率P值〔Sig.<2-tailed>、樣本均值與和檢驗值的差〔MeanDifference、均值差的95%置信區(qū)間〔95%ConfidenceIntervaloftheDifference。當置信水平為95%時,顯著性水平為0.05,從表中可以看出,雙尾檢測概率P值為0.432,大于0.05,故零假設成立,也就是說抽樣袋裝食鹽的重量與500克無顯著性差異,有理由相信生產線工作狀態(tài)正常。5.兩獨立樣本T檢驗[例5-3]為比較兩種不同品種的玉米的產量,分別統(tǒng)計了8個地區(qū)的單位面積產量,具體數(shù)據(jù)見表5.8。假定樣本服從正態(tài)分布,且兩組樣本相互獨立,試比較在置信度為95%的情況下,兩種玉米產量是否有顯著性差異。第1步數(shù)據(jù)組織;根據(jù)表5.8,SPSS數(shù)據(jù)文件中建立兩個變量,分別為"品種"、"產量",變量"品種"的變量值標簽為:a-品種A,b-品種B,錄入數(shù)據(jù)即可。第2步打開主對話框;選擇分析→比較均值→獨立樣本T檢驗,打開同圖5-4一樣的兩獨立樣本T檢驗主對話框。第3步確定要進行T檢驗的變量;在圖5-4所示的對話框中,選擇"產量"變量作為檢驗變量,移入"檢驗變量"框中。第4步確定分組變量;選擇變量"品種"作為分組變量,將其移入圖5-4中的"分組變量"文本框中,并定義分組的變量值:Group1—1,Group2—2。結果分析:首先做2個樣本方差的齊性檢驗。上圖中sig.=0.752>0.05,因此認為2個樣本方差不存在差異,可以按照P=0.332取值。在顯著性水平為0.05的情況下,T統(tǒng)計量的概率p值大于0.05,故不應拒絕零假設,,即認為兩樣本的均值是相等的,在本例中,不能認為兩種玉米品種的產量有顯著性差異。6.兩配對樣本T檢驗3、實例分析[例5-4]以下是某大學跆拳道選手15人的平衡訓練的數(shù)據(jù),統(tǒng)計實驗前、后平衡訓練成績是否有差異。訓練前:86,77,59,79,90,68,85,94,66,72,75,72,69,85,88訓練后:78,81,76,92,88,76,93,87,62,84,87,95,88,87,80第1步數(shù)據(jù)組織;首先建立SPSS數(shù)據(jù)文件,建立兩個變量:"訓練前"、"訓練后",錄入相應數(shù)據(jù)。第2步打開主對話框;選擇分析→比較均值→配對樣本T檢驗,打開同圖5-5一樣的配對樣本T檢驗主對話框。第3步確定配對分析的變量;將變量"訓練前"和"訓練后"添加到"成對變量"框中,作為第一對分析的配對變量。兩配對樣本T檢驗的簡單相關關系及其檢驗結果。表中第3列為訓練前和訓練兩樣本的相關系數(shù),第4列是相關系數(shù)的檢驗p值。從表中可以看出,在顯著性水平為0.05時,訓練前后的概率p值為0.132,大于0.05,接受零假設,可以認為訓練前后的成績沒有明顯的線性關系。由于概率p值為0.041,小于0.05,拒絕零假設,可以認為訓練前后對成績有顯著效果。第六章方差分析單因素方差分析:用四種飼料喂豬,共19頭分為四組,每一組用一種飼料。一段時間后稱重,豬體重增加數(shù)據(jù)如下表所示,比較四種飼料對豬體重增加的作用有無不同。飼料A飼料B飼料C飼料D133.8151.2193.4225.8125.3149.0185.3224.6143.1162.7182.8220.4128.9143.8188.5212.3135.7153.5198.6第1步分析:由于考慮的是一個控制變量〔飼料對一個觀測變量〔豬體重的影響,而且是4種飼料,所以不適宜用獨立樣本T檢驗〔僅適用兩組數(shù)據(jù),應采用單因素方差分析。第2步數(shù)據(jù)的組織:數(shù)據(jù)分成兩列,一列是豬的體重,變量名為"weight",另一變量是飼料品種〔變量值分別為1,2,3,4,變量名為"fodder",輸入數(shù)據(jù)并保存。第3步方差相等的齊性檢驗:由于方差分析的前提是各個水平下〔這里是不同的飼料folder影響下的體重weight的總體服從正態(tài)分布,且各組方差具有齊性。其中正態(tài)分布的要求并不是很嚴格,但對于方差相等的要求是比較嚴格的,因此必須對方差相等的前提進行檢驗。方差齊性檢驗的方法:打開分析——比較均值——單因素ANOVA——選項,在"方差同質性檢驗"前打鉤就可以了。方差齊性檢驗的方法:方差齊性檢驗的H0假設是:方差相等。從上表可看出相伴概率Sig.=0.995>〔0.05說明應該接受H0假設〔即方差相等。故下面就用方差相等的檢驗方法。上表是幾種飼料方差分析的結果,組間〔BetweenGroups平方和〔SumofSquares為20538.698,自由度〔df為3,均方為6846.233;組內〔WithinGroups平方和為652.159,自由度為15,均方為43.477;F統(tǒng)計量為157.467。由于組間比較的相伴概率Sig.〔p值=0.000<0.05,故應拒絕H0假設〔四種飼料喂豬效果無顯著差異,說明四種飼料對養(yǎng)豬的效果有顯著性差異。從整個表反映出來四種飼料相互之間均存在顯著性差異,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論