單因素方差分析_第1頁
單因素方差分析_第2頁
已閱讀5頁,還剩32頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、綜合性課程設計題目:某校學生成績單因素方差分析學院:理學院班級:統(tǒng)計13-2班學生姓名:黃克韜胡遠亮賀鵬杰學生學號:272324師:2016年12月1日課程設計任務書姓名黃克韜胡遠亮賀鵬杰班級統(tǒng)計13-2班學號272324設計題目某校學生成績單因素方差分析理論要點1. 單因素方差分析2. 卡方檢驗3. F檢驗設計目標從網絡搜取某大學信息學院學生的匯編成績,并對其進行分析,要求如下:1、分析匯編成績與學生人數之間的關系(取顯著性水平a=°.°5);2、為了查看學生動手操作能力與理論結合的情況,分析匯編課程設計等級對匯編成績之間的影響。研究方法步驟(1)確定研究問題(2)進行文

2、獻檢索和文獻回顧(3)確定研究的分析方法(4)進行數據的收集(5)進行數據的處理和分析(6)得出結論,并完成論文預期結果1. 學生的匯編成績和學生人數呈正態(tài)分布2. 學生的匯編課程設計等級對匯編成績的有著顯著影響計劃與進度的安排課程安排一周,分四次完成:第一次(2天):查找所需要的相關資料,進行整理;第二次(1天):系統(tǒng)學習相關理論和操作,設計總體流程;第三次(3天):編寫課程設計報告;第四次(1天):進行后續(xù)整理工作。目錄摘要I1問題重述12模型假設33模型建立43.1單因素方差分析前提條件43.2單因素方差分析步驟53.3模型推導94模型求解124.1做出直方圖124.2做假設檢驗154.

3、3檢驗原假設174.4計算平方和194.5比較F值和臨界值205 模型檢驗206 模型評價277結論與體會288參考文獻299源程序30摘要方差分析用于多個樣本均數差別的顯著性檢驗。它的基本思想是通過分析研究不同來源的變異對總變異的貢獻大小,從而確定可控因素對研究結果影響力的大小。本文研究學生成績與課設等級之間的關系,其中可明確觀測變量為學生成績,控制變量為課設等級。由于僅研究單個因素(課設等級)對觀測變量(學生成績)的影響,因此稱為單因素方差分析。本文利用了假設檢驗和方差分析來對學生成績進行分析,首先對學生匯編成績的分布進行假設,其次利用皮爾遜2對所得的分步進行檢驗,結合SPSS數據處理軟件

4、求出想要得到的結果,最后用單因素的方差分析判斷學生匯編課設等級對學生匯編成績的影響,從而得出匯編成績與學生人數之間呈正態(tài)分布,學生匯編課設等級對學生匯編成績有著顯著影響。關鍵詞:假設檢驗;單因素方差分析;Spss、卡方檢驗I課程設計1問題重述從網絡搜取某大學信息學院學生的匯編成績,并對其進行分析,要求如下:1、分析匯編成績與學生人數之間的關系(取顯著性水平«=0.05);2、為了查看學生動手操作能力與理論結合的情況,分析匯編課程設計等級對匯編成績之間的影響。1.1問題背景在科學研究和生產實踐中,常常需要同時研究兩個以上因素對試驗結果的影響,t檢驗法使用于樣本平均數及兩個樣本平均數間的

5、差異顯著性檢驗,但是在生產和科學研究中經常會遇到比較多個處理優(yōu)劣的問題,即需進行多個平均數間的差異顯著性檢驗。這時t檢驗不合適是因為(1)檢驗過程繁瑣(2)無統(tǒng)一的試驗誤差,誤差估計的精確性和檢驗的靈敏性低。(3)判斷的可靠性低。方差分析法常用于解決此類問題。方差分析是由英國統(tǒng)計學家R.A.Fisher與1923年提出的。其用于多個樣本均數差別的顯著性檢驗。它的基本思想是通過分析研究不同來源的變異對總變異的貢獻大小,從而確定可控因素對研究結果影響力的大小。其目的是通過數據分析找出對該事物有顯著影響的因素,各因素之間的交互作用,以及顯著影響因素的最佳水平等。方差分析又分為單因素方差分析、雙因素試

6、驗方差分析、多因素方差分析和協(xié)方差分析等。單因素方差分析是用來研究一個控制變量的不同水平是否對觀測變量產生了顯著影響。由于僅研究單個因素對觀測變量的影響,因此稱為單因素方差分析。例如,分析不同施肥量是否給農作物產量帶來顯著影響。單因素方差分析的第一步是明確觀測變量和控制變量。單因素方差分析的第二步是剖析觀測變量的方差。方差分析認為:觀測變量值得變動會受控制變量和隨機變量兩方面的影響。據此,單因素方差分析將觀測變量總的離差平方和分解為組間離差平方和和組內離差平方和兩部分,用數學形式表述為SST二SSA+SSE。單因素方差分析的第三步是通過比較觀測變量總離差平方和各部分所占的比例,推斷控制變量是否

7、給觀測變量帶來了顯著影響。在觀測變量總離差平方和中,如果組間離差平方和所占比例較大,則說明觀測變量的變動主要是由控制變量引起的,可以主要由控制變量來解釋,控制變量給觀測變量帶來了顯著影響;反之,如果組間離差平方和所占比例小,則說明觀測變量的變動不是主要由控制變量引起的,不可以主要由控制變量來解釋,控制變量的不同水平沒有給觀測變量帶來顯著影響,觀測變量值的變動是由隨機變量因素引起的。單因素方差分析基本步驟是提出原假設,無差異;F>F有a顯著差異。選擇檢驗統(tǒng)計量,方差分析采用的檢驗統(tǒng)計量是F統(tǒng)計量,即F值檢驗。計算檢驗統(tǒng)計量的觀測值和概率P值:該步驟的目的就是計算檢驗統(tǒng)計量的觀測值和相應的概

8、率P值。給定顯著性水平,并作出決策。因此本論文主要運用單因素方差分析解決匯編課程設計與匯編成績的關系。1.2數據表1.21不同學生課設等級下的學生匯編成績表匯編課設等級一二三四匯67798093編63648780分55818688數47707889表1.22不同匯編成績段下學生人數分布表匯編成績學生人數頻數9510020.008909560.0248590110.0448085230.0927580350.147075470.1886570450.186065360.1445560260.1045055130.052455050.02404510.004總計25012模型假設2.1假設學生匯編

9、成績與學生人數之間呈正態(tài)分布,學生的匯編課程設計等級與匯編成績之間存在相關性,可以用單因素方差分析方法解決。2.2符號說明m:頻數iA:水平等級iX:樣本數據nic:各個偏差fp的權iii3模型建立3.1單因素方差分析前提條件假設檢驗方法被用來對兩個總體的參數之間可能出現的差異進行判斷。但是通常情況下,需要判斷數個總體的參數之間的差異。在這種情況下,總體被稱為組別。這些組別可能根據所關心的因素層級進行分類。如果在分析過程中,各組別的數據是連續(xù)的,而且特定假設條件得到滿足,就可以使用一種叫做方差分析的方法對兩組的均值進行比較。當僅涉及單因素分析時的方差分析叫做單向方差分析。運用單因素方差分析法解

10、決問題有以下前提:(1) 在每一個水平上的實驗結果是一個隨機變量x(i為第i個水平,jij為j次實驗),且服從于正態(tài)分布x,x,x是第i個水平的正態(tài)總體中i1i2in抽取的一個簡單隨機樣本,樣本容量為n。(2) 所有的k個不同水平對應的k個正態(tài)總體的方差是相等的,具有方差齊性,xN(卩,52)。iji(3) k個總體是相互獨立的,樣本與樣本之間也是相互獨立的。要檢驗的假設是:H:卩=卩=卩;H:不是所有的卩(i=1,2k)都相等。0A2kAi若拒絕H,則認為至少有兩個水平之間的差異是顯著的,因素A對實驗結0果有顯著影響;反之,若接受Ho,則認為因素A對實驗結果無顯著影響,實驗結果在各水平之間的

11、不同僅僅是由于隨機因素引起的。3.1.2單因素方差分析解決問題單因素方差分析又稱一元方差分析,它是討論一種因素對試驗結果有無顯著影響。設某種單因素A有r種水平A,A,A3,A,在每種水平下的試驗結果服從正態(tài)分布。如果在各水平下分別作了n(i=1,2r)次試驗,通過單因素試驗方i差分析可以判斷因素A對試驗結果是否有顯著影響。單因素方差分析數據如下AAAA2irxx.x.x1121i1r1xxxx1222i2r2x1jx2jxijxrjx1n1x2n2xinjxrnr3.2單因素方差分析步驟1. 計算平均值將每種水平看成一組,令x為第i種水平上所有試驗的算術平均值,稱為i組內平均值。即:所以組內和

12、為:x二丄,(i=l,2,r)inijij=1(1)T=藝x=nxiijii/=1總平均x為試驗值得算術平均值,即-=1yyxxniji=1j=1如果將(2)帶入(3),可以得到總平均另兩種計算式-1yn(2)(3)nxiii=1-5-_1yx=乙ni=1Ti其中n表示總試驗數,可以用下式計算:n二工nii=12. 計算離差平方和在單因素試驗中,各個試驗結果存在差異,這種差異可用離差平方和來表示。(1) 離差平方和。因為在零假設下,c個組別的總體均值假設相等,可以課程設計先求出單個觀測值與所有組別觀測值的全局均值X之間的差異,然后將其平方求和,從而得到所有觀測值的總離差??傠x差平方和用ss(s

13、umofsquareforTtotal)表示,其計算式為ss二僉a(xx)2=£n(x-x)2Tij-iiji=1j=1i=1式中X=組j的第i個觀測值ijn二組j的觀察值得數量jn二總觀測值數量c二相關因素的組別的數量它表示了各個試驗值與總平均值的偏差的平方和,反映了試驗之間存在的總差異。(2) 組間離差平方和。先求出每一組別的樣本均值X與全局均值X之間的差異,然后以每一組的樣本容量n為權重將其平方加總,就得到了組間離差。組j間離差平方和可以用ss(sumofsquareAforfactorA)表示,ss=血2(x-x)2Aii=1j=1二£n(x-x)2iii=1ss計

14、算公式如下:A式中C二所比較的組別數n二組j的觀察值得數量jX=組j的樣本均值X;全局均值由上式可知,組間離差平方和反映了各組內平均值的差異程度,這種差異由于因素A不同水平的不同作用造成的,所以組間離差平方和又稱為水平向離差平方和。(3) 組內離差平方和。它度量了每一觀測值與本組均值之間的差異,以及所有組別這些差異的平方和。組內離差平方和可以用ss(sumofsquareforerror)e表示,ss計算公式如下:ss=血ni(x-x)2eijii=1j=1式中X=組j的第i個觀測值ijX=組j的樣本均值由上式可知,組內離差平方和反映老了在各個水平內,各試驗值之間的差異程度,這種差異是由于隨機

15、誤差的作用產生的,所以組內離差平方和又稱為誤差項離差平方和??梢宰C明ss=ss+ssTAe說明了試驗值之間的差異來自于兩個方面;一方面是由因素中不同水平造成的,例如反應溫度的不同導致不同的產品得率,這種差異是系統(tǒng)性的;另一方面是由于試驗的隨機誤差產生的差異,例如在相同的溫度下,產品得率也不一定相同。3計算自由度由離差平方和的計算公式可以看出,在同樣的誤差程度下,測得數據越多計算出的離差平方和就越大,因此僅用于離差平方和反映試驗值間差異大小還是不夠多的,還需要考慮試驗數據的多少對離差平方和帶來的影響,為此需要考慮自由度(degreeoffreedom).總離差平方和對應的自由度分別如下。ss對應

16、的自由度稱為總自由度,即:Tdf=n1Tss對應的自由度成為組間自由度,即:Adf=r1Ass對應的自由度稱作組內自由度,即:edf=nre顯然,以上3個自由度的關系為:df=df+dfTAe4.計算平均平方利用離差平方和除以對應的自由度即可得到平均平方(meansquare),簡稱均方。將SS,SS分別除以df,df就可以得到:AeAeMS=SS/dfAAAMS=SS/dfeee稱MS為組間均方(meansquarebetweengroups),MS為組內均方Ae(meansquareswithingroup),MS也被稱為誤差的均方(errormeansquare)。e5F檢驗組間(也稱水

17、平間)均方和組內(也稱水平內)均方之比F是一個統(tǒng)計量,即;F二組間均方/組內均方二aMS它服從自由度為(df,df)的F分布(Fdistribution),對于給定的顯Ae著性水平a,查臨界值F(df,df),如果F>F(df,df),則認為因素AaAeAaAe對試驗結果有顯著影響,否則認為因素A對試驗結果沒有顯著影響。為了將方差分析主要過程表現的更清楚,將有關的計算結果列成方差分析表,如下所示。表321單因素計算結果差異源SSdfMSF顯著性組內(誤差)ss=Ar-1=4MS=ss/(r-1AAMS/MSAe*組內(誤差)SSn-r=45)MS=ss/(n-r)eA總和通常,若F>

18、;F(df,df),就稱因素A對試驗結果有非常顯著的影響,A0.01e用兩個(*)號表示;若F(df,df)<F<F(df,df),則因素A對0.05eA0.01eAA試驗結果有顯著的影響,用一個(*)號表示;若F<F(df,df),A0.05e則因素A對試驗結果不顯著,不用“*”號。A-7-課程設計拒絕域判定:-13-如果零假設為真,F統(tǒng)計值有望接近于1,這是因為分子和分母上的均方STAT項都是對數據內在全局方差的估計。若H不為真(即均值間實際存在差異),0F統(tǒng)計值有望比1大很多,因為分子MSA除了是對數據內在變化性的估計之STAT外,還是對處理效應或組間差異的估計,而分母

19、MSW僅僅度量了內在變化性。因此,單因素方差分析過程所提供的F檢驗中,選定顯著性水平«,只有當F檢STAT驗統(tǒng)計量大于F分布(分子自由度為r-1,分母自由度為n-r)的右側臨界值F時,a零假設才被拒絕,如上圖所示。33模型推導首先用Excel做出該組數據的直方圖,由圖大致分析一下兩者之間的關系,認為其大致服從正態(tài)分布,設總體X服從N(RQ2),其中卩和。0都是未知參數,樣本觀測值為xx.x,似然函數12n1l(pq)=ne2b22兀oi=1v取對數得(x11)2ilnL(y,o)=-ln(2兀)-nlno-1蘭22o2i=1對卩及O求偏導數,并讓他們等于零,得dlnL1中=£

20、;(x_卩)=0dUO2idlnLi-1蘭(x-U)2-二0iOi-1借此方程組得U及O的最大釋然估計值分別是A1iU£xxnii1;n蘭w-x)2oii接著將x以及O算出,然后在計算X落在各個子區(qū)間內的概率p(i1,2,3.l)。為了檢驗原假設H,即檢驗理論分布與統(tǒng)計分布是否符合,我i0們把偏差f-p(i1,2.l)ii的加權平方和作為理論分布與統(tǒng)計分布之間的差異度:Q£c(f-p)2,iiii1其中c為各個偏差f-p的權,如果取c,則當n時,統(tǒng)計量Q的分iiiipi布趨于自由度為kl-r-1的咒2分布,其中/十分不自取間的個數,r是理論分布中需要利用樣本觀測值估計的未知

21、參數的個數。通常把統(tǒng)計量Q記作X2,即£ln(f-p)2£ln(m-np)2X2計為了便于計算,上式可以寫成X2inpi。1p1npi1ii1i對于給定的顯著性水平a,查表可知X2的臨界值X2(1r-1),使aPX2X2(1r1)a.a如果由實驗數據計算得到的統(tǒng)計量X2的內測之大于X2(1r1),則在顯著性水a平a下拒絕原假設H;否則,接受H.00應當指出,利用X2擬合檢驗準則檢驗關于總體分布假設時,要求樣本容量n樣本觀測值落在各個子區(qū)間的頻數m都相當大,一般要求n>50,而im>5(i1,2,.1),如果某些字區(qū)間內的頻數太小,則應適當地把響鈴的兩個或i幾個子

22、區(qū)間合并起來,使得合并后得到的子區(qū)間內的頻數足夠大。當然,這是必須相應地減少統(tǒng)計量X2分布的自由度。對于單因素方差分析,我們設因素A有l(wèi)個水平A,A.A,在水平A下的12li總體X服從正態(tài)分布N(卩,o2),i=I,2,.1,在水平A下進行n次試驗,iiii因為在水平A下的樣本X.與總體分布X服從相同的分布,所以有iijiXN(卩q2),.=12.1,記a二卩-卩,要檢驗的原假設是.j.H:a=a=a=0,設第i組樣本的樣本均值為X(i=1,2,.1),即012l.1n.X=21X.n.ij=1。于是,總的樣本均值1x=ni=1xiji=1=-工nXn.i=1S=22(x.-X)2,把S分解,

23、得到TijTi=1j=1s=2n(Xx)2+22(%-xj2=s+s,由于s和s獨立,現在考慮統(tǒng)TiiijiAeAei=1i=1j=1計量F=s/(11)As/(n1)eF(11,n1).對于給定的顯著性水平a,查表可知的臨界值F(1-1,n-1),如果有樣本觀a測值計算得到的統(tǒng)計量F的觀測值大于F(11,n1),則在顯著性水平a下拒絕a原假設H,如果統(tǒng)計量F的觀測值不大于F(11,n1),貝V接受原假設H,即0a0認為因素A的不同水平對總體無顯著影響。4模型求解4.1做出直方圖用Excel做出各成績段學生人數分布直方圖,1)把匯編成績學生人數表錄入Excel如圖4.1表4.1學生成績錄入表R

24、丘'I.IRAB:D1J編成績學牛人數頻數2ki門70.X39(1"95?0.?2445E5u11U.工!沁七,0.092G0.147vo'vn0.im8聲巧i牛g1060"f?536(i.Lt4F5xtu26u.Lid11buxbb0.052125飛(JC.OJK40“451o.m14總卄?.f1“卜h|52氏1/5hEui:2/Shuui:3/tjm2)點擊插入選擇堆形柱狀圖tmiviAJ三主砒as9=F»ZTJL*BcD1-.1半生人皺E芻曰TMM2nmus=Ga'-3EGO.OZd11OsasENZ5O.032TSQ曰曰Q丄弓F75

25、a?U.12565"70口.:L&GOSE3SU144iil550ZBn111ISU.OPS124ESOB口.C2丄y1OOi:i.14總十卜2EO11M<:Sh七2SH««-t3一J1口1szsu-nv瑠供jjlI.hs|fflg|UJM.LwW-lLanJMQQttl囤UAAAA*得到如下條形統(tǒng)計圖各成績段學生人數直方圖03少985g0757O66055504599°8s807s7065605550450學生匯編成績(單位:分)圖4.1各成績段學生人數分布直方圖4.1.2做出PP圖1)把匯編成績錄入SPSS醸未甑題1數援案0-IBMSP

26、SSStatistics數據綢輯器衰件日編輔目視圖過;數據側轉換(I)分祈血直銷刪方泊捕即ar密匯編成績孌量孌量孌量167126335544757S664761870&SO108711851278加議據視團變星視園2)選擇分析,然后選擇描述統(tǒng)計,再選P-P圖按如圖所示選擇檢驗分布為正態(tài)課程設計住P-P圖芟亙世):札融吩帀CD回從敢庭中怙計叵)r.巨然玄融秋崖匚標準1(2)匸M季節(jié)吐苣行邏):勻咼爭;T匕創(chuàng)苗計門弍國旦lornCiRanKjtC1rukeCVanderVVaerden出結治滬旳根題均值廻)®(H)低也)物強制打開姑邑)確疋翔1占(E)重罷遲/取湎|梨助3)確定,

27、輸出如下圖所示期盟的累鴛舔圖4.2.2-17-圖4.2匯編成績的p-p圖由柱狀圖和P-P圖可以看出學生成績以及各成績段中的學習人數大體上成正態(tài)分布。4.2做假設檢驗要求檢驗的原假設是:已知X,6=丄Y(x-x)2=&,n=250,把各個分數段的中點值取作n:'i=iX.,計算參數卩及b的最大釋然估計值。將數據輸入到Excel中利用公式,i得到©=x=69.9,b=Y(xx)210.5,如下圖:97.5:112.=A16+B1692.5655587.511962.582.5231397.577.5眺2712.572.54T3407.567.5453037.562.522

28、5057.526149552.513682.547.55237.542.5142.5圖4.2.12195116j555j11f9&2.5j23j1897.5f35f2712.547j3407.545j3037.5!362250j26j1495!13j6S2.5j5!237.51L座d=sumSUMfnumb&rl,numberSl,.J:97.5)B(A30-69.9)292.5510.T6687.5309.T61182.5158.T62377.557.T63572.56.T6476了55TG4562.554.T6365了5153.T62652.5302.T61347.5501

29、.76542.5750.T61圖4.2.397.5;761.76;:2)=B30C3092.5510.7663064.5687.5309.76113407.3682.515E.76233651.4S77.55匚76352021.&72.56.7647317.7267.55.7645259.262.554.76361971.3657.5153.76263997.7652.5302.76133935.8847.5501.7652508.842.5750.761750.76027410圖4.2.4表4.1Excel圖注圖4.2.1、4.2.2為各分數段中值點與對應頻數相乘,得到總和最終求得r

30、圖4.2.3為各分數段中值點與成績平均值差的平方即(x-X)2i圖4.2.4為各分數段中值點與成績平均值差的平方與對應頻數相乘即m(x-X)2ii課程設計4.3檢驗原假設現在檢驗原假設:H:XN(69.9,10.52)01(x699)2X的概率密度f(x)=-e-220.510.5Q注意到正態(tài)區(qū)間是(-也+Q,所以第一個區(qū)間應擴大為(95,+Q,最后一個區(qū)間應擴大為(-。45),運用公式P(x1通過查詢正態(tài)分布表可以算出X落在各個分數段的概率p(i=1,2,3,),得到的i數據如下表:表4.3學生成績落在各個分數段的概率表匯編成績人數fPinpi(mnp)2iinpi90+g80.0320.0

31、2870.1438590110.0440.04711.750.0488085230.0920.09423.50.0117580350.140.14335.750.0167075470.1880.184460.0226570450.180.18546.250.0346065360.1440.14536.250.0025560260.1040.096240.1675055130.0520.04912.250.046g5060.0240.0297.250.216總計250112500.705再利用皮爾遜X2擬合檢驗準則來檢驗假設是否成立,已知u(m-np)2X2iinpi=1i由此得X2q0.705

32、因為合并后子空間的個數l=10,利用觀測值估計的參數個數r=2,所以自由度k=10-2-1=7對于給定的a=0.05,查表可知X2(k)=X2(7)=14.10.05因為X2<X2(7),所以接受原假設H,即可認為學生成績服從正態(tài)分布0.050N(69.9,10.52)。用Matlab畫出其圖像,輸入如下:x=40:1:100;y二exp(-(x-69.9)2/220.5)/10.5*(2*pi廠0.5;plot(x,y,'b')輸出圖像如下:-19-課程設計所以學生匯編成績服從XN(69.9,10.52)的正態(tài)分布研究學生匯編課設等級對匯編成績的影響,我們用單因素方差分

33、析來解決。4.4計算平方和根據總偏差平方和公式ST上(x.x)2、組間平方和公式Tiji=1j=1SA亠ni(xi-x)2、誤差平方和公式S=ST-SA,用Matlab將其總偏差平方AiieTAi=1和S,組間平方和S,以及誤差平方和S的觀測值算出,如下:TAex=67,63,55,47,79,64,81,70,80,87,86,78,93,80,88,89;a=67,63,55,47;b=79,64,81,70;c=80,87,86,78;d=93,80,88,89;fl二sum(x(l,:)-mean(x)2);f2=(sum(mean(a)-mean(x)廠2)+sum(mean(b)-

34、mean(x)廠2)+sum(mean(c)-mean(x)廠2)+sum(mean(d)-mean(x)廠2)*4;st=flsa=f2se=fl-f2輸出:st=2.5999e+003sa=2.0272e+003se=572.7500因此可知S=2599.9,S=2027.2,S二572.75TAe4.5比較F值和臨界值根據公式F二SA/(l1),得到F二2°27.188/3沁18.151S/(n-1)572.75/12e根據計算結果,寫出單因素試驗的方差分析如下:表4.2.2單因素方差分析表方差來源平方和自由度F值臨界值顯著性組間2027.2318.151F(3,12)=3.4

35、90.05*F(3,12)=5.95誤差572.75120.01總計2599.915由于F>F(3,12)沁18.151所以學生匯編課設等級對學生匯編成績有著顯0.01著影響。5模型檢驗一檢驗正態(tài)分布1.打開SPSS,定義兩個變量學生人數和匯編成績,輸入原題所給數據。君汩強區(qū)ar嚴+H學生人數匯編咸績1292&92.531187.E42382.553577.5&4772.E14567B8託62.592657.5101252.E11547.512142.513142選擇分析,然后選擇回歸中的線性回歸,將匯編成績導入因變量,學生人數導入為自變量-23-3選擇統(tǒng)計量,按如圖所示

36、勾選尊裁性回歸:統(tǒng)計量回歸系數V估計回H置信區(qū)間水平():|曲協(xié)方差距陣址卜H檔型擬合度迦)HR右變化爸)H描述桂凰前環(huán)H利廚亟1回共線性診斯丄)蜿計量迢)繪制CD保存冏選項9)旦ootstrap(B).叢差Durbin-YVatsonU個案謾斷©裔群(1C0):卜標準差所有個案4選擇繪制,然后按如圖所示操作5確定,輸出如下圖所示模型匯總和參數估計值因變量:匯編成績方程模型匯總參數估計值R方Fdfldf2Sig.常數bl線性.000.001110.98267.668-.008自變量為學生人數。模型匯總模型RR方調整R方標準估計的誤差1.008a.000-.10018.907a.預測變

37、量:(常量),學生人數。Anovab模型平方和df均方FSig.1回歸.2011.201.001.982a殘差3574.79910357.480總計3575.00011a.預測變量:(常量),學生人數。b.因變量:匯編成績課程設計系數a模型非標準化系數標準系數tSig.B標準誤差試用版1(常量)67.6688.9287.579.000學生人數-.008.339-.008-.024.982a.因變量:匯編成績數據散點:圖5.1學生人數匯編成績散點圖可以得出學生成績與學生人數呈正態(tài)分布。二、檢驗相關性運用spss檢驗:1. 打開SPSS,定義兩個變量課設等級和匯編成績,輸入原題所給數據。4-I1-

38、rnf1rl匯編啟換諜設等皴變量孌1E7126313551447157926642181287029eo310B7311SE312783伯舗414S0415S341B11旳42選擇分析中的比較均值,然后選擇單因素方差分析,將匯編成績導入因變量列表,課設等級導入因子列表。甜單因素方差分析因孌量列表旦舂匯編成績J,因子日:夕諜設善級對比型)兩兩比較凹迭項Bootstrap(B).確定|粘貼重蚩但取消幫助»<><<>3. 點擊選項,按下圖所示勾選4, 確定,輸出如下圖所示:ANOVA匯編成績SumofSquaresdfMeanSquareFSig.Betwee

39、nGroups2027.1883675.72918.151.000WithinGroups572.7501247.729Total2599.93815由此可以看出F>F(3,12)沁18.151,所以學生匯編課設等級對學生匯編成績0.01有著顯著影響。運用excel檢驗:1打開excel,輸入數據。AB1等級成績16751634155n147G27972648281927010380113B71U3SG133781*4931n4801G生B8174S92. 選中數據,點擊功能區(qū)數據一數據分析一方差分析:單因素方差分析3. 在彈出的選項框里面,進行如下設置4. 點擊確定,輸出結果方差井析差異源SSdfNSFP-valueFcrit2027.1883&75.72918.1510.001073.357572.75124:7.729總計2599.93015由此可以看出FFcrit,所以拒絕原假設,認為學生匯編課設等級對學生匯編成績有著顯著影響。6 模型評價模型優(yōu)點:1. 建立模型步驟嚴謹,淺顯易懂;2. 運用了正確的數據處理方法;3. 模型求解詳細易于理解;4. 模型類型緊扣實際,適合應用在實際生活中。模型不足:1. 由于對相關知識掌握的不夠,所以在知識解釋上存在一些不足,不易于讀者正確理解。2. 沒有很好的把握論文中心,讓人感覺論

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論