現代心理教育統計學復習要點_第1頁
現代心理教育統計學復習要點_第2頁
現代心理教育統計學復習要點_第3頁
現代心理教育統計學復習要點_第4頁
現代心理教育統計學復習要點_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

(完整word版)現代心理教育統計學復習要點(完整word版)現代心理教育統計學復習要點..(完整word版)現代心理教育統計學復習要點一二章、緒論現代統計學之父:皮爾遜描述統計與推斷統計描述統計主要研究如何整理、描述數據的特征。推斷統計主要研究如何通過局部數據所提供的信息推論總體特征。變量類型定類變量:如,性別、學號、顏色類別、教學方法。特征:沒有絕對零點,沒有測量單位。變量值之間有“相等”和“不等”的關系,但沒有大小之分,不能比較大小,更不能進行加、減、乘、除四則運算.定序變量:程度、等級和水平。如,比賽名次、品質等級、喜愛程度特征:既無零點、又無測量單位。變量的值之間具有“等于”或“不等于"關系、序關系(優(yōu)于、先于、劣于、后于等),四則運算沒有意義。定比變量:除了可以說出名稱和排出大小,還能算出差異大小量的變量.如溫度、測驗成績、智商.特征:有相等的測量單位,無絕對零點。考試成績?yōu)榱悴槐硎緵]有一點知識。可進行加減運算,乘除運算則無意義。定距變量:如身高、重量、學生人數。既有測量單位,又有絕對零點,可進行計算。降低偏差:利用隨機抽樣降低變異性:用大一點的樣本描述統計一、頻數:某一事件在某一類別中出現的次數。頻數分布類型:正態(tài),正(負)偏態(tài),正(反)J形,U形分布.分布性質;集中(分散)程度,偏度和峰度不同。偏態(tài)系數:數據的對稱性峰態(tài)系數:數據的峰度二、集中量數:包括算術平均數、中位數、眾數(用眾數代表一組數據,可靠性較差,不過,眾數不受極端數據的影響,并且求法簡便)、加權平均數、幾何平均數、調和平均數。組數據中有少數數據偏大或偏小,數據的分布呈偏態(tài)時,應用幾何平均數.算數平均數的性質(算法必須會):(1)每一個變量加減或乘除一個數之后,均值也相應增加。(2)變量值與均值的離均差之和為零。(3)變量值與均值的離均差平方和為最小值.三、離散量數:全距R、四分位差Q、平均差A。D、方差(樣本統計量總體參數)、標準差(s或者SD)、百分位差全距:全部數據中的最大值與最小值的差,描述了數據分布的范圍。四分位差(Q):樣本中間50%的人的全距的一半.是一個距離,Q越大,表示樣本中各樣品越不整齊.平均差:全部數據與均值絕對離均差的均值。方差:各個數據偏離中心的程度。方差越大,數據波動越大.標準差:方差的算術平方根。自由度:自由度是指當以樣本的統計量來估計總體的參數時,樣本中獨立或能自由變化的數據的個數.標準分數:以標準差為單位表示一個原始分數在團體中所處的相對位置,即原始分數在均值以上或以下幾個標準差的位置。性質:標準分數的均值為0,標準差為1.沒有實際單位。應用:(1)、比較不同性質的觀測值在各自數據分布中相對位置的高低。如身高與體重。(2)計算不同質的觀測值的總和或者均值,以表示在團體中的相對位置。如高考的標準分。(3)做線性轉換后,表示標準測驗分數。如IQ。圖表條形圖,用于定性數據。直方圖與多邊圖:用于定量數據時序圖:反映事物變化趨勢餅圖:定性數據的多少或構成比例散點圖:兩個變量的變化關系和變化方向.莖葉圖:保留小樣本連續(xù)變量的原貌。三線表的組成要素包括:表序、表題、項目欄、表體、表注五、隨機變量分布正態(tài)分布———---——---——-—---樣本均值的分布正態(tài)分布曲線下的面積:曲線高度是頻數(Y),曲線下面積則是累積頻數P(也視作隨機變量出現的概率)。X軸上的截距為Z.其中,μ決定曲線的位置,σ決定曲線的“胖瘦".無論各分布的均值與標準差的值是多少,x取值以下特定區(qū)域的概率(面積)是確定的,即:正負一個標準差,占68。27%,兩個95。45%,三個99.73%標準正態(tài)分布:均值為0,標準差為1??傮w服從正態(tài)分布N~(μ,)時,來自該總體的所有容量為n的樣本的均值X也服從正態(tài)分布,X的期望為μ,方差為σ2/n。即X~N(μ,)平均數的標準誤標準誤衡量了抽樣誤差(samplingerror)的大小。所謂抽樣誤差是指由抽樣引起的樣本統計量與總體參數間的差異。標準誤越小,統計量與參數越接近,樣本對總體越有代表性,用統計量推斷參數的可靠度越大,所以,標準誤是推斷統計可靠性的重要指標。卡方分布:變量相互獨立,且服從分布的隨機變量。稱隨機變量服從自由度為為n的卡方分布.記做,卡方分布:樣本方差的分布(樣本方差的分布)T分布:隨機變量X服從N(0,1),Y服從,且相互獨立,則隨機變量服從自由度為n的t分布,記做tt(n)..來自一個正態(tài)總體:來自兩個正態(tài)總體為兩樣本的混合標準差。T分布的均值為0,方差為n/(n-2)。t統計量是參數估計與假設檢驗的基礎.特點:當樣本容量趨于,t分布為正態(tài)分布,方差為1,隨自由度的減少,離散程度(方差)增大,分布中間變低,尾部變高。F分布:—--————--—兩樣本方差的比F統計量主要用于方差分析、協方差分析、回歸分析等。參數估計參數估計:當在研究中從樣本獲得一組數據后,如何通過這組信息,對總體特征進行估計,也就是如何從局部結果推論總體的情況,稱為總體參數估計??傮w參數估計問題可以分為點估計與區(qū)間估計.點估計:用某一樣本統計量的值來估計相應總體參數的值.優(yōu)良的估計量具有的性質:無偏性、有效性、一致性.區(qū)間估計:按一定概率要求,由樣本統計量的值估計總體參數值的所在范圍.原理:抽樣分布理論.抽樣分布的標準誤的大小決定置信區(qū)間的長度。置信區(qū)間:指在某一置信度時,總體參數所在的區(qū)域長度。置信度:是作出某種推斷時正確的可能性(概率)。通常用(1-a)表示。顯著性水平:即a,是指估計總體參數落在某一區(qū)間時可能犯錯誤的概率。兩個要素:可靠性(置信水平的高低)和精確度(區(qū)間長度)。置信水平為95%的置信區(qū)間的確切含義:重復抽樣N次,所得到的N個置信區(qū)間中有95%個包含了總體參數.影響區(qū)間估計精確度的因素:置信度(1-a)(反比)樣本容量(正比)總體數據的變異程度(反比)0。95的置信區(qū)間:單總體均值的區(qū)間估計:方差已知,正態(tài)分布;方差未知,t分布.兩總體均值差異的區(qū)間估計:T分布。相關樣本與獨立樣本都為T分布。其中,獨立樣本時用很長很長的那個公式。總體均值的區(qū)間估計:卡方分布假設檢驗假設檢驗(顯著性檢驗):事先對總體參數或分布形式作出某種假設,然后利用樣本信息來判斷原假設是否成立。類型:參數檢驗和非參數檢驗(包括分布檢驗和獨立性檢驗)。假設檢驗的原理:(1)邏輯上為反證法(假設檢驗首先假定虛無假設為真,通過否定,來檢驗備擇假設的真實性)(2)統計上為小概率事件(小概率事件在一次實驗或觀測中,幾乎是不可能發(fā)生的。在一次試驗中小概率事件一旦發(fā)生,我們就有理由拒絕原假設.小概率由研究者事先確定,如0。05,0。01,0。001等)。假設檢驗的步驟:(1)提出原假設和備擇假設(2)確定適當的檢驗統計量,檢驗統計量(方差已知)的基本形式為:(3)規(guī)定顯著性水平(0。05或0.01)(4)計算檢驗統計量的值(5)作出統計決策拒絕域:拒絕原假設的概率.兩類錯誤:拒真錯誤型錯誤;取偽錯誤型錯誤。統計效力(統計檢驗力).兩類錯誤的關系:不一定等于1。其他條件不變,兩者不能同時增大或者減小.兩者地位不一樣。我們應盡量避免第一類錯誤。影響錯誤的因素有總體標準差(正比)和樣本容量(反比)。單側檢驗與雙側檢驗單側檢驗:強調方向性.雙側檢驗:只強調差異,不強調方向性。單總體均值的假設檢驗:方差已知,正態(tài)分布;。用這個統計公式,然后查表。方差未知,t分布。兩總體均值差異的顯著性檢驗:相關樣本,使用t分布統計量獨立樣本,方差已知,使用正態(tài)分布統計量;獨立樣本,方差未知,但是齊性,使用t分布統計量總體分布的假設檢驗(屬于非參數檢驗):卡方檢驗設有N個被試,按變量X的取值可以分成k類,第i類有Oi個觀測值,則檢驗統計量為:方差分析方差分析的邏輯:把觀察值的總變異分解為兩個或多個部分,除隨機誤差外,其余各部分變異可由某個或某幾個因素或它們的交互作用來解釋。F分布的統計推斷可闡明某一或某些因素或因素間交互作用是否對觀察值有影響。單因素方差分析的邏輯與步驟:(1)模型與假設(2)平方和的分解與F檢驗(3)關聯強度與效應值(4)多重比較(5)前提假設方差分析的前提條件:總體服從正態(tài)分布;變異可加性;方差齊性;獨立性。單因素完全隨機設計的方差分析:關聯強度與效應值:實驗處理引致的效應的大小或者數據的變異有多少部分是由實驗處理造成的。關聯強度:因變量的變異被自變量解釋的百分比。事后比較:F檢驗顯著說明各組均值并不相同(至少兩組不同),但不能回答到底哪幾組不同。通過對各組均值之間的配對比較來進一步檢驗到底哪些均值之間存在差異。事后比較的方法:(1)費舍最小顯著差異法:對檢驗兩總體均值是否相等的t檢驗方法的總體方差估計加以修正(用MSE代替)。(2)S—N-K,q檢驗:把各組均值排序,用每一比較的兩個均值在排序序列種相差的等級數來確定不同的q臨界值。(3)HSD檢驗:與SNK法類似,不同之處在于不論各組均值的大小次序,均使用同一臨界值.(4)Bonferroni校正(以t分布作為檢驗分布,對檢驗水準進行調整),不適用于比較的次數很多的情況。方差分析結果的解釋與報告:單因素方差分析結果(范例):方差分析的結果(見表2)顯示,教學方法對閱讀理解的成績有顯著影響,F(2,15)=4.44,MSE=34。94,p=0。031<0。05,Etap2=0.37.進一步的多重比較顯示,當使用教學方法2時,被試的成績顯著高于使用方法1(p=0。015)或方法3時(p=0。030);但是,方法1和方法3之間則無顯著差異(p=0.737)。雙因素結果方差分析(范例):標題提示與閱讀速度對成績的影響方差分析的結果顯示,標題提示對成績有顯著影響,F(2,66)=3。856,MSE=2.475,p=0.026〈0。05,Etap2=0。105。事后比較結果顯示,當標題提示為正確與中性時,成績顯著高于標題提示為誤導時的成績(p〈0。05),但前兩者無顯著差異.方差分析還顯示,閱讀速度對成績有顯著影響,F(1,66)=21.573,MSE=2。475,p=0.000〈0.01,Etap2=0。246,閱讀速度為常速時的成績比快速時更高。更重要的是,交互作用顯著,F(2,66)=3.575,MSE=2.475,p=0.034〈0.05,Etap2=0。098,也就是說,標題提示對成績的影響會隨著閱讀速度的不同而不同.簡單主效應檢驗顯示,閱讀速度為快速時,標題提示為正確時的成績顯著高于標題提示為中性(p=0。031)和誤導時(p=0.001)的成績,但后兩者無顯著差異(p=0。247);而當閱讀速度為常速時,標題提示對成績無顯著影響F(1,66)=1.560,MSE=2。475,p=0.218,Etap2=0.045。兩因素完全隨機設計的方差分析:適用情形:有2個自變量,自變量A有p個水平,自變量B有q個水平,共有p*q種處理.比單因素多了一個交互作用的離均差平方和。交互作用:交互作用顯著以后,還要做進一步的簡單主效應的檢驗。多重比較:小結:F檢驗:主效應與交互作用是否顯著。多重比較:對顯著的主效應進行多重比較。簡單主效應檢驗:檢驗因素A(B)在B(A)各個水平上的簡單主效應,若顯著,繼續(xù)就簡單主效應進行多重比較.相關相關量數相關系數:兩列變量間相關程度的數字表現形式作為樣本的統計量用r表示,作為總體參數一般用ρ表示。正相關:兩列變量變動方向相同負相關:兩列變量中有一列變量變動時,另一列變量呈現出與前一列變量方向相反的變動零相關:兩列變量之間沒有關系,各自按照自己的規(guī)律或無規(guī)律變化1.積差相關也就是Pearson相關。(1)前提①數據要成對出現,即若干個體中每個個體都有兩種不同的觀測值,并且每隊數據與其它對子相互獨立②兩列變量各自總體的分布都是正態(tài)的,至少接近正態(tài)③兩個相關的變量是連續(xù)變量,也即兩列數據都是測量數據④兩列變量之間的關系應是直線性的2.等級相關也就是Spearman相關(1)適用范圍①當研究考察的變量為順序型數據時,若原始數據為等比貨等距,則先轉化為順序型數據②當研究考察的變量為非線性數據時(2)公式將原始數據轉化為順序型數據,仍然用Pearson相關公式計算即可。3.肯德爾等級相關(1)肯德爾W系數也叫肯德爾和諧系數,原始數據資料的獲得一般采用等級評定法,即讓K個被試對N件實物進行等級評定.其原理是評價者評價的一致性除以最大變異可能性。(2)肯德爾U系數#其與肯德爾W系數所處理的問題相同,但評價者采用對偶比較法,即將N件事物兩兩配對分別進行比較4.點二列相關與二列相關(1)點二列相關適用于一列數據為等距正態(tài)變量,另一列為離散型二分變量.是與二分稱名變量的一個值對應的連續(xù)變量的平均數是與二分稱名變量的另一個值對應的連續(xù)變量的平均數p與q是二分稱名變量兩個值各自所占的比率st是連續(xù)變量的標準差(2)二列相關適用于兩列變量都是正態(tài)等距變量,但其中一列變量被人為地分成兩類。y為標準正態(tài)曲線中p值對應的高度,查正態(tài)分布表能得到相關系數:度量兩個變量相關程度大小的數字特征。變量類型與該用的相關方法:兩個定序變量--———--—斯皮爾曼等級相關兩定類變量———————--—---——————卡方獨立性檢驗一定類,一個定序-—----——卡方獨立性檢驗定類(序),定距-—-—----——點二列相關,單因素方差分析兩定距———————--—-—-—-—-—--—-皮爾遜相關(積差相關)各種統計方法的適用條件:T檢驗:(1)總體正態(tài)分布(2)方差齊性(3)變量相互獨立方差分析:(1)正態(tài)(2)方差齊性(3)獨立性(4)變異可加性積差相關:(1)兩個變量都是連續(xù)的(2)正態(tài)分布(3)變量之間為線性關系回歸:(1)正態(tài)(2)線性關系(3)獨立性(4)誤差等分散積差相關的計算協方差:協方差是兩個變量離均差乘積的均值.兩個變量離均差的成績能夠反映兩個變量的一致性。協方差是兩個變量線性關系的指示器,但不能直接用它來表示相關的大小,因為有不同的測量單位,故將其標準化。方差是協方差的特例。相關系數值的大小不表示相關是否顯著.相關的程度與r值不成正比卡方檢驗:,理論頻數=所占比率*人數點二列相關:一個連續(xù)變量與另一個二分稱名變量的相關程度。(男女,高低)二列相關:兩列數據均為正態(tài)分布(男女兩個類別);十、回歸回歸:指由一個變量的變化去預測另一個變量的變化,描述一個變量隨另一變量做不同程度變化的單向關系?;貧w分析的目的就是要找出一個錯誤最小的方法來用X預測Y?;貧w分析的步驟:(1)建立并求解回歸模型的方程(2)檢驗與評價回歸方程的有效性針對整個回歸方程針對各個回歸系數利用回歸方程作出預測與控制建立回歸方程:Y=a+bXb為回歸系數,Y為實際的Y的預測值。回歸系數與相關系數:檢驗與評價:是一個估計總體參數的置信區(qū)間和假設檢驗的問題。估計誤差標準差(標準誤):回歸方程的顯著性檢驗:回歸方程參數的置信區(qū)間與檢驗:t檢驗回歸系數的b的檢驗:(1)提出假設=0(2)確定顯著性水平,并決策。決定序數(度量了Y的變異(由總平方和衡量)中可以由自變量的變異來解釋的比例):(回歸平方和與殘差平方和)回歸平方和占的比例越大,殘差平方和占的比例就越小,回歸直線擬合得越

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論