現(xiàn)代心理與教育統(tǒng)計學(xué)的復(fù)習(xí)重點-_第1頁
現(xiàn)代心理與教育統(tǒng)計學(xué)的復(fù)習(xí)重點-_第2頁
現(xiàn)代心理與教育統(tǒng)計學(xué)的復(fù)習(xí)重點-_第3頁
已閱讀5頁,還剩6頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、一二章、緒論現(xiàn)代統(tǒng)計學(xué)之父:皮爾遜描述統(tǒng)計與推斷統(tǒng)計描述統(tǒng)計主要研究如何整理、描述數(shù)據(jù)的特征。推斷統(tǒng)計主要研究如何通過局部數(shù)據(jù)所提供的信息推論總體特征。變量類型定類變量:如,性別、學(xué)號、顏色類別、教學(xué)方法。特征:沒有絕對零點,沒有測量單位。變量值之間有“相等”和“不等”的關(guān)系,但沒有大小之分,不能比較大小,更不能進(jìn)行加、減、乘、除四則運算。定序變量:程度、等級和水平。如,比賽名次、品質(zhì)等級、喜愛程度特征:既無零點、又無測量單位。變量的值之間具有“等于”或“不等于”關(guān)系、序關(guān)系(優(yōu)于、先于、劣于、后于等),四則運算沒有意義。定比變量:除了可以說出名稱和排出大小,還能算出差異大小量的變量。如溫度、

2、測驗成績、智商。特征:有相等的測量單位,無絕對零點??荚嚦煽?yōu)榱悴槐硎緵]有一點知識??蛇M(jìn)行加減運算,乘除運算則無意義。定距變量:如身高、重量、學(xué)生人數(shù)。既有測量單位,又有絕對零點,可進(jìn)行計算。降低偏差:利用隨機抽樣降低變異性:用大一點的樣本3、 描述統(tǒng)計一、頻數(shù):某一事件在某一類別中出現(xiàn)的次數(shù)。頻數(shù)分布類型:正態(tài),正(負(fù))偏態(tài),正(反)J形,U形分布。分布性質(zhì);集中(分散)程度,偏度和峰度不同。偏態(tài)系數(shù):數(shù)據(jù)的對稱性峰態(tài)系數(shù):數(shù)據(jù)的峰度二、集中量數(shù):包括算術(shù)平均數(shù)、中位數(shù)、眾數(shù)(用眾數(shù)代表一組數(shù)據(jù),可靠性較差,不過,眾數(shù)不受極端數(shù)據(jù)的影響,并且求法簡便)、加權(quán)平均數(shù)、幾何平均數(shù)、調(diào)和平均數(shù)。組

3、數(shù)據(jù)中有少數(shù)數(shù)據(jù)偏大或偏小,數(shù)據(jù)的分布呈偏態(tài)時,應(yīng)用幾何平均數(shù)。算數(shù)平均數(shù)的性質(zhì)(算法必須會):(1)每一個變量加減或乘除一個數(shù)之后,均值也相應(yīng)增加。(2)變量值與均值的離均差之和為零。(3)變量值與均值的離均差平方和為最小值。三、離散量數(shù):全距R、四分位差Q、平均差A(yù).D、方差(樣本統(tǒng)計量總體參數(shù))、標(biāo)準(zhǔn)差(s或者SD)、百分位差全距:全部數(shù)據(jù)中的最大值與最小值的差 ,描述了數(shù)據(jù)分布的范圍 。四分位差(Q):樣本中間50%的人的全距的一半。是一個距離,Q越大,表示樣本中各樣品越不整齊.平均差:全部數(shù)據(jù)與均值絕對離均差的均值。方差:各個數(shù)據(jù)偏離中心的程度。方差越大,數(shù)據(jù)波動越大。標(biāo)準(zhǔn)差:方差的

4、算術(shù)平方根。自由度:自由度是指當(dāng)以樣本的統(tǒng)計量來估計總體的參數(shù)時,樣本中獨立或能自由變化的數(shù)據(jù)的個數(shù)。標(biāo)準(zhǔn)分?jǐn)?shù):以標(biāo)準(zhǔn)差為單位表示一個原始分?jǐn)?shù)在團體中所處的相對位置,即原始分?jǐn)?shù)在均值以上或以下幾個標(biāo)準(zhǔn)差的位置。性質(zhì):標(biāo)準(zhǔn)分?jǐn)?shù)的均值為0,標(biāo)準(zhǔn)差為1。沒有實際單位。應(yīng)用:(1)、比較不同性質(zhì)的觀測值在各自數(shù)據(jù)分布中相對位置的高低。如身高與體重。(2)計算不同質(zhì)的觀測值的總和或者均值,以表示在團體中的相對位置。如高考的標(biāo)準(zhǔn)分。(3)做線性轉(zhuǎn)換后,表示標(biāo)準(zhǔn)測驗分?jǐn)?shù)。如IQ。圖表條形圖,用于定性數(shù)據(jù)。直方圖與多邊圖:用于定量數(shù)據(jù)時序圖:反映事物變化趨勢餅圖:定性數(shù)據(jù)的多少或構(gòu)成比例散點圖:兩個變量的變化

5、關(guān)系和變化方向。莖葉圖:保留小樣本連續(xù)變量的原貌。三線表的組成要素包括:表序、表題、項目欄、表體、表注五、隨機變量分布正態(tài)分布-樣本均值的分布正態(tài)分布曲線下的面積:曲線高度是頻數(shù)(Y),曲線下面積則是累積頻數(shù)P(也視作隨機變量出現(xiàn)的概率)。X軸上的截距為Z。其中,決定曲線的位置,決定曲線的“胖瘦”。無論各分布的均值與標(biāo)準(zhǔn)差的值是多少,x取值以下特定區(qū)域的概率(面積)是確定的,即:正負(fù)一個標(biāo)準(zhǔn)差,占68.27%,兩個95.45% ,三個99.73%標(biāo)準(zhǔn)正態(tài)分布:均值為0,標(biāo)準(zhǔn)差為1.總體服從正態(tài)分布N (, )時,來自該總體的所有容量為n的樣本的均值X也服從正態(tài)分布,X的期望為,方差為2/n。即

6、XN(,)平均數(shù)的標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤衡量了抽樣誤差(sampling error)的大小。所謂抽樣誤差是指由抽樣引起的樣本統(tǒng)計量與總體參數(shù)間的差異。標(biāo)準(zhǔn)誤越小,統(tǒng)計量與參數(shù)越接近,樣本對總體越有代表性,用統(tǒng)計量推斷參數(shù)的可靠度越大,所以,標(biāo)準(zhǔn)誤是推斷統(tǒng)計可靠性的重要指標(biāo)??ǚ椒植迹鹤兞肯嗷オ毩ⅲ曳姆植嫉碾S機變量。稱隨機變量服從自由度為為n的卡方分布。記做,卡方分布:樣本方差的分布(樣本方差的分布)T分布:隨機變量X服從N(0,1),Y服從,且相互獨立,則隨機變量服從自由度為n的t 分布,記做t t(n).來自一個正態(tài)總體:來自兩個正態(tài)總體為兩樣本的混合標(biāo)準(zhǔn)差。T分布的均值為0,方差為n/(n-2

7、).t 統(tǒng)計量是參數(shù)估計與假設(shè)檢驗的基礎(chǔ)。特點:當(dāng)樣本容量趨于,t分布為正態(tài)分布,方差為1,隨自由度的減少,離散程度(方差)增大,分布中間變低,尾部變高。F分布:-兩樣本方差的比F統(tǒng)計量主要用于方差分析、協(xié)方差分析、回歸分析等。6、 參數(shù)估計參數(shù)估計:當(dāng)在研究中從樣本獲得一組數(shù)據(jù)后,如何通過這組信息,對總體特征進(jìn)行估計,也就是如何從局部結(jié)果推論總體的情況,稱為總體參數(shù)估計??傮w參數(shù)估計問題可以分為點估計與區(qū)間估計。點估計:用某一樣本統(tǒng)計量的值來估計相應(yīng)總體參數(shù)的值。優(yōu)良的估計量具有的性質(zhì):無偏性、有效性、一致性。區(qū)間估計:按一定概率要求,由樣本統(tǒng)計量的值估計總體參數(shù)值的所在范圍。原理:抽樣分布

8、理論。抽樣分布的標(biāo)準(zhǔn)誤的大小決定置信區(qū)間的長度。置信區(qū)間:指在某一置信度時,總體參數(shù)所在的區(qū)域長度。置信度:是作出某種推斷時正確的可能性(概率)。通常用(1a)表示。顯著性水平:即 a,是指估計總體參數(shù)落在某一區(qū)間時可能犯錯誤的概率。兩個要素:可靠性(置信水平的高低)和精確度(區(qū)間長度)。置信水平為95%的置信區(qū)間的確切含義:重復(fù)抽樣N次,所得到的N個置信區(qū)間中有95%個包含了總體參數(shù)。影響區(qū)間估計精確度的因素:(1) 置信度(1a)(反比)(2) 樣本容量(正比)(3) 總體數(shù)據(jù)的變異程度(反比)0.95的置信區(qū)間:單總體均值的區(qū)間估計:方差已知,正態(tài)分布;方差未知,t分布。兩總體均值差異的

9、區(qū)間估計:T分布。相關(guān)樣本與獨立樣本都為T分布。其中,獨立樣本時用很長很長的那個公式??傮w均值的區(qū)間估計:卡方分布7、 假設(shè)檢驗假設(shè)檢驗(顯著性檢驗):事先對總體參數(shù)或分布形式作出某種假設(shè),然后利用樣本信息來判斷原假設(shè)是否成立。類型:參數(shù)檢驗和非參數(shù)檢驗(包括分布檢驗和獨立性檢驗)。假設(shè)檢驗的原理:(1)邏輯上為反證法(假設(shè)檢驗首先假定虛無假設(shè)為真,通過否定,來檢驗備擇假設(shè)的真實性)(2)統(tǒng)計上為小概率事件(小概率事件在一次實驗或觀測中,幾乎是不可能發(fā)生的。在一次試驗中小概率事件一旦發(fā)生,我們就有理由拒絕原假設(shè)。小概率由研究者事先確定,如0.05, 0.01, 0.001等)。假設(shè)檢驗的步驟:

10、(1)提出原假設(shè)和備擇假設(shè)(2)確定適當(dāng)?shù)臋z驗統(tǒng)計量,檢驗統(tǒng)計量(方差已知)的基本形式為:(3)規(guī)定顯著性水平(0.05或0.01)(4)計算檢驗統(tǒng)計量的值(5)作出統(tǒng)計決策拒絕域:拒絕原假設(shè)的概率。兩類錯誤:拒真錯誤型錯誤;取偽錯誤型錯誤。統(tǒng)計效力(統(tǒng)計檢驗力)。兩類錯誤的關(guān)系:(1) 不一定等于1.(2) 其他條件不變,兩者不能同時增大或者減小。(3) 兩者地位不一樣。我們應(yīng)盡量避免第一類錯誤。(4) 影響錯誤的因素有總體標(biāo)準(zhǔn)差(正比)和樣本容量(反比)。單側(cè)檢驗與雙側(cè)檢驗單側(cè)檢驗:強調(diào)方向性。雙側(cè)檢驗:只強調(diào)差異,不強調(diào)方向性。單總體均值的假設(shè)檢驗:方差已知,正態(tài)分布;。用這個統(tǒng)計公式,

11、然后查表。方差未知,t分布。兩總體均值差異的顯著性檢驗:(1) 相關(guān)樣本,使用 t 分布統(tǒng)計量(2) 獨立樣本,方差已知,使用正態(tài)分布統(tǒng)計量;(3) 獨立樣本,方差未知,但是齊性,使用 t 分布統(tǒng)計量總體分布的假設(shè)檢驗(屬于非參數(shù)檢驗):卡方檢驗設(shè)有N個被試,按變量X的取值可以分成k類,第i類有Oi個觀測值,則檢驗統(tǒng)計量為:8、 方差分析方差分析的邏輯:把觀察值的總變異分解為兩個或多個部分,除隨機誤差外,其余各部分變異可由某個或某幾個因素或它們的交互作用來解釋。F 分布的統(tǒng)計推斷可闡明某一或某些因素或因素間交互作用是否對觀察值有影響。單因素方差分析的邏輯與步驟:(1)模型與假設(shè)(2)平方和的分

12、解與F 檢驗(3)關(guān)聯(lián)強度與效應(yīng)值(4)多重比較(5)前提假設(shè)方差分析的前提條件:總體服從正態(tài)分布;變異可加性;方差齊性;獨立性。單因素完全隨機設(shè)計的方差分析:關(guān)聯(lián)強度與效應(yīng)值:實驗處理引致的效應(yīng)的大小或者數(shù)據(jù)的變異有多少部分是由實驗處理造成的。關(guān)聯(lián)強度:因變量的變異被自變量解釋的百分比。事后比較:F檢驗顯著說明各組均值并不相同(至少兩組不同),但不能回答到底哪幾組不同。通過對各組均值之間的配對比較來進(jìn)一步檢驗到底哪些均值之間存在差異。事后比較的方法:(1)費舍最小顯著差異法:對檢驗兩總體均值是否相等的t檢驗方法的總體方差估計加以修正(用MSE代替)。(2)S-N-K,q檢驗:把各組均值排序,

13、用每一比較的兩個均值在排序序列種相差的等級數(shù)來確定不同的q 臨界值。(3)HSD檢驗:與SNK法類似,不同之處在于不論各組均值的大小次序,均使用同一臨界值。(4)Bonferroni校正(以t 分布作為檢驗分布,對檢驗水準(zhǔn)進(jìn)行調(diào)整),不適用于比較的次數(shù)很多的情況。方差分析結(jié)果的解釋與報告:單因素方差分析結(jié)果(范例):方差分析的結(jié)果(見表2)顯示,教學(xué)方法對閱讀理解的成績有顯著影響,F(xiàn)(2, 15)=4.44,MSE=34.94,p=0.0310.05,Etap2=0.37。進(jìn)一步的多重比較顯示,當(dāng)使用教學(xué)方法2時,被試的成績顯著高于使用方法1(p=0.015)或方法3時(p=0.030);但是

14、,方法1和方法3之間則無顯著差異(p=0.737)。雙因素結(jié)果方差分析(范例):標(biāo)題提示與閱讀速度對成績的影響方差分析的結(jié)果顯示,標(biāo)題提示對成績有顯著影響,F(xiàn)(2,66)=3.856,MSE=2.475,p=0.0260.05,Eta p2 =0.105。事后比較結(jié)果顯示,當(dāng)標(biāo)題提示為正確與中性時,成績顯著高于標(biāo)題提示為誤導(dǎo)時的成績(p0.05),但前兩者無顯著差異。方差分析還顯示,閱讀速度對成績有顯著影響,F(xiàn)(1,66)=21.573,MSE=2.475,p=0.0000.01,Eta p2 =0.246,閱讀速度為常速時的成績比快速時更高。更重要的是,交互作用顯著,F(xiàn)(2,66)=3.57

15、5,MSE=2.475,p=0.0340.05,Eta p2 =0.098,也就是說,標(biāo)題提示對成績的影響會隨著閱讀速度的不同而不同。簡單主效應(yīng)檢驗顯示,閱讀速度為快速時,標(biāo)題提示為正確時的成績顯著高于標(biāo)題提示為中性(p=0.031)和誤導(dǎo)時(p=0.001)的成績,但后兩者無顯著差異(p=0.247);而當(dāng)閱讀速度為常速時,標(biāo)題提示對成績無顯著影響F(1,66)=1.560,MSE=2.475,p=0.218,Eta p2 =0.045。兩因素完全隨機設(shè)計的方差分析:適用情形:有2個自變量,自變量A有p個水平,自變量B有q個水平,共有p*q種處理。比單因素多了一個交互作用的離均差平方和。交互

16、作用:交互作用顯著以后,還要做進(jìn)一步的簡單主效應(yīng)的檢驗。多重比較:小結(jié):F檢驗:主效應(yīng)與交互作用是否顯著。多重比較:對顯著的主效應(yīng)進(jìn)行多重比較。簡單主效應(yīng)檢驗:檢驗因素A(B)在B(A)各個水平上的簡單主效應(yīng),若顯著,繼續(xù)就簡單主效應(yīng)進(jìn)行多重比較。9、 相關(guān)相關(guān)量數(shù)相關(guān)系數(shù):兩列變量間相關(guān)程度的數(shù)字表現(xiàn)形式作為樣本的統(tǒng)計量用r表示,作為總體參數(shù)一般用表示。正相關(guān):兩列變量變動方向相同負(fù)相關(guān):兩列變量中有一列變量變動時,另一列變量呈現(xiàn)出與前一列變量方向相反的變動零相關(guān):兩列變量之間沒有關(guān)系,各自按照自己的規(guī)律或無規(guī)律變化1積差相關(guān)也就是Pearson相關(guān)。(1)前提數(shù)據(jù)要成對出現(xiàn),即若干個體中每

17、個個體都有兩種不同的觀測值,并且每隊數(shù)據(jù)與其它對子相互獨立兩列變量各自總體的分布都是正態(tài)的,至少接近正態(tài)兩個相關(guān)的變量是連續(xù)變量,也即兩列數(shù)據(jù)都是測量數(shù)據(jù)兩列變量之間的關(guān)系應(yīng)是直線性的2等級相關(guān)也就是Spearman相關(guān)(1)適用范圍當(dāng)研究考察的變量為順序型數(shù)據(jù)時,若原始數(shù)據(jù)為等比貨等距,則先轉(zhuǎn)化為順序型數(shù)據(jù)當(dāng)研究考察的變量為非線性數(shù)據(jù)時(2)公式將原始數(shù)據(jù)轉(zhuǎn)化為順序型數(shù)據(jù),仍然用Pearson相關(guān)公式計算即可。3肯德爾等級相關(guān)(1)肯德爾W系數(shù)也叫肯德爾和諧系數(shù),原始數(shù)據(jù)資料的獲得一般采用等級評定法,即讓K個被試對N件實物進(jìn)行等級評定。其原理是評價者評價的一致性除以最大變異可能性。(2)肯德

18、爾U系數(shù)#其與肯德爾W系數(shù)所處理的問題相同,但評價者采用對偶比較法,即將N件事物兩兩配對分別進(jìn)行比較4點二列相關(guān)與二列相關(guān)(1)點二列相關(guān)適用于一列數(shù)據(jù)為等距正態(tài)變量,另一列為離散型二分變量。是與二分稱名變量的一個值對應(yīng)的連續(xù)變量的平均數(shù)是與二分稱名變量的另一個值對應(yīng)的連續(xù)變量的平均數(shù)p與q是二分稱名變量兩個值各自所占的比率st是連續(xù)變量的標(biāo)準(zhǔn)差(2)二列相關(guān)適用于兩列變量都是正態(tài)等距變量,但其中一列變量被人為地分成兩類。y為標(biāo)準(zhǔn)正態(tài)曲線中p值對應(yīng)的高度,查正態(tài)分布表能得到相關(guān)系數(shù):度量兩個變量相關(guān)程度大小的數(shù)字特征。變量類型與該用的相關(guān)方法:兩個定序變量-斯皮爾曼等級相關(guān)兩定類變量-卡方獨立

19、性檢驗一定類,一個定序-卡方獨立性檢驗定類(序),定距-點二列相關(guān),單因素方差分析兩定距-皮爾遜相關(guān)(積差相關(guān))各種統(tǒng)計方法的適用條件:T檢驗:(1)總體正態(tài)分布(2)方差齊性(3)變量相互獨立方差分析:(1)正態(tài)(2)方差齊性(3)獨立性(4)變異可加性積差相關(guān):(1)兩個變量都是連續(xù)的(2)正態(tài)分布(3)變量之間為線性關(guān)系回歸:(1)正態(tài)(2)線性關(guān)系(3)獨立性(4)誤差等分散積差相關(guān)的計算協(xié)方差:協(xié)方差是兩個變量離均差乘積的均值。兩個變量離均差的成績能夠反映兩個變量的一致性。協(xié)方差是兩個變量線性關(guān)系的指示器,但不能直接用它來表示相關(guān)的大小,因為有不同的測量單位,故將其標(biāo)準(zhǔn)化。 方差是協(xié)

20、方差的特例。相關(guān)系數(shù)值的大小不表示相關(guān)是否顯著。相關(guān)的程度與r 值不成正比卡方檢驗:,理論頻數(shù)=所占比率*人數(shù)點二列相關(guān):一個連續(xù)變量與另一個二分稱名變量的相關(guān)程度。(男女,高低)二列相關(guān):兩列數(shù)據(jù)均為正態(tài)分布(男女兩個類別);十、回歸回歸:指由一個變量的變化去預(yù)測另一個變量的變化,描述一個變量隨另一變量做不同程度變化的單向關(guān)系?;貧w分析的目的就是要找出一個錯誤最小的方法來用X預(yù)測Y?;貧w分析的步驟:(1)建立并求解回歸模型的方程(2)檢驗與評價回歸方程的有效性 針對整個回歸方程 針對各個回歸系數(shù)(3) 利用回歸方程作出預(yù)測與控制建立回歸方程:Y=a+bX b為回歸系數(shù),Y 為實際的Y的預(yù)測值。 回歸系數(shù)與相關(guān)系數(shù):檢驗與評價:是一個估計總體參數(shù)的置信區(qū)間和假設(shè)檢驗的問題。估計誤差標(biāo)準(zhǔn)差(標(biāo)準(zhǔn)誤):回歸方程的顯著性檢驗:回歸方程參數(shù)的置信區(qū)間與檢驗:t檢驗回歸系數(shù)的b的檢驗:(1)提出假設(shè)=0 (2)(3) 確定顯著性水平,并

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論