第九章T檢驗講解_第1頁
第九章T檢驗講解_第2頁
第九章T檢驗講解_第3頁
第九章T檢驗講解_第4頁
第九章T檢驗講解_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

T檢驗學習要點第一節(jié)

T檢驗的用途第二節(jié)

獨立樣本與成對樣本兩獨立樣本平均數(shù)的差異檢驗第四節(jié)

成對樣本的T檢驗本章小結學習要點在語言實驗研究中,我們通常選取研究對象的一部分(即樣本)加以研究,在此基礎上,通過推斷統(tǒng)計對所有的研究對象(即總體)的情況作出推斷。在進行這種推斷時,我們不僅要指出總休可能是什么情況,而且還要指出我們進行這種推斷的把握程度有多大,或者總體出現(xiàn)這種情況的可能性有多大,這個“可能性”就是概率。因此,要學好推斷統(tǒng)計,就要對概率這一概念有所了解。第一節(jié)

T檢驗的用途t檢驗是對各回歸系數(shù)的顯著性所進行的檢驗,(--這個太不全面了,這是指在多元回歸分析中,檢驗回歸系數(shù)是否為0的時候,先用F檢驗,考慮整體回歸系數(shù),再對每個系數(shù)是否為零進行t檢驗。t檢驗還可以用來檢驗樣本為來自一元正態(tài)分布的總體的期望,即均值;和檢驗樣本為來自二元正態(tài)分布的總體的期望是否相等)目的:比較樣本均數(shù)所代表的未知總體均數(shù)μ和已知總體均數(shù)μ0。計算公式:t統(tǒng)計量:自由度:v=n-1編輯本段適用條件(1)已知一個總體均數(shù);(2)可得到一個樣本均數(shù)及該樣本標準誤;(3)樣本來自正態(tài)或近似正態(tài)總體。解:1.建立假設、確定檢驗水準αH0:μ=μ0(無效假設,nullhypothesis)H1:(備擇假設,alternativehypothesis,)雙側檢驗,檢驗水準:α=0.052.計算檢驗統(tǒng)計量,v=n-1=35-1=343.查相應界值表,確定P值,下結論查附表1,t0.05/2.34=2.032,t<t0.05/2.34,P>0.05,按α=0.05水準,不拒絕H0,兩者的差別無統(tǒng)計學意義T檢驗(TTest)什么是T檢驗T檢驗,亦稱studentt檢驗(Student'sttest),主要用于樣本含量較?。ɡ鏽<30),總體標準差σ未知的正態(tài)分布資料。T檢驗是用于小樣本(樣本容量小于30)的兩個平均值差異程度的檢驗方法。它是用T分布理論來推斷差異發(fā)生的概率,從而判定兩個平均數(shù)的差異是否顯著。T檢驗是戈斯特為了觀測釀酒質量而發(fā)明的。戈斯特在位于都柏林的健力士釀酒廠擔任統(tǒng)計學家,基于ClaudeGuinness聘用從牛津大學和劍橋大學出來的最好的畢業(yè)生以將生物化學及統(tǒng)計學應用到健力士工業(yè)程序的創(chuàng)新政策。戈特特于1908年在Biometrika上公布T檢驗,但因其老板認為其為商業(yè)機密而被迫使用筆名(學生)。實際上,戈斯特的真實身份不只是其它統(tǒng)計學家不知道,連其老板也不知道。簡而言之,概率就是在某種條件下,某個事件出現(xiàn)的可能性。顯然,這個事件可能會出現(xiàn),也可能不出現(xiàn),所以通常稱之為“隨機事件”。概率可分為兩類:“后驗概率”與“先驗概率”。后驗概率(或統(tǒng)計概率)是指通過實際觀測,根據(jù)在總觀測次數(shù)中某事件所出現(xiàn)的次數(shù)來計算該事件出現(xiàn)的概率,這種概率其實是一個相對頻率,是實際概率的估計值。一般用A代表隨機事件(例如“全體學生中的男生”),用P代表頻率(概率估計值),或用n表示觀測的次數(shù),用m表示事件出現(xiàn)的次數(shù)。第二節(jié)

獨立樣本與成對樣本T檢驗的適用條件:正態(tài)分布資料T檢驗注意事項要有嚴密的抽樣設計隨機、均衡、可比選用的檢驗方法必須符合其適用條件(注意:t檢驗的前提是資料服從正態(tài)分布)單側檢驗和雙側檢驗單側檢驗的界值小于雙側檢驗的界值,因此更容易拒絕,犯第Ⅰ錯誤的可能性大。假設檢驗的結論不能絕對化不能拒絕H0,有可能是樣本數(shù)量不夠拒絕H0,有可能犯第Ⅰ類錯誤正確理解P值與差別有無統(tǒng)計學意義P越小,不是說明實際差別越大,而是說越有理由拒絕H0,越有理由說明兩者有差異,差別有無統(tǒng)計學意義和有無專業(yè)上的實際意義并不完全相同假設檢驗和可信區(qū)間的關系結論具有一致性差異:提供的信息不同區(qū)間估計給出總體均值可能取值范圍,但不給出確切的概率值,假設檢驗可以給出H0成立與否的概率。編輯本段t檢驗舉例說明例如,T檢驗可用于比較藥物治療組與安慰劑治療組病人的測量差別。理論上,即使樣本量很小時,也可以進行T檢驗。(如樣本量為10,一些學者聲稱甚至更小的樣本也行),只要每組中變量呈正態(tài)分布,兩組方差不會明顯不同。如上所述,可以通過觀察數(shù)據(jù)的分布或進行正態(tài)性檢驗估計數(shù)據(jù)的正態(tài)假設。方差齊性的假設可進行F檢驗,或進行更有效的Levene's檢驗。如果不滿足這些條件,只好使用非參數(shù)檢驗代替T檢驗進行兩組間均值的比較。T檢驗中的P值是接受兩均值存在差異這個假設可能犯錯的概率。在統(tǒng)計學上,當兩組觀察對象總體中的確不存在差別時,這個概率與我們拒絕了該假設有關。一些學者認為如果差異具有特定的方向性,我們只要考慮單側概率分布,將所得到t-檢驗的P值分為兩半。另一些學者則認為無論何種情況下都要報告標準的雙側T檢驗概率。1、數(shù)據(jù)的排列為了進行獨立樣本T檢驗,需要一個自(分組)變量(如性別:男女)與一個因變量(如測量值)。根據(jù)自變量的特定值,比較各組中因變量的均值。用T檢驗比較下列男、女兒童身高的均值。此外,當測量單位不同或均數(shù)相差懸殊時,絕對數(shù)或絕對統(tǒng)計量也是無法直接進行對比。譬如,比較一個人身高和體重,或是田賽與徑賽成績時,因其測量單位不同是無法比較的。若要進行這類比較分析,必須將絕對數(shù)或絕對統(tǒng)計量進行轉換,使其變換成為一種可比較的相對量數(shù)。相對量數(shù)包括相對地位量數(shù)和相對差異量數(shù)。前者用于說明一個絕對數(shù)在某一團體中所處的相對位置的高低,后者則用于比較各列數(shù)據(jù)分布的差異程度的大小。對于一組數(shù)據(jù)是否為正態(tài)分布,可以用多種方法進行檢驗。方法之一是繪制直力一圖或多邊圖,這樣就可以非常直觀地看出數(shù)據(jù)分布的形態(tài)是否大休對稱或呈單眾數(shù)分布。方法之二是比較理論分布與實際分布中各標準差之間的而積或概率。方法之三是計算數(shù)據(jù)分布的偏態(tài)值和峰值。如果分布的形態(tài)不是對稱的,而是偏向一邊,稱為“偏態(tài)”。如果偏向左邊,即低數(shù)值的次數(shù)偏高,稱為“正偏態(tài)”反之,則稱為“負偏態(tài)’()。偏態(tài)值就是分布的偏剎程度的指標,正值表示分布為正偏態(tài),負值表示分布為負偏態(tài),如果其值為0,則表示分布為正態(tài)。峰值表示分布曲線的頂點尖峭的程度,正值表示分布曲線較尖,稱“尖峰態(tài)”,負值表示分布曲線較平,稱為“低峰態(tài)”,如果其值為0,則表示分布曲線為正態(tài)()計算偏態(tài)值與峰值的公式為方法之四是比較算術平均數(shù)、眾數(shù)與中數(shù)。從正態(tài)分布的特征可知,在正態(tài)分布中這三個數(shù)值完全相同,在正偏態(tài)分布中,平均數(shù)高于中數(shù)和眾數(shù),而在負偏態(tài)分布中,平均數(shù)則低于中數(shù)和眾數(shù),因此通過比較它們的接近程度,就可以知道數(shù)據(jù)的分布是否呈正態(tài)分布。根據(jù)三者之間的關系,皮爾遜提出了一個偏態(tài)量數(shù)公式:式中SK—偏態(tài)量數(shù)M—算術平均數(shù);Mo—眾數(shù);Md—中數(shù)。如果SK為正值,則分布為正偏態(tài),如果SK為負值,則分布為負偏態(tài),如果SK的值為零,則分布為正態(tài)。第三節(jié)

兩獨立樣本平均數(shù)的差異檢驗科研實踐中,經常需要進行兩組以上比較,或含有多個自變量并控制各個自變量單獨效應后的各組間的比較,(如性別、藥物類型與劑量),此時,需要用方差分析進行數(shù)據(jù)分析,方差分析被認為是T檢驗的推廣。在較為復雜的設計時,方差分析具有許多t-檢驗所不具備的優(yōu)點。(進行多次的T檢驗進行比較設計中不同格子均值時)。只要在標有A的一列里找到該面積值,其前的數(shù)值即是對應的Z值。如果已知的面積在表里沒有列出,則用表里與之最接近的面積值。如果不知道該面積是平均數(shù)以上還是以下的面積,則查出的Z值可能是正值,也可能是負值。例如:已知平均數(shù)以上的面積A=0.067,Z=0.17(表中面積為0.06749);已知平均數(shù)以下的面積A=0.35,Z=-1.04(表中面積為0.35083)(2)已知正態(tài)分布兩端的面積值,求該面積的分界點的值。由于表中所給面積為平均數(shù)與值之間的面積,因而查表時不能直接用兩端的面積,而是要用0.5減去兩端的面積,然后再查表求Z值。例如:求分布曲線右端面積為0.025的分界點的值:0.5-0.025=0.475,查表得Z=1.96;求分布曲線左端面積為0.05的分界點的Z值:0.5-0.05=0.45,查表得Z=-1.64(表中面積為0.44950)。(3)已知正態(tài)曲線下中央部分的面積,求兩側分界點的值。由于分布曲線是對稱的,兩側的Z值其實是一樣的,只是符號不同而已,所以只查一側的Z值即可。由于表中列出的只是平均數(shù)與一側Z值之間的面積,所以查表之前,要先用2去除中央部分的面積。例如:求中央部分面積為0.68的兩側分界點的Z值:0.68/2=0.34,查表得Z=±1.00(表中面積為0.34134).四、正態(tài)分布理論的實際應用正態(tài)分布理論和正態(tài)分布表在語言研究中有著重要的實用份值。下面是一些主要的應用示例。1.選拔與淘汰在包括外語教學在內的各類教育中,我們都面著對學生進行選拔和淘汰的問題,如高考時選拔考生、教學中選拔優(yōu)等生或淘汰差生等等。在所有這些工作中,正態(tài)分布的理論都能給予我們有益的指導。2.考試后分數(shù)的分檔在各類教育評估中,都會遇到對分數(shù)或能力進行分檔的問題,例如在考試后,往往要統(tǒng)計每個分數(shù)段的人數(shù)。當考生人數(shù)比較少時,直接數(shù)一數(shù)就可以了,但是對于大規(guī)模的考試(例如涉及數(shù)以千計、數(shù)以萬計的考生),這一做法顯然不太經濟有效。這時,如果考試的平均分和標準差已知,利用正態(tài)分布表就可以估計出各分數(shù)段的人數(shù)。該人數(shù)為理論值,它與實際人數(shù)是比較接近的。3.等級評定前確定各等級或檔次的人數(shù)我們在按照某種能力指標、考試分數(shù)等對學生評定等級或分檔時,為了保證各等級人數(shù)分布合理,可以利用正態(tài)分布的理論,計算出各等級或檔次應該包含的人數(shù)。例1如果100個學生的能力服從正態(tài)分布,要把他們分成5個等級(A,B,C,D,E),求每個等級應該包含的人數(shù)。分析:求每個等級的人數(shù),首先要計算每個等級在正態(tài)分布中的面積或概率,然后乘以總人數(shù)即可得到各等級的人數(shù)。在討論正態(tài)分布的特征時我們看到,正負三個標準差基本上包括了正態(tài)曲線下所有的面積,因此我們可以將6個標準差除以等級的個數(shù)5,就可以把整個面積等分成5個部分。計算:第一步:將6個標準差除以等級的個數(shù)5,得1.2個標準差,即平均每一等級約包含1.2個標準差或Z分數(shù)。這5個等級為:第三步:用各等級的面積乘以總人數(shù)100,得各等級應該包含的人數(shù)(應四舍五入取整數(shù),如果各等級的人數(shù)之和與總人數(shù)有出入,則在中間一個等級調整):第四節(jié)

成對樣本的T檢驗在研究中,常用配對設計。配對設計主要有四種情況:①同一受試對象處理前后的數(shù)據(jù);②同一受試對象兩個部位的數(shù)據(jù);③同一樣品用兩種方法(儀器等)檢驗的結果;④配對的兩個受試對象分別接受兩種處理后的數(shù)據(jù)。情況①的目的是推斷其處理有無作用;情況②、③、④的目的是推斷兩種處理(方法等)的結果有無差別。

式中,0為差數(shù)年總體均數(shù),因為假設處理前后或兩法無差別,則其差數(shù)的均數(shù)應為0,d為一組成對數(shù)據(jù)之差d(簡稱差數(shù))的均數(shù),其計算公式同式(18.1);Sd為差數(shù)均數(shù)的標準誤,sd為差數(shù)年的標準差,計算公式同式(18.3);n為對子數(shù)。

因計算的統(tǒng)計量是t,按表19-4所示關系作判斷。112.811.71.01.21213.113.10.00.00314.914.40.50.25414.413.60.80.64513.613.10.50.25613.113.3-0.20.04713.312.80.50.25814.113.60.50.25913.312.31.01.00合計4.73.89

α=0.05

自由度v=n-1=8,查t界值表得t0.05(8)=2.306,t0.01(8)=3.355,本例t=3.714>t0.01(8),P<0.01,按α=0.05檢驗水準拒絕H0,接受H1,可認為治療前后舒張壓有變正態(tài)分布也叫正態(tài)曲線,有時也稱作高斯分布或高斯曲線。正態(tài)分布其實是次數(shù)分布的其中一種,但是它在統(tǒng)計學中(尤其是推斷統(tǒng)計中)具有特殊的重要性。首先,在自然界、現(xiàn)實生活以及我們的語言研究中,許多現(xiàn)象或特征都是呈正態(tài)分布。就統(tǒng)計工作本身來講,正態(tài)分布具有一些特殊的數(shù)學特征,使得我們能夠預測總體中多大比例的個體將會在一定范圍內取正態(tài)分布的變量的某些值,此外,一些重要的差異顯著性檢驗也要求所涉及的變量呈正態(tài)分布(見第七章)。正態(tài)分布主要具有以下幾個特征:(1)其形狀如鐘,中央點(最高點)為平均數(shù)點,整個分布以過該點的垂線左右對稱,橫坐標代表標準差,即橫坐標上各點表示離開平均數(shù)的標準差單位數(shù),曲線兩端向靠近橫坐標處無限延伸,但永遠不能與之相交(見圖5.1)(2)在正態(tài)分布的中央點,平均數(shù)、中數(shù)與眾數(shù)相等或重合(見圖5.1)。(3)正態(tài)曲線完全是由平均數(shù)和標準差兩個參數(shù)碗定的。有了這兩個值,就可以利用正態(tài)分布的密度函數(shù)繪出正態(tài)曲線。當隨機變量的平均數(shù)與標準差的值不同時,正態(tài)分布就會呈現(xiàn)不同的形態(tài)。在平均數(shù)相同的情況下,標準差大的正態(tài)曲線低平寬闊,而小的則

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論