spss假設(shè)檢驗_第1頁
spss假設(shè)檢驗_第2頁
spss假設(shè)檢驗_第3頁
spss假設(shè)檢驗_第4頁
spss假設(shè)檢驗_第5頁
已閱讀5頁,還剩22頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第七章 假設(shè)檢驗n第一節(jié) 引言n第二節(jié) 實驗研究 n第三節(jié) 假設(shè) 一、假設(shè)的特征 二、假設(shè)的種類n第四節(jié) 假設(shè)檢驗 一、假設(shè)檢驗證實與證偽 二、顯著水平 三、顯著性檢驗中的兩類錯誤 四、檢驗統(tǒng)計值與臨界值 五、單尾與雙尾檢驗第一節(jié) 引 言 假設(shè)檢驗是推斷統(tǒng)計的最重要的一個部分。語言研究經(jīng)常要涉及統(tǒng)計值之間的差異問題,即在比較兩個樣本統(tǒng)計量(比如平均數(shù)、相關(guān)系數(shù)等)或者樣本統(tǒng)計量與相應(yīng)的總體參數(shù)之間的差異的基礎(chǔ)上,推斷總體參數(shù)之間是否確實存在差異。簡單來說, 我們先對兩個 (或多個)異提出一個假設(shè),然后在樣本統(tǒng)計量的基礎(chǔ)上,運用適當?shù)慕y(tǒng)計手段對該假設(shè)進行檢驗,就可以發(fā)現(xiàn)在多大程度上(或有多大的可

2、能性)兩者之間的差異是真正存在的。第二節(jié)實驗研究 實驗研究實質(zhì)上是一個假設(shè)檢驗的過程,一般來說,有以下幾個步驟: (1)首先對研究結(jié)果作出預(yù)測或提出假設(shè):如果X出現(xiàn),那么 Y 將會隨之出現(xiàn)。假設(shè)不能憑空而來,而是要有一定的依據(jù),譬如已有的理論或研究結(jié)果等。 (2)操縱某一或某些因素,以創(chuàng)造使Y出現(xiàn)的條件X。所操縱的因素就是我們要研究的變量。與此同時,要盡量控制所有其它變量,如果不加以嚴格的控制,就有可能使研究結(jié)果模糊不清。 (3)觀察預(yù)期出現(xiàn)的結(jié)果是否出現(xiàn)了。這一階段就要用到統(tǒng)計分析(例如進行各種假設(shè)檢驗) 。 (4)得出結(jié)論。一個實驗研究的結(jié)果會有以下幾種可能:一是預(yù)期中的Y明確無誤地出現(xiàn)了

3、,意味著所提出的假設(shè)(及其所基于的理論等)得到了證實; 二是Y沒有出現(xiàn),這說明假設(shè)及其所基于的理論被推翻了,或至少被部分地推翻了;三是結(jié)果模糊,無法解釋,因而不能得出任何結(jié)論。至于假設(shè)是否被推翻或得到了證實,其實往往難以下一個絕對的結(jié)論,因為我們無法保證在整個實驗過程中把所有可能影響實驗結(jié)果的潛在因素都排除掉或控制住了。 因此實驗研究的過程是先提出假設(shè),然后再根據(jù)觀測資料或數(shù)據(jù)來檢驗假設(shè)的可能性或正確性。例如,根據(jù)圖式理論(schematic theory),閱讀者對閱讀材料的熟悉程度(或者是否具備理解閱讀材料所需的背景知識) 可能會影響閱讀的質(zhì)量 (即理解程度) , 據(jù)此, 我們可以提出如下

4、假設(shè):熟悉材料的閱讀質(zhì)量要高于生疏材料的閱讀質(zhì)量。我們可以用實驗的方法來檢驗這一假設(shè)。 在此過程中, 需要控制的因素是非常多的, 例如被試的年齡、 智商、 受教育情況、 母語閱讀能力、 外語的語言水平、 閱讀材料的語言難度等等, 我們可以通過隨機抽樣、 隨機分組、 增大樣本容量等措施 (有關(guān)隨機抽樣、 樣本容量等概念參見有關(guān)章節(jié))來控制與被試有關(guān)的變量,用改寫的方法來控制閱讀材料的語言難度(使兩類材料在語言本身的難度上具有可比性)等等。 對于實驗研究特別需要注意的問題是: 提出的假設(shè)是否得當; 對統(tǒng)計檢驗是否科學。 變量的操縱與控制是否合理;第三節(jié) 假設(shè) 一、 假設(shè)的特征 如前所述,實驗研究是

5、一個假設(shè)檢驗的過程,因此我們必須對假設(shè)有一定的了解。簡單地說,假設(shè)就是根據(jù)已知理論與事實等對研究結(jié)果所作出的預(yù)測。一般來講,假設(shè)應(yīng)具備以下幾個特征:它要表明兩個或多個變量之間的關(guān)系;要用陳述句的形式來表達,措辭要清楚明確;要具有可檢驗性。例如,上述有關(guān)閱讀材料的熟悉程度的假設(shè)就是用陳述句的形式清楚、明確地表明了熟悉程度與閱讀質(zhì)量兩個變量之間的關(guān)系,然后我們再用實驗的方法來檢驗這一假設(shè)的有效性。 二、 假設(shè)的種類 實驗研究的目的是為了回答或解決問題。譬如我們對各種教學方進行對比研究,其中一個問題是:對于提高學生的外語水平,交際教學是否優(yōu)于語法翻譯法。對于這個問題我們可以提出三種假設(shè): (1)交際

6、教學法的效果好于語法翻譯法; (2)交際教學法的效果劣于語法翻譯法; (3)交際教學法與語法翻譯法的效果相同(或沒有差別)。 假設(shè)一般分為 “零假設(shè)” 與 “備擇假設(shè)” 兩種。 簡單來說, 零假設(shè)就是預(yù)測兩個特征之間沒有差別的假設(shè)。零假設(shè)一般表述為“(兩個或多個)樣本所來自的總體的某個參數(shù)之間沒有差異”,因為雖然我們研究的是樣本,但是我們感興趣的是總體,也就是說要把對樣本的研究結(jié)果推廣至整個總體。零假設(shè)通常用符號表示為 , 例如:意思是說,A總體的平均值與B總體的平均值之間沒有差異。 另一種假設(shè)是 “備擇假設(shè)” 或 “對立假設(shè)” 、 “擇一假設(shè)” 等。 顧名思義,這類假設(shè)是與零假設(shè)對立的,它預(yù)

7、測兩特征之間存在差異,例如上例中的假設(shè)(1)和(2)。備擇假設(shè)通常用 來表示, 例如:第一個假設(shè)的意思是:A總體的平均值小于B總體的平均值; 第二個假設(shè)則表示:A總體的平均值大于B 總體的平均值。當然,備擇假設(shè)也可以不指出差異的方向 (即大于或小于、 高于或低于等) , 而僅僅指出總體的參數(shù)不相等。第四節(jié) 假設(shè)檢驗 在實驗研究中,我們不是直接去證實 的正確性,而是去設(shè)法推翻 , 也就是先假設(shè)有關(guān)參數(shù)之間不存在差異,然后再通過實驗收集證據(jù),看能不能推翻這一假設(shè)。這時,只要找到一條反證,就足以證明零假設(shè)是錯誤的。采用這種檢驗假設(shè)的方法,就能夠得出確定的結(jié)論。如果推翻了零假設(shè)(即 為真),就表明有關(guān)

8、差異是由各種誤差造成的, 就表明差異確實存在, 那么就接受與零假設(shè)對立的備擇假設(shè) (即 為真) ; 如果無法推翻它 (即 為真),而不是真正的差異,那么就接受零假設(shè),而拒絕有關(guān)備擇假設(shè)。 如果推翻了零假設(shè)(即 為假) , 就表明差異確實存在, 那么就接受與零假設(shè)對立的備擇假設(shè) (即 為真) ; 如果無法推翻它 (即 為真),就表明有關(guān)差異是由各種誤差造成的,而不是真正的差異,那么就接受零假設(shè),而拒絕有關(guān)備擇假設(shè)(即 為假) 。 因此,統(tǒng)計學中假設(shè)檢驗的方法是:先對有關(guān)總體參數(shù)之間的差異提出零假設(shè)(同時給出相應(yīng)的備擇假設(shè)),然后分析樣本統(tǒng)計量之間的差異看看是否能推翻零假設(shè)。二、 顯著水平 在決定

9、是否能推翻零假設(shè)時,必須確定一個允許的誤差限度,即隨機誤差造成的差異在多大范圍之內(nèi)才能推翻零假設(shè)。這個范圍用概率表示,譬如5%,1%的等(或0.05, 0.01等)。 如果隨機誤差的概率 (即可能性)為 ,就表示當隨機誤差造成的差異在等于或小于5%,就可以推翻零假設(shè)。如果零假設(shè)被推翻,我們就說觀察到的差異有顯著意義或者說檢驗有顯著意義,所以這個概率通常稱為顯著水平。 顯著水平是由研究者決定的,顯著水平的設(shè)定需要考慮多種因素,譬如研究領(lǐng)域、 研究目的、 研究對象、 研究內(nèi)容等等。另外還要考慮, 假如所得出的結(jié)論是錯誤的(例如在不該推翻零假設(shè)時而推翻了),是否會帶來嚴重的后果,如果其后果是嚴重的,

10、就要謹慎一些,要把顯著水平定得嚴一些(即不要輕易推翻零假設(shè)),否則就可以定得松一些。在語言研究中 (譬如比較不同教學方法的優(yōu)劣) , 一般來說即使結(jié)論有誤, 也不會帶來分嚴重的后果, 所以, 可以定得寬松一些。三、 顯著性檢驗中的兩類錯誤 上面談到,我們在對差異進行顯著性檢驗時有可能得出錯誤的結(jié)論。一種情況是 “錯誤地拒絕” , 即零假設(shè)成立或?qū)僬鏁r (也就是說不存在真正的差異,所觀察到的差異只是由隨機誤差造成的),應(yīng)該接受零假設(shè)而我們卻拒絕了。 另一種情況是 “錯誤地接受” , 即零假設(shè)不成立或?qū)偌贂r (也就是所觀察到的差異是確實存在的),應(yīng)該拒絕零假設(shè)而我們卻過于謹慎,認為沒有足夠的證據(jù)推

11、翻它,所以在不該接受零假設(shè)時接受了它。四、檢驗統(tǒng)計值與臨界值 誤差概率是否低于某水平,是用根據(jù)樣本所計算的一個值來判斷或檢驗的,這個值就叫做檢驗統(tǒng)計值。顯著水平(即認為差異顯著時所允許的最大隨機誤差概率)其實就是抽樣分布曲線中處于尾端部分的面積。當我們說“低于某個顯著水平”時拒絕零假設(shè),就等于說尾端的面積要小于該面積,這個面積或區(qū)域叫做 “臨界區(qū)域” 或 “拒絕區(qū)域” , 界定該區(qū)域的值叫做臨界值, 也就是對應(yīng)于該區(qū)域面積的Z值、t值等。 當我們對零假設(shè)進行檢驗時,要首先依據(jù)樣本計算檢驗統(tǒng)計值,如果檢驗統(tǒng)計值的絕對值小于顯著水平對應(yīng)的臨界值,我們稱檢驗統(tǒng)計值落在了臨界區(qū)域之外,這就意味著檢驗統(tǒng)

12、計值對應(yīng)的尾端的面積大于臨界值對應(yīng)的尾端的面積,這時就要接受零假設(shè)。反之,如果檢驗統(tǒng)計值的絕對值大于顯著水平對應(yīng)的臨界值,我們稱檢驗統(tǒng)計值落在了臨界區(qū)域之內(nèi),這就意味著檢驗統(tǒng)計值對應(yīng)的尾端的面積小于臨界值對應(yīng)的尾端的面積,這時就可以推翻或拒絕零假設(shè)。五、 單尾與雙尾檢驗 我們已經(jīng)知道,在檢驗零假設(shè)時,要同時提出適當?shù)膫鋼窦僭O(shè)。備擇假設(shè)預(yù)測總體參數(shù)之間存在差異,但是具體來講,又有兩種情況。一種在指出存在差異的同時, 還指出差異的方向 (即 “大于” 、 “小于” 、 “高于“低于” 等) , 例如:而另一種則僅僅強調(diào)差異的存在,而不指出差異的方向,例如: 如果備擇假設(shè)是方向性的,譬如 ,這時檢驗

13、只與抽樣分布曲線下的一個尾巴(即右側(cè)的尾巴)有關(guān),所以這樣的檢驗叫做單尾或單側(cè)檢驗。 如果備擇假設(shè)為非方向性的, 譬如 , 那么由于可能大于 也可能小于 , 所以檢驗與分布曲線的兩個尾巴都有關(guān)系,因此我們稱這樣的檢驗為雙尾或雙側(cè)檢驗。 單尾檢驗與雙尾檢驗的差別示意圖如圖7.2和圖7.3。 從圖7.2和圖7.3可以看出,同樣的顯著水平,單尾檢驗的臨界值要小于雙尾檢驗的臨界值,因此對于同樣的檢驗統(tǒng)計值,就有可能在使用單尾檢驗時差異是顯著的,而在使用雙尾檢驗時差異卻是不顯著的。反過來講,在單尾檢驗時,推翻零假設(shè)所需的檢驗統(tǒng)計值要小于雙尾檢驗所需的檢驗統(tǒng)計值,這是因為在單尾檢驗時我們輸入了更多的信息的

14、存在以及差異的方向,所以為了證明差異有顯著意義所需的檢驗統(tǒng)計值就小一些。六、 參數(shù)檢驗與非參數(shù)檢驗 所謂的“參數(shù)檢驗”一般對所涉及的變量的測量水平、總體的分布形態(tài)、總體的方差等方面有一定的要求。嚴格來講, 參數(shù)檢驗只適用于連續(xù)性的等距 (或比率) 變量, 譬如考試分數(shù)。 此外,參數(shù)檢驗一般都要求樣本所來自的總體呈正態(tài)分布,因為這對決定檢驗統(tǒng)計值的抽樣分布非常重要。當數(shù)據(jù)為正態(tài)分布時,參數(shù)檢驗最為有效,隨著其偏斜程度的增加,參數(shù)檢驗的有效性也隨之降低。不過,這一要求在有些情況下可以有所放松,譬如當樣本容量較大時,根據(jù)“中心極限定理”,即使總體的分布為非正態(tài),平均數(shù)的抽樣分布也會接近正態(tài)。 參數(shù)檢

15、驗與非參數(shù)檢驗各有其優(yōu)缺點。參數(shù)檢驗用于等距數(shù)據(jù),因此能夠把數(shù)據(jù)中每一個觀測值的大小都考慮進去,也就是說能夠最大限度地利用數(shù)據(jù)所提供的信息。由于這個原因,參數(shù)檢驗的“靈敏度”比較高,即在保證樣本容量的情況下,參數(shù)檢驗?zāi)軌虬l(fā)現(xiàn)數(shù)據(jù)間存在的很小的真正差異。,非參數(shù)檢驗的計算過程相對簡便一些,因此如果只是要粗略地看看差異情況,非參數(shù)檢驗是個比較好的選擇。但是非參數(shù)檢驗的缺陷是對真正差異的反應(yīng)不夠靈敏,對存在的差異可能檢驗不出來,這是因為非參數(shù)檢驗利用的數(shù)據(jù)信息量小一些。七、假設(shè)檢驗的一般步驟 對于多數(shù)假設(shè)檢驗,檢驗的過程都是一樣的: (1)陳述零假設(shè),同時提出適當?shù)膫鋼窦僭O(shè)(表明是方向性的,還是非方向性的,以便決定采用單尾檢驗還是雙尾檢驗); (2)根據(jù)研究的性質(zhì)和目的設(shè)定適當?shù)娘@著水平; (3)根據(jù)數(shù)據(jù)的測量水平、分布的形態(tài)以及實驗設(shè)計等選擇適當?shù)臋z驗; (4)根據(jù)樣本計算檢驗統(tǒng)計值;

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論