教科研方法十章_第1頁
教科研方法十章_第2頁
教科研方法十章_第3頁
教科研方法十章_第4頁
教科研方法十章_第5頁
已閱讀5頁,還剩36頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

教科研方法十章第一頁,共四十一頁,編輯于2023年,星期日第十章研究假設(shè)的統(tǒng)計(jì)推斷一、教學(xué)要求1.了解統(tǒng)計(jì)推斷的基本概念2.了解參數(shù)估計(jì)的基本方法3.會用假設(shè)檢驗(yàn)(Z檢驗(yàn)、T檢驗(yàn)、X2檢驗(yàn)、F檢驗(yàn))的方法

第二頁,共四十一頁,編輯于2023年,星期日第十章研究假設(shè)的統(tǒng)計(jì)推斷二、內(nèi)容要求1.統(tǒng)計(jì)推斷的意義、內(nèi)容和概念2.參數(shù)的估計(jì)3.假設(shè)檢驗(yàn)4.非參數(shù)統(tǒng)計(jì)

第三頁,共四十一頁,編輯于2023年,星期日第十章研究假設(shè)的統(tǒng)計(jì)推斷三、重點(diǎn)與難點(diǎn)1.參數(shù)估計(jì)2.假設(shè)檢驗(yàn)(Z檢驗(yàn)、T檢驗(yàn)、X2檢驗(yàn)、F檢驗(yàn))3.非參數(shù)統(tǒng)計(jì)第四頁,共四十一頁,編輯于2023年,星期日第一節(jié)假設(shè)檢驗(yàn)的基本問題假設(shè)檢驗(yàn)是數(shù)理統(tǒng)計(jì)學(xué)中根據(jù)一定假設(shè)條件由樣本推斷總體的一種方法。假設(shè)檢驗(yàn)的基本問題是要探索哪一個假設(shè)被接受的問題。常用的假設(shè)檢驗(yàn)方法有u—檢驗(yàn)法、t—檢驗(yàn)法、X2檢驗(yàn)法、F—檢驗(yàn)法等。第五頁,共四十一頁,編輯于2023年,星期日一、假設(shè)檢驗(yàn)的意義假設(shè)檢驗(yàn)是抽樣推斷中的一項(xiàng)重要內(nèi)容。它是根據(jù)原資料作出一個總體指標(biāo)是否等于某一個數(shù)值,某一隨機(jī)變量是否服從某種概率分布的假設(shè),然后利用樣本資料采用一定的統(tǒng)計(jì)方法計(jì)算出有關(guān)檢驗(yàn)的統(tǒng)計(jì)量,依據(jù)一定的概率原則,以較小的風(fēng)險(xiǎn)來判斷估計(jì)數(shù)值與總體數(shù)值(或者估計(jì)分布與實(shí)際分布)是否存在顯著差異,是否應(yīng)當(dāng)接受原假設(shè)選擇的一種檢驗(yàn)方法。第六頁,共四十一頁,編輯于2023年,星期日二、假設(shè)檢驗(yàn)的具體作法具體作法是:根據(jù)問題的需要對所研究的總體作某種假設(shè),記作H0;選取合適的統(tǒng)計(jì)量,這個統(tǒng)計(jì)量的選取要使得在假設(shè)H0成立時,其分布為已知;由實(shí)測的樣本,計(jì)算出統(tǒng)計(jì)量的值,并根據(jù)預(yù)先給定的顯著性水平進(jìn)行檢驗(yàn),作出拒絕或接受假設(shè)H0的判斷。第七頁,共四十一頁,編輯于2023年,星期日分析1用樣本指標(biāo)估計(jì)總體指標(biāo),其結(jié)論有的完全可靠,有的只有不同程度的可靠性,需要進(jìn)一步加以檢驗(yàn)和證實(shí)。通過檢驗(yàn),對樣本指標(biāo)與假設(shè)的總體指標(biāo)之間是否存在差別作出判斷,是否接受原假設(shè)。這里必須明確,進(jìn)行檢驗(yàn)的目的不是懷疑樣本指標(biāo)本身是否計(jì)算正確,而是為了分析樣本指標(biāo)和總體指標(biāo)之間是否存在顯著差異。從這個意義上,假設(shè)檢驗(yàn)又稱為顯著性檢驗(yàn)。第八頁,共四十一頁,編輯于2023年,星期日分析2進(jìn)行假設(shè)檢驗(yàn),先要對假設(shè)進(jìn)行陳述。通過下例加以說明。例如,設(shè)某工廠制造某種產(chǎn)品的某種精度服從平均數(shù)為方差為的正態(tài)分布,據(jù)過去的數(shù)據(jù),已知平均數(shù)為75,方差為100?,F(xiàn)在經(jīng)過技術(shù)革新,改進(jìn)了制造方法,出現(xiàn)了平均數(shù)大于75,方差沒有變更,但仍存在平均數(shù)不超過75的可能性。試陳述為統(tǒng)計(jì)假設(shè)。第九頁,共四十一頁,編輯于2023年,星期日分析3根據(jù)上述情況,可有兩種假設(shè),一個是假想平均數(shù)不超過75,即假設(shè)另一個假想是平均數(shù)大于75,即假設(shè)如果我們把作為原假設(shè),即被檢驗(yàn)的假設(shè),稱作零假設(shè),記作于是,假設(shè)相對于假設(shè)來說,是約定的、補(bǔ)充的假設(shè),記作它和有兩者選擇其一的意思,即作為被檢驗(yàn)的假設(shè),則就是備擇的,故稱為備擇假設(shè)或?qū)α⒓僭O(shè)。第十頁,共四十一頁,編輯于2023年,星期日分析4還須指出,哪個是零假設(shè),哪個是備擇假設(shè),是無關(guān)緊要的。我們關(guān)心的問題,是要探索哪一個假設(shè)被接受的問題。被接受的假設(shè)是要作為推理的基礎(chǔ)。在實(shí)際問題中,一般要考慮事情發(fā)生的邏輯順序和關(guān)心的事件,來設(shè)立零假設(shè)和備擇假設(shè)。第十一頁,共四十一頁,編輯于2023年,星期日三、假設(shè)檢驗(yàn)的步驟一個完整的假設(shè)檢驗(yàn)過程,通常包括以下四個步驟:第一,提出原假設(shè)(Nullhypothesis)和備擇假設(shè)(Alternativehypothesis);第二,確定適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量并計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值;第三,規(guī)定顯著性水平α;第四,作出統(tǒng)計(jì)決策。第十二頁,共四十一頁,編輯于2023年,星期日1、提出原假設(shè)和替換假設(shè)在統(tǒng)計(jì)學(xué)中,把需要通過樣本去推斷其正確與否的命題稱為原假設(shè),用H0表示。例如,在新生兒體重這個例子中,我們可以事先提出一個命題(假設(shè)),“1990年出生的新生兒與1989年出生的新生兒在體重上沒有什么差異”。于是可以這樣表示:,這里μ表示1990年新生兒總體的均值,它與1989年新生兒總體的均值3190g相同。與原假設(shè)相對立的假設(shè)是備擇假設(shè),用H1表示。在上面這個例子中,備擇假設(shè)H1意味著“1990年出生的新生兒與1989年出生的新生兒在體重上有明顯差異”。第十三頁,共四十一頁,編輯于2023年,星期日2、確定適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量在參數(shù)的假設(shè)檢驗(yàn)中,如同在參數(shù)估計(jì)中一樣,要借助于樣本統(tǒng)計(jì)量進(jìn)行統(tǒng)計(jì)推斷。用于假設(shè)檢驗(yàn)問題的統(tǒng)計(jì)量稱為檢驗(yàn)統(tǒng)計(jì)量。在具體問題里,選擇什么統(tǒng)計(jì)量作為檢驗(yàn)統(tǒng)計(jì)量,需要考慮的因素與參數(shù)估計(jì)相同。例如,用于進(jìn)行檢驗(yàn)的樣本是大樣本還是小樣本,總體方差已知還是未知,等等。在不同的條件下應(yīng)選擇不同的檢驗(yàn)統(tǒng)計(jì)量,并計(jì)算統(tǒng)計(jì)量的值。第十四頁,共四十一頁,編輯于2023年,星期日3、規(guī)定顯著性水平α假設(shè)檢驗(yàn)是圍繞對原假設(shè)內(nèi)容的審定而展開的。如果原假設(shè)正確我們接受了(同時也就拒絕了備擇假設(shè)),或原假設(shè)錯誤我們拒絕了(同時也就接受了備擇假設(shè)),這表明我們作出了正確的決定。但是,由于假設(shè)檢驗(yàn)是根據(jù)樣本提供的信息進(jìn)行推斷的,也就有犯錯誤的可能。有這樣一種情況,原假設(shè)正確,而我們卻把它當(dāng)成錯誤的加以拒絕。犯這種錯誤的概率用α表示,統(tǒng)計(jì)上把α稱為假設(shè)檢驗(yàn)中的顯著性水平,也就是決策中所面臨的風(fēng)險(xiǎn)。所以,顯著性水平是指當(dāng)原假設(shè)為正確時人們卻把它拒絕了的概率或風(fēng)險(xiǎn)。這個概率是由人們確定的,通常取α=0.05或α=0.01。這表明,當(dāng)作出接受原假設(shè)的決定時,其正確的可能性(概率)為95%或99%。第十五頁,共四十一頁,編輯于2023年,星期日“顯著”的含義假設(shè)檢驗(yàn)中的“顯著”與實(shí)際問題中效果的“顯著”既有聯(lián)系又有區(qū)別。前者是統(tǒng)計(jì)學(xué)概念而后者是專業(yè)上常用的術(shù)語,以兩個樣本平均數(shù)差異為例,當(dāng)t檢驗(yàn)的結(jié)果在0.05水平上“顯著”,這是從統(tǒng)計(jì)學(xué)意義來說由樣本平均數(shù)之間的差異可以作出“兩個總體平均數(shù)存在差異”的結(jié)論。但兩總體平均數(shù)之間的差異是否具有專業(yè)意義(即有否實(shí)際上的“顯著效果”)還要根據(jù)專業(yè)上的標(biāo)準(zhǔn)而定。就是說,統(tǒng)計(jì)結(jié)論“顯著”并不一定意味著實(shí)際效果的“顯著”。

第十六頁,共四十一頁,編輯于2023年,星期日4、作出統(tǒng)計(jì)決策根據(jù)顯著性水平α和統(tǒng)計(jì)量的分布,可以找出接受域和拒絕域的臨界點(diǎn),用計(jì)算出的檢驗(yàn)統(tǒng)計(jì)量的值與臨界點(diǎn)值相比較,就可以作出接受原假設(shè)或拒絕原假設(shè)的統(tǒng)計(jì)決策。第十七頁,共四十一頁,編輯于2023年,星期日四、假設(shè)檢驗(yàn)的思路假設(shè)檢驗(yàn)的基本思想是一種“反證法”式的推理,即通過檢驗(yàn)Ho的真?zhèn)蝸矸醋C研究假設(shè)H1的真?zhèn)?,若Ho為真,則H1必為假,而Ho為假,H1即為真,而且無論作出Ho是真還是假的結(jié)論都是在一個概率水平意義上的推斷。第十八頁,共四十一頁,編輯于2023年,星期日分析在作出了統(tǒng)計(jì)假設(shè)之后,就要采用適當(dāng)?shù)姆椒▉頉Q定是否應(yīng)該接受零假設(shè)。由于運(yùn)用統(tǒng)計(jì)方法所遇到的問題不同,因而解決問題的方法也不盡相同。但其解決方法的基本思想?yún)s是一致的,即都是“概率反證法”思想。第十九頁,共四十一頁,編輯于2023年,星期日概率反證法(1)為了檢驗(yàn)一個零假設(shè)(即虛擬假設(shè))是否成立,先假定它是成立的,然后看接受這個假設(shè)之后,是否會導(dǎo)致不合理結(jié)果。如果結(jié)果是合理的,就接受它;如不合理,則否定原假設(shè)。第二十頁,共四十一頁,編輯于2023年,星期日概率反證法(2)所謂導(dǎo)致不合理結(jié)果,就是看是否在一次觀察中,出現(xiàn)小概率事件。通常把出現(xiàn)小概率事件的概率記為0,即顯著性水平。它在次數(shù)函數(shù)圖形中是曲線兩端或一端的面積。因此,從統(tǒng)計(jì)檢驗(yàn)來說,就涉及到雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn)問題。在實(shí)踐中采用何類檢驗(yàn)是由實(shí)際問題的性質(zhì)來決定的。一般可以這樣考慮:雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn)第二十一頁,共四十一頁,編輯于2023年,星期日雙側(cè)檢驗(yàn)雙側(cè)檢驗(yàn)。如果檢驗(yàn)的目的是檢驗(yàn)抽樣的樣本統(tǒng)計(jì)量與假設(shè)參數(shù)的差數(shù)是否過大(無論是正方向還是負(fù)方向),就把風(fēng)險(xiǎn)平分在右側(cè)和左側(cè)。比如顯著性水平為0.05,即則概率曲線左右兩側(cè)各占,即0.0025。第二十二頁,共四十一頁,編輯于2023年,星期日單側(cè)檢驗(yàn)單側(cè)檢驗(yàn)。這種檢驗(yàn)只注意估計(jì)值是否偏高或偏低。如只注意偏低,則臨界值在左側(cè),稱左側(cè)檢驗(yàn);如只注意偏高,則臨界值在右側(cè),稱右側(cè)檢驗(yàn)。對總體的參數(shù)的檢量,是通過由樣本計(jì)算的統(tǒng)計(jì)量來實(shí)現(xiàn)的。所以檢驗(yàn)統(tǒng)計(jì)量起著決策者的作用。第二十三頁,共四十一頁,編輯于2023年,星期日五、假設(shè)檢驗(yàn)中的小概率原理假設(shè)檢驗(yàn)的基本思想是應(yīng)用小概率的原理。所謂小概率原理,是指發(fā)生概率很小的隨機(jī)事件在一次實(shí)驗(yàn)中是幾乎不可能發(fā)生的。根據(jù)這一原理,可以作出是否接受原假設(shè)的決定。第二十四頁,共四十一頁,編輯于2023年,星期日例證例如,有一個廠商聲稱其產(chǎn)品的合格品率很高,可以達(dá)到99%,那么從一批產(chǎn)品(如100件)中隨機(jī)抽取1件,這一件恰好是次品的概率就非常小,只有1%。如果廠商的宣稱是真的,隨機(jī)抽取1件是次品的情況就幾乎是不可能發(fā)生的,但如果這種情況確實(shí)發(fā)生了,我們就有理由懷疑原來的假設(shè),即產(chǎn)品中只有1%次品的假設(shè)是否成立,這時就可以推翻原來的假設(shè),可以作出廠商的宣稱是假的這樣一個推斷,我們進(jìn)行推斷的依據(jù)就是小概率原理。第二十五頁,共四十一頁,編輯于2023年,星期日例證當(dāng)然,推斷也可能會犯錯誤,即這100件產(chǎn)品中確實(shí)只有1件是次品,而恰好在一次抽取中被抽到了。所以這個例子中犯這種錯誤的概率是1%,也就是說我們在冒1%的風(fēng)險(xiǎn)作出廠商宣稱是假的這樣一個推斷。由此也可以看出,這里的1%正是前面所說的顯著性水平。第二十六頁,共四十一頁,編輯于2023年,星期日六、假設(shè)檢驗(yàn)中的兩類錯誤由前面的敘述中知道,假設(shè)檢驗(yàn)是依據(jù)樣本提供的信息進(jìn)行判斷的,也就是由部分來推斷整體,因而假設(shè)檢驗(yàn)不可能絕對準(zhǔn)確,它也可能犯錯誤。所犯的錯誤有兩種類型:α錯誤或棄真錯誤;β錯誤或取偽錯誤第二十七頁,共四十一頁,編輯于2023年,星期日α錯誤或棄真錯誤一類錯誤是原假設(shè)H0為真卻被我們拒絕了。犯這種錯誤的概率用α來表示,所以也稱作α錯誤或棄真錯誤。

第二十八頁,共四十一頁,編輯于2023年,星期日β錯誤或取偽錯誤另一類錯誤是原假設(shè)為偽,卻被我們接受了。犯這種錯誤的概率用β來表示,所以也稱作β錯誤或取偽錯誤。第二十九頁,共四十一頁,編輯于2023年,星期日例證在前面的例子中,廠商聲稱其產(chǎn)品的合格品率為99%,而實(shí)際上合格品率僅為90%,這意味著在100件產(chǎn)品中有90件合格品和10件次品。為了檢驗(yàn)廠商的宣稱是否真實(shí),我們隨機(jī)抽取了20件產(chǎn)品。結(jié)果都是合格品,于是我們由此推斷廠商的宣稱是真實(shí)的,這時我們就犯了第二類錯誤,犯這種錯誤的概率用β來表示,所以也稱作β錯誤或取偽錯誤。第三十頁,共四十一頁,編輯于2023年,星期日分析1自然,人們希望犯這兩類錯誤的概率越小越好。但對于一定的樣本容量n,不能同時做到犯這兩類錯誤的概率都很小。如果減小α錯誤,就會增大犯β錯誤的機(jī)會;若減小β錯誤,也會增大犯α錯誤的機(jī)會。第三十一頁,共四十一頁,編輯于2023年,星期日分析2當(dāng)然,使α、β同時變小的辦法也有,這就是增大樣本容量。但樣本容量不可能沒有限制,否則就會使抽樣調(diào)查失去意義。因此,在假設(shè)檢驗(yàn)中,就有一個對兩類錯誤進(jìn)行控制的問題。第三十二頁,共四十一頁,編輯于2023年,星期日分析3一般地說,哪一類錯誤所帶來的后果越嚴(yán)重,危害越大,在假設(shè)檢驗(yàn)中就應(yīng)當(dāng)把哪一類錯誤作為首要的控制目標(biāo)。但在假設(shè)檢驗(yàn)中,大家都在執(zhí)行這樣一個原則,即首先控制犯α錯誤原則。從前面假設(shè)檢驗(yàn)的步驟中我們會發(fā)現(xiàn),步驟之三“規(guī)定顯著性水平”就體現(xiàn)了這樣的原則。這樣做的原因主要有兩點(diǎn),一個是大家都遵循一個統(tǒng)一的原則,討論問題就比較方便。但這還不是最主要的。最主要的原因在于,從實(shí)用的觀點(diǎn)看,原假設(shè)是什么常常是明確的,而備擇假設(shè)是什么則常常是模糊的。第三十三頁,共四十一頁,編輯于2023年,星期日總結(jié)在具體應(yīng)用假設(shè)檢驗(yàn)時,一定要根據(jù)各種條件,使用相應(yīng)的公式,不可錯用,尤其是平均數(shù)差異的t檢驗(yàn),條件較多,相應(yīng)的公式不少,切不能以一代全。每一種統(tǒng)計(jì)檢驗(yàn)方法都有它的使用條件和對數(shù)據(jù)資料的要求,在實(shí)際應(yīng)用中,一定要注意它們的使用條件和應(yīng)用范圍,要對相應(yīng)的前提條件進(jìn)行檢驗(yàn)和證明。第三十四頁,共四十一頁,編輯于2023年,星期日第二節(jié)平均數(shù)差異顯著性檢驗(yàn)平均數(shù)的顯著性檢驗(yàn)是常用的參數(shù)檢驗(yàn)的方法。平均數(shù)的顯著性檢驗(yàn)分兩種情況,其一是關(guān)于樣本平均數(shù)與總體平均數(shù)差異的顯著性檢驗(yàn),在總體服從正態(tài)分布,總體方差已知的情況下,用Z檢驗(yàn);總體方差未知的情況下,用t檢驗(yàn)。其二是平均數(shù)差異的顯著性檢驗(yàn),在兩個總體都服從正態(tài)分布,總體方差均已知的情況下,用Z檢驗(yàn)(相關(guān)樣本和獨(dú)立樣本所用統(tǒng)計(jì)量不同);在兩個總體都服從正態(tài)分布,但是總體方差未知時,用t檢驗(yàn)(所用檢驗(yàn)統(tǒng)計(jì)量方法與兩個總體是否獨(dú)立以及方差是否相等有關(guān))。第三十五頁,共四十一頁,編輯于2023年,星期日第三節(jié)方差及方差差異性檢驗(yàn)方差的顯著性檢驗(yàn)分為兩種情況:一個是樣本方差與總體方差差異的檢驗(yàn),用卡方檢驗(yàn);另一個兩個樣本方差差異性的檢驗(yàn),用F檢驗(yàn)。第三十六頁,共四十一頁,編輯于2023年,星期日第四節(jié)相關(guān)系數(shù)的顯著性檢驗(yàn)相關(guān)系數(shù)的顯著性檢驗(yàn)分兩種情況:(1)樣本相關(guān)系數(shù)與總體相關(guān)系數(shù)差異的顯著性檢驗(yàn),在總體相關(guān)為零的假設(shè)下,用t檢驗(yàn);在

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論