數(shù)據(jù)分析技術課件第5章假設檢驗_第1頁
數(shù)據(jù)分析技術課件第5章假設檢驗_第2頁
數(shù)據(jù)分析技術課件第5章假設檢驗_第3頁
數(shù)據(jù)分析技術課件第5章假設檢驗_第4頁
數(shù)據(jù)分析技術課件第5章假設檢驗_第5頁
已閱讀5頁,還剩28頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、 第5章 假設檢驗目錄Contents假設檢驗概述假設檢驗方法均值過程單樣本T檢驗獨立樣本T檢驗配對樣本T檢驗假設檢驗概述知識目標:了解假設檢驗的概念與種類;能力目標:掌握假設檢驗的基本思想;素質目標:具備良好的職業(yè)道德,誠實守信。01PART知識導入 某豆制品生產(chǎn)企業(yè)試圖鼓動消費者在早餐中盡量多地食用豆制品,以獲得更好的市場利潤。于是他們大力宣傳:“早上要多吃豆制品,這樣有助于減肥!”為了驗證這個說法,調查者隨機選取了35個人,詢間他們早餐和午餐的通常食譜,并根據(jù)食譜將他們分為兩類:一類為經(jīng)常豆制品食用者(A類),一類為非經(jīng)常豆制品食用者(B類),然后測度每人午餐的熱量攝取量。經(jīng)過一段時間的

2、跟蹤調查,得到的結果如下所示。食用者類型熱量攝取量A568 681 636 607 555 496 540 539 529 562 589 646 596 617 584B650 630 628 624 711 723 569 632 688 580 569 596 706 563 480 651 709 622 637 617“多吃豆制品有助于減肥”這一說法是否成立呢?概率分布函數(shù)概率分布概率概率是反映隨機事件出現(xiàn)的可能性大小。隨機事件是指在相同條件下,可能出現(xiàn)也可能不出現(xiàn)的事件。概率分布是指用于表述隨機事件結果取值的概率規(guī)律。事件的概率表示了一次試驗中某一個結果發(fā)生的可能性大小。概率分布函

3、數(shù)是描述隨機變量取值分布規(guī)律的數(shù)學表示。例如:統(tǒng)計學基礎 在統(tǒng)計學中,正態(tài)分布是許多統(tǒng)計分析方法的理論基礎。無論是本章所講的假設檢驗還是后續(xù)的方差分析、相關與回歸等內容,均要求分析的指標服從正態(tài)分布。因此,我們需要重點了解一下正態(tài)分布的概率密度函數(shù)及其特征。正態(tài)分布重點知識正態(tài)分布的概率密度函數(shù)是:正態(tài)曲線呈鐘型,兩頭低,中間高,曲線與橫軸間的面積總等于1;正態(tài)曲線關于均值對稱,在均值處達到最大值,在正(負)無窮遠處取值為0;隨機變量的取值鄰近均值的概率越大,遠離均值的概率越??;方差越小,分布越集中在均值附近;方差越大,分布越分散。01020304請思考:正態(tài)分布的概率分布圖具有哪些特征?圖5

4、-1 正態(tài)分布概率分布圖 假設檢驗也叫顯著性檢驗,是以小概率反證法的邏輯推理,判斷假設是否成立的統(tǒng)計方法。它首先假設樣本對應的總體參數(shù)(或分布)與某個已知總體參數(shù)(或分布)相同,然后根據(jù)統(tǒng)計量的分布規(guī)律來分析樣本數(shù)據(jù),利用樣本信息判斷是否支持這種假設,并對檢驗假設做出取舍抉擇,做出的結論是概率性的,不是絕對的肯定或否定。假設檢驗假設檢驗概念【案例分析】可口可樂標簽的承諾是否可信? 假如可口可樂生產(chǎn)的一種瓶裝雪碧,其標簽上標注的容量為250毫升,標準差為4毫升。如果從市場上隨機抽取50瓶,發(fā)現(xiàn)其平均含量為248毫升,那么標簽上的承諾是否可信? 這時,我們就可以假設“可口可樂標簽的承諾是可信”或者

5、“可口可樂標簽的承諾不可信”,然后通過樣本數(shù)據(jù)進行檢驗分析來檢測假設是否正確,從而做出最終的判斷,這就是我們所謂的假設檢驗。假設檢驗種類我們都知道在數(shù)據(jù)軸上有正負方向。在某些情況下,某些假設問題是具有方向性的。通常來說,所謂的方向性有兩種情況:一種是所觀察的數(shù)值越大越好;另一種情況是所觀察的數(shù)值越小越好。根據(jù)檢驗的實際需求不同,單側檢驗中可能會出現(xiàn)不同的方向。單側檢驗雙側檢驗雙側檢驗,就是指當統(tǒng)計分析的目的是要檢驗樣本平均數(shù)與總體平均數(shù),或樣本成數(shù)有沒有顯著差異,而不問差異的方向是否是正差還是負差時,所采用的一種統(tǒng)計檢驗方法。例如,要檢驗車間技術改進后的產(chǎn)品單位成本總體均值與技術改進前的產(chǎn)品單

6、位成本總體均值是否有什么不同。假設檢驗的基本思想 假設檢驗的基本思想是對總體數(shù)值設定某種假設,以小概率事件不發(fā)生為基準,運用反證法思想,按照總體數(shù)值的假設,并根據(jù)所獲取的樣本數(shù)據(jù),通過樣本統(tǒng)計量的分布,得出小概率事件在某一次試驗或者觀測中發(fā)生與否的現(xiàn)象,從而對總體數(shù)值進行分析及對其原先設定的假設作出拒絕與否的判斷。04030201統(tǒng)計學基礎知識:概率、概率分布以及概率分布函數(shù)等;假設檢驗是以小概率反證法的邏輯推理,判斷假設是否成立的統(tǒng)計方法;假設檢驗的種類分為單側和雙側檢驗;假設檢驗的基本思想。本節(jié)課教學內容總結 假設檢驗的分析方法知識目標:了解假設檢驗的原理;能力目標:掌握假設檢驗的基本步驟

7、和兩類錯誤;素質目標:具備良好的職業(yè)道德,誠實守信。02PART案例講解下面將使用假設檢驗的分析方法來解決上述問題。第一步,根據(jù)問題的實際情況,提出原假設H0和備選假設H1。假設檢驗的基本步驟第二步,選取適當?shù)娘@著水平。在假設檢驗中,顯著性水平是指當原假設成立時,人們卻把它拒絕了的概率或風險,犯這種錯誤的概率用 表示。實際檢驗中, 通常取值為0.05。第三步,選定檢驗統(tǒng)計量并分析拒絕域的形式。案例中可選定如下統(tǒng)計量:假設檢驗的基本步驟第四步,確定接受域與拒絕域。由于Z服從標準正態(tài)分布,認為給定顯著性水平 =0.05,過查標準正態(tài)分布表可知臨界值為1.96,則拒絕域可表示為 。第五步,計算統(tǒng)計量

8、的值,根據(jù)拒絕域作出決策。在案例中,如果抽樣值|u|1.96,則接受原假設H0,拒絕備選假設H1;如果抽樣值|u|1.96,則拒絕原假設H0,接受備選假設H1。假設檢驗的基本步驟根據(jù)計算結果,|u|=|-3.536|=3.5361.96,說明一次抽樣的樣本統(tǒng)計量落在拒絕域內,此時小概率事件在一次抽樣中發(fā)生了,利用反證法思想得出矛盾現(xiàn)象,則拒絕原假設H0。原假設H0實際是正確或者成立的,但卻錯誤的拒絕了H0,這樣就犯了“誤拒”的錯誤,通常稱之為第類錯誤或拒真錯誤,犯第類錯誤的概率記為 。誤拒 錯誤誤受錯誤原假設H0實際是不正確或者不成立的,但卻錯誤的接受了H0,這樣就犯了“誤受”的錯誤,通常稱之

9、為第類錯誤或取偽錯誤,犯第類錯誤的概率記為 。假設檢驗的兩類錯誤假設檢驗的兩類錯誤對原假設的判斷假設本身的真假情況原假設H0成立原假設H0不成立接受原假設H0 決策正確 “誤受”錯誤 拒絕原假設H0 “誤拒”錯誤 決策正確 對原假設的判斷與假設本身的真假的關系如果減少犯第類錯誤的概率,就會增大犯第類錯誤的概率;如果減少犯第類錯誤的概率,就會增大犯第類錯誤的概率。 均值過程知識目標:了解均值的基本概念;能力目標:掌握均值過程的基本思想;素質目標:具備良好的職業(yè)道德,誠實守信。03PART 均值,亦稱為平均數(shù),是表示一組數(shù)據(jù)集中趨勢的量數(shù),是指在一組數(shù)據(jù)中所有數(shù)據(jù)之和再除以這組數(shù)據(jù)的個數(shù)。 均值是

10、反映數(shù)據(jù)集中趨勢的一項指標,解答均值相關問題的關鍵在于確定“總數(shù)量”以及和總數(shù)量對應的總份數(shù)。根據(jù)“總數(shù)量”的不同,我們把均值分別確認為樣本均值和總體均值。其中,樣本均值是指在總體中的樣本數(shù)據(jù)的均值;而總體均值又稱為總體的數(shù)學期望或簡稱期望,是描述隨機變量取值平均狀況的數(shù)字特征。均值的基本概念 (1)計算思路相同:兩個均值的計算思路都是用所測量的群體的某指標的總和除以群體個數(shù); (2)反映的都是數(shù)據(jù)的集中趨勢。樣本均值和總體均值都是反映數(shù)據(jù)集中趨勢的一項指標; (3)兩者一般情況下不完全相等,樣本是對總體的推測。 樣本只是總體的一部分,樣本取自總體,可以反映總體的特征,因此樣本平均值也會比較接

11、近于總體平均值,恰好等于總體平均值的機會很少。一般情況下樣本均值與總體均值之間會有些差異。樣本均值與總體均值的關系 單樣本t檢驗知識目標:了解單樣本t檢驗的基本思想;能力目標:掌握單樣本t檢驗的基本步驟;素質目標:具備良好的職業(yè)道德,誠實守信。04PART 單樣本t檢驗的目的是利用來自某單個總體的樣本數(shù)據(jù),推斷該總體的均值是否與假設的檢驗值之間存在顯著性差異。 比如,在一批產(chǎn)品中選取部分產(chǎn)品進行成本檢驗,以樣本檢驗結果推斷總體,再與假設檢驗值比較,類似審計抽樣檢驗;或在一批產(chǎn)品中選取從不同地區(qū)的產(chǎn)品銷量作為檢驗樣本,測試樣本的銷售情況,以樣本檢驗結果推斷總體,再與假設檢驗值比較,得出是否與預期

12、保持大致一致的結果。單樣本t檢驗的基本思想單樣本t檢驗的基本步驟 獨立樣本t檢驗知識目標:了解獨立樣本t檢驗的基本概念;能力目標:掌握獨立樣本t檢驗的基本步驟;素質目標:具備良好的職業(yè)道德,誠實守信。05PART 在進行數(shù)據(jù)分析時,我們經(jīng)常會遇到比較兩類人或兩個類別在某些觀察方面是否存在差異的實際問題,這種問題從數(shù)據(jù)建模的角度講,就是比較兩個總體是否具有相同分布的問題。 兩獨立樣本t檢驗(各實驗處理組之間毫無相關存在,即為獨立樣本)的目的是利用來自兩個非相關樣本總體的獨立樣本,推斷兩個總體的均值是否存在顯著差異。例如男生和女生的高中學習能力、產(chǎn)品A和產(chǎn)品B的銷量是否有差異等。獨立樣本t檢驗的基本思想獨立樣本t檢驗的基本步驟情形一獨立樣本t檢驗的基本步驟情形二 配對樣本t檢驗知識目標:了解配對樣本t檢驗的基本概念;能力目標:掌握配對樣本t檢驗的基本思想;素質目標:具備良好的職業(yè)道德,誠實守信。06PART 匹配樣本就是兩個樣本是配對的,其觀察值數(shù)目相同,其觀察值的順序不能隨意更改。匹配樣本檢驗的思想出發(fā)點在于對試驗前后樣本的差值情況

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論