《商務(wù)統(tǒng)計分析 第2版》 課件 第13章 非參數(shù)檢驗_第1頁
《商務(wù)統(tǒng)計分析 第2版》 課件 第13章 非參數(shù)檢驗_第2頁
《商務(wù)統(tǒng)計分析 第2版》 課件 第13章 非參數(shù)檢驗_第3頁
《商務(wù)統(tǒng)計分析 第2版》 課件 第13章 非參數(shù)檢驗_第4頁
《商務(wù)統(tǒng)計分析 第2版》 課件 第13章 非參數(shù)檢驗_第5頁
已閱讀5頁,還剩19頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

第13章

非參數(shù)檢驗1第13章非參數(shù)檢驗——目錄利用二項分布對兩類數(shù)據(jù)以及中位數(shù)進行推斷第1節(jié)符號檢驗利用秩-順序數(shù)據(jù)對兩個或多個總體進行推斷第2節(jié)威爾科克森符號秩檢驗第3節(jié)威爾科克森秩和檢驗第4節(jié)克魯斯卡爾-沃利斯檢驗利用秩-順序數(shù)據(jù)對兩個變量計算等級相關(guān)系數(shù)第5節(jié)斯皮爾曼秩相關(guān)系數(shù)2符號檢驗:用于檢驗兩個相關(guān)樣本的觀測值之差的正負(fù)號頻次是否存在顯著差異多用途的非參數(shù)方法對總體分布沒有假定的要求既能分析分類型數(shù)據(jù),也能分析數(shù)量型數(shù)據(jù)313.1符號檢驗符號檢驗應(yīng)用:總體中位數(shù)假設(shè)檢驗(獨立樣本)匹配樣本的假設(shè)檢驗為了進行符號檢驗,從總體中隨機抽取樣本。將抽取的隨機樣本中大于中位數(shù)的值標(biāo)記為加號,小于中位數(shù)的值標(biāo)記為減號。如果一個值等于中位數(shù),則在進一步分析中將其刪除。令p表示加號的概率。若中位數(shù)實際值和假設(shè)值相等的假設(shè)成立,那么樣本數(shù)據(jù)中每個觀測值大于或小于假定值的概率都是0.5。抽樣分布:p=0.5的二項分布:413.1符號檢驗中位數(shù)總體中位數(shù)假設(shè)檢驗:考慮一個總體,其中沒有任何一個數(shù)值恰好等于中位數(shù),則中位數(shù)是中心趨勢的度量,它將總體分為兩個部分,其中50%的值大于中位數(shù),另外50%的值小于中位數(shù)。當(dāng)總體是偏斜分布時,中位數(shù)是總體中心位置的最佳度量。513.1符號檢驗——總體中位數(shù)假設(shè)檢驗總體中位數(shù)假設(shè)檢驗的原假設(shè)和備擇假設(shè)的一般形式如下:總體中位數(shù)的檢驗統(tǒng)計量如下:H0:總體中位數(shù)的實際值與假定值一致H1:總體中位數(shù)的實際值與假定值不一致:觀測值與假定的中位數(shù)的差值為正的個數(shù)613.1符號檢驗——總體中位數(shù)假設(shè)檢驗例:某地產(chǎn)商想要確認(rèn)城市平均樓盤價格的中位數(shù)與媒體公布的7600元/m2是否有顯著差異,故對某城市16座預(yù)出售的樓盤均價進行調(diào)研,結(jié)果如下所示(單位:百元/m2)。試檢驗該城市平均樓盤價格的中位數(shù)與媒體公布的7600元/m2是否有顯著差異。72 73 76 77 87 90 70 7168 80 83 76 82 89 78 79解:設(shè)該城市平均樓盤價格假定的中位數(shù)為7600元/m2,依題意提出如下假設(shè):H0:該城市平均樓盤價格的中位數(shù)等于7600元/m2H1:該城市平均樓盤價格的中位數(shù)等于7600元/m2713.1符號檢驗——總體中位數(shù)假設(shè)檢驗二項式檢驗

類別數(shù)字觀測到的比例檢驗比例精確顯著性水平(雙尾)樓盤價格組1<=76007.44.50.804組2>76009.56

總計

161.00

SPSS輸出檢驗結(jié)果如表13-1所示:表13-1樓盤均價的中位數(shù)符號檢驗從表13-1中可以看出樓盤價格小于等于中位數(shù)的有7個,大于中位數(shù)的有9個。SPSS給出的精確雙尾概率為

,所以不能拒絕原假設(shè)。也就是說該城市樓盤價格的實際中位數(shù)與7600元/m2有顯著差異,媒體公布的數(shù)據(jù)不準(zhǔn)確。813.1符號檢驗——匹配樣本的假設(shè)檢驗匹配樣本:可以是同一研究對象分別給于兩種不同處理的效果比較的觀察值;或者同一研究就對象處理前后的效果比較的觀察值。匹配樣本的符號檢驗要求兩個樣本的觀測值之差服從對稱分布匹配樣本假設(shè)檢驗的原假設(shè)和備擇假設(shè)的一般形式如下:H0:兩個總體的分布相同H1:兩個總體的分布不相同匹配樣本的檢驗統(tǒng)計量如下::兩個匹配樣本數(shù)據(jù)對的差值為正的個數(shù)9例:為了研究放松(如聽音樂)對于入睡時間的影響,隨機選擇了11名志愿者,分別記錄他們未進行放松時的入睡時間及放松后的入睡時間,數(shù)據(jù)如下表13-2。檢驗該放松方法對睡眠時間的影響是否有顯著差異。13.1符號檢驗——匹配樣本的假設(shè)檢驗表13-2

經(jīng)歷放松前后兩種方式的入睡時常(單位:min)編號1234567891011放松前2315171819302214132821放松后181017141524201872218解:這里有兩個匹配總體。為了檢驗放松對入睡時長的影響是否存在顯著差異,提出如下假設(shè):H0:兩個總體分布相同H1:兩個總體分布不同10從表13-3中,可以看出有9個志愿者放松前的入睡時長高于放松后的入睡時長,有1個志愿者放松后的入睡時長高于放松前的入睡時長,有1個志愿者的入睡時長在放松前后沒有變化,樣本容量為10。13.1符號檢驗——匹配樣本的假設(shè)檢驗SPSS輸出檢驗結(jié)果如表13-3和表13-4所示:表13-3頻率

數(shù)字放松前的入睡時長-放松后的入睡時長負(fù)差分a1正差分b9結(jié)c1總計11a.放松前的入睡時長<放松后的入睡時長

b.放松前的入睡時長>放松后的入睡時長

c.放松前的入睡時長=放松后的入睡時長

1113.1符號檢驗——匹配樣本的假設(shè)檢驗SPSS輸出檢驗結(jié)果如表13-3和表13-4所示:表13-4檢驗統(tǒng)計a

放松前的入睡時長-放松后的入睡時長精確顯著性水平(雙尾).021ba.符號檢驗b.使用了二項分布。

從表13-4中可以看出,SPSS給出的精確雙尾概率為所以拒絕原假設(shè),認(rèn)為放松對入睡時長有顯著差異。威爾科克森符號秩檢驗:檢驗兩個匹配總體的位置(中位數(shù))是否存在顯著差異匹配樣本觀測值之差具有對稱分布可以同時考慮樣本差異大小和差異方向上的信息。13.2威爾科克森符號秩檢驗威爾科克森符號秩檢驗的原假設(shè)和備擇假設(shè)的一般形式如下:H0:兩個總體的分布相同H1:兩個總體的分布不相同匹配樣本的檢驗統(tǒng)計量計算步驟如下:設(shè)X,Y是具有對稱分布的兩個匹配連續(xù)總體。從兩個總體中分別抽取兩個獨立的隨機樣本分別為,;組成數(shù)據(jù)對;計算;秩(rank):一組數(shù)據(jù)按照從小到大順序排列以后,每個觀測值所在的位置。13.2威爾科克森符號秩檢驗計算;將從小到達(dá)排列,并找出它們的秩。最小的

秩為1,最大的

秩為n,如果有相同的,則取各點秩的平均值;計算正的秩的總和,負(fù)的

秩的總和

。小樣本情況下::統(tǒng)計量W服從威爾科克森符號秩分布:統(tǒng)計量W近似服從正態(tài)分布大樣本情況下:13.2威爾科克森符號秩檢驗例:根據(jù)例13.2的數(shù)據(jù),檢驗放松對入睡時長是否有顯著影響。解:依題意給出如下假設(shè):H0:兩個總體的分布相同;H1:兩個總體的分布不相同。SPSS輸出的結(jié)果如表13-5和表13-6所示:表13-5列組

數(shù)字等級平均值等級之和放松前的入睡時長-放松后的入睡時長負(fù)秩1a4.004.00正秩9b5.6751.00結(jié)1c

總計10

a.放松前的入睡時長<放松后的入睡時長b.放松前的入睡時長>放松后的入睡時長c.放松前的入睡時長=放松后的入睡時長從表13-5可知,有8個志愿者放松前入睡時長高于放松后的入睡時長,有1個志愿者放松后的入睡時長高于放松前的入睡時長,有1個志愿者的入睡時長在放松前后沒有變化,樣本容量為9。13.2威爾科克森符號秩檢驗從表13-6可知

,SPSS給出的精確雙尾概率為所以拒絕原假設(shè),認(rèn)為放松對入睡時長有顯著差異。

表13-6檢驗統(tǒng)計a

放松前的入睡時長-放松后的入睡時長Z-2.409b漸近顯著性(雙尾).016a.Wilcoxon帶符號等級檢驗b.基于負(fù)秩。13.3曼-惠特尼秩和檢驗曼-惠特尼秩和檢驗:檢驗兩個獨立總體間是否存在顯著差異獨立樣本不要求兩個樣本總體服從正態(tài)分布可使用順序型數(shù)據(jù),也可以使用數(shù)量型數(shù)據(jù)曼-惠特尼秩和檢驗的原假設(shè)和備擇假設(shè)的一般形式如下:H0:兩個總體的分布相同H1:兩個總體的分布不相同獨立樣本的檢驗統(tǒng)計量計算步驟如下:設(shè)X,Y是兩個相互獨立的連續(xù)總體。從兩個總體中分別抽取兩個獨立的隨機樣本分別為,;混合兩組數(shù)據(jù),并將新樣本按照從小到大的順序排列,得到它們的秩,新樣本的樣本容量為;13.3曼-惠特尼秩和檢驗分別對樣本、對應(yīng)的秩求出秩和、;若,檢驗統(tǒng)計量

;若,檢驗統(tǒng)計量

;

若,檢驗統(tǒng)計量W為第一個變量所在樣本組的W值。小樣本情況下::統(tǒng)計量U服從曼惠特尼分布:統(tǒng)計量U近似服從正態(tài)分布大樣本情況下:13.3曼-惠特尼秩和檢驗例:市盈率指的是某公司股票當(dāng)前價格除以12個月的每股收益。下表列出了北京的10家公司和上海的12家公司的市盈率。檢驗北京公司和上海公司的市盈率之間是否存在顯著差異?

表13-7北京和上海公司市盈率北京12345678910

市盈率1522118243121364583367

上海ABCDEFGHIJKL市盈率29932445125172114122391419解:將北京的公司看作一個整體,上海的公司看作另一個整體,要檢驗北京的公司和上海的公司的市盈率是否存在顯著差異,做出如下假設(shè):H0:北京公司總體和上海公司市盈率總體分布相同H1:北京公司總體和上海公司市盈率總體分布不同13.3曼-惠特尼秩和檢驗SPSS輸出的結(jié)果如表所示13-8和表13-9所示:表13-8列組

城市數(shù)字等級平均值等級之和市盈率1.001013.35133.502.00129.96119.50總計22

表13-9檢驗統(tǒng)計a

市盈率Mann-WhitneyU41.500WilcoxonW119.500Z-1.221漸近顯著性(雙尾).222精確顯著性[2*(單尾顯著性)].228ba.分組變量:城市b.未修正結(jié)。表13-9中給出的統(tǒng)計量

,精確雙尾

所以不能拒絕原假設(shè),北京公司和上海公司的市盈率沒有顯著差異。13.4克魯斯卡爾-沃利斯檢驗克魯斯卡爾-沃利斯檢驗(KW檢驗):檢驗多個獨立總體間是否存在顯著差異的一種非參數(shù)檢驗方法不要求多個樣本總體服從正態(tài)分布可使用順序型數(shù)據(jù),也可以使用數(shù)量型數(shù)據(jù)KW檢驗的原假設(shè)和備擇假設(shè)的一般形式如下:H0:所有總體的分布相同H1:所有總體的分布不相同獨立樣本的檢驗統(tǒng)計量計算步驟如下:設(shè)存在k個相互獨立的連續(xù)總體,從這k個總體中分別隨機抽取樣本,每個樣本的樣本容量分別為

;混合k組數(shù)據(jù),并將新樣本按照從小到大的順序排列,得到它們的秩,新樣本的樣本容量為;13.4克魯斯卡爾-沃利斯檢驗分別第i個樣本的秩和統(tǒng)計量H近似服從自由度為k-1的卡方分布:13.4克魯斯卡爾-沃利斯檢驗例:W公司從3所不同的大學(xué)招聘銷售經(jīng)理。最近該公司試圖確定畢業(yè)于這3所大學(xué)的銷售經(jīng)理的業(yè)績評分是否存在差異。A大學(xué)畢業(yè)的7名銷售經(jīng)理、B大學(xué)畢業(yè)的6名銷售經(jīng)理、C大學(xué)畢業(yè)的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論