第四講 假設(shè)檢驗(yàn)_第1頁(yè)
第四講 假設(shè)檢驗(yàn)_第2頁(yè)
第四講 假設(shè)檢驗(yàn)_第3頁(yè)
第四講 假設(shè)檢驗(yàn)_第4頁(yè)
第四講 假設(shè)檢驗(yàn)_第5頁(yè)
已閱讀5頁(yè),還剩92頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第四講假設(shè)檢驗(yàn)第一頁(yè),共九十七頁(yè),2022年,8月28日例子開(kāi)發(fā)研制的新藥對(duì)治療某種特定疾病的效果水稻畝產(chǎn)量的影響因素分析心臟病猝死與日期的關(guān)系(2.8:1:1:1:1:1:1)產(chǎn)品自動(dòng)生產(chǎn)線工作是否正常?某種新生產(chǎn)方法是否會(huì)降低產(chǎn)品成本?廠商聲稱產(chǎn)品質(zhì)量符合標(biāo)準(zhǔn),是否可信?第二頁(yè),共九十七頁(yè),2022年,8月28日案例澳大利亞統(tǒng)計(jì)局公布的2003年第一季度失業(yè)率為6.1%。而RoyMorgan公司在調(diào)查了14656名14歲以上的居民以后得到的失業(yè)率為7.8%。你認(rèn)為RoyMorgan的結(jié)果顯著高于統(tǒng)計(jì)局的數(shù)字嗎?美國(guó)勞工局公布的數(shù)字表明,1998年11月美國(guó)的平均失業(yè)時(shí)間為14.6周。在費(fèi)城市市長(zhǎng)的要求下進(jìn)行的一項(xiàng)研究調(diào)查了50名失業(yè)者,平均失業(yè)時(shí)間為15.54周。根據(jù)調(diào)查結(jié)果能否認(rèn)為費(fèi)城的平均失業(yè)時(shí)間高于全國(guó)平均水平?

第三頁(yè),共九十七頁(yè),2022年,8月28日樣本推斷總體的情況總體分布已知的情形下,根據(jù)樣本數(shù)據(jù)對(duì)總體分布的統(tǒng)計(jì)參數(shù)進(jìn)行推斷(估計(jì)或檢驗(yàn))總體分布未知的情形,根據(jù)樣本數(shù)據(jù)對(duì)總體的分布形式或特征進(jìn)行推斷第四頁(yè),共九十七頁(yè),2022年,8月28日參數(shù)假設(shè)檢驗(yàn)與非參數(shù)假設(shè)檢驗(yàn)參數(shù)假設(shè)檢驗(yàn):已知總體分布(給定或假定),猜到總體某個(gè)參數(shù)的數(shù)值(H0),那么這種猜測(cè)對(duì)不對(duì)?需要用一組樣本信息來(lái)判斷。,效率高。有一個(gè)總體、兩個(gè)總體和多個(gè)總體的參數(shù)檢驗(yàn)。非參數(shù)假設(shè)檢驗(yàn):又稱分布檢驗(yàn)。在總體分布未知或知之甚少的情況下,用樣本數(shù)據(jù)對(duì)總體分布形態(tài)等進(jìn)行推斷。猜出總體分布(H0),用一組樣本來(lái)檢驗(yàn)該假設(shè)是否正確。即假設(shè)總體服從,用樣本信息推斷總體是否服從某理論分布。檢驗(yàn)條件較寬松,適應(yīng)性強(qiáng),但功效較低。(含總體的分布類型檢驗(yàn)及獨(dú)立性檢驗(yàn)等)第五頁(yè),共九十七頁(yè),2022年,8月28日假設(shè)檢驗(yàn)內(nèi)容第六頁(yè),共九十七頁(yè),2022年,8月28日4.1假設(shè)檢驗(yàn)的基本問(wèn)題一、假設(shè)檢驗(yàn)的基本原理二、假設(shè)檢驗(yàn)的基本步驟三、假設(shè)檢驗(yàn)的兩類錯(cuò)誤四、利用P-Value進(jìn)行檢驗(yàn)第七頁(yè),共九十七頁(yè),2022年,8月28日4.2參數(shù)檢驗(yàn)一、總體均值的假設(shè)檢驗(yàn)二、總體比例的假設(shè)檢驗(yàn)三、總體方差的假設(shè)檢驗(yàn)第八頁(yè),共九十七頁(yè),2022年,8月28日4.3方差分析主要應(yīng)用在在農(nóng)業(yè)、商業(yè)、醫(yī)學(xué)、社會(huì)學(xué)、經(jīng)濟(jì)學(xué)等諸多領(lǐng)域一、方差分析的基本問(wèn)題二、單因素方差分析三、多因素方差分析四、協(xié)方差分析第九頁(yè),共九十七頁(yè),2022年,8月28日一、方差分析的基本原理意義:是英國(guó)統(tǒng)計(jì)學(xué)家費(fèi)歇(R.A.Fisher)20世紀(jì)20年代提出,某變量受多種不同因素不同程度的影響,哪些因素有顯著影響,通過(guò)方差分析來(lái)解決。核心問(wèn)題從數(shù)據(jù)差異角度看:觀測(cè)變量的數(shù)據(jù)差異

=控制因素造成+隨機(jī)因素造成影響某農(nóng)作物畝產(chǎn)量的因素方差分析正是要分析觀測(cè)變量的變動(dòng)是主要由控制因素造成還是由隨機(jī)因素造成的,以及控制變量的各個(gè)水平是如何對(duì)觀測(cè)變量造成影響的。第十頁(yè),共九十七頁(yè),2022年,8月28日一、方差分析的基本原理基本思路:通過(guò)實(shí)驗(yàn)或調(diào)查,取得不同因素不同水平條件下被考察的隨機(jī)變量(因變量)的樣本;利用樣本構(gòu)造統(tǒng)計(jì)量,檢驗(yàn)不同條件下的因變即幾個(gè)不同的總體的均值是否相等,如果均值相等的假設(shè)被接受,說(shuō)明因素及水平對(duì)因變量的影響不顯著。方差分析:從觀察變量的方差入手,研究諸多控制變量中哪些變量是對(duì)觀測(cè)變量有顯著影響的變量。對(duì)觀測(cè)變量有顯著影響的各控制變量其不同水平以及各水平的交互搭配是如何影響觀測(cè)變量的。第十一頁(yè),共九十七頁(yè),2022年,8月28日一、方差分析的基本原理方差分析實(shí)際上是通過(guò)推斷控制變量各水平下觀測(cè)變量的總體分布是否有顯著差異來(lái)實(shí)現(xiàn)的,1、假定:觀測(cè)變量各總體服從正態(tài)分布觀測(cè)變量各總體的方差相同基于上述假定,方差分析對(duì)個(gè)總體分布是否有顯著差異的推斷就轉(zhuǎn)化成對(duì)各總體均值是否存在顯著差異的推斷。第十二頁(yè),共九十七頁(yè),2022年,8月28日因素(Factor):方差分析的對(duì)象因素水平(Factorlevel):因素的內(nèi)容方差分析:針對(duì)一定因素(Factor)分析各總體的各個(gè)因素水平(Factorlevel)是否有差異。單因素方差分析(One-Wayanalysisofvariance):針對(duì)一個(gè)因素所進(jìn)行的雙因素方差分析(Two-Wayanalysisofvariance):針對(duì)兩個(gè)因素進(jìn)行的。多因數(shù)方差分析:涉及兩個(gè)以上的因數(shù)?;驹淼谑?yè),共九十七頁(yè),2022年,8月28日2、觀測(cè)值間差異觀察值之間存在的差異主要來(lái)自于:①組間方差:因素的不同水平造成的,主要是系統(tǒng)性誤差,也包括隨機(jī)因素的影響,用水平間方差來(lái)解釋。如飲料的不同顏色帶來(lái)不同的銷售量②組內(nèi)方差:抽選樣本的隨機(jī)性而產(chǎn)生,是隨機(jī)因素的影響,通過(guò)水平內(nèi)方差來(lái)顯示。如相同顏色飲料在不同商場(chǎng)銷售量不同??傠x差平方和=組間離差平方和+組內(nèi)離差平方和第十四頁(yè),共九十七頁(yè),2022年,8月28日觀測(cè)值間差異總離差平方和=組間離差平方和+組內(nèi)離差平方和(即SST=SSA+SSE)構(gòu)建統(tǒng)計(jì)量:統(tǒng)計(jì)學(xué)家(1890-1962)提出的,叫分布若比值近似為1,控制變量影響不顯著,即不拒絕H0;若比值偏離1,方差分析的結(jié)果可以得到總體均值不相同。因此方差分析就是通過(guò)不同方差的比較,做出接受或拒絕原假設(shè)的判斷。第十五頁(yè),共九十七頁(yè),2022年,8月28日3、方差分析的步驟建立方差分析模型檢查方差分析的前提條件是否成立建立檢驗(yàn)的原假設(shè)和備釋假設(shè)根據(jù)樣本值計(jì)算檢驗(yàn)統(tǒng)計(jì)量作出方差分析表根據(jù)F檢驗(yàn)結(jié)果作出推斷第十六頁(yè),共九十七頁(yè),2022年,8月28日4、方差分析的內(nèi)容單因素方差分析多因素方差分析協(xié)方差分析第十七頁(yè),共九十七頁(yè),2022年,8月28日基本思想:?jiǎn)我蛩胤讲罘治鍪侵会槍?duì)一個(gè)因素進(jìn)行,用來(lái)研究一個(gè)控制變量的不同水平是否對(duì)觀測(cè)變量產(chǎn)生顯著影響,旨在分析該因素對(duì)樣本的觀察值是否產(chǎn)生影響,各因素水平的樣本容量大小可以一致,也可以不一致。二、單因素方差分析第十八頁(yè),共九十七頁(yè),2022年,8月28日舉例:消費(fèi)者對(duì)行業(yè)的投訴次數(shù)如下,消費(fèi)者協(xié)會(huì)想知道這幾個(gè)行業(yè)之間的服務(wù)質(zhì)量是否有顯著差異?試驗(yàn)號(hào)行業(yè)(因數(shù)水平)零售業(yè)旅游業(yè)航空公司家電制造業(yè)123455766494034683929455631492134404451657758第十九頁(yè),共九十七頁(yè),2022年,8月28日第二十頁(yè),共九十七頁(yè),2022年,8月28日1、分析思路明確觀測(cè)變量和控制變量剖析觀測(cè)變量的方差第二十一頁(yè),共九十七頁(yè),2022年,8月28日2、步驟比較觀測(cè)變量總離差平方和中各部分的比例單因素方差分析一般分為四步:(1)建立原假設(shè)和備擇假設(shè);(H0控制變量不同水平下觀測(cè)變量各總體的均值無(wú)顯著差異)(2)選擇檢驗(yàn)統(tǒng)計(jì)量,計(jì)算F和P;(3)給定顯著性水平,確定臨界值;(4)決策。第二十二頁(yè),共九十七頁(yè),2022年,8月28日3、應(yīng)用舉例例“廣告地區(qū)與銷售額.sav”AnalyzeCompareMeansOne-WayANOVE第二十三頁(yè),共九十七頁(yè),2022年,8月28日4、進(jìn)一步分析AnalyzeCompareMeansOne-WayANOVE對(duì)比檢驗(yàn)(先驗(yàn)對(duì)比和趨勢(shì)檢驗(yàn))多重比較檢驗(yàn)方差齊性檢驗(yàn)第二十四頁(yè),共九十七頁(yè),2022年,8月28日(1)Contrasts檢驗(yàn)先驗(yàn)對(duì)比檢驗(yàn)?zāi)芨_地掌握各水平間或相似子集間均值的差異程度趨勢(shì)檢驗(yàn)(polynominal):分析隨控制變量水平的變化,觀測(cè)變量值變化的總體趨勢(shì)是怎樣的。線性、二次、三次等?從另一角度把握控制變量不同水平對(duì)觀測(cè)變量總體作用的程度第二十五頁(yè),共九十七頁(yè),2022年,8月28日(2)PostHoc多重比較當(dāng)方差分析檢驗(yàn)的結(jié)果拒絕原假設(shè)時(shí),只能得到各水平間的樣本均值不完全相同的結(jié)論。如果要想明確是哪一個(gè)因素水平的均值或哪幾個(gè)同其他均值不相等,就需要進(jìn)行多重比較。進(jìn)一步確定控制變量的不同水平對(duì)觀測(cè)變量的影響程度,哪個(gè)水平的作用明顯區(qū)別于其他水平,哪個(gè)水平作用不顯著等第二十六頁(yè),共九十七頁(yè),2022年,8月28日PostHoc多重比較目的如果總體均值存在差異,F(xiàn)檢驗(yàn)不能說(shuō)明哪個(gè)水平造成了觀察變量的顯著差異。多重比較將對(duì)每個(gè)水平的均值逐對(duì)進(jìn)行比較檢驗(yàn)。常用方法LSD法(適用于總體方差相等的情形,檢驗(yàn)敏感度最高)實(shí)際上就是t檢驗(yàn)的變形,只是在變異和自由度的計(jì)算上利用了整個(gè)樣本信息。Bonferroni方法(對(duì)犯第一類錯(cuò)誤進(jìn)行了控制)Tukey法;Scheffe法;S-N-K法第二十七頁(yè),共九十七頁(yè),2022年,8月28日(3)Options方差齊性對(duì)控制變量不同水平下各觀測(cè)變量總體方差是否相等進(jìn)行分析(即方差齊性檢驗(yàn)),同兩獨(dú)立樣本t檢驗(yàn)的方差檢驗(yàn)。即控制變量不同水平下各觀測(cè)變量總體方差是否相Homogeneityofvariance實(shí)現(xiàn)方差齊性檢驗(yàn)。Descriptive基本描述統(tǒng)計(jì)量MeansPlot各水平下觀測(cè)變量均值折線圖第二十八頁(yè),共九十七頁(yè),2022年,8月28日(4)應(yīng)用舉例目的檢驗(yàn)?zāi)骋粋€(gè)控制因素的改變是否會(huì)給觀察變量帶來(lái)顯著影響.例如:考察不同肥料對(duì)某農(nóng)作物畝產(chǎn)量是否有顯著差異.考察不同學(xué)歷是否對(duì)工資收入產(chǎn)生顯著影響.例“廣告地區(qū)與銷售額.sav”步驟【Analyze】【CompareMeans】【One-wayANOVA】第二十九頁(yè),共九十七頁(yè),2022年,8月28日

實(shí)際中對(duì)某個(gè)結(jié)果的影響因素可能有多個(gè)而不是唯一的,這時(shí)就需要進(jìn)行雙因素甚至于多因素方差分析。雙因素方差分析的步驟與單因素方差分析的步驟完全類似,但要特別注意計(jì)算F值時(shí)每個(gè)因素的自由度的確定原則。第三十頁(yè),共九十七頁(yè),2022年,8月28日三、多因素方差分析多因素方差分析是用來(lái)研究?jī)蓚€(gè)或以上控制變量的不同水平是否對(duì)觀測(cè)變量產(chǎn)生顯著影響。多因素方差分析不僅能夠分析多個(gè)因素對(duì)觀測(cè)變量的獨(dú)立影響,更能分析多個(gè)控制因素的交互作用能否對(duì)觀測(cè)變量的分布產(chǎn)生影響,進(jìn)而最終找到利于觀測(cè)變量的最優(yōu)組合。如農(nóng)作物產(chǎn)量(品種、施肥量),進(jìn)一步分析哪種品種與哪種水平的施肥量是提高農(nóng)作物產(chǎn)量的最優(yōu)組合。第三十一頁(yè),共九十七頁(yè),2022年,8月28日分析思路明確觀測(cè)變量和若干控制變量固定效應(yīng)因素(FixedFactor):指的是該因素在樣本中所有可能的水平都出現(xiàn)了。隨機(jī)效應(yīng)因素(RandomFactor):該因素所有可能的取值在樣本中沒(méi)有都出現(xiàn),因此要用樣本來(lái)推論總體情況,包括未出現(xiàn)的水平。這不可避免的存在誤差(即隨機(jī)效應(yīng)),需要估計(jì)該誤差的大小,因此被稱為隨機(jī)因素。第三十二頁(yè),共九十七頁(yè),2022年,8月28日1、分析思路剖析觀測(cè)變量的方差控制變量獨(dú)立作用的影響:?jiǎn)蝹€(gè)控制變量獨(dú)立作用對(duì)觀測(cè)變量的影響控制變量交互作用的影響:多個(gè)控制變量不同水平相互搭配后對(duì)觀測(cè)變量產(chǎn)生的影響

隨機(jī)因素的影響:抽樣誤差帶來(lái)的影響比較觀測(cè)變量總離差平方和中各部分的比例通常:第三十三頁(yè),共九十七頁(yè),2022年,8月28日分析思路第三十四頁(yè),共九十七頁(yè),2022年,8月28日交互作用的判斷A與B無(wú)交互作用A與B有交互作用

A1A2A1A2B125B125B2710B273第三十五頁(yè),共九十七頁(yè),2022年,8月28日2、步驟:(1)建立原假設(shè)和備擇假設(shè)(H0各控制變量不同水平下觀測(cè)變量各總體的均值無(wú)顯著差異,控制變量各效應(yīng)和交互作用效應(yīng)同時(shí)為0)第三十六頁(yè),共九十七頁(yè),2022年,8月28日步驟(2)選擇檢驗(yàn)統(tǒng)計(jì)量,計(jì)算F和P(3)給定顯著性水平,確定臨界值;(4)決策。第三十七頁(yè),共九十七頁(yè),2022年,8月28日3、應(yīng)用舉例例“廣告地區(qū)與銷售額.sav”。對(duì)廣告形式、地區(qū)以及廣告形式與地區(qū)的交互作用是否對(duì)商品銷售額產(chǎn)生影響進(jìn)行分析。步驟【Analyze】【GeneralLinearModel】【Univariate】第三十八頁(yè),共九十七頁(yè),2022年,8月28日4、進(jìn)一步分析模型選擇(飽和、不飽和)對(duì)比檢驗(yàn)(指定對(duì)比檢驗(yàn)的檢驗(yàn)值)控制變量交互作用圖形分析均值比較分析(Lsd法)方差齊性檢驗(yàn)第三十九頁(yè),共九十七頁(yè),2022年,8月28日(1)模型選擇在飽和模型中,觀測(cè)變量總的變差被分解為控制變量獨(dú)立作用、控制變量交互作用以及抽樣誤差三部分。如果研究發(fā)現(xiàn)控制變量的某種交互作用沒(méi)有給觀測(cè)變量帶來(lái)顯著影響,就可建立非飽和模型如兩因素的非飽和模型:

原來(lái)的SSAB被合并到SSE中第四十頁(yè),共九十七頁(yè),2022年,8月28日(2)其他功能對(duì)比檢驗(yàn)(Contrasts):與指定的檢驗(yàn)值進(jìn)行比較控制變量交互作用的圖形分析:反映兩控制變量的交互情況均值檢驗(yàn):(PostHoc)對(duì)各控制變量不同水平下觀測(cè)變量的均值是否存在顯著差異進(jìn)行比較。第四十一頁(yè),共九十七頁(yè),2022年,8月28日(3)應(yīng)用舉例例“廣告地區(qū)與銷售額.sav”。由前面分析可知:廣告形式與地區(qū)的交互作用不顯著,現(xiàn)進(jìn)一步建立非飽和模型,并進(jìn)行均值比較分析和交互作用圖形分析。變差分解:CorrectModel是X1、X2、X1*X2對(duì)應(yīng)變差的和,是線性模型整體解釋的部分Error是隨機(jī)因素引起的CorrectTotal=SST第四十二頁(yè),共九十七頁(yè),2022年,8月28日四、協(xié)方差分析目的:將無(wú)法或很難人為控制的因素作為協(xié)變量,并在排除協(xié)變量影響的條件下,分析控制變量(可控)對(duì)觀測(cè)變量的作用,從而更準(zhǔn)確地地對(duì)因素進(jìn)行評(píng)價(jià)。協(xié)方差分析仍然采用方差分析的基本思想,并在分析觀測(cè)變量時(shí),考慮了協(xié)變量的影響,認(rèn)為觀測(cè)變量的變動(dòng)受四個(gè)因素的影響:控制變量的獨(dú)立作用、控制變量的交互作用、協(xié)變量的作用和隨機(jī)因素的作用,并在扣除協(xié)變量的影響后,再分析控制變量對(duì)觀測(cè)變量的影響。第四十三頁(yè),共九十七頁(yè),2022年,8月28日四、協(xié)方差分析原假設(shè):協(xié)變量對(duì)觀測(cè)變量的線性影響是不顯著的;在協(xié)變量影響扣除下,控制變量各水平下觀測(cè)變量的總體均值無(wú)顯著差異,控制變量各水平對(duì)觀測(cè)變量的效應(yīng)同時(shí)為零。檢驗(yàn)統(tǒng)計(jì)量F是各均方與隨機(jī)因素引起的均方的比。相對(duì)于隨機(jī)因素引起的變差,協(xié)變量帶來(lái)的變差比例較大,即F較大,說(shuō)明協(xié)變量是引起觀測(cè)變量變動(dòng)的主要因素之一,觀測(cè)變量的的變動(dòng)可以部分地由協(xié)變量來(lái)線性解釋在扣除了協(xié)變量的線性影響后,控制變量對(duì)觀測(cè)變量的影響同方差分析第四十四頁(yè),共九十七頁(yè),2022年,8月28日四、協(xié)方差分析如何扣除協(xié)變量對(duì)觀測(cè)變量的線性影響?如果將控制變量看作解釋變量,觀測(cè)變量看作被解釋變量,那么協(xié)方差分析就是介于方差分析和線性回歸分析之間的分析方法(要求多個(gè)協(xié)變量間無(wú)交互作用,于是可以參照回歸分析中對(duì)解釋變量的處理方式來(lái)處理協(xié)變量)。此外,協(xié)方差分析中常常要求多個(gè)協(xié)變量之間無(wú)交互作用,且觀測(cè)變量與協(xié)變量間有顯著的線性關(guān)系第四十五頁(yè),共九十七頁(yè),2022年,8月28日協(xié)方差分析基本思路:協(xié)變量是數(shù)值型的;與觀測(cè)變量的線性關(guān)系在各水平均成立,且斜率大致相同。SS總=SS協(xié)+SSA+SSB+SSAB+SSe步驟【Analyze】【GeneralLinearModel】【Univariate】注意:在彈出的對(duì)話框中將協(xié)變量選入【Covariate(s)】欄第四十六頁(yè),共九十七頁(yè),2022年,8月28日應(yīng)用舉例

“生豬與飼料.sav”第四十七頁(yè),共九十七頁(yè),2022年,8月28日變差分解:CorrectModel是X1、X2、X1*X2對(duì)應(yīng)變差的和,是線性模型整體解釋的部分Error是隨機(jī)因素引起的CorrectTotal=SST輸出結(jié)果分析第四十八頁(yè),共九十七頁(yè),2022年,8月28日4.4非參數(shù)檢驗(yàn)一、單樣本非參數(shù)檢驗(yàn)二、兩獨(dú)立樣本非參數(shù)檢驗(yàn)三、多獨(dú)立樣本非參數(shù)檢驗(yàn)四、兩配對(duì)樣本非參數(shù)檢驗(yàn)五、多配對(duì)樣本非參數(shù)檢驗(yàn)第四十九頁(yè),共九十七頁(yè),2022年,8月28日一、單樣本非參數(shù)檢驗(yàn)對(duì)單個(gè)總體的分布形態(tài)等進(jìn)行推斷的方法。第五十頁(yè),共九十七頁(yè),2022年,8月28日1、c2檢驗(yàn):擬合優(yōu)度檢驗(yàn)

(定序數(shù)據(jù))【例1】一種飲料的容器材料可以選擇玻璃、塑料或者金屬。為了比較消費(fèi)者對(duì)包裝材料的偏好,抽樣調(diào)查了120名消費(fèi)者發(fā)現(xiàn),最喜歡玻璃、塑料和金屬容器的分別有55、25和40人。根據(jù)調(diào)查結(jié)果,能否認(rèn)為消費(fèi)者對(duì)3種材料的偏好程度是無(wú)差異的(顯著性水平a=0.05)?見(jiàn)“材料種類.sav”第五十一頁(yè),共九十七頁(yè),2022年,8月28日檢驗(yàn)統(tǒng)計(jì)量H0:樣本來(lái)自的總體分布與期望分布或某一理論分布無(wú)顯著差異。如卡方值較小,說(shuō)明觀測(cè)頻數(shù)分布與期望頻數(shù)分布接近第五十二頁(yè),共九十七頁(yè),2022年,8月28日c2檢驗(yàn):擬合適度檢驗(yàn)例2:據(jù)以往經(jīng)驗(yàn),機(jī)床發(fā)生故障的頻數(shù)服從均勻分布。某車間在一周內(nèi)統(tǒng)計(jì)所有機(jī)床發(fā)生故障頻數(shù)資料如下:試問(wèn)故障頻數(shù)是否服從均勻分布(0.05)星期一二三四五六故障頻數(shù)78391617第五十三頁(yè),共九十七頁(yè),2022年,8月28日分析:原假設(shè):一周內(nèi)故障頻數(shù)服從均勻分布,則每日發(fā)生故障的概率為1/6由分布表查得6-1;0.05=11.07;由于實(shí)際值大于臨界值拒絕原假設(shè),認(rèn)為周內(nèi)機(jī)床發(fā)生故障頻數(shù)不服從均勻分布第五十四頁(yè),共九十七頁(yè),2022年,8月28日特別說(shuō)明大樣本、每個(gè)單元中的期望頻數(shù)大于等于5時(shí)可以使用c2分布。小樣本時(shí)應(yīng)該按照精確方法計(jì)算得到的p值得出結(jié)論。c2檢驗(yàn)也可以按照同樣的思想對(duì)正態(tài)分布或者任何想象的其他分布進(jìn)行檢驗(yàn),但主要用于對(duì)定性變量的檢驗(yàn)。另外,c2檢驗(yàn)也可以用于對(duì)兩個(gè)總體分布的比較。第五十五頁(yè),共九十七頁(yè),2022年,8月28日步驟:AmalyzeNonparametricTestsChi-SquareTestVariableList待檢驗(yàn)變量

ExpectedRange參與分析的觀察值的范圍

ExpectedValues給出各個(gè)理論值第五十六頁(yè),共九十七頁(yè),2022年,8月28日軟件操作:結(jié)果分析觀察數(shù)期望數(shù)殘差1.005540.015.02.002540.0-15.03.004040.0.0總數(shù)120材料卡方11.250df2漸近顯著性.004精確顯著性.003點(diǎn)概率.000結(jié)論:計(jì)算出的c2統(tǒng)計(jì)量的值為11.250,自由度為2,相應(yīng)的p值(漸近顯著性)為0.004,小于a=0.05。所以檢驗(yàn)的結(jié)論是拒絕總體中消費(fèi)者對(duì)3種材料的偏好程度無(wú)差異的零假設(shè)。第五十七頁(yè),共九十七頁(yè),2022年,8月28日2、二項(xiàng)分布檢驗(yàn)(二值變量)通過(guò)樣本數(shù)據(jù)檢驗(yàn)樣本來(lái)自的總體是否服從指定的概率為p的二項(xiàng)分布。原假設(shè):樣本來(lái)自的總體與指定的二項(xiàng)分布無(wú)顯著差異步驟:AmalyzeNonparametricTestsBinomial例子:產(chǎn)品合格率.sav;儲(chǔ)戶對(duì)未來(lái)收入的看法.sav(樂(lè)觀,0.6;保守或悲觀,0.4)第五十八頁(yè),共九十七頁(yè),2022年,8月28日3、K-S檢驗(yàn)(連續(xù)變量)以俄羅斯數(shù)學(xué)家柯?tīng)柲绾退姑字Z夫的名字命名的。K-S檢驗(yàn)利用樣本數(shù)據(jù)推斷樣本來(lái)自的總體是否服從某一理論分布。是一種擬合優(yōu)度的檢驗(yàn)方法,適用于探索連續(xù)性隨機(jī)變量的分布。原假設(shè):樣本來(lái)自的總體與指定的理論分布無(wú)顯著差異第五十九頁(yè),共九十七頁(yè),2022年,8月28日【例】例:周歲兒童身高.sav。檢驗(yàn)?zāi)芊裾J(rèn)為總體中兒童身高服從正態(tài)分布(顯著性水平a=0.05)。H0:總體中兒童身高服從正態(tài)分布。H1:總體中兒童身高不服從正態(tài)分布。又例:儲(chǔ)戶存款金額總體分布.sav第六十頁(yè),共九十七頁(yè),2022年,8月28日4、游程檢驗(yàn)

(變量的隨機(jī)性檢驗(yàn))通過(guò)對(duì)樣本變量值的分析,實(shí)現(xiàn)對(duì)總體的變量值出現(xiàn)是否隨機(jī)進(jìn)行檢驗(yàn)變量值隨機(jī)性檢驗(yàn)的重要依據(jù)是游程。游程指樣本序列中連續(xù)出現(xiàn)相同的變量值的次數(shù)游程數(shù)太大或太小都表明變量值存在不隨機(jī)的現(xiàn)象AmalyzeNonparametricTestsRuns第六十一頁(yè),共九十七頁(yè),2022年,8月28日變量的隨機(jī)性檢驗(yàn):

游程檢驗(yàn)游程的抽樣分布的均值和方差分別為:大樣本時(shí),游程近似服從正態(tài)分布SPSS自動(dòng)計(jì)算Z統(tǒng)計(jì)量和概率P值例:電纜數(shù)據(jù).sav第六十二頁(yè),共九十七頁(yè),2022年,8月28日二、兩獨(dú)立樣本非參數(shù)檢驗(yàn)在對(duì)總體分布不甚了解的情況下,通過(guò)對(duì)兩組獨(dú)立樣本的分析來(lái)推斷樣本來(lái)自的兩個(gè)總體的分布是否存在顯著差異的方法。獨(dú)立樣本:在一個(gè)總體中隨機(jī)抽樣對(duì)在另一總體中隨機(jī)抽樣沒(méi)有影響的情況下所獲得的樣本。檢驗(yàn)方法:曼-惠特尼U檢驗(yàn);K-S檢驗(yàn);W-W游程檢驗(yàn);極端反應(yīng)檢驗(yàn)等第六十三頁(yè),共九十七頁(yè),2022年,8月28日1、曼-惠特尼U檢驗(yàn)用于對(duì)兩個(gè)總體分布的比較判斷。通過(guò)對(duì)兩組樣本平均秩的研究來(lái)實(shí)現(xiàn)的原假設(shè):兩組獨(dú)立樣本來(lái)自的總體分布無(wú)顯著差異第六十四頁(yè),共九十七頁(yè),2022年,8月28日步驟:①將兩組樣本數(shù)據(jù)和混合并按升序排序,得到每個(gè)數(shù)據(jù)各自的秩②分別對(duì)各組樣本數(shù)據(jù)的秩求平均,得到兩個(gè)平均秩對(duì)兩個(gè)平均秩的差距進(jìn)行比較③計(jì)算樣本每個(gè)秩優(yōu)于樣本每個(gè)秩的個(gè)數(shù)U1

,以及樣本每個(gè)秩優(yōu)于樣本每個(gè)秩的個(gè)數(shù)U2,,對(duì)U1

、U2,進(jìn)行比較,如相差較大,則有必要懷疑原假設(shè)的真實(shí)性④依據(jù)U1

、U2計(jì)算WilconxonW統(tǒng)計(jì)量和曼-惠特尼U統(tǒng)計(jì)量第六十五頁(yè),共九十七頁(yè),2022年,8月28日步驟:④依據(jù)U1

、U2計(jì)算WilconxonW統(tǒng)計(jì)量和曼-惠特尼U統(tǒng)計(jì)量。第六十六頁(yè),共九十七頁(yè),2022年,8月28日步驟:第六十七頁(yè),共九十七頁(yè),2022年,8月28日2、兩獨(dú)立樣本的K-S檢驗(yàn)檢驗(yàn)兩總體分布是否存在顯著差異原假設(shè):兩組獨(dú)立樣本來(lái)自的兩總體的分布無(wú)顯著差異分析步驟:(1)兩組樣本混合并按升序排列(2)分別計(jì)算兩組樣本秩的累計(jì)頻數(shù)和累計(jì)頻率(3)計(jì)算兩組累計(jì)頻率的差,得到秩的差值序列并得到D統(tǒng)計(jì)量SPSS自動(dòng)計(jì)算在大樣本下如果概率P值小于給定的顯著性水平,則因拒絕原假設(shè)H0。認(rèn)為兩總體的分布有顯著差異第六十八頁(yè),共九十七頁(yè),2022年,8月28日3、極端反應(yīng)檢驗(yàn)從另一角度檢驗(yàn)兩獨(dú)立樣本說(shuō)來(lái)自的兩總體分布是否存在顯著差異原假設(shè):兩獨(dú)立樣本來(lái)自的兩個(gè)總體的分布無(wú)顯著差異基本思路:一組樣本作為控制樣本,另一組作為實(shí)驗(yàn)樣本。檢驗(yàn)實(shí)驗(yàn)樣本相對(duì)于控制樣本是否出現(xiàn)了極端反映。如未出現(xiàn),則認(rèn)為兩總體分布無(wú)顯著差異第六十九頁(yè),共九十七頁(yè),2022年,8月28日步驟(1)兩組樣本混合按升序排序(2)求出控制樣本的最小秩和最大秩并計(jì)算出跨度(Span):(3)為消除樣本數(shù)據(jù)中極端值對(duì)分析結(jié)果的影響,在計(jì)算跨度之前可按比例(通常為5%)去除控制樣本中部分靠近兩端的樣本值,然后再求跨度,得到截頭跨度如(截頭)跨度較小,則是兩樣本數(shù)據(jù)無(wú)法充分混合,一組樣本值顯著大于另一組樣本值的結(jié)果,可以認(rèn)為相對(duì)于控制樣本,實(shí)驗(yàn)樣本出現(xiàn)了極端反應(yīng),樣本來(lái)自的兩總體分布存在顯著差異。針對(duì)(截頭)跨度計(jì)算H檢驗(yàn)統(tǒng)計(jì)量,即:第七十頁(yè),共九十七頁(yè),2022年,8月28日4、兩獨(dú)立樣本的游程檢驗(yàn)檢驗(yàn)兩獨(dú)立樣本來(lái)自的兩總體的的分布是否無(wú)顯著差異。原假設(shè):兩組樣本來(lái)自的兩總體的分布無(wú)顯著差異步驟:(1)兩組樣本混合并按升序排列(2)對(duì)組標(biāo)記值序列計(jì)算游程數(shù);如兩總體分布存在較大差距,那么游程數(shù)會(huì)相對(duì)較少;如游程數(shù)比較大,則應(yīng)是兩組樣本值充分混合的結(jié)果,兩總體的分布不會(huì)存在顯著差異(3)根據(jù)游程數(shù)計(jì)算Z統(tǒng)計(jì)量,該統(tǒng)計(jì)量近似服從正態(tài)分布第七十一頁(yè),共九十七頁(yè),2022年,8月28日5、應(yīng)用舉例兩種不同工藝下產(chǎn)品的使用壽命數(shù)據(jù),判斷其分布是否存在顯著差異,進(jìn)而對(duì)兩種工藝的優(yōu)劣進(jìn)行評(píng)價(jià)。(顯著性水平a=0.05)?!笆褂脡勖?savH0:兩種工藝的使用壽命無(wú)顯著差異;H1:兩種工藝的使用壽命差異顯著。操作:

AnalyzeNonparametricTests2IndependentSamples第七十二頁(yè),共九十七頁(yè),2022年,8月28日分析在彈出的對(duì)話框中將“使用壽命”設(shè)定為檢驗(yàn)變量,“工藝”設(shè)定為分組變量,然后單擊“定義組”,按照“工藝”的取值進(jìn)行設(shè)定,然后單擊“繼續(xù)”,檢驗(yàn)類型使用默認(rèn)“Mann-WhitneyU”,單擊“確定”第七十三頁(yè),共九十七頁(yè),2022年,8月28日結(jié)果分析根據(jù)精確檢驗(yàn)的p值,在顯著性水平大于0.002時(shí)我們應(yīng)該拒絕原假設(shè),結(jié)論是本科與研究生的收入的中位數(shù)不相等。第七十四頁(yè),共九十七頁(yè),2022年,8月28日三、多獨(dú)立樣本的非參數(shù)檢驗(yàn)通過(guò)分析多組獨(dú)立樣本數(shù)據(jù),推斷樣本來(lái)自的多個(gè)總體的中位數(shù)或分布是否存在顯著差異檢驗(yàn)方法:Kruskal-Wallis檢驗(yàn)、中位數(shù)檢驗(yàn)、Jonckheere-Terpstra檢驗(yàn)等第七十五頁(yè),共九十七頁(yè),2022年,8月28日1、Kruskal-Walls檢驗(yàn)是兩獨(dú)立樣本的曼-惠特尼U檢驗(yàn)在多個(gè)獨(dú)立樣本下的推廣原假設(shè):多個(gè)獨(dú)立樣本來(lái)自的多個(gè)總體的分布無(wú)顯著差異基本思想:先將多組樣本數(shù)據(jù)混合并按升序排列,求出個(gè)變量的秩;然后,考察各組秩的均值是否存在顯著差異為研究各組秩的差異可借鑒方差分析法第七十六頁(yè),共九十七頁(yè),2022年,8月28日Kruskal-Walls檢驗(yàn)方差分析法認(rèn)為,各樣本組秩的總變差一方面來(lái)源于不同樣本組之間的差異(組間差),另一方面來(lái)源于各樣本組內(nèi)的抽樣誤差(組內(nèi)差)。如各樣本組秩的總變差的大部分可由組間差解釋,則表明確實(shí)各樣本組的總體分布存在顯著差異?;诖耍蓸?gòu)造K-W檢驗(yàn)統(tǒng)計(jì)量第七十七頁(yè),共九十七頁(yè),2022年,8月28日Kruskal-Walls檢驗(yàn)第七十八頁(yè),共九十七頁(yè),2022年,8月28日2、中位數(shù)檢驗(yàn)通過(guò)對(duì)多組獨(dú)立樣本的分析,檢驗(yàn)他們來(lái)自的總體的中位數(shù)是否存在顯著差異。原假設(shè):多個(gè)獨(dú)立樣本來(lái)自的多個(gè)總體的中位數(shù)無(wú)顯著差異基本思想:如多個(gè)總體的中位數(shù)無(wú)顯著差異,或者說(shuō)多個(gè)總體有共同的中位數(shù),那么這個(gè)共同的中位數(shù)應(yīng)在各樣本組中均處在中間位置上。于是,每組樣本中大于或小于該中位數(shù)的樣本數(shù)目應(yīng)大致相同第七十九頁(yè),共九十七頁(yè),2022年,8月28日中位數(shù)檢驗(yàn)分析步驟:(1)多組樣本混合并按升序排列;(2)分別計(jì)算各組樣本中大于或小于上述中位數(shù)的樣本個(gè)數(shù);(3)利用卡方檢驗(yàn)分析各組樣本來(lái)自的總體對(duì)于上述中位數(shù)的分布是否一致;第八十頁(yè),共九十七頁(yè),2022年,8月28日3、Jonckheere-Terpstra檢驗(yàn)檢驗(yàn)多個(gè)獨(dú)立樣本來(lái)自的多個(gè)總體的分布是否存在顯著差異原假設(shè):多個(gè)獨(dú)立樣本來(lái)自的多個(gè)總體的分布無(wú)顯著差異基本思路:兩獨(dú)立樣本的曼-惠特尼U檢驗(yàn)類似。計(jì)算一組樣本的觀察值小于其他組樣本的觀察值的個(gè)數(shù)第八十一頁(yè),共九十七頁(yè),2022年,8月28日4、例:多城市兒童身高.sav。判斷多城市周歲兒童的身高分布是否存在顯著差異操作:AmalyzeNonparametricTestsKIndependentSamples將“周歲兒童身高”設(shè)定為檢驗(yàn)變量,“城市”設(shè)定為分組變量,然后單擊“定義組”,檢驗(yàn)類型使用默認(rèn)“Kruskal-WallisH”,單擊“確定”第八十二頁(yè),共九十七頁(yè),2022年,8月28日結(jié)果分析結(jié)論:p值為0.003。由于p值很小,所以有理由拒絕原假設(shè),即認(rèn)為這四個(gè)城市兒童身高分布差異顯著。第八十三頁(yè),共九十七頁(yè),2022年,8月28日特別說(shuō)明在樣本量較小時(shí),應(yīng)當(dāng)使用精確檢驗(yàn)的結(jié)果,根據(jù)c2分布進(jìn)行近似會(huì)有較大的誤差。嚴(yán)格來(lái)說(shuō)用Kruskal-Wallis檢驗(yàn)對(duì)多個(gè)總體的中位數(shù)進(jìn)行假設(shè)檢驗(yàn),需要假多個(gè)總體分布有類似的形狀才能得出可靠的結(jié)論。

第八十四頁(yè),共九十七頁(yè),2022年,8月28日四、兩配對(duì)樣本的非參數(shù)檢驗(yàn)是在對(duì)總體分布不甚了解的情況下,通過(guò)對(duì)兩組配對(duì)樣本的分析,推斷樣本來(lái)自的兩個(gè)總體的分布是否存在顯著差異的方法。檢驗(yàn)方法:Wilcoxon檢驗(yàn)、符號(hào)檢驗(yàn)、McNemar檢驗(yàn)等第八十五頁(yè),共九十七頁(yè),2022年,8月28日1、Wilcoxon檢驗(yàn)基本思路:用第二組樣本的各觀察值減去第一組樣本的各觀察值,差值為正則記正號(hào),差值為負(fù)則記負(fù)號(hào),并同時(shí)保存差值數(shù)據(jù);然后將

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論