數(shù)據(jù)模型與決策20125_第1頁(yè)
數(shù)據(jù)模型與決策20125_第2頁(yè)
數(shù)據(jù)模型與決策20125_第3頁(yè)
數(shù)據(jù)模型與決策20125_第4頁(yè)
數(shù)據(jù)模型與決策20125_第5頁(yè)
已閱讀5頁(yè),還剩53頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、假設(shè)檢驗(yàn)的基本思想實(shí)際推斷原理: 小概率事件在一次試驗(yàn)中不會(huì)出現(xiàn).注意:若小概率事件在一次試驗(yàn)中出現(xiàn)了, 就被認(rèn)為前提假設(shè)是不合理的.1假設(shè)檢驗(yàn)的基本概念 統(tǒng)計(jì)檢驗(yàn)的概念 假設(shè)及p值 統(tǒng)計(jì)顯著性2 如果一個(gè)人說(shuō)他從來(lái)沒(méi)有罵過(guò)人,他能夠證明嗎? 但是,反過(guò)來(lái),如果要證明這個(gè)人罵過(guò)人很容易。 企圖肯定一件事很難,而否定一件事卻要相對(duì)容易得多,這就是統(tǒng)計(jì)檢驗(yàn)(statistical test)背后的哲學(xué)。假設(shè)檢驗(yàn)的基本概念3常常在附近打休閑籃球的一個(gè)自以為是的球員號(hào)稱,他的罰球命中率有80%。你對(duì)他說(shuō):“投給我看看?!彼读?0球,結(jié)果投中8球。于是你下了結(jié)論:“如果他的命中率真是80%,那他幾乎不

2、大可能會(huì)在投20次時(shí)只中8球,所以我不相信他的話?!边@就是統(tǒng)計(jì)檢驗(yàn)背后的休閑版本:在“斷言”正確時(shí),很少會(huì)發(fā)生的結(jié)果卻發(fā)生了,這就是“該斷言”不正確的論據(jù)。假設(shè)檢驗(yàn)的基本概念4統(tǒng)計(jì)推論是利用樣本的數(shù)據(jù),來(lái)對(duì)總體做推論。所以,正式來(lái)說(shuō),統(tǒng)計(jì)檢驗(yàn)處理的是有關(guān)總體的“斷言”。檢驗(yàn)要判斷的是,樣本數(shù)據(jù)是否提供了不利于“斷言”的證據(jù)。換言之,若出現(xiàn)“如果我們?nèi)≡S多樣本而且斷言正確,我們很少會(huì)得到這樣的結(jié)果。”則你可對(duì)該“斷言”提出懷疑。為給出懷疑強(qiáng)度的數(shù)值量度,就要把語(yǔ)意模糊的“很少”用概率來(lái)取代。比如5%以下就認(rèn)為是很少,按照習(xí)慣,稱5%為顯著性水平假設(shè)檢驗(yàn)的基本概念5例 咖啡是現(xiàn)煮的嗎?注重口味的人

3、,想來(lái)應(yīng)該是喜歡現(xiàn)煮咖啡超過(guò)即溶咖啡的。但從另一方面來(lái)看,有些喝咖啡的人也可能只是對(duì)咖啡因有癮。一位持懷疑態(tài)度的人斷言:喝咖啡的人里,只有一半偏好現(xiàn)煮咖啡。讓我們做個(gè)實(shí)驗(yàn)來(lái)檢定這個(gè)斷言。讓50個(gè)受試對(duì)象都品嘗兩杯沒(méi)有做記號(hào)的咖啡,并且要說(shuō)出喜歡哪一杯。兩杯中有一杯是即溶咖啡,另一杯是現(xiàn)煮咖啡。實(shí)驗(yàn)結(jié)果得到的統(tǒng)計(jì)量是樣本中說(shuō)比較喜歡現(xiàn)煮咖啡的人的比例。假定50位受試對(duì)象中有36位選的是現(xiàn)煮咖啡,則:假設(shè)檢驗(yàn)的基本概念6為了說(shuō)明清楚,讓我們把結(jié)果 和另一個(gè)可能結(jié)果做比較。如果50位受試對(duì)象里,只有28位喜歡現(xiàn)煮咖啡超過(guò)即溶咖啡,樣本比例就是當(dāng)然用72%這個(gè)數(shù)據(jù)來(lái)否定這位懷疑者的斷言,比起用56%要

4、強(qiáng)。但是強(qiáng)多少呢?即使樣本里有72%的人喜歡現(xiàn)煮咖啡,但這就可以當(dāng)做總體中大部分人都是如此的有力證據(jù)嗎?統(tǒng)計(jì)檢驗(yàn)可以回答這些問(wèn)題。假設(shè)檢驗(yàn)的基本概念7下面是用概要形式來(lái)回答問(wèn)題: 1)斷言 懷疑的人斷言:喝咖啡的人里,只有一半偏好現(xiàn)煮咖啡。換句話說(shuō),他斷言的總體比例 p只有0.5。為了方便討論,假設(shè)這個(gè)斷言是正確的。 2)抽樣分布 如果斷言p=0.5是正確的,而我們調(diào)查了很多個(gè)包含50位喝咖啡的人的隨機(jī)樣本,樣本比例的值會(huì)隨樣本而變化,由中心極限定理知道, 遵循(近似)正態(tài)分布,其平均數(shù)p=0.5及標(biāo)準(zhǔn)差 假設(shè)檢驗(yàn)的基本概念8假設(shè)檢驗(yàn)的基本概念9假設(shè)檢驗(yàn)的基本概念10 3) 數(shù)據(jù) 把樣本比例的

5、值 標(biāo)示在抽樣分布上。你可以從圖13.2看出來(lái), 這個(gè)值很正常,但是 就很稀奇了。 4)概率 我們可以用概率來(lái)度量對(duì)斷言不利的證據(jù)到底有多強(qiáng)。當(dāng)總體的真正比例是0.5時(shí),一個(gè)樣本的值會(huì)這么大或更大的概率是多少? 若 ,這個(gè)概率就是圖13.2中正態(tài)曲線之下的陰影區(qū)面積。這個(gè)面積是0.20. 我們的樣本比例值事實(shí)上是 ,只有0.001的機(jī)率會(huì)得到這樣大的樣本結(jié)果,它對(duì)應(yīng)的區(qū)域小到在圖13.2里根本看不到。 在所有樣本中,光因?yàn)闄C(jī)遇就有20會(huì)發(fā)生的結(jié)果,無(wú)法當(dāng)成斷言不正確的有力證據(jù)。但是在1000次當(dāng)中只會(huì)發(fā)生一次的結(jié)果,就是很好的證據(jù)。假設(shè)檢驗(yàn)的基本概念11有兩種可能的解釋,可以說(shuō)明為什么會(huì)得到“

6、受試對(duì)象中72比較喜歡現(xiàn)煮咖啡”的這個(gè)結(jié)果:(1)懷疑者是對(duì)的,但是因?yàn)檫\(yùn)氣太差,應(yīng)該極不可能發(fā)生的結(jié)果卻發(fā)生了。(2)事實(shí)上,偏好現(xiàn)煮咖啡的總體比例大于0.5,所以樣本結(jié)果差不多就是預(yù)期的結(jié)果。我們不能確定(1)一定不對(duì),因?yàn)槲覀兊目谖稖y(cè)試結(jié)果有可能真的就只是機(jī)遇造成的。但是,這樣的一個(gè)結(jié)果完全是由機(jī)遇造成的概率非常?。?.001),所以我們相當(dāng)有信心的認(rèn)為(2)才是對(duì)的。假設(shè)檢驗(yàn)的基本概念12顯著性檢驗(yàn)想要證明:總體中有某種特定的效應(yīng)。例如在上例中,我們猜想大部分喝咖啡的人偏好現(xiàn)煮咖啡。為方便討論,統(tǒng)計(jì)檢驗(yàn)會(huì)先假設(shè)我們?cè)谡业男?yīng)并不存在,然后我們開(kāi)始尋找不利于這個(gè)假設(shè)的證據(jù),從而支持我們想

7、找的效應(yīng)。顯著性檢驗(yàn)的第一步,是要先列出一個(gè)斷言,即原假設(shè),然后我們?cè)僭囍业阶C據(jù)來(lái)否定它。假設(shè)及p值13 1) 原假設(shè) 在統(tǒng)計(jì)檢驗(yàn)中,受檢驗(yàn)的斷言叫做原假設(shè)。檢驗(yàn)是想辦法去評(píng)估否定原假設(shè)的證據(jù)有多強(qiáng)。通常,原假設(shè)都是“沒(méi)有效應(yīng)”或“沒(méi)有差別”的敘述?!霸僭O(shè)”這個(gè)詞用 代表,讀法是“H零”。 。原假設(shè)是: 是關(guān)于總體的敘述,所以一定要用總體參數(shù)來(lái)表示。例13.1當(dāng)中的參數(shù)是所有喝咖啡的人里面,偏愛(ài)現(xiàn)煮咖啡的比例我們希望或猜想可以取代 的正確敘述,叫做備擇假設(shè),用 表示。在例13.1中,備擇假設(shè)就是喝咖啡的人大多偏好現(xiàn)煮咖啡。用總體參數(shù)表示就是:。假設(shè)及p值14顯著性檢驗(yàn)會(huì)找對(duì)原假設(shè)不利但對(duì)備

8、擇假設(shè)有利的證據(jù)。如果觀測(cè)到的結(jié)果,在原假設(shè)為真的情況下是出人意料的,而在備擇假設(shè)為真時(shí)卻較易發(fā)生,這個(gè)證據(jù)就很強(qiáng)。比如說(shuō),當(dāng)事實(shí)上總體只有一半喜歡現(xiàn)煮咖啡時(shí),發(fā)現(xiàn)50位受試對(duì)象中有36位喜歡,就會(huì)出人意料。有多么出人意料呢?顯著性檢驗(yàn)用概率來(lái)回答這個(gè)問(wèn)題:這個(gè)概率指的就是,在 正確時(shí)得到的結(jié)果跟預(yù)期結(jié)果的差距。怎么樣算是“跟預(yù)期結(jié)果的差距很大”?這既和 有關(guān),也和 有關(guān)。在口味測(cè)試中,我們希望得到的概率,就是在50人中至少有36人喜歡現(xiàn)煮咖啡的概率。如果原假設(shè)p0.5正確的話,上述的這個(gè)概率會(huì)非常?。?.001)。這就是原假設(shè)不正確的有力證據(jù)。假設(shè)及p值152) p值統(tǒng)計(jì)檢驗(yàn)的p值(p-va

9、lue)是在為真的假設(shè)下,所得到樣本結(jié)果會(huì)像實(shí)際觀測(cè)結(jié)果那么極端或更極端的概率。p值愈小,資料所提供否定的證據(jù)就愈強(qiáng)。在實(shí)際應(yīng)用中,大部分的統(tǒng)計(jì)檢驗(yàn)可以由會(huì)計(jì)算p值的電腦軟件(Exceel也可以)來(lái)執(zhí)行。在許多領(lǐng)域中都常見(jiàn)到引用p值來(lái)描述研究結(jié)果。所以,即使你自己不做統(tǒng)計(jì)檢驗(yàn),也應(yīng)該要知道p值的意義;就像雖然你自己不用計(jì)算置信區(qū)間,也應(yīng)該要了解“95置信”是什么意思。假設(shè)及p值16例 布方伯爵的銅板法國(guó)自然主義者布方伯爵擲了4040次銅板,他得到2048次正面。正面的樣本比例是:這個(gè)結(jié)果比一半稍多一點(diǎn)。這是不是布方的銅板不均勻的證據(jù)呢?這就是顯著性檢驗(yàn)可以發(fā)揮作用的時(shí)候了。假設(shè)及p值171)

10、假設(shè)原假設(shè)說(shuō)銅板是平衡的(p0.5)。在我們看到資料之前,并沒(méi)有懷疑銅板會(huì)偏向哪個(gè)特定方向,所以備擇假設(shè)只是“銅板不平衡”。兩個(gè)假設(shè)分別是.假設(shè)及p值18 2) 抽樣分布如果原假設(shè)為真,樣本中的正面比例就會(huì)近似正態(tài)分布假設(shè)及p值193) p值得到結(jié)果和0.5的差距,會(huì)至少有布方伯爵的0.507遠(yuǎn)的機(jī)會(huì)有多大?因?yàn)閭鋼窦僭O(shè)里 可能在0.5之左,也可能在0.5之右,往左、右任一方向遠(yuǎn)離0.5,都提供了否定 而肯定 的證據(jù)。因此,p值是觀測(cè)值在左、右任一方向,偏離0.5的程度至少和0.507相同的概率。下圖用正態(tài)曲線底下的面積來(lái)表示這個(gè)概率。它是p0.37。假設(shè)及p值204)結(jié)論在布方試驗(yàn)的不斷重復(fù)

11、當(dāng)中,真正平衡的銅板會(huì)有37的機(jī)會(huì)得到離0.5這么遠(yuǎn)或更遠(yuǎn)的結(jié)果。布方的結(jié)果讓我們沒(méi)有理由認(rèn)為他的銅板不均勻。假設(shè)及p值21 前例中的備擇假設(shè) 是單邊備擇假設(shè),因?yàn)槲覀儗ふ易C據(jù)是期望能夠說(shuō):總體比例大于1/2。 后例中的備擇假設(shè) 是雙邊備擇假設(shè),因?yàn)槲覀冎粏?wèn)銅板是否均勻。假設(shè)及p值22我們可以在事前決定,用于否定原假設(shè)的證據(jù)必須強(qiáng)到何種程度。這等于是說(shuō)我們要求多小的p值,而這個(gè)關(guān)鍵的p值就叫做顯著水平,通常用希臘字母(讀作alpha)表示。假如我們選擇0.05,我們要求的是:資料所傳達(dá)否定原假設(shè)的證據(jù)要強(qiáng)到:“當(dāng)原假設(shè)正確時(shí)這種結(jié)果發(fā)生的頻率不超過(guò)5”。如果我們選0.01,我們就是堅(jiān)持要有否定

12、原假設(shè)的更強(qiáng)證據(jù),證據(jù)要強(qiáng)到:“當(dāng)事實(shí)上為真時(shí),這種結(jié)果只有1的時(shí)候會(huì)發(fā)生?!苯y(tǒng)計(jì)顯著性23 如果p值小于或等于值,我們稱該組數(shù)據(jù)有的統(tǒng)計(jì)顯著性。 “顯著” 的意義并不是“重要”,而只代表“光是靠機(jī)遇不容易發(fā)生”。 我們?cè)谇懊嬖眠^(guò)這個(gè)字眼?,F(xiàn)在我們給統(tǒng)計(jì)顯著性加上數(shù)字,來(lái)表示所謂“不容易”到底是什么意思。 有0.01的顯著水平,常常是用下列敘述表示:“結(jié)果有顯著性(p0.01)?!边@里的p代表p值。統(tǒng)計(jì)顯著性24我們并不需要用傳統(tǒng)的5和1這些顯著水平。p值提供了更多信息,因?yàn)閜值讓我們可以對(duì)我們選擇的任意水平評(píng)估結(jié)果是否有統(tǒng)計(jì)顯著性。舉例來(lái)說(shuō),p值為0.03的結(jié)果有 0.05的顯著水平,但是

13、沒(méi)有 0.01的顯著水平。然而傳統(tǒng)的顯著水平已經(jīng)廣為接受,做為“多少證據(jù)才足夠”的標(biāo)準(zhǔn)。我們大概可以說(shuō):p0.1代表“有一些證據(jù)”不利原假設(shè),p0.05代表“適度證據(jù)”,而p0 iii) H0: 0 H1: u1/2拒絕域?yàn)?W2 = U u1拒絕域?yàn)?W3 = U0 iii) H0: 0 H1: t1/2 (n1)拒絕域?yàn)?W2 = T t1 (n1)拒絕域?yàn)?W3 = T t1 (n1)40設(shè)某次考試的考生成績(jī)服從正態(tài)分布,從中隨機(jī)地抽取36位考生的成績(jī),算得平均成績(jī)?yōu)?6.5分,標(biāo)準(zhǔn)差為15分,問(wèn)在顯著性水平=0.05下,是否可以認(rèn)為這次考試全體考生的平均成績(jī)?yōu)?0分?H0: =70 H

14、1: 70如何做檢驗(yàn)?41統(tǒng)計(jì)與打官司美國(guó)司法中,允許采用統(tǒng)計(jì)分析等方法進(jìn)行舉證。來(lái)看一個(gè)真實(shí)的案例(1995年): 美國(guó)一艘漁船到遠(yuǎn)離新英格蘭海岸捕撈扇貝。為了保護(hù)幼扇貝免遭捕撈,美國(guó)漁業(yè)和野生動(dòng)物保護(hù)機(jī)構(gòu)規(guī)定“每個(gè)扇貝肉的平均重量至少1/36磅才可以捕撈”。 這艘船被指控違反了這個(gè)重量標(biāo)準(zhǔn)。42具體的經(jīng)過(guò)是: 這艘船抵達(dá)馬薩諸塞州的一個(gè)港口時(shí)裝有11000袋扇貝,港務(wù)人員隨機(jī)抽選了其中的18袋來(lái)檢查。港務(wù)人員從每一個(gè)袋中隨機(jī)取出一滿勺扇貝,然后算出每個(gè)扇貝肉的平均重量。港務(wù)人員根據(jù)18袋的結(jié)果估計(jì)這艘船的每個(gè)扇貝肉的平均重量為1/39磅,低于標(biāo)準(zhǔn),于是立即沒(méi)收了捕獲的95%,后來(lái)進(jìn)行了拍賣

15、。 船主不服,對(duì)聯(lián)邦政府提起訴訟,認(rèn)為自己的捕撈符合標(biāo)準(zhǔn),認(rèn)為只選了18袋,不足以代表全體。原告的律師問(wèn)法官的問(wèn)題之一就是:“能夠從一個(gè)容量18的樣本中得到所有扇貝的平均重量的可靠估計(jì)嗎?” 法官請(qǐng)來(lái)美國(guó)MIT的Arnold Bennett教授,從統(tǒng)計(jì)角度進(jìn)行分析。統(tǒng)計(jì)與打官司43顯著性檢驗(yàn)的問(wèn)題顯著性檢驗(yàn)的目的是想提出總體中存在某種效應(yīng)的證據(jù)。什么是效應(yīng)?也許是指銅板出現(xiàn)正面和反面的可能性不相等,或者新藥是有效的。如果效應(yīng)足夠大,那么,它就會(huì)在大部分樣本中表現(xiàn)出來(lái):得到的正面數(shù)和反面數(shù)相差大;使用新藥的病人康復(fù)更快。反過(guò)來(lái)說(shuō),如果效應(yīng)小,那么,它就會(huì)在大部分樣本中不會(huì)表現(xiàn)出來(lái):得到的正面數(shù)和

16、反面數(shù)相差不了多少;使用新藥的病人看起來(lái)沒(méi)有康復(fù)更快。事實(shí)也應(yīng)該這樣:大的效應(yīng)比較容易偵察出來(lái),或者說(shuō),當(dāng)總體真正的值離原假設(shè)很遠(yuǎn)的時(shí)候,p值通常會(huì)很小。 44 檢驗(yàn)的主要弱點(diǎn)是它只能度量不利于原假設(shè)的證據(jù)強(qiáng)度。 檢驗(yàn)并沒(méi)有說(shuō)我們正在尋找的總體效應(yīng)到底有多大或多重要。 例如,剛剛提到的銅板,原假設(shè)可能是“這個(gè)銅板是均勻的”,或者用p表示出現(xiàn)正面的概率,這個(gè)原假設(shè)為 真正的銅板沒(méi)有哪一個(gè)是百分之百均勻的,所以我們知道這個(gè)假設(shè)并不會(huì)完全正確。 若該銅板出現(xiàn)正面的概率p=0.5007,從實(shí)際觀點(diǎn)來(lái)看,我們可能認(rèn)為它已經(jīng)是均勻的了,可是統(tǒng)計(jì)檢驗(yàn)可不管什么“實(shí)際觀點(diǎn)”,它只會(huì)回答是否有足夠的證據(jù)顯示“p

17、并不是恰好0.5 ” 。 由此可見(jiàn),檢驗(yàn)把焦點(diǎn)放在不利于某個(gè)確切的原假設(shè)的證據(jù)強(qiáng)度上面。這是檢驗(yàn)的主要弱點(diǎn)。 45當(dāng)您讀一項(xiàng)顯著性檢驗(yàn)的結(jié)果時(shí),要特別注意樣本的大小,這是因?yàn)椋?1、太大的樣本會(huì)讓顯著性檢驗(yàn)特別敏感。 如果要檢驗(yàn)一個(gè)銅板是否均勻,假定事實(shí)上該銅板正面出現(xiàn)的概率是p=0.5002,倘若我們擲銅板幾十萬(wàn)次,則往往會(huì)得到很小的p值。 檢驗(yàn)結(jié)果并沒(méi)有錯(cuò):它找到合理的證據(jù),顯示的確不是恰好等于0.5,但它把這么小的差距也找出來(lái),并沒(méi)有什么實(shí)際用途。 這就告訴我們:一項(xiàng)發(fā)現(xiàn)可能有統(tǒng)計(jì)顯著性,卻沒(méi)有什么實(shí)際上的重要性,這是樣本量很大時(shí)檢驗(yàn)通常會(huì)出現(xiàn)的后果。 46 2、另一方面,用小的樣本做顯

18、著性檢驗(yàn),敏感度又常常不夠。 如果您只擲銅板十次,即使這個(gè)銅板真正的p=0.7,檢驗(yàn)結(jié)果的p值也常常較大。 這回檢驗(yàn)仍然是正確的,因?yàn)橹粩S10次原本就不足以提供不利于原假設(shè)的合理證據(jù)。 沒(méi)有達(dá)到統(tǒng)計(jì)顯著性,不代表效應(yīng)不存在,只能說(shuō)明我們沒(méi)有找到合理的證據(jù)來(lái)支持它。 小樣本常常會(huì)漏掉總體中確實(shí)存在的效應(yīng)。47不論總體的真實(shí)情況如何,不管是0.5002或是0.70,觀察值多一點(diǎn),就可以讓我們抓的值抓得準(zhǔn)些。只要不等于0.5,觀察值愈多就會(huì)給我們愈多證據(jù),也就是較小的p值。在顯著性檢驗(yàn)問(wèn)題中,如果不能拒絕原假設(shè),那么我們也不能說(shuō)“接受原假設(shè)”,而只能說(shuō)“不能拒絕原假設(shè)”,那么這兩種說(shuō)法究竟有什么不同

19、呢?我們來(lái)看看下面的例子。48例 一個(gè)大米加工廠賣給一個(gè)超市一批標(biāo)明10kg重的大米。而該超市懷疑該廠家短斤少兩,于是隨機(jī)抽查10包大米進(jìn)行稱重,數(shù)據(jù)如下(單位:kg):9.93 9.83 9.76 9.95 10.07 9.89 10.03 9.97 9.89 9.87這里假設(shè)大米重量服從正態(tài)分布,由于發(fā)生分歧,于是各方同意用這些數(shù)據(jù)進(jìn)行關(guān)于大米重量的檢驗(yàn);以廠家的聲明作為原假設(shè),以超市的懷疑作為備選假設(shè),即49于是,超市、加工廠老板和該老板的律師都作了檢驗(yàn),結(jié)果如下: 1超市用全部數(shù)據(jù)進(jìn)行t檢驗(yàn),得到“拒絕原假設(shè)”的結(jié)論。 他們根據(jù)樣本得到樣本平均數(shù)是9.92kg,相應(yīng)的p值為0.0106

20、,因此,超市認(rèn)為,對(duì)顯著性水平0.05,應(yīng)該拒絕原假設(shè)。502大米加工廠老板只用頭兩個(gè)數(shù)據(jù)進(jìn)行t檢驗(yàn),得到“接受原假設(shè)”的結(jié)論。 大米加工廠老板也宣稱懂得些統(tǒng)計(jì),他只用頭兩個(gè)數(shù)據(jù)9.93和9.83進(jìn)行同樣的行t檢驗(yàn),他得到樣本平均數(shù)是9.88kg,相應(yīng)的p值為0.1257。 雖然樣本平均數(shù)不如超市檢驗(yàn)大,但p值大大增加。 加工廠老板于是下了結(jié)論:對(duì)顯著性水平,應(yīng)該“接受原假設(shè)”,即加工廠的 大米平均重量的確為10kg。513大米加工廠老板的律師用全部數(shù)據(jù),但使用不同的檢驗(yàn)方法,得到“接受原假設(shè)”的結(jié)論。大米加工廠老板的律師用全部數(shù)據(jù),但他使用的是非參數(shù)檢驗(yàn)方法,用符號(hào)檢驗(yàn)*方法去檢驗(yàn)是不是中位數(shù),他得到檢驗(yàn)的p值為0.0547。所以律師說(shuō)在顯著性水平0.05時(shí),應(yīng)該“接受原假設(shè)”,即加工廠的 大米平均重量的確為10kg。律師補(bǔ)充說(shuō),“既然三個(gè)檢驗(yàn)中有兩個(gè)都接受原假設(shè),就應(yīng)該接受”。52我們指出,后面兩個(gè)說(shuō)法不對(duì)的: (1)大米加工廠老板實(shí)際上減少了作為證據(jù)的數(shù)據(jù),因此,只能得到“證據(jù)不足,無(wú)法拒絕原假設(shè)”的結(jié)論。 但大米加工廠老板卻將“證據(jù)不足,無(wú)法拒絕原假設(shè)”說(shuō)成了“接受原假設(shè)”。 另外,他從樣本中選擇某些數(shù)據(jù)而忽視另外的數(shù)據(jù)的做法等于銷毀證據(jù),違背了統(tǒng)計(jì)道德。53(2)律師雖然用了全部數(shù)據(jù),但使用了不同的檢

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論