高中數(shù)學(xué)人教A版第三章概率幾何概型概率統(tǒng)計(jì)小故事

上傳人：學(xué)*** IP屬地：安徽上傳時(shí)間：2023-02-05 格式：DOCX 頁(yè)數(shù)：36 大?。?13.02KB 積分：14 舉報(bào) 版權(quán)申訴

高中數(shù)學(xué)人教A版第三章概率幾何概型概率統(tǒng)計(jì)小故事_第2頁(yè)

高中數(shù)學(xué)人教A版第三章概率幾何概型概率統(tǒng)計(jì)小故事_第3頁(yè)

高中數(shù)學(xué)人教A版第三章概率幾何概型概率統(tǒng)計(jì)小故事_第4頁(yè)

高中數(shù)學(xué)人教A版第三章概率幾何概型概率統(tǒng)計(jì)小故事_第5頁(yè)

已閱讀5頁(yè)，還剩31頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1.分賭本問(wèn)題A，B二人賭博，各出注金元，每局每個(gè)人獲勝的概率都是，約定：誰(shuí)先勝局，即贏得全部注金元，現(xiàn)進(jìn)行到A勝局、B勝局(與都小于)時(shí)賭博因故停止，問(wèn)此時(shí)注金應(yīng)如何分配給A和B才算公平？此問(wèn)題文字最早見(jiàn)于1494年帕西奧利的一本著作，是對(duì)，和的情況的分析.由于對(duì)“公平分配”一詞的意義沒(méi)有一個(gè)公認(rèn)的正確理解，在早期文獻(xiàn)中出現(xiàn)過(guò)關(guān)于此問(wèn)題的種種不同的解法，如今看來(lái)都不正確.例如，帕西奧利本人提出按的比例分配.塔泰格利亞則在1556年懷疑能找到一種數(shù)學(xué)解法的可能性，他認(rèn)為這是一個(gè)應(yīng)由法官來(lái)解決的問(wèn)題，但他也提出了如下的解法：若，則A取回自己下的注,并取走B下的注的，這等于按的比例瓜分注金.法雷斯泰尼在1603年根據(jù)某種理由，提出按的比例分配.卡丹諾在其1539年的著作中，通過(guò)較深的推理提出了一種解法：記，.把注金按︰之比分給A和B.他這個(gè)解法如今看來(lái)雖然仍不正確，但有一個(gè)重要之處，即他注意到起作用的是,與的差距，而不在其本身.這個(gè)問(wèn)題的癥結(jié)在于：它關(guān)乎每個(gè)人在當(dāng)時(shí)狀況下的期望值.從以上這些五花八門(mén)的解法中，似乎可以認(rèn)為，這些作者已多少意識(shí)到這一點(diǎn)，但未能明確期望與概率的關(guān)系.而與此處有關(guān)的是：假定賭博繼續(xù)進(jìn)行下去，各人最終取勝的概率.循著這個(gè)想法問(wèn)題很易解決：至多再賭局，即能分出勝負(fù).假如A獲勝，他在這局中至少須勝局.因此按二項(xiàng)分布，A取勝的概率為，而B(niǎo)取勝的概率為.注金按之比分配給A和B，因和是A，B在當(dāng)時(shí)狀態(tài)下的期望值.這個(gè)解是巴斯噶（,1623～1662）在1654年提出的.他用了兩種方法，其一是遞推公式法，其二是用“巴斯噶三角”（即楊輝三角）.1710年，蒙特姆特在一封信中給出了我們?cè)谇懊鎸?xiě)出的解法，且不必規(guī)定二人的獲勝概率相同.后來(lái)他又把此問(wèn)題推廣到多個(gè)賭徒的情形.分賭本問(wèn)題在概率史上起的作用，在于通過(guò)對(duì)這個(gè)在當(dāng)時(shí)來(lái)說(shuō)較復(fù)雜的問(wèn)題的探索，對(duì)數(shù)學(xué)期望及其與概率的關(guān)系有了啟示.有的解法，特別是巴斯噶的解法，使用或隱含了若干直到現(xiàn)在還廣為使用的計(jì)算概率的工具.如組合法、遞推公式、條件概率和全概率公式等.可以說(shuō)，通過(guò)對(duì)這個(gè)問(wèn)題的研究，概率計(jì)算從初期簡(jiǎn)單計(jì)數(shù)步入較為精細(xì)的階段.2.巴斯噶與費(fèi)爾馬的通信巴斯噶與費(fèi)爾馬(P.deFermat，1601-1665)的名字，對(duì)學(xué)習(xí)過(guò)中學(xué)以上數(shù)學(xué)的人來(lái)說(shuō)，想必不陌生.巴斯噶三角，在我國(guó)稱楊輝三角，中學(xué)教科書(shū)中已有提及.至于費(fèi)爾馬，因其“費(fèi)爾馬大定理”(不存在整數(shù)xyz≠0和整數(shù)，使)于近年得到證明，名聲更遠(yuǎn)播數(shù)學(xué)圈子內(nèi)外.費(fèi)爾馬在數(shù)學(xué)上的名聲主要因其數(shù)論方面的成就，其在概率史上占到一席地位，多少有些偶然，由于他與巴斯噶在1654年7～10月間來(lái)往的7封信件，其中巴致費(fèi)的有3封.這幾封信全是討論具體的賭博問(wèn)題.與前人一樣，他們用計(jì)算等可能的有利與不利情況數(shù)，作為計(jì)算“機(jī)遇數(shù)”即概率的方法(他們沒(méi)有使用概率這個(gè)名稱).與前人相比，他們?cè)诜椒ǖ木?xì)和復(fù)雜性方面大大前進(jìn)了.他們廣泛使用組合工具和遞推公式，初等概率一些基本規(guī)律也都用上了.他們引進(jìn)了賭博的值(value)的概念，值等于賭注乘以獲勝概率.3年后，惠更斯改“值”為“期望”(expectation)，這就是概率論的最重要的概念之一——(數(shù)學(xué))期望的形成和命名過(guò)程.前文已指出：此概念在更早的作者中已醞釀了一段時(shí)間.這些通信中討論的一個(gè)重要問(wèn)題之一是分賭本問(wèn)題，還討論了更復(fù)雜的輸光問(wèn)題：甲、乙二人各有賭本a和b元(a，b為正整數(shù))，每局輸贏1元，要計(jì)算各人輸光的概率.這個(gè)問(wèn)題拿現(xiàn)在的標(biāo)準(zhǔn)看也有相當(dāng)?shù)碾y度.由此也可看出這組通信達(dá)到的水平及其在概率論發(fā)展史上的重要性.有的學(xué)者，如丹麥概率學(xué)者哈爾德，認(rèn)為巴、費(fèi)2人在1654年的這些信件奠定了概率論的基礎(chǔ).這話相當(dāng)有道理，但也應(yīng)指出，這些通信的內(nèi)容是討論具體問(wèn)題，沒(méi)有明確陳述并提煉出概率運(yùn)算的原則性內(nèi)容.例如，他們想當(dāng)然地使用了概率加法和乘法定理.但未將其作為一般原則凸現(xiàn)出來(lái).促使巴、費(fèi)2人進(jìn)行這段通信的，是一個(gè)名叫德梅爾的人，他曾向巴斯噶請(qǐng)教幾個(gè)有關(guān)賭博的問(wèn)題.1564年7月29日巴斯噶首先給費(fèi)爾馬寫(xiě)信，轉(zhuǎn)達(dá)了這些問(wèn)題之一，請(qǐng)費(fèi)爾馬解決.所提問(wèn)題并不難，但不知為何巴斯噶未親自回答：將兩顆骰子擲24次，至少擲出一個(gè)“雙6”的機(jī)遇小于（其值為≈4）.但從另一方面看，擲兩顆骰子只有36種等可能結(jié)果，而24占了36的，這似乎有矛盾，如何解釋.現(xiàn)今學(xué)過(guò)初等概率論的讀者都必能毫無(wú)困難地回答這個(gè)問(wèn)題.巴、費(fèi)通信中涉及的有關(guān)分賭本問(wèn)題的解法，包含了一些在當(dāng)時(shí)看很先進(jìn)且直到現(xiàn)在仍廣為使用的想法和技巧.3.惠更斯的《機(jī)遇的規(guī)律》惠更斯是一個(gè)有多方面成就的、在當(dāng)時(shí)聲名與牛頓相若的大科學(xué)家.人們熟知他的貢獻(xiàn)之一是單擺周期公式.他在概率論的早期發(fā)展史上也占有重要地位，其主要著作《機(jī)遇的規(guī)律》出版于1657年，出版后得到學(xué)術(shù)界的高度重視，在歐洲作為概率論的標(biāo)準(zhǔn)教本長(zhǎng)達(dá)50年之久.該著作的寫(xiě)作方式不大像一本書(shū)，而更像一篇論文.他從關(guān)于公平賭博(fairgame)的值的一條公理出發(fā)，推出關(guān)于“期望”（這是他首先引進(jìn)的術(shù)語(yǔ)）的3條定理.基于這些定理并利用遞推法等工具，惠更斯解決了當(dāng)時(shí)感興趣的一些機(jī)遇博弈問(wèn)題.最后，他提出了5個(gè)問(wèn)題，對(duì)其中的3個(gè)給出了答案但未加證明.3條定理加11個(gè)問(wèn)題，被稱為惠更斯的14個(gè)命題.前3條如下述：命題1若某人在賭博中以等概率得，元，則其期望為元.命題2若某人在賭博中以等概率得，和元，則其期望為元.命題3若某人在賭博中以概率,得，元，則其期望為元.看了這些命題，現(xiàn)代的讀者或許會(huì)感到惶惑：為何一個(gè)應(yīng)取為定義的東西，要當(dāng)作需要證明的定理?答案在于，這反映了當(dāng)時(shí)對(duì)純科學(xué)的一種公認(rèn)的處理方法，即應(yīng)從盡可能少的“第一原理”（firstprinciple，即公理）出發(fā)，把其他內(nèi)容推演出來(lái).惠更斯只從一條公理出發(fā)而導(dǎo)出上述命題，其推理頗為別致，此處不細(xì)述.這幾個(gè)命題是期望概念的一般化.此前涉及或隱含這一概念只是相當(dāng)于命題3中的特例，即注金乘取勝概率，因而本質(zhì)上沒(méi)有超出概率這個(gè)概念的范圍.惠更斯的命題將其一般化，是這個(gè)重要概念定型的決定性的一步.實(shí)際上，據(jù)惠更斯的命題不難證明：若某人在賭博中分別以概率得元，則其期望為.這與現(xiàn)代概率論教科書(shū)中關(guān)于離散隨機(jī)變量的期望的定義完全一致.余下的11個(gè)命題及最后的5個(gè)問(wèn)題，都是在形形色色的賭博取勝約定下，去計(jì)算各方取勝的概率，其中命題4～9是關(guān)于2人和多人的分賭本問(wèn)題.對(duì)這些及其他問(wèn)題，惠更斯都用了現(xiàn)行概率論教科書(shū)中初等概率計(jì)算方法，通過(guò)列出一定的方程求解，大體上與巴斯噶的做法相似.這種方法后來(lái)被伯努利稱為“惠更斯的分析方法”.最后5個(gè)問(wèn)題較難一些，其解法的技巧性也較強(qiáng).現(xiàn)舉其一為例：A，B二人約定按ABBAABBAABB…擲兩顆骰子，即A先擲一次，然后從B開(kāi)始輪流各擲兩次.若A擲出和為6點(diǎn)，則A勝；若B擲出和為7點(diǎn)，則B勝.求A，B獲勝的概率.A在一次投擲時(shí)擲出和為6的概率，而B(niǎo)在一次投擲時(shí)擲出和為7的概率.記，又記為在第次投擲完時(shí)A，B都未取勝，求在這一條件下A最終取勝的概率.利用全概率公式，并注意到約定的投擲次序，可以列出方程組：.由此容易得出略小于1/2.故此賭法對(duì)A不利.機(jī)遇博弈在概率概念的產(chǎn)生及其運(yùn)算規(guī)則的建立中，起了主導(dǎo)的作用.這一點(diǎn)不應(yīng)當(dāng)使人感到奇怪：雖說(shuō)機(jī)遇無(wú)時(shí)不在，但要精確到數(shù)量上去考慮，在幾百年前那種科學(xué)水平之下，只有在像擲骰子這類很簡(jiǎn)單的情況下才有可能.但這門(mén)學(xué)科建立后，既脫離賭博的范圍又找到了多方面的應(yīng)用.這也是一個(gè)有趣的例子，表明一種看似無(wú)益的活動(dòng)(如賭博），可以產(chǎn)生對(duì)人類文明極有價(jià)值的副產(chǎn)物.把概率論由局限于對(duì)賭博機(jī)遇的討論拓展出去的轉(zhuǎn)折點(diǎn)和標(biāo)志，應(yīng)是1713年伯努利劃時(shí)代著作《推測(cè)術(shù)》的出版，是在惠更斯的《機(jī)遇的規(guī)律》出版后56年.惠更斯這一著作，內(nèi)容基本上限于擲骰子等賭博中出現(xiàn)各種情況的概率的計(jì)算，而伯努利這本著作不僅對(duì)以前的成果作了總結(jié)和發(fā)揮，更提出了“大數(shù)定律”這個(gè)無(wú)論從理論和應(yīng)用角度看都有著根本重要性的命題，可以說(shuō)其影響一直到今日而不衰.其對(duì)數(shù)理統(tǒng)計(jì)學(xué)的發(fā)展也有不可估量的影響，許多統(tǒng)計(jì)方法和理論都是建立在大數(shù)定律的基礎(chǔ)上.有的概率史家認(rèn)為，這本著作的出版，標(biāo)志著概率概念漫長(zhǎng)的形成過(guò)程的終結(jié)與數(shù)學(xué)概率論的開(kāi)端.假定有一個(gè)事件A，根據(jù)某種理論，我們算出其概率為.這理論是否正確呢？一個(gè)檢驗(yàn)的方法就是通過(guò)實(shí)際觀察，看其結(jié)果與此理論的推論——是否符合.或者，一開(kāi)始我們根本就不知道等于多少，而希望通過(guò)實(shí)際觀察去估計(jì)其值.這些包含了數(shù)理統(tǒng)計(jì)學(xué)中兩類重要問(wèn)題——檢驗(yàn)與估計(jì).這個(gè)檢驗(yàn)與估計(jì)概率的問(wèn)題，是數(shù)理統(tǒng)計(jì)學(xué)中最常見(jiàn)、最基本的兩個(gè)問(wèn)題.要構(gòu)造具體例子，最方便的做法是使用古典概率模型.拿一個(gè)缸子，里面裝有大小、質(zhì)地一樣的球個(gè)，其中白球個(gè)，黑球個(gè).這時(shí)，隨機(jī)從缸中抽出一球(意指各球有同等可能被抽出），則“抽出之球?yàn)榘浊颉边@事件A有概率.如果不知道，的比值，則也不知道.但我們可以反復(fù)從此缸內(nèi)抽球(每次抽出記下其顏色后再放回缸中）.設(shè)抽了次，發(fā)現(xiàn)白球出現(xiàn)次，則用去估計(jì).這個(gè)估計(jì)含有一定程度不確定的誤差，但我們直觀上會(huì)覺(jué)得，抽取次數(shù)愈大，誤差一般會(huì)愈小.這一點(diǎn)如伯努利所說(shuō)：“哪怕最愚笨的人，也會(huì)經(jīng)由他的本能，不需他人的教誨而理解的”.但對(duì)這個(gè)命題卻無(wú)人能給出一個(gè)嚴(yán)格的理論證明.伯努利決心著手解決這個(gè)問(wèn)題，其結(jié)果導(dǎo)致了以他的名字命名的大數(shù)定律的發(fā)現(xiàn).這個(gè)發(fā)現(xiàn)對(duì)概率論和數(shù)理統(tǒng)計(jì)學(xué)有極重大的意義.伯努利把這一研究成果寫(xiě)在他的著作《推測(cè)術(shù)》的第四部分中，是該著作的精華部分.由于該書(shū)在概率統(tǒng)計(jì)史上的重要意義，在此對(duì)伯努利其人及此書(shū)的整個(gè)面貌先做一點(diǎn)介紹.4.伯努利的《推測(cè)術(shù)》伯努利1654年出生于瑞士巴塞爾.在其家族成員中，對(duì)數(shù)學(xué)各方面做出過(guò)不同程度貢獻(xiàn)的至少有12人，在概率論方面有5人，其中杰出的除他本人外，還有其弟弟約翰與侄兒尼科拉斯.伯努利的父親為其規(guī)劃的人生道路是神職人員.但他的愛(ài)好卻是數(shù)學(xué).他對(duì)數(shù)學(xué)的貢獻(xiàn)除概率論外，還包括微積分、微分方程和變分法等.后者包括著名的懸鏈線問(wèn)題.他和牛頓、萊布尼茲是同時(shí)代人，并與后者有密切的通信聯(lián)系，因而非常了解當(dāng)時(shí)新興的微積分學(xué)的進(jìn)展，學(xué)者們認(rèn)為他在這方面的貢獻(xiàn)，是牛、萊之下的第一人.此外，他對(duì)物理學(xué)和力學(xué)也做出過(guò)貢獻(xiàn).他與惠更斯長(zhǎng)期保持通信聯(lián)系，仔細(xì)閱讀過(guò)惠更斯的《機(jī)遇的規(guī)律》，由此引發(fā)了他對(duì)概率論的興趣.從他與萊布尼茲的通信中，可知他寫(xiě)《推測(cè)術(shù)》這一著作是在他生命的最后兩年.在1705年他去世時(shí)，此書(shū)尚未整理定稿.由于家族內(nèi)部的問(wèn)題，整理和出版遺稿的工作，遲遲未能實(shí)現(xiàn).先是其遺孀因?qū)ζ涞芗s翰的不信任，不愿把整理和出版的事委托給他，后來(lái)又拒絕了歐洲一位富有學(xué)者捐資出版的建議.最后在萊布尼茲的敦促下，才決定由其侄兒尼科拉斯來(lái)負(fù)責(zé)這件事情.尼科拉斯也是當(dāng)時(shí)重要的數(shù)學(xué)家，與歐拉和萊布尼茲保持通信聯(lián)系.當(dāng)時(shí)尚無(wú)科學(xué)期刊，學(xué)者的通信是學(xué)術(shù)交流的一種重要方式.《推測(cè)術(shù)》一書(shū)共239頁(yè)，分四個(gè)部分.第一部分(P2～71)對(duì)《機(jī)遇的規(guī)律》一書(shū)作了詳細(xì)的注解，總量比惠更斯的原書(shū)長(zhǎng)4倍.第二部分(P72～137)是關(guān)于排列組合的系統(tǒng)的論述.第三部分(P138～209)利用前面的知識(shí)，討論了一些使用骰子等的賭博問(wèn)題.第四部分(P210～239)是關(guān)于概率論在社會(huì)、道德和經(jīng)濟(jì)等領(lǐng)域中的應(yīng)用，其中包括了該書(shū)的精華、奠定了概率史上不朽地位的，以其名字命名的“伯努利大數(shù)定律”——大數(shù)定律的名稱不是出自該書(shū)，首見(jiàn)于泊松1837年的一篇著作中.該書(shū)若缺了這一部分，則很可能會(huì)像某些早期概率論著作那樣湮沒(méi)無(wú)聞，或至多作為一本一般著作被人評(píng)價(jià).該書(shū)最后有一長(zhǎng)為35頁(yè)的附錄，用與友人通信的形式討論網(wǎng)球比賽中計(jì)分問(wèn)題.5.伯努利大數(shù)定律現(xiàn)在我們來(lái)介紹伯努利《推測(cè)術(shù)》中最重要的部分——包含了如今被稱之為“伯努利大數(shù)定律”的第四部分.回到前面的缸中抽球模型：缸中有大小、質(zhì)地一樣的球個(gè)，其中白球個(gè)，黑球個(gè)，“抽出之球?yàn)榘浊颉钡母怕蕿椋瑒t有.假設(shè)有放回地從缸中抽球次，記為抽到白球的次數(shù)，以估計(jì).這種估計(jì)法現(xiàn)今仍是數(shù)理統(tǒng)計(jì)學(xué)中最基本的方法之一.此處的條件是，每次抽取時(shí)都要保證缸中個(gè)球的每一個(gè)有同等機(jī)會(huì)被抽出，但這一點(diǎn)在實(shí)踐中并不見(jiàn)得容易保證.例如，產(chǎn)生中獎(jiǎng)號(hào)碼時(shí)可能要用復(fù)雜的裝置.在實(shí)際工作中，統(tǒng)計(jì)學(xué)家有時(shí)用一種叫做“隨機(jī)數(shù)表”的工具.這是一本很厚的書(shū)，各頁(yè)按行、列排列著數(shù)字，它們是用據(jù)說(shuō)是“充分隨機(jī)”的方法產(chǎn)生的.在使用時(shí)，“隨機(jī)地”翻到一頁(yè)并隨機(jī)地點(diǎn)到一個(gè)位置，以此處的數(shù)字確定抽出的對(duì)象.伯努利企圖證明的是：用估計(jì)可以達(dá)到事實(shí)上的確定性——他稱為道德確定性.其確切含義是：任意給定兩個(gè)數(shù)和，總可以取足夠大的抽樣次數(shù)，使事件的概率不超過(guò).這意思就很顯然：表明估計(jì)誤差未達(dá)到指定的接近程度，但這種情況發(fā)生的可能性可以“隨心所欲地小”(代價(jià)是加大).為忠實(shí)于伯努利的表達(dá)形式，應(yīng)指出兩點(diǎn)：一是伯努利把限定于，雖然其證明對(duì)一般也有效.但他做這一模型限定與所用缸子模型的特殊性有關(guān)：必要時(shí)把缸中的白、黑球分別改為和個(gè)，則不變，改為，只須取足夠大，便可使任意小.二是伯努利欲證明的是：對(duì)任給的，只要抽取次數(shù)足夠大，就可使.（5）這與前面所說(shuō)是一回事.因?yàn)橛缮鲜降茫?）取充分大，可使(6)式右邊小于.另外要指出的是：伯努利使用的這個(gè)缸子模型使被估計(jì)的值只能取有理數(shù)，因而有損于結(jié)果的普遍性.但其證明對(duì)任意的成立，故這一細(xì)節(jié)并不重要.伯努利上述對(duì)事實(shí)上確定性數(shù)學(xué)的理解，即(5)式，有一個(gè)很值得贊賞的地方，即他在概率論的發(fā)展剛剛起步的階段，就給出了問(wèn)題的一個(gè)適當(dāng)?shù)奶岱?因?yàn)?，既然我們欲證明的是當(dāng)充分大時(shí)，和可以任意接近，則一個(gè)看來(lái)更直截了當(dāng)?shù)奶岱ㄊ牵?）而這不可能實(shí)現(xiàn).因?yàn)樵瓌t上不能排除“每次抽到白球”的可能性，這時(shí)總為1，不能收斂到.或者退一步：要求(7)式成立的概率為1，這一結(jié)論是對(duì)的，但直到1909年才由波萊爾給予證明，證明的難度比伯努利的提法大得多.設(shè)想一下，如果當(dāng)時(shí)伯努利就采用該提法，他也許在有生之年不能完成這一工作.由于波萊爾的結(jié)論比伯努利的結(jié)論強(qiáng)，現(xiàn)今人們又把他們的結(jié)論分別稱之為強(qiáng)大數(shù)定律和弱大數(shù)定律.6.泊松公式、泊松分布與泊松大數(shù)定律泊松（Possion）的名字對(duì)學(xué)概率論與數(shù)理統(tǒng)計(jì)的人來(lái)說(shuō)，可謂耳熟能詳.原因主要在于泊松近似公式，以及更重要的是源于該近似公式的泊松分布，泊松分布的重要性和知名度在離散型分布中僅次于二項(xiàng)分布.泊松的另一個(gè)重要工作是把伯努利大數(shù)定律推廣到每次試驗(yàn)中事件發(fā)生的概率可以不同的情況，現(xiàn)稱泊松大數(shù)定律.繼狄莫佛給出二項(xiàng)概率近似計(jì)算公式(10)之后，丹尼爾和拉普拉斯也給出了二項(xiàng)概率近似計(jì)算公式，但這些公式在現(xiàn)今的教科書(shū)上已很少提及，只有泊松近似公式則不然，其形式為（11）其中，.公式(11)在教科書(shū)上通稱為泊松逼近公式、泊松近似公式或泊松公式.它是泊松在1838年于《概率在法律審判的應(yīng)用》一書(shū)中所引進(jìn)，此公式適用于很小，很大而又不很大時(shí)，這正好填補(bǔ)了狄莫佛公式(10)的不足，因后者只適用于不太接近于0和1的時(shí)候.不過(guò)，從歷史上看，狄莫佛早在1712年已做出了這個(gè)結(jié)果.7.貝葉斯及其傳世之作托馬斯?貝葉斯(ThomasBayes,1701－1761)在18世紀(jì)上半葉的歐洲學(xué)術(shù)界，恐怕不能不算是一個(gè)很知名的人物.在他生前，沒(méi)有發(fā)表過(guò)任何的科學(xué)論著.那時(shí)，學(xué)者之間的私人通信，是傳播和交流科學(xué)成果的一種重要方式.許多這類信件得以保存下來(lái)并發(fā)表傳世，而成為科學(xué)史上的重要文獻(xiàn)，例如，前面提到的費(fèi)爾馬和巴斯噶的通信、伯努利與萊布尼茲的通信等.但對(duì)貝葉斯來(lái)說(shuō)，這方面材料也不多.在他生前，除在1755年有一封致約翰?康頓的信(其中討論了辛普森有關(guān)誤差理論的工作)外，歷史上沒(méi)有記載他與當(dāng)時(shí)的學(xué)術(shù)界有何重要的交往.但他曾在1742年當(dāng)選為英國(guó)皇家學(xué)會(huì)會(huì)員(相當(dāng)于科學(xué)院院士），因而可以想到，他必定曾以某種方式表現(xiàn)出其學(xué)術(shù)造詣而被當(dāng)時(shí)的學(xué)術(shù)界所承認(rèn).如今，我們對(duì)這個(gè)生性孤僻、哲學(xué)氣味重于數(shù)學(xué)氣味的學(xué)術(shù)怪杰的了解，是因他的一篇題為“Anessaytowardssolvingaprobleminthedoctrineofchance(機(jī)遇理論中一個(gè)問(wèn)題的解)”的遺作.此文發(fā)表后很長(zhǎng)一個(gè)時(shí)期在學(xué)術(shù)界沒(méi)有引起什么反響，但到20世紀(jì)以來(lái)突然受到人們的重視，成為貝葉斯學(xué)派的奠基石.1958年，國(guó)際權(quán)威性的統(tǒng)計(jì)雜志《Biometrika》（生物計(jì)量）重新刊載了這篇文章.此文也有中譯本(見(jiàn)廖文等譯《貝葉斯統(tǒng)計(jì)學(xué)——原理、模型及應(yīng)用》的附錄4，中國(guó)統(tǒng)計(jì)出版社1992年版）.此文是他的兩篇遺作之一，首次發(fā)表于1764年倫敦皇家學(xué)會(huì)的刊物《PhilosophicalTransactions》上.此文在貝葉斯生前已寫(xiě)就，為何當(dāng)時(shí)未交付發(fā)表，后來(lái)的學(xué)者有些猜測(cè)，但均不足定論.據(jù)文獻(xiàn)記載，在他逝世之前4個(gè)月，他在一封遺書(shū)中將此文及100英鎊托付給一個(gè)叫普萊斯的學(xué)者，而貝葉斯當(dāng)時(shí)對(duì)此人在何處也不了然.所幸的是，后來(lái)普萊斯在貝葉斯的文件中發(fā)現(xiàn)了這篇文章，他于1763年12月23日在皇家學(xué)會(huì)上宣讀了此文，并在次年得以發(fā)表.發(fā)表時(shí)普萊斯為此文寫(xiě)了一個(gè)有實(shí)質(zhì)內(nèi)容的前言和附錄.據(jù)普萊斯說(shuō)，貝葉斯自己也準(zhǔn)備了一個(gè)前言.這使人們無(wú)法確切區(qū)分：哪些思想屬于貝葉斯本人，哪些又是普萊斯所附加的.貝葉斯寫(xiě)作此文的動(dòng)機(jī)，說(shuō)法也不一.一種表面上看來(lái)顯然的說(shuō)法是為了解決伯努利和狄莫佛未能解決的、二項(xiàng)分布概率的“逆概率”問(wèn)題，因?yàn)楫?dāng)時(shí)距這兩位學(xué)者的工作發(fā)表后尚不久，有人認(rèn)為他是受了辛普森誤差工作的觸動(dòng)，想為這種問(wèn)題的處理提供一種新的思想.還有人主張，貝葉斯寫(xiě)作此文，是為了給“第一推動(dòng)力”的存在提供一個(gè)數(shù)學(xué)證明.這些說(shuō)法現(xiàn)在都無(wú)從考證.上面提到“逆概率”這個(gè)名詞.在較早的統(tǒng)計(jì)學(xué)著作中這個(gè)名詞用得較多，現(xiàn)在已逐漸淡出.顧名思義，它是指“求概率這個(gè)問(wèn)題的逆問(wèn)題”：已知事件的概率為，可由之計(jì)算某種觀察結(jié)果出現(xiàn)的概率如何.反過(guò)來(lái)，給定了觀察結(jié)果，問(wèn)由之可以對(duì)概率做出何種推斷.推廣到極處可以說(shuō)，“正概率”是由原因推結(jié)果，是概率論；“逆概率”是由結(jié)果推原因，是數(shù)理統(tǒng)計(jì).8.拉普拉斯的“不充分推理原則”貝葉斯的遺作發(fā)表后很長(zhǎng)一段時(shí)期，都沒(méi)有得到學(xué)術(shù)界的注意，因而他的這種思想未能及早地發(fā)展成為一種得到廣泛應(yīng)用的統(tǒng)計(jì)推斷方法.但是，也有些學(xué)者獨(dú)立地朝這個(gè)方向思考，提出類似的思想并付諸實(shí)用，其中最重要的當(dāng)屬拉普拉斯.拉普拉斯在1774年的一篇文章中提出了所謂的“不充分推理原則”（principleofinsufficientreasoning）.他的思想大致如下：如果一個(gè)問(wèn)題中存在若干個(gè)不同的原因(cause)，則在沒(méi)有理由認(rèn)為其中哪一個(gè)特別有優(yōu)勢(shì)時(shí)，概率應(yīng)各取，即認(rèn)為各原因有同等機(jī)會(huì)出現(xiàn).在統(tǒng)計(jì)問(wèn)題中，這里所說(shuō)的不同“cause”可看作代表未知參數(shù)的不同的可能值.以E記在這原因下可能產(chǎn)生的事件(例如，在某參數(shù)值之下觀察到的樣本)，拉普拉斯提出：與無(wú)關(guān).（12）用現(xiàn)今熟知的概率論知識(shí)很容易證明(12），但拉普拉斯在其文章中用了一個(gè)很復(fù)雜的證法.拉普拉斯的原則(12)可用于由推，這與貝葉斯的原則完全一樣，也并未超出貝葉斯思想的范圍.因此，現(xiàn)在統(tǒng)計(jì)學(xué)史上也把拉普拉斯視為貝葉斯統(tǒng)計(jì)的一個(gè)奠基者.9.勒讓德發(fā)明最小二乘法勒讓德是法國(guó)大數(shù)學(xué)家，在數(shù)學(xué)的許多領(lǐng)域，包括橢圓、積分、數(shù)論和幾何等方面，都有重大的貢獻(xiàn).最小二乘法最先出現(xiàn)在他于1805年發(fā)表的一本題為《計(jì)算彗星軌道的新方法》著作的附錄中，該附錄占據(jù)了這本長(zhǎng)達(dá)80頁(yè)著作的最后9頁(yè).勒讓德在這本書(shū)前面幾十頁(yè)關(guān)于彗星軌道計(jì)算的討論中沒(méi)有使用最小二乘法，可見(jiàn)在他剛開(kāi)始寫(xiě)作時(shí)，這一方法尚未在他頭腦中成形.歷史資料還表明，勒讓德在參加測(cè)量巴黎子午線長(zhǎng)這項(xiàng)工作很久以后還未發(fā)現(xiàn)這個(gè)方法.考慮到此書(shū)發(fā)表于1805年且該法出現(xiàn)在書(shū)尾的附錄中，可以推測(cè)他發(fā)現(xiàn)這個(gè)方法應(yīng)當(dāng)在1805年或之前不久的某個(gè)時(shí)間.勒讓德在該書(shū)72～75頁(yè)描述了最小二乘法的思想、具體做法及方法的優(yōu)點(diǎn).他提到：使誤差平方和達(dá)到最小，在各方程的誤差之間建立了一種平衡，從而防止了某一極端誤差（對(duì)決定參數(shù)的估計(jì)值）取得支配地位，而這有助于揭示系統(tǒng)的更接近真實(shí)的狀態(tài).的確，考察勒讓德之前一些學(xué)者的做法，都是把立足點(diǎn)放在解出一個(gè)線性方程組上.這種做法對(duì)于誤差在各方程之間的分布的影響如何，是不清楚的.在方法的具體操作上，勒讓德指出，為實(shí)現(xiàn)而對(duì)各求偏導(dǎo)數(shù)所形成的線性方程組（13）只涉及簡(jiǎn)單的加、乘運(yùn)算，至于解線性方程組，這是當(dāng)時(shí)已知的其他方法也難免的.現(xiàn)今我們把(13)叫做正則方程組，這是后來(lái)高斯引進(jìn)的稱呼.關(guān)于最小二乘法的優(yōu)點(diǎn)，勒讓德指出了以下幾條：第一，通常的算術(shù)平均值是其一特例.第二，如果觀察值全部嚴(yán)格符合某一線性方程，則這個(gè)方程必是最小二乘法的解.第三，如果在事后打算棄置某些觀察值不用或增加新的觀察值，對(duì)正則方程組的修改易于完成.從現(xiàn)在的觀點(diǎn)看，這方法只涉及解線性方程組是其最重要的優(yōu)點(diǎn)之一（其他的重要優(yōu)點(diǎn)包括此法在統(tǒng)計(jì)推斷上的一些優(yōu)良性質(zhì)，以及其廣泛的適用性）.近年發(fā)展起來(lái)的，從最小二乘法衍生出的其他一些方法，盡管在理論上有其優(yōu)點(diǎn)，可是由于計(jì)算上的困難而影響了其應(yīng)用.最小二乘法在19世紀(jì)初發(fā)明后，很快得到了歐洲一些國(guó)家的天文和地測(cè)學(xué)工作者的廣泛使用.據(jù)不完全統(tǒng)計(jì)，自1805年至1864年的60年期間，有關(guān)這一方法的研究論文約250篇，一些百科全書(shū)，包括1837年出版的《不列顛百科全書(shū)》（第7版），都收進(jìn)了有關(guān)這個(gè)方法的介紹.在研究論文中，有一些是關(guān)于最小二乘估計(jì)的計(jì)算，這涉及解線性方程組.高斯也注意到了這個(gè)問(wèn)題，給出了正則方程組的命名并發(fā)展了解方程組的消去法.但是，在電子計(jì)算機(jī)出現(xiàn)以前，當(dāng)參數(shù)個(gè)數(shù)(即(13)式中的)較大時(shí)，計(jì)算任務(wù)很繁重.1858年，英國(guó)為繪制本國(guó)地圖作了一次大型的調(diào)查，其數(shù)據(jù)處理用最小二乘法涉及模型(13)中k=920，n=1554.用兩組人員獨(dú)立計(jì)算，花了兩年半的時(shí)間才完成.1958年我國(guó)某研究所計(jì)算一個(gè)煉鋼方面的課題，涉及用最小二乘法解13個(gè)自變量的線性回歸，30余人用電子計(jì)算機(jī)計(jì)算，夜以繼日花了一個(gè)多月的時(shí)間.勒讓德的工作沒(méi)有涉及最小二乘法的誤差分析問(wèn)題.這一點(diǎn)由高斯在1809年發(fā)表的正態(tài)誤差理論加以補(bǔ)足，詳細(xì)介紹見(jiàn)后面故事(高斯的正態(tài)誤差理論).高斯的這個(gè)理論對(duì)于最小二乘法用于數(shù)理統(tǒng)計(jì)有極其重要的意義.這一點(diǎn)在20世紀(jì)哥色特、費(fèi)歇爾等人發(fā)展了正態(tài)小樣本理論后，尤其明顯.正因?yàn)楦咚惯@一重大貢獻(xiàn)，以及他聲稱自1799年以來(lái)一直使用這個(gè)方法，所以人們多把這一方法的發(fā)明優(yōu)先權(quán)歸于高斯.當(dāng)時(shí)在這兩位大數(shù)學(xué)家之間曾發(fā)生優(yōu)先權(quán)之爭(zhēng)，其知名度僅次于牛頓和萊布尼茲之間關(guān)于微積分發(fā)明的優(yōu)先權(quán)之爭(zhēng).近年來(lái)還有學(xué)者根據(jù)有關(guān)的文獻(xiàn)研究這個(gè)問(wèn)題，也作不出斷然的結(jié)論.這個(gè)公案大概也只能以“兩人同時(shí)獨(dú)立做出”來(lái)了結(jié).但無(wú)論如何，第一個(gè)在書(shū)面上發(fā)表的是勒讓德，他有理由占先一些.我們已指出，最小二乘法是針對(duì)形如的線性關(guān)系的觀測(cè)數(shù)據(jù)而作出的，現(xiàn)在統(tǒng)計(jì)學(xué)上把這叫做線性(統(tǒng)計(jì))模型——當(dāng)然，其含義比最初所賦予它的要廣得多.最小二乘法在數(shù)理統(tǒng)計(jì)學(xué)中的顯赫地位，大部分來(lái)自它與這個(gè)模型的聯(lián)系.另一個(gè)原因是它有簡(jiǎn)單的線性表達(dá)式.這不僅使它易于計(jì)算，更重要的是，在正態(tài)誤差的假定下，它有較完善的小樣本理論，使基于它的統(tǒng)計(jì)推斷易于操作且有關(guān)的概率計(jì)算不難進(jìn)行.其他的方法雖也可能具有某種優(yōu)點(diǎn)，但由于缺乏最小二乘法所具備的上述特性，故仍不可能取代最小二乘法的位置，這就是此法得以長(zhǎng)盛不衰的原因.10.高斯導(dǎo)出誤差正態(tài)分布1809年，高斯(CarlFriedrichGauss，1777-1855)發(fā)表了數(shù)學(xué)和天體力學(xué)的名著《繞日天體運(yùn)動(dòng)的理論》.在此書(shū)末尾，他寫(xiě)了一節(jié)有關(guān)“數(shù)據(jù)結(jié)合”（datacombination）的問(wèn)題，實(shí)際涉及的就是這個(gè)誤差分布的確定問(wèn)題.設(shè)真值為，個(gè)獨(dú)立測(cè)量值為.高斯把后者的概率取為（14）其中為待定的誤差密度函數(shù).到此為止他的做法與拉普拉斯相同.但在往下進(jìn)行時(shí)，他提出了兩個(gè)創(chuàng)新的想法.一是他不采取貝葉斯式的推理方式，而徑直把使(9)式達(dá)到最大的作為的估計(jì)，即使（15）成立的.現(xiàn)在我們把稱為樣本的似然函數(shù)，而把滿足(15)式的稱為的極大似然估計(jì).這個(gè)稱呼是追隨費(fèi)歇爾的，因?yàn)樗?912年發(fā)表的一篇文章中，明確提到以上概念并非針對(duì)一般參數(shù)的情形.如果拉普拉斯采用了高斯這個(gè)想法，那他會(huì)得出：在已定誤差密度為（16）基礎(chǔ)上，其中為未知參數(shù).的估計(jì)是樣本中位數(shù)，即按大小排列居于正中的那一個(gè)(為奇數(shù)時(shí)），或居于正中的那兩個(gè)的算術(shù)平均(為偶數(shù)時(shí)）.這個(gè)解不僅計(jì)算容易，且在實(shí)際意義上，有時(shí)比算術(shù)平均更為合理.不過(guò)，即使這樣，拉普拉斯的誤差分布(16)大概也不可能取得高斯正態(tài)誤差那樣的地位.原因是是線性函數(shù)，在正態(tài)總體下有完善的小樣本理論，而要用于推斷就難于處理了.另外，這里所談的是一個(gè)特定的問(wèn)題——隨機(jī)測(cè)量誤差該如何分布.測(cè)量誤差由諸多因素形成，每種因素影響都不大.按中心極限定理，其分布近似于正態(tài)分布是勢(shì)所必然.其實(shí)，早在1780年左右，拉普拉斯就推廣了狄莫佛的結(jié)果，得到了中心極限定理的比較一般的形式.可惜的是他未能把這一成果用到確定誤差分布的問(wèn)題上來(lái).高斯的第二點(diǎn)創(chuàng)新的想法是：他把問(wèn)題倒過(guò)來(lái)，先承認(rèn)算術(shù)平均是應(yīng)取的估計(jì)，然后去找誤差密度函數(shù)以迎合這一點(diǎn)，即找這樣的，使由(15)式?jīng)Q定的就是.高斯證明了：這只有在（17）條件下才能成立，這里為常數(shù)，這就是正態(tài)分布.高斯這項(xiàng)工作對(duì)后世的影響極大，他使正態(tài)分布同時(shí)有了“高斯分布”的名稱，后世之所以多將最小二乘法的發(fā)明權(quán)歸之于他，也是出于這一工作.高斯是一個(gè)偉大的數(shù)學(xué)家，重要的貢獻(xiàn)不勝枚舉.但現(xiàn)今德國(guó)10馬克的印有高斯頭像的鈔票，其上還印有正態(tài)分布的密度曲線.這傳達(dá)了一種想法：在高斯的一切科學(xué)貢獻(xiàn)中，其對(duì)人類文明影響最大的就是這一項(xiàng).在高斯作出這個(gè)發(fā)現(xiàn)之初，也許人們還只能從其理論的簡(jiǎn)化上來(lái)評(píng)價(jià)其優(yōu)越性，其全部影響還不能充分看出來(lái).這要到20世紀(jì)正態(tài)小樣本理論充分發(fā)展起來(lái)以后才能充分看出來(lái).拉普拉斯很快得知高斯的工作，并馬上將其與他發(fā)現(xiàn)的中心極限定理聯(lián)系起來(lái)，為此，他在即將發(fā)表的一篇文章(發(fā)表于1810年）上加上了一點(diǎn)補(bǔ)充，指出如若誤差可看成許多量的疊加，根據(jù)他的中心極限定理，誤差理應(yīng)有高斯分布.這是歷史上第一次提到所謂“元誤差學(xué)說(shuō)”——誤差是由大量的、由種種原因產(chǎn)生的元誤差疊加而成.后來(lái)到1837年，海根在一篇論文中正式提出了這個(gè)學(xué)說(shuō).其實(shí)，他提出的形式有相當(dāng)大的局限性：海根把誤差設(shè)想成個(gè)數(shù)很多的、獨(dú)立分布的“元誤差”之和，每個(gè)只取兩值，其概率都是1/2，由此出發(fā)，按狄莫佛的中心極限定理，立即就得出誤差(近似地)服從正態(tài)分布.拉普拉斯所指出的這一點(diǎn)有重大的意義，在于他給誤差的正態(tài)理論一個(gè)更自然合理、更令人信服的解釋.因?yàn)楦咚沟恼f(shuō)法有一點(diǎn)循環(huán)論證的氣味：由于算術(shù)平均是優(yōu)良的，推出誤差必須服從正態(tài)分布；反過(guò)來(lái)，由后一結(jié)論又推出算術(shù)平均及最小二乘估計(jì)的優(yōu)良性，故必須認(rèn)定這二者之一(算術(shù)平均的優(yōu)良性，誤差的正態(tài)性)為出發(fā)點(diǎn).但算術(shù)平均到底并沒(méi)有自行成立的理由，以它作為理論中一個(gè)預(yù)設(shè)的出發(fā)點(diǎn)，終覺(jué)有其不足之處.拉普拉斯的理論把這斷裂的一環(huán)連接起來(lái)，使之成為一個(gè)和諧的整體，實(shí)有著極重大的意義.11.莎士比亞的新詩(shī)：一曲統(tǒng)計(jì)學(xué)的贊歌這個(gè)強(qiáng)有力的旋律，將勝過(guò)大理石或者是君主的金箔紀(jì)念碑.莎士比亞（Shakespeme）1985年11月，研究莎士比亞的學(xué)者泰勒(G.Taylor)從1775年以來(lái)就保存在Bodelian圖書(shū)館的收藏中發(fā)現(xiàn)了寫(xiě)在紙片上的九節(jié)新詩(shī).新詩(shī)只有429個(gè)字，沒(méi)有記載誰(shuí)是詩(shī)的作者.這首詩(shī)會(huì)是莎士比亞的作品嗎？?jī)蓚€(gè)統(tǒng)計(jì)學(xué)者Thisted和Efron（1987）利用統(tǒng)計(jì)方法研究了這個(gè)問(wèn)題，得到結(jié)論:這首詩(shī)用詞的風(fēng)格(規(guī)范)與莎士比亞的風(fēng)格非常一致.這個(gè)研究純粹基于統(tǒng)計(jì)學(xué)基礎(chǔ)，其過(guò)程可描述如下：已知莎士比亞所有著作的用詞總數(shù)為884647個(gè)，其中31534個(gè)是不同的.這些詞出現(xiàn)的頻數(shù)如表1所示.表1不同單詞所使用的頻數(shù)分布單詞使用的頻數(shù)不同的單詞數(shù)1143762434332292414635104368377638>100846總數(shù)31534表1中所包含的信息可用來(lái)回答下列類型的問(wèn)題.如果要求莎士比亞寫(xiě)一個(gè)含有一定數(shù)量單詞的新作品，他會(huì)使用多少新單詞(以前作品中未使用過(guò)的)？在他以前所有的作品中，有多少單詞他僅使用過(guò)一次，兩次，三次，…這些數(shù)字可以用費(fèi)歇爾等(1943)提出的劃時(shí)代的法則來(lái)預(yù)測(cè).在完全不同的領(lǐng)域內(nèi)，費(fèi)歇爾利用他的方法估計(jì)了未被發(fā)現(xiàn)的蝴蝶總數(shù)，利用費(fèi)歇爾的理論，如果莎士比亞用與他已有的所有作品中出現(xiàn)的單詞數(shù)884647完全一樣數(shù)目的單詞來(lái)寫(xiě)他的新的劇本和詩(shī)，則估計(jì)他將使用約35000個(gè)新詞.這種情形下，莎士比亞的總詞匯估計(jì)至少有66000個(gè)單詞(在莎士比亞時(shí)代，英語(yǔ)語(yǔ)言的總詞匯約有100000個(gè)，目前約有500000個(gè)).現(xiàn)在回到新發(fā)現(xiàn)的詩(shī)上，其含有429個(gè)單詞中有258個(gè)是不同的，新詩(shī)的觀測(cè)值和預(yù)測(cè)值(基于莎士比亞的風(fēng)格)的分布由表2(最后兩欄)給出.從表2可以看到，（在所期望的差的范圍內(nèi)）兩個(gè)分布非常一致，這表示了新發(fā)現(xiàn)的詩(shī)的作者可能就是莎士比亞.表2長(zhǎng)度幾乎相同的詩(shī)中，莎士比亞風(fēng)格所含不同單詞與其他作者風(fēng)格所含不同單詞的頻數(shù)分布莎士比亞作品中單詞使用的次數(shù)不同單詞使用的頻數(shù)基于莎士比亞作品的期望值本?約翰遜(哀歌)馬洛(四首詩(shī))多恩(狂喜)新發(fā)現(xiàn)的詩(shī)081017912857218653～4616585～9922121110～19920171020～291213142130～3912961640～591314121860～791093880～991313105不同單詞數(shù)243272252258258單詞總數(shù)411495487429…表2中也給出了與莎士比亞同時(shí)代的其他幾位詩(shī)人本?約翰遜、馬洛lowe)、多恩長(zhǎng)度幾乎相同的作品中所使用的單詞的分布頻數(shù).這些作者的作品中單詞的分布頻數(shù)與新發(fā)現(xiàn)詩(shī)中單詞的觀測(cè)頻數(shù)，以及與莎士比亞用詞風(fēng)格的期望觀測(cè)頻數(shù)之間看起來(lái)多少有些不同.另一個(gè)與其類似的故事是——有爭(zhēng)議的作者權(quán):《聯(lián)邦主義者論文集》作者是誰(shuí).這是與上一故事密切相關(guān)的驗(yàn)明作者是誰(shuí)的問(wèn)題，或者是對(duì)作者不明的作品所列出的可能的作者群中去識(shí)別一個(gè)作者，下面再給大家講一個(gè)故事.這個(gè)故事來(lái)源于費(fèi)歇爾，他是第一個(gè)使用這個(gè)方法來(lái)回答一個(gè)人類學(xué)家向他提出的問(wèn)題的.是否存在任何客觀的、僅利用測(cè)量的方法判斷從墓中發(fā)現(xiàn)的下鄂骨是男性，還是女性？同樣的技術(shù)可用來(lái)回答本質(zhì)上相同的問(wèn)題：在兩個(gè)可能的作者中，誰(shuí)是有作者權(quán)的爭(zhēng)議作品的真正作者.讓我們來(lái)考察一下《聯(lián)邦主義者論文集》的情形.這個(gè)論文集是1787～1788年由哈密頓、杰伊和馬德森為了勸說(shuō)紐約市民批準(zhǔn)憲法所著的.按那個(gè)時(shí)代所時(shí)興的，這個(gè)論文集共含77篇論文，全部署名為筆名“民眾(Publicus)”.這個(gè)論文集的大多數(shù)文章的真正作者已經(jīng)判明了，但有12篇文章仍存在爭(zhēng)議，到底是哈密頓的，還是馬德森的.兩個(gè)統(tǒng)計(jì)學(xué)者，莫斯特雷和華萊士(D.Wallace)利用統(tǒng)計(jì)方法解決了這個(gè)問(wèn)題，得出的結(jié)論是:12篇有爭(zhēng)議的文章最可能的作者是馬德森.解決這個(gè)問(wèn)題所使用的度量化方法是從有爭(zhēng)議的作者的作品中研究每一個(gè)作者自己的風(fēng)格，按有爭(zhēng)議的作品的風(fēng)格最接近于其作品來(lái)確定其作者.12.柏拉圖著作的系列排列柏拉圖作品的問(wèn)世已超過(guò)22個(gè)世紀(jì)了，他的哲學(xué)思想以及優(yōu)美的文體被廣泛地研究著.遺憾的是，沒(méi)有人提及，或者是沒(méi)有人知道他的35篇對(duì)話，6篇短文和13封信件寫(xiě)作的時(shí)間年表.柏拉圖作品時(shí)間年表的問(wèn)題19世紀(jì)就已經(jīng)提出來(lái)了，但沒(méi)有什么進(jìn)展.幾年以前，統(tǒng)計(jì)學(xué)家開(kāi)始著手這個(gè)問(wèn)題，現(xiàn)在已給出了一個(gè)看起來(lái)很合理的解答.所用的統(tǒng)計(jì)方法是從求出作品之間的相似性指數(shù)開(kāi)始的.在波納法(Boneva，1971)的研究中，基于每一作品中最后5個(gè)音節(jié)的32個(gè)可能特征的頻數(shù)分布，求出相似性指數(shù)，這個(gè)技術(shù)稱為定性終止.在沒(méi)有其他附加信息的情形下，這里所用到的唯一的假設(shè)是寫(xiě)作時(shí)間相近的作品寫(xiě)作風(fēng)格相似.利用這個(gè)方法推斷了柏拉圖作品的時(shí)間年表.13.地質(zhì)年代的尺度這是費(fèi)歇爾(1952)所引證的一個(gè)例子，用來(lái)說(shuō)明地質(zhì)學(xué)中一個(gè)最偉大的發(fā)現(xiàn)里面所隱含的統(tǒng)計(jì)思想.不少人已經(jīng)熟悉地質(zhì)年代的尺度以及地質(zhì)層的名字，如鮮新世(Pliocene)、中新世(Miocene)、漸新世(Oligocene)，但也許很少有人知道這些是如何得到的.這是由出生于1797年的著名《地質(zhì)學(xué)原理》一書(shū)的作者、地質(zhì)學(xué)家萊爾發(fā)明的.在1833年出版的這本書(shū)的第三卷中，他給出了這些時(shí)間尺度的詳細(xì)計(jì)算.這些時(shí)間尺度的詳細(xì)計(jì)算基于一個(gè)完全新穎的思想并利用了很復(fù)雜的統(tǒng)計(jì)過(guò)程.在杰出的貝類學(xué)家德夏斯的協(xié)助下，萊爾把一個(gè)或多個(gè)地質(zhì)層中鑒定了的化石列成表，并查明目前還生存的占多大比例，就像一個(gè)統(tǒng)計(jì)學(xué)家擁有一個(gè)沒(méi)有記錄年齡的近期的人口統(tǒng)計(jì)記錄，以及一系列未標(biāo)明時(shí)間的過(guò)去人口調(diào)查的記錄，從中可以辨認(rèn)某些個(gè)人與現(xiàn)在的記載是同一個(gè)人.在這種情況下，由生命表的知識(shí)分析可以估計(jì)未標(biāo)明的數(shù)據(jù).即使沒(méi)有生命表，僅僅由比較每個(gè)記錄中現(xiàn)在仍生存的人的比率，也可以按年代順序排成序列.也就是說(shuō)，現(xiàn)存的生物在化石中所占的比率越小，可以推斷其在地層中形成的年代越久遠(yuǎn).萊爾的思想以及他漂亮的統(tǒng)計(jì)論證給地質(zhì)學(xué)帶來(lái)了一場(chǎng)革命，他所命名的地質(zhì)層和其他研究結(jié)果如表3所示.表3萊爾的地質(zhì)學(xué)分類地質(zhì)層命名比率=生存數(shù)量/不同化石的數(shù)量實(shí)例更新世（Pleistocene）96%西西里島群鮮新世（Pliocene）40%意大利巖石，英國(guó)峭壁中新世（Miocene）18%始新世（Eocene）3%或4%由上述的分類，地質(zhì)學(xué)家可根據(jù)化石中少量的清晰的形態(tài)學(xué)上的特征來(lái)確認(rèn)化石的分層.遺憾的是許多教師在給學(xué)生講授的過(guò)程中，從來(lái)沒(méi)有強(qiáng)調(diào)萊爾方法中隱含的度量思想.14.鰻魚(yú)的公共繁殖場(chǎng)所下面的故事也選自費(fèi)歇爾(1952)的文章，說(shuō)明如何由基本的描述統(tǒng)計(jì)量的知識(shí)引出一個(gè)重要的發(fā)現(xiàn).20世紀(jì)早期，哥本哈根卡爾堡實(shí)驗(yàn)室的施密特發(fā)現(xiàn)不同地區(qū)所捕獲的同種魚(yú)類的脊椎骨和鰓線的數(shù)量有很大不同，甚至在同一海灣內(nèi)不同地點(diǎn)所捕獲的同種魚(yú)類，也發(fā)現(xiàn)有這樣的傾向，然而，鰻魚(yú)的脊椎骨的數(shù)量變化卻不大.施密特從歐洲各地、冰島、亞速爾群島、以及尼羅河等幾乎分離的海域里所捕獲的鰻魚(yú)的樣本中，計(jì)算發(fā)現(xiàn)了幾乎一樣的均值和標(biāo)準(zhǔn)偏差值.由此，施密特推斷所有各個(gè)不同海域內(nèi)的鰻魚(yú)是在海洋中某公共場(chǎng)所繁殖的.后來(lái)名為“戴納(Dana)”的科學(xué)考察船在一次遠(yuǎn)征中發(fā)現(xiàn)了這個(gè)場(chǎng)所.15.人所具有的特點(diǎn)是遺傳的嗎？這個(gè)問(wèn)題是在一次討論達(dá)爾文的理論時(shí)提出的.為了回答這個(gè)問(wèn)題，丹麥的遺傳學(xué)家約翰尼森進(jìn)行了實(shí)驗(yàn)，他的實(shí)驗(yàn)已出現(xiàn)在今天的教科書(shū)上.但是，在他1909年第一次發(fā)表這個(gè)結(jié)果時(shí)卻沒(méi)有引起注意.下面是從卡克（）的一個(gè)筆記(1983)中引用的，卡克介紹了當(dāng)他13歲時(shí)所了解的這個(gè)實(shí)驗(yàn).“約翰尼森取了大量的豆子，稱它們的重量，由這些重量做成頻率直方圖并由此擬合了今日被稱為正態(tài)分布的曲線.然后，他從中取出大的和小的豆子，分別進(jìn)行栽培，并分別做出它們各自收獲后豆子重量的直方圖.這些直方圖又分別與正態(tài)曲線擬合.如果豆子的大小是遺傳的，則人們可以預(yù)期后做的兩條曲線會(huì)以大小不同的均值為分布中心.但是，事情恰恰不是這樣，兩條曲線與它們祖先的曲線幾乎看不出區(qū)別，因此產(chǎn)生了一個(gè)嚴(yán)肅的問(wèn)題：豆子的大小是否是遺傳的.”卡克繼續(xù)介紹說(shuō)：“當(dāng)時(shí)那些完全嶄新的議論使我感到很吃驚，直到今天還保留很深的印象，這是我當(dāng)時(shí)在已接受的數(shù)學(xué)、物理和生物學(xué)知識(shí)中還未遇到過(guò)的.從那以后，我開(kāi)始學(xué)習(xí)了大量的統(tǒng)計(jì)學(xué)知識(shí)，甚至還給具有不同數(shù)學(xué)程度的人講授統(tǒng)計(jì)學(xué)，但我始終認(rèn)為約翰尼森的實(shí)驗(yàn)是我所知道的關(guān)于闡述統(tǒng)計(jì)推斷方法之有效、精彩的最好的例證.”16.左撇子的重要性一般人并不知道根據(jù)椰子樹(shù)樹(shù)葉螺旋的方向，能夠分為右螺旋形狀和左螺旋形狀.幾年以前，印度統(tǒng)計(jì)所的戴維斯就這個(gè)問(wèn)題進(jìn)行了調(diào)查研究.他的研究為統(tǒng)計(jì)方法在了解自然本質(zhì)中的應(yīng)用，提供了一個(gè)極好的例子.也就是說(shuō)，由觀測(cè)事實(shí)提出新問(wèn)題，為解決這些新的問(wèn)題，要做出更進(jìn)一步的觀測(cè).綜合每個(gè)階段所得到的結(jié)果，尋找新的證據(jù)來(lái)加強(qiáng)已有結(jié)果的基礎(chǔ)并探索新的方向.為什么有的樹(shù)的樹(shù)葉是左螺旋形狀的，有的是右螺旋形狀的呢？這是個(gè)遺傳特征嗎？要回答這個(gè)問(wèn)題，可以考慮由不同螺旋形狀的樹(shù)木組合成的雙親樹(shù)，并分類計(jì)算所產(chǎn)生的子孫樹(shù)具有相同特征的數(shù)量.為此目的所收集到的數(shù)據(jù)列在表4中.可以看到，左對(duì)右的比率在所有類型的雙親樹(shù)的組合中幾乎是一樣的.這顯示了左螺旋和右螺旋不是遺傳的基因.表4不同種類交配后所產(chǎn)生的子孫樹(shù)中左螺旋和右螺旋的比例雙親的花粉雙親的種子子孫樹(shù)左:右右右44:56右左47:53左右45:55左左47:53因而，左螺旋對(duì)右螺旋的比例似乎完全是由隨機(jī)發(fā)生的外來(lái)因素決定的.但是，為什么在表4觀測(cè)的數(shù)據(jù)中，右螺旋子孫樹(shù)略占優(yōu)勢(shì)(約55%)呢？其生長(zhǎng)環(huán)境中一定存在很大的可能性使得樹(shù)木的葉子向右螺旋.如果真是如此，這種可能性依賴于樹(shù)的地理位置嗎？由于還有從世界各地收集到的數(shù)據(jù)，不能明確回答這個(gè)問(wèn)題.但是已經(jīng)發(fā)現(xiàn)，從地球北半球收集到的樣本中，左螺旋的比例占，而從南半球收集到的樣本中，左螺旋占.這個(gè)差別恐怕是受地球繞一個(gè)方向自轉(zhuǎn)的影響.這也解釋了浴缸中漩渦的原理(當(dāng)拔出抽水栓排出浴缸中的水時(shí)，會(huì)產(chǎn)生左的或右的漩渦).因而，在良好控制的條件下，北半球的漩渦多是逆時(shí)針?lè)较虻模习肭虻匿鰷u多是順時(shí)針?lè)较虻?如果不是戴維斯熱心去尋找左螺旋和右螺旋樹(shù)木不同的特征，他的研究?jī)H會(huì)保留某些學(xué)術(shù)上的特點(diǎn).戴維斯花了12年多的時(shí)間在一個(gè)大種植園中比較了左螺旋和右螺旋樹(shù)的平均產(chǎn)量.他十分驚奇地發(fā)現(xiàn)，左螺旋形樹(shù)的產(chǎn)量高出右螺旋形樹(shù)的10%.雖然還不能做出任何解釋——這個(gè)問(wèn)題不容易解決，需要進(jìn)一步研究，但這個(gè)經(jīng)驗(yàn)的結(jié)論在經(jīng)濟(jì)上是很重要的.只選擇種植左螺旋形的樹(shù)木，產(chǎn)量可提高10%！戴維斯繼而提出了下面的問(wèn)題：慣用左手的女性是否比慣用右手的女性更具想象力.森福德公司提供的研究表明，慣用左手的人具有特別的創(chuàng)造力而且長(zhǎng)得漂亮.所有慣用左手的人中引以為豪的著名人物有：本杰明?富蘭克林，達(dá)?芬奇，愛(ài)因斯坦，亞歷山大大帝，朱莉阿斯?西撒……左螺旋和右螺旋的現(xiàn)象在植物王國(guó)中是非常普遍的.你或許還沒(méi)有注意到你的花園中，同一種植物上的花瓣也有左螺旋和右螺旋排列的.纏繞植物的爬藤有的僅是右螺旋形環(huán)繞，有的僅是左螺旋方向的.在加爾各答印度統(tǒng)計(jì)研究所，研究者企圖改變這個(gè)習(xí)慣所做的實(shí)驗(yàn)以失敗告終.這些植物頑強(qiáng)地抵抗任何這樣的嘗試.更奇怪的是，除了非常低級(jí)的原始形式外，所有生物有機(jī)體的生化結(jié)構(gòu)都是左手形的.除了甘油外，所有的氨基酸(Aminoacids（D&L）)都分為兩種形式：L(左旋)和D(右旋).兩種形式L和D相互是鏡像關(guān)系，分別稱為左旋形分子和右旋形分子.在植物和動(dòng)物的蛋白質(zhì)中，甚至在簡(jiǎn)單的有機(jī)體如細(xì)菌、霉菌、病毒等中所發(fā)現(xiàn)的所有24種氨基酸均是左旋形的.所有左旋形和右旋形分子均有完全相同的性質(zhì).生命可能在僅有D酸(右旋)，或是L和D的混合形式中存在.那么，生命有機(jī)體的進(jìn)化，比起D(右旋)分子，更愿意選擇L(左旋)分子是自然界中的偶然現(xiàn)象嗎？或者是說(shuō)，左旋分子可能天生地適應(yīng)于有機(jī)體的構(gòu)造嗎？左邊傾向或許有什么神秘的力量，人們還得從科學(xué)上去探索.諾貝爾獎(jiǎng)獲得者斯普瑞博士證明了：研究人是受左腦還是右腦的控制時(shí)，發(fā)現(xiàn)受左腦控制的人占多數(shù).簡(jiǎn)單地說(shuō)，其特征就是：相對(duì)于受右腦控制的人，受左腦控制的人更具有邏輯推理能力.17.日內(nèi)循環(huán)如果有人問(wèn)你的身高是多少，你會(huì)立即給出答案——某個(gè)特定的數(shù)字.你的身高已經(jīng)被某人在某個(gè)時(shí)刻測(cè)量過(guò)了，并給了你這個(gè)數(shù)字.但是可能不會(huì)要求你去回答為什么這個(gè)數(shù)字能有效地代表你的身高.如果你確實(shí)考慮答案的話，則應(yīng)該是一個(gè)仔細(xì)按照“測(cè)量高度規(guī)定的過(guò)程”所得到的一個(gè)觀測(cè)值.這樣一個(gè)關(guān)于身高度量的定義能滿足所有實(shí)用的目的.但是出現(xiàn)了其他問(wèn)題：我們所要測(cè)量的身高依賴于一天之內(nèi)不同的測(cè)量時(shí)間嗎？也就是說(shuō)，如果在一天內(nèi)不同的時(shí)間測(cè)量,這個(gè)值會(huì)發(fā)生變化嗎？如果有變化，我們?nèi)绾未_定這個(gè)值呢？例如，人的身高（真值）早上和晚上有差別嗎？如果有，這個(gè)差別有多大？有任何生理學(xué)上的解釋嗎？一個(gè)簡(jiǎn)單的統(tǒng)計(jì)調(diào)查可以給出答案.分別在早上和晚上仔細(xì)測(cè)量了加爾各答41名學(xué)生的身高，發(fā)現(xiàn)早上的測(cè)量值高于晚上的測(cè)量值，其平均差為9.6毫米.事實(shí)上，如果假設(shè)一天之內(nèi)不同時(shí)間測(cè)量的身高是沒(méi)有差別的話，則所出現(xiàn)的任何觀測(cè)值的差別可以歸因于測(cè)量上的誤差，其以相等的概率可以在正負(fù)兩個(gè)方向上產(chǎn)生.在這個(gè)假設(shè)下，所有41名學(xué)生測(cè)定的差別為正(即早上的身高值較大)的概率為2-41，即這個(gè)事件(測(cè)量誤差為正)在1013次實(shí)驗(yàn)中最多發(fā)生5次.也就是說(shuō)，反對(duì)身高無(wú)差別的假設(shè)的比率非常高.看起來(lái)，我們夜間睡眠時(shí)身高要伸長(zhǎng)約1厘米，而白天工作時(shí)卻要縮減約1厘米.因?yàn)橐呀?jīng)顯示了早晚身高的差別，那么下一個(gè)問(wèn)題也許就是：當(dāng)我們進(jìn)入睡眠時(shí)，身體的哪一部分在伸長(zhǎng)呢？為了檢驗(yàn)這一點(diǎn)，分別在早、晚對(duì)身體做了記號(hào)的幾個(gè)點(diǎn)之間進(jìn)行了測(cè)量.發(fā)現(xiàn)整個(gè)身體約有1厘米的差別產(chǎn)生在脊椎部分.生理學(xué)上的說(shuō)明是，白天因?yàn)樽倒侵g的軟骨(椎間板)的收縮，椎骨變得非常接近；而夜里當(dāng)身體放松時(shí)，椎骨又回到原來(lái)的位置.為什么教師愿意在早上授課呢？這是因?yàn)榻處熀蛯W(xué)生在早上精力充沛，互相之間非常和諧.這個(gè)現(xiàn)象有任何生理學(xué)上的解釋嗎？從體內(nèi)血漿中可的松(一種荷爾蒙)成分的變化可以解釋我們?cè)谏衔绲臋C(jī)敏性.正常狀態(tài)下，早上8點(diǎn)時(shí)，人體內(nèi)的可的松水平為每100毫升含16微克(16μg/100ml)，然后逐漸下降，至晚上11點(diǎn)為每100毫升含6微克(6μg/100ml)，降低了%.早上可的松的升高催人起床，到晚上的下降則誘人入睡.因此，我們?cè)谏衔缡菣C(jī)敏的，當(dāng)夜晚漸漸降臨時(shí)，我們會(huì)變得遲緩起來(lái).實(shí)際上，就如身高所顯示的情形一樣，人類的幾個(gè)生理上的特征也在一天中不斷地變化，也就是以24小時(shí)為周期，每個(gè)人有自己特別的日內(nèi)循環(huán).哈爾堡(Hallberg,1974)強(qiáng)調(diào)了研究這樣的變動(dòng)的重要性，即所謂的時(shí)間生物學(xué)，就能決定患者服藥的最佳時(shí)間.可以證明一天之中應(yīng)在某一時(shí)刻服用的藥，在其他時(shí)間服用是無(wú)效的；服用藥物的有效程度也許依賴于不同時(shí)間內(nèi)血漿中各種生化物質(zhì)的水平.時(shí)間生物學(xué)已成為一個(gè)具有廣泛應(yīng)用前景的活躍的研究領(lǐng)域.這些研究中，大多數(shù)發(fā)展均基于統(tǒng)計(jì)技術(shù)來(lái)發(fā)現(xiàn)并建立不同時(shí)間內(nèi)測(cè)量值的周期性.18.統(tǒng)計(jì)學(xué)中的鹽我平生所遇之最不平常的一件事，是我在一本哲學(xué)著作中發(fā)現(xiàn)食鹽的用量變成了一次雄辯的爭(zhēng)議的主題，其他許多類似的事情也受到類似的稱贊.Pheadrus（柏拉圖的“愛(ài)的盛宴”）1947年印度剛獨(dú)立，新德里就發(fā)生了一些公共暴亂.一個(gè)少數(shù)民族團(tuán)體中的大多數(shù)人避難到被稱為“紅色堡壘”的地方，這是一個(gè)被保護(hù)的區(qū)域，少部分人逃到另一個(gè)地區(qū)的修姆因廟里，這個(gè)廟臨近一個(gè)古建筑物.政府有責(zé)任提供食物給這些避難者.這個(gè)任務(wù)委托給了承包商，由于沒(méi)有任何關(guān)于避難者人數(shù)的信息，政府被迫接受和支付承包商所提出的為避難者所購(gòu)買(mǎi)的各種日用品和生活保障品的賬單.政府的這項(xiàng)開(kāi)支看起來(lái)非常大，因而有人建議讓統(tǒng)計(jì)學(xué)家來(lái)求出“紅色城堡”中避難者的準(zhǔn)確人數(shù).在當(dāng)時(shí)的混亂條件下，這個(gè)問(wèn)題看起來(lái)很困難.另一個(gè)復(fù)雜的情形是，政府所謂的統(tǒng)計(jì)學(xué)家是屬于多數(shù)派團(tuán)體的(與避難者所屬團(tuán)體對(duì)立)，因而如果要應(yīng)用統(tǒng)計(jì)技術(shù)估計(jì)避難者的人數(shù)而要求進(jìn)入“紅色城堡”的話，這些統(tǒng)計(jì)專家的安全沒(méi)有保證.擺在統(tǒng)計(jì)學(xué)家面前的問(wèn)題是：在沒(méi)有任何避難者人數(shù)的先驗(yàn)信息、沒(méi)有任何機(jī)會(huì)直接了解那個(gè)地區(qū)人口密度的情形下，同時(shí)在不能使用任何已知的用于估計(jì)或人口統(tǒng)計(jì)調(diào)查中的抽樣技術(shù)條件下，來(lái)估計(jì)一個(gè)給定地區(qū)的人口數(shù)量.專家們不得不想出某個(gè)辦法來(lái)解決這個(gè)問(wèn)題.無(wú)論是統(tǒng)計(jì)學(xué)或是統(tǒng)計(jì)學(xué)家的失敗，政府都是能容忍的，不管怎樣，統(tǒng)計(jì)學(xué)家們接受了承包商交給政府的賬單，這些賬單記錄了提供給避難者的不同的生活用品，如所購(gòu)入的米、豆類和鹽.如何利用這些資料呢？假設(shè)全體避難者一天所需要的米、豆類和鹽的總量分別為R,P,S.由消費(fèi)調(diào)查，每人每天所需要這些食物的量分別為r,p,s.因而R/r,P/p,S/s，提供了一個(gè)集團(tuán)中相同人數(shù)的平行估計(jì)量，也就是說(shuō)，這三個(gè)值無(wú)論哪一個(gè)均是等價(jià)有效的.專家們利用承包商提供的R,P,S計(jì)算了這些值，發(fā)現(xiàn)S/s最小，而表示大米的R/r最大.與鹽相比，商品中最貴的大米的量有可能被夸大了(當(dāng)時(shí)在印度鹽的價(jià)格非常低，因而不會(huì)夸大鹽的用量).因此，統(tǒng)計(jì)學(xué)家提出估計(jì)值S/s為紅色城堡中避難者的人數(shù).對(duì)所提出的這種方法的驗(yàn)證是用同樣的方法獨(dú)立地估計(jì)了修姆因廟里的避難者人數(shù)(這里的人數(shù)要少得多)，得到了很好的近似值.這個(gè)基于鹽量的估計(jì)方法思想來(lái)自森古普塔他長(zhǎng)期在印度統(tǒng)計(jì)研究所工作.統(tǒng)計(jì)學(xué)者所給出的估計(jì)值對(duì)政府做出行政管理決策時(shí)非常有用.這也提高了統(tǒng)計(jì)學(xué)的威信，從那以后，統(tǒng)計(jì)學(xué)受到政府的大力支持，可以說(shuō)，這個(gè)估計(jì)方法對(duì)印度統(tǒng)計(jì)學(xué)的發(fā)展做出了很大的貢獻(xiàn).這里所用的方法在任何教科書(shū)中都沒(méi)有記載，是一個(gè)非慣例且很巧妙的方法.這個(gè)思想的背后是統(tǒng)計(jì)的推理和定量的思考，或許也可以說(shuō)包含了一種藝術(shù)成分吧.19.血液檢查中的經(jīng)濟(jì)學(xué)第二次世界大戰(zhàn)期間，必須招募很多人到軍隊(duì)，要檢查申請(qǐng)者中某種罕見(jiàn)的疾病需要對(duì)每一個(gè)人進(jìn)行血液檢查，這無(wú)疑是一項(xiàng)巨大的工作.盡管被淘汰的比率很低，但這個(gè)檢驗(yàn)是決定一個(gè)人是否能參軍的關(guān)鍵.如何保證“有問(wèn)題的”會(huì)被淘汰掉，同時(shí)又減少檢驗(yàn)次數(shù)呢？這在教科書(shū)上是沒(méi)有答案的.這里介紹一個(gè)統(tǒng)計(jì)學(xué)家富有才氣的解答.假設(shè)申請(qǐng)者中平均20個(gè)人中有一個(gè)人患有此病，也就是說(shuō)，將申請(qǐng)者20個(gè)人分為一組，對(duì)每一組進(jìn)行20次血液檢驗(yàn)，則平均每一組有一例呈陽(yáng)性.顯然，如果把幾個(gè)人的血樣混合起來(lái)進(jìn)行檢查，僅當(dāng)至少有一個(gè)人的血呈陽(yáng)性時(shí)混合血樣才呈陽(yáng)性.代替20次單個(gè)檢驗(yàn)，我們把20個(gè)人分為兩組，對(duì)10個(gè)人一組的兩個(gè)混合血液樣本分別進(jìn)行檢驗(yàn).平均來(lái)說(shuō)，此時(shí)一個(gè)混合樣本呈陽(yáng)性，另一個(gè)呈陰性.然后僅對(duì)呈陽(yáng)性的混合樣本進(jìn)行單個(gè)檢驗(yàn)，以確認(rèn)哪一個(gè)人的血液是陽(yáng)性的.這樣，對(duì)每20個(gè)人一組平均僅需2+10=12次檢驗(yàn)，即減少了20次中的8次（減少40%）.可以看到，如果把20個(gè)樣本按5個(gè)一組進(jìn)行混合，則平均實(shí)驗(yàn)總數(shù)僅有4+5=9次，這是對(duì)20個(gè)申請(qǐng)者一組進(jìn)行檢驗(yàn)所需次數(shù)的最佳值，減少了11次，即55%.類似上述問(wèn)題的求最佳值過(guò)程依賴于要調(diào)查疾病的流行率.如果假設(shè)某種疾病個(gè)人患病的比率為，則進(jìn)行血液檢查時(shí)，混合樣本人數(shù)大小的最佳值應(yīng)為使最大的.得到最佳值一個(gè)最好的方法的過(guò)程，是對(duì)不同的列表求出函數(shù)的值，選擇其中最大值所對(duì)應(yīng)的.這個(gè)思想非常漂亮，可用于其他領(lǐng)域.例如，常常要對(duì)來(lái)自不同水源的水進(jìn)行檢驗(yàn)，確定是否被污染.按上面所描述的混合樣本和分組的實(shí)驗(yàn)手段，則有可能在不增加實(shí)驗(yàn)設(shè)備的情況下，檢驗(yàn)大量來(lái)自不同水源的樣本并能做出精密的檢查.混合樣本檢測(cè)的方法現(xiàn)已廣泛實(shí)踐于環(huán)境保護(hù)研究和其他領(lǐng)域，用于削減實(shí)驗(yàn)檢測(cè)費(fèi)用.20.家庭人口、出生順序和智商IQ過(guò)去20年中，人們對(duì)中學(xué)高年級(jí)學(xué)生的平均SAT(學(xué)業(yè)才能測(cè)試)成績(jī)降低已經(jīng)有一些研究.為了解釋這個(gè)現(xiàn)象，在一些國(guó)家收集了子女SAT成績(jī)以及可能與之相關(guān)的父母的職業(yè)，家庭人數(shù)和出生順序等數(shù)據(jù).下面表5和表6給出了兩個(gè)相關(guān)研究的數(shù)據(jù).表5和表6的數(shù)據(jù)表明：成績(jī)隨家庭人數(shù)的增加一般在降低(表6中家庭僅有一人的情形例外)，隨出生順序的增加而降低(表明后出生的不如先出生的聰明）.有爭(zhēng)議的是，比起早出生的來(lái)說(shuō)，是否后出生的子女是在較低智商的環(huán)境中成長(zhǎng)的，這里考慮的智商環(huán)境是父母與較早出生子女智商水平的平均值.可以認(rèn)可的一種情形是隨著增加子女間年齡的間隔其影響是可以逆轉(zhuǎn)的.因此，僅取決于年齡來(lái)判斷智商水平將使得早出生的子女高于晚出生的子女的好幾倍.表5英國(guó)家庭人口中按子女人數(shù)分類計(jì)算的子女平均智商IQ家庭子女人數(shù)智商IQ抽取家庭樣本數(shù)111522123185415251276103788表61965年美國(guó)國(guó)家獎(jiǎng)學(xué)金資格測(cè)試按家庭人口排序的平均數(shù)家庭人口出生順序123451234521.令人悲哀的數(shù)字不要告訴我那些悲哀的數(shù)字，人生不過(guò)是一場(chǎng)空夢(mèng).朗費(fèi)羅（）今天，通過(guò)報(bào)紙、雜志和其他新聞媒介，我們已經(jīng)能不斷地認(rèn)識(shí)到我們的飲食習(xí)慣、運(yùn)動(dòng)、吸煙和飲酒的習(xí)慣，以及在工作單位和其他日?；顒?dòng)中所受到的壓力對(duì)我們的影響.這些信息，常常用帶有單位的損失或增益的數(shù)值來(lái)表示.下面，從Cohen和Lee（1979）的文章中我們抄錄了一些悲哀的數(shù)字.我們?nèi)绾谓忉屵@些數(shù)字呢？這些數(shù)字傳達(dá)的是什么信息呢？個(gè)人如何利用這些數(shù)據(jù)形成自己的生活模式來(lái)增加幸福呢？(參見(jiàn)表7）首先,考慮表7中的第一個(gè)數(shù)字，即未婚男性平均壽命的損失.這個(gè)數(shù)字通?？梢杂伤劳鲇涗浿杏嘘P(guān)死者的性別、婚姻狀態(tài)和年齡的信息中得到.災(zāi)難性的死亡記錄中，只須分別對(duì)已婚和未婚簡(jiǎn)單地計(jì)算平均死亡年齡.這些平均數(shù)字的差為3500天.這個(gè)結(jié)果可能給未婚者一個(gè)危險(xiǎn)的信號(hào)，說(shuō)明結(jié)婚的慣例是好的，而且為某些人的早結(jié)婚可大約延長(zhǎng)10年壽命的建議提供了一個(gè)強(qiáng)有力的根據(jù)！然而，這里并不意味著這個(gè)原因(結(jié)婚)和結(jié)果(延長(zhǎng)10年壽命)的關(guān)系適用于每一個(gè)人.十分可能的是，對(duì)某個(gè)人來(lái)說(shuō)，結(jié)婚就意味著是自殺！毫無(wú)疑問(wèn)，如果按照男性的個(gè)人特征進(jìn)行分組所做的死亡記錄，會(huì)得到有更多信息的更好的列表結(jié)果.一般來(lái)說(shuō)，不同的組壽命的長(zhǎng)短也不同.每個(gè)人可根據(jù)自己的特征，參照與自己的特征相似的分組的數(shù)字進(jìn)行分析.表7不同原因所引起的壽命損失原因天數(shù)原因天數(shù)未結(jié)婚（男性）3500飲酒130慣用左手3285槍炮事故11未結(jié)婚（女性）1600自然放射線830%超重1300醫(yī)療X-射線620%超重900咖啡6吸香煙（男性）2250口服避孕藥5吸香煙（女性）800減肥飲料2抽雪茄330PAP檢驗(yàn)-4*用煙斗抽煙絲220家里有煙霧警報(bào)-10危險(xiǎn)工作，事故300帶有氣墊的轎車(chē)-50一般工作，事故74移動(dòng)冠狀動(dòng)脈監(jiān)護(hù)器-125*負(fù)數(shù)表示增加壽命.從表7可以看到，慣用左手的人比慣用右手的人少活約9年.這意味著慣用左手的人在遺傳上有什么問(wèn)題嗎？恐怕不是吧：這個(gè)差別或許是由于慣用左手的人生活的這個(gè)世界，即絕大多數(shù)日用品都是為慣用右手的人的方便而生產(chǎn)的不利因素所造成的.但是，統(tǒng)計(jì)信息對(duì)那些慣用左手的人是有用的，保護(hù)自己免遭可能的危險(xiǎn).一般說(shuō)來(lái)，平均值是把個(gè)體組成的集合(總體)視為整體的一個(gè)概括特征的指標(biāo)，可用于比較各個(gè)不同的總體.我們可以說(shuō)，平均月收入1000美元個(gè)體組成的總體比平均月收入500美元個(gè)體組成的總體富裕.但是，平均值對(duì)個(gè)體之間個(gè)人收入的差別沒(méi)有任何評(píng)價(jià).例如，個(gè)體的收入可以在20美元到100000美元之間變動(dòng)，而平均值為1000美元.一個(gè)總體內(nèi)，個(gè)體之間收入的差別稱為變異(variability)，也是與總體之間的比較有關(guān)的指標(biāo).絕大多數(shù)情況下，平均值和某些變異的量度(如收入的范圍)，可以提供一些實(shí)際水平的信息.平均值自身有可能是靠不住的，因而在對(duì)個(gè)體進(jìn)行判斷時(shí)并不總是有用.可以想象一下，如果讓一個(gè)不會(huì)游泳的人涉過(guò)一條平均深度淺于他的身高的河，會(huì)是什么情形！22.天氣預(yù)報(bào)可信賴的天氣預(yù)報(bào)員將他們的麥克風(fēng)移近窗戶，從而決定是否采用官方的預(yù)報(bào)或是根據(jù)他自己對(duì)窗戶外情形的判斷來(lái)預(yù)報(bào).幾年以前，天氣預(yù)報(bào)用的是籠統(tǒng)的表達(dá)形式，諸如：明日有雨，明日可能有雨，明日不會(huì)降雨等等.天氣預(yù)報(bào)經(jīng)常出錯(cuò).今天，天氣預(yù)報(bào)采用了不同的形式：明日有雨的可能性為60％.這個(gè)60％意味什么？這樣的預(yù)報(bào)比起早期的預(yù)報(bào)形式來(lái)說(shuō)包含更多的信息嗎？或許，對(duì)那些完全不知道“可能性”代表什么的人來(lái)說(shuō)，今天的天氣預(yù)報(bào)會(huì)引起混亂，甚至?xí)a(chǎn)生今天的預(yù)報(bào)不如過(guò)去準(zhǔn)確或是不如過(guò)去有用的印象.天氣預(yù)報(bào)中，無(wú)論怎樣都會(huì)有不確定的因素.因而，從邏輯上講，沒(méi)有給出預(yù)測(cè)精度的預(yù)報(bào)，對(duì)決策來(lái)說(shuō)是毫無(wú)意義或者是沒(méi)有用的.天氣預(yù)報(bào)中，60％這個(gè)數(shù)字提供了預(yù)測(cè)精度的一個(gè)度量.作出這樣的預(yù)報(bào)，常常意味的是明天有60％可能會(huì)降雨.當(dāng)然，不可能斷言某一特定時(shí)刻會(huì)降雨.在這個(gè)意義下，預(yù)報(bào)“明日有雨的可能性為60％”更有用，比起“明日有雨”的籠統(tǒng)說(shuō)法來(lái)更有邏輯性.那么，在什么意義下這個(gè)敘述是有用的呢？假設(shè)基于天氣預(yù)報(bào)“明天有雨的可能性為60％”的情形下要決定是否帶傘.再假設(shè)無(wú)論哪一天，由于帶傘所引起的不便能用錢(qián)來(lái)度量，設(shè)為元，而由于沒(méi)有帶傘被淋濕了的損失設(shè)為元，則當(dāng)降雨的可能性為60％時(shí)，以元的形式求出兩種決策下所期望的損失為決策期望的損失帶傘不帶傘×r+×0＝因而，當(dāng)≤時(shí)，決定帶傘，時(shí)不帶傘，可以最小化你的損失.這是一個(gè)簡(jiǎn)單的例證，說(shuō)明如何利用預(yù)報(bào)的準(zhǔn)確度，來(lái)加權(quán)處理不同的可能的決策下所產(chǎn)生的結(jié)果，從而選擇最佳.如果在預(yù)報(bào)中，沒(méi)有指定不確定的精度，就沒(méi)有基礎(chǔ)去做出一個(gè)決策.23.社會(huì)輿論調(diào)查即使我下定決心，我仍充滿了猶豫.奧斯卡·列文托(OscarLevant)過(guò)去，當(dāng)權(quán)者們利用偵探系統(tǒng)來(lái)查明公眾的觀點(diǎn).或許，由此所收集的信息幫助他們形成公眾政策，制定和實(shí)施法律.現(xiàn)代的社會(huì)輿論調(diào)查的歷史，是由蓋洛普民意調(diào)查的第一個(gè)報(bào)告開(kāi)始的.今天，社會(huì)輿論調(diào)查在報(bào)紙和其他新聞媒介中已經(jīng)扮演了一個(gè)非常重要的角色.他們收集公眾對(duì)各種社會(huì)、政治和經(jīng)濟(jì)問(wèn)題上的信息，出版摘要報(bào)告.這樣的輿論調(diào)查在民主政治社會(huì)中能起到積極的作用.他們可以告訴政治領(lǐng)導(dǎo)人和官僚們什么是公眾的需要，什么是公眾的愛(ài)好.他們也向公眾報(bào)告新聞，通告公眾的想法，或許可幫助在某個(gè)重要的問(wèn)題上明確表現(xiàn)公眾的觀點(diǎn).通常以某種特定的統(tǒng)計(jì)形式宣布公眾輿論調(diào)查的結(jié)果同時(shí)需要一定的解釋.例如，播音員說(shuō)：贊成總統(tǒng)外交政策的人占42％，正負(fù)誤差界限為4％.代替給出單個(gè)數(shù)字，這里播音員給出一個(gè)區(qū)間(42－4，42＋4)＝(38，46).這是如何得到的？如何解釋呢？假設(shè)所有美國(guó)成人中，實(shí)際贊成總統(tǒng)外交政策的比率為數(shù)值T.為了了解T的大小，必須接觸每一個(gè)美國(guó)成人，得到他們對(duì)“你贊成總統(tǒng)的外交政策嗎？”這樣問(wèn)題的反應(yīng).如果必須要得到一個(gè)限時(shí)的、迅速的答案，這是不可能的.最好的方法是求出一個(gè)最接近于T的估計(jì)值.新聞媒介對(duì)某一數(shù)量的“任意選擇的個(gè)體”進(jìn)行電話采訪，得到他們的答案.如果接觸了數(shù)量為的個(gè)體，其中有個(gè)人回答“贊成”，則T的估計(jì)值可為100％×().當(dāng)然，這樣的估計(jì)是存在一定的誤差的，因?yàn)槲覀兯〉膬H僅是某個(gè)集合中的樣本(美國(guó)成人中很小的一部分).如果接觸另外的個(gè)人，可能得到不同的估計(jì)值.如何求出估計(jì)值的誤差呢？基于兩個(gè)統(tǒng)計(jì)學(xué)家內(nèi)曼和阿·皮爾森發(fā)展起來(lái)的一個(gè)理論，我們可以算出一個(gè)數(shù)字，使得T的真實(shí)值以很高的概率，一般為95％(或99％），落于區(qū)間(100％×()-，100％×()+)之內(nèi).也就是說(shuō)，這個(gè)區(qū)間不包含真實(shí)值的事件，等價(jià)于在裝有5個(gè)(或1個(gè))白球，95個(gè)(或99個(gè))黑球的口袋中隨機(jī)地抽取一球，“抽得白球”這樣一個(gè)幾乎很少發(fā)生的事件.社會(huì)輿論調(diào)查的有效性，基于所選擇個(gè)體的“代表性”.十分明顯的是，調(diào)查的結(jié)果是依賴于所選擇個(gè)體所屬的政治團(tuán)體(民主黨或共和黨)的.即便假設(shè)所選擇的個(gè)人的政治所屬是沒(méi)有偏差的，如果有些個(gè)體不回答問(wèn)題，有些又恰恰屬于某些特別的政治團(tuán)體，則結(jié)果也會(huì)不同.任何調(diào)查中，都有不同程度的不回答者，這種場(chǎng)合下要評(píng)價(jià)誤差是困難的，除非有更多的可利用的信息.24.迷信和心理作用當(dāng)問(wèn)到倫理學(xué)家斯馬利安為什么不相信占星術(shù)時(shí)，他說(shuō)他是雙子星座的人，雙子星座的人絕不會(huì)信占星術(shù).我的一個(gè)朋友是一個(gè)虔誠(chéng)的基督教徒，他把剛參加工作得到的第一個(gè)月的薪水全部捐給了教會(huì).當(dāng)我問(wèn)他是否相信上帝時(shí)，他回答到：“我不知道上帝是否存在，但相信上帝的存在并以此來(lái)行動(dòng)，是安全的.”或許，信仰和迷信在每一個(gè)人的生活中都存在，一旦當(dāng)它們變成一個(gè)人行動(dòng)的唯一指導(dǎo)時(shí)，就會(huì)產(chǎn)生危險(xiǎn).心理作用會(huì)對(duì)一個(gè)人身體的生理功能產(chǎn)生影響嗎？很遺憾，這個(gè)問(wèn)題還沒(méi)有實(shí)驗(yàn)證明.但是已經(jīng)不斷有研究報(bào)告涉及支持所謂“心于物質(zhì)之上”的言論.最近有一個(gè)研究報(bào)告，圣地亞哥的加利福尼亞大學(xué)的菲利普斯花了25年的時(shí)間，對(duì)老年美籍華裔婦女在一個(gè)重要的節(jié)日——中秋節(jié)前后的死亡率進(jìn)行了調(diào)查，他發(fā)現(xiàn)節(jié)日前一周死亡率比通常低%，節(jié)日后一周死亡率比通常高出%.看起來(lái)，人具有一種能力來(lái)延續(xù)死亡直到經(jīng)歷某個(gè)吉祥的時(shí)刻.在菲利普斯較早(1977年)的研究中，對(duì)1251個(gè)著名的美國(guó)人的出生和死亡月份數(shù)據(jù)的調(diào)查的論證也有類似的結(jié)果.表8給出了菲利普斯報(bào)告的數(shù)據(jù)，以及英國(guó)皇家學(xué)會(huì)中印度籍會(huì)員的有關(guān)數(shù)據(jù).表8出生月前后以及出生月間的死亡率出生月前出生月出生月后總數(shù)比率P65432112345樣本1243120233416263637412634348樣本2666967736770938284738772903樣本302102232013218注:P=在出生月和出生月后死亡的人的比率.樣本1《400個(gè)著名美國(guó)人》中所列出的其中348人.樣本2《現(xiàn)代名人錄》三卷(1897～1942，1943～1950，1951～1960)中著名家庭中的家長(zhǎng).樣本3英國(guó)皇家學(xué)會(huì)中去世的印度籍理事.從表8可以看出，出生月前去世的人數(shù)比在出生月中和出生月后去世的人要少.整個(gè)數(shù)據(jù)看起來(lái)顯示了一個(gè)趨向：延緩死亡到誕生月后.這些研究結(jié)果是否顯示一些人能夠運(yùn)用他們的能力延緩死亡日期，直到某個(gè)重要的事件發(fā)生，如生日、節(jié)日或紀(jì)念日.與這個(gè)類似的一個(gè)著名例子是有關(guān)托馬斯·杰弗遜(ThomasJefferson)的報(bào)道，據(jù)說(shuō)他延長(zhǎng)了他的死亡直到1826年的7月4日——?jiǎng)偤谩丢?dú)立宣言》簽字后的第50年，他僅僅問(wèn)了醫(yī)生：“今天是7月4日嗎？”就去世了.像菲利普斯發(fā)表的這樣有關(guān)死亡日期的研究報(bào)告，

人人文庫(kù)> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

高中數(shù)學(xué)人教A版第三章概率幾何概型概率統(tǒng)計(jì)小故事

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

高中數(shù)學(xué)人教A版第三章概率幾何概型 概率統(tǒng)計(jì)小故事

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔

高中數(shù)學(xué)人教A版第三章概率幾何概型概率統(tǒng)計(jì)小故事