已閱讀5頁(yè),還剩4頁(yè)未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
統(tǒng)計(jì)發(fā)展概覽由于人類的統(tǒng)計(jì)實(shí)踐是通過計(jì)算活動(dòng)實(shí)現(xiàn)的,統(tǒng)計(jì)發(fā)展史可以追溯到古代的原始社會(huì),即從現(xiàn)在開始足有5000多年的漫長(zhǎng)歲月。但是可以將人類的統(tǒng)計(jì)實(shí)踐提高到理論上可以概括的水平。也就是說,開始成為系統(tǒng)的學(xué)問統(tǒng)計(jì)是近代的事情,離現(xiàn)在只有300多年前的短暫歷史了。統(tǒng)計(jì)發(fā)展的概述可以分為經(jīng)典記錄統(tǒng)計(jì)、現(xiàn)代技術(shù)統(tǒng)計(jì)、現(xiàn)代推理統(tǒng)計(jì)三種形式。一、經(jīng)典記錄統(tǒng)計(jì)古典記錄統(tǒng)計(jì)形成時(shí)間大約從17世紀(jì)中葉到19世紀(jì)中葉。統(tǒng)計(jì)在這個(gè)崛起階段仍然是意義和范圍不太明確的學(xué)科,在用文字或數(shù)字真實(shí)地記錄和分析國(guó)家社會(huì)經(jīng)濟(jì)狀況的過程中,初步建立了統(tǒng)計(jì)研究的方法和規(guī)則。概率理論引進(jìn)后,才成為越來越成熟的方法。第一次有效地將古典概率論引入統(tǒng)計(jì)學(xué)的是法國(guó)天文學(xué)家、數(shù)學(xué)家和統(tǒng)計(jì)學(xué)家拉普拉斯(P.S. Laplace,1749-1827)。因此,比利時(shí)統(tǒng)計(jì)學(xué)家凱特勒指出,統(tǒng)計(jì)應(yīng)該從拉普拉斯開始。(a)拉普拉斯的主要貢獻(xiàn)1,開發(fā)概率論的研究拉氏概率論的最初表達(dá)發(fā)表于1774年。這是他的代表作,從1812年開始發(fā)行4版概率分析理論。在本書中,拉氏首次將數(shù)學(xué)分析方法系統(tǒng)地應(yīng)用于概率論研究,建立了嚴(yán)密的概率數(shù)學(xué)理論。這本書不僅總結(jié)了自己過去的研究,還總結(jié)了老一輩學(xué)者研究概率論的成果,成為古典概率論的集大成者。2、推進(jìn)概率論在統(tǒng)計(jì)中的應(yīng)用,由于拉普拉斯將天文學(xué)和物理學(xué)的研究結(jié)合起來從事概率研究,他可以指出,概率理論可以相當(dāng)自覺、相當(dāng)明確地應(yīng)用,并能解決一系列實(shí)際問題。他在實(shí)際振興中的成績(jī)多方面,主要表現(xiàn)在人口統(tǒng)計(jì)、觀測(cè)誤差理論及概率論在天文問題上的應(yīng)用。結(jié)合概率分布模型和中心極限思想,研究了最小二乘法的1809年至1812年,首次為統(tǒng)計(jì)中此后最廣泛使用的手段提供了理論依據(jù)。3,統(tǒng)計(jì)學(xué)的大量法則拉普拉斯認(rèn)為?!白鳛楝F(xiàn)象的原因,我們知道或知道的也是原因復(fù)雜,無法計(jì)算;發(fā)生原因被偶然因素或沒有一定規(guī)律的因素?cái)_亂,直到事物發(fā)展的變化,要長(zhǎng)期廣泛觀察,才能求得發(fā)展的真法。概率理論可以研究造成這種發(fā)展變化的成分,并指明其成分的數(shù)量。”這是他通過天文學(xué)上的研究獲得的經(jīng)驗(yàn)。他發(fā)現(xiàn),如果有足夠的時(shí)間觀察天體的運(yùn)動(dòng),就會(huì)出現(xiàn)使物體特征消失的傾向等現(xiàn)象。他指出,這不是偶然,而是其中一定有什么原因。4、在統(tǒng)計(jì)發(fā)展史上,試圖推斷大樣本,人口計(jì)算問題,可以成為統(tǒng)計(jì)學(xué)家多年的問題。拉普拉斯直到19世紀(jì)初才利用概率論的原理邁出了重要的一步。理論上,1781年拉普拉斯在“理論上概率論”一文中建立了概率積分,提供了計(jì)算區(qū)間誤差的強(qiáng)有力的手段。從1781年到1786年,提出了“拉普拉斯定理”(中心極限定理的一部分),初步確立了大樣本推理的理論基礎(chǔ)。實(shí)際上,拉普拉斯在1786年寫了一篇關(guān)于巴黎人口出生、結(jié)婚和死亡的文章,文章提出了根據(jù)法國(guó)特定地區(qū)的出生率估計(jì)全國(guó)人口的問題。他抽調(diào)了30個(gè)市縣,進(jìn)行了深入調(diào)查,估算了全國(guó)總?cè)丝跀?shù)。其方法和結(jié)果仍然相當(dāng)粗糙,但在統(tǒng)計(jì)發(fā)展史上,他利用樣本推斷出整體的思想方式,為后人開辟了抽樣調(diào)查的新途徑。對(duì)概率論與統(tǒng)計(jì)的結(jié)合研究做出貢獻(xiàn)的另一個(gè)人是德國(guó)偉大的數(shù)學(xué)家高斯(c.f .高斯,1777-1855)。(b)高斯的主要貢獻(xiàn)1、成立最小平方的學(xué)生時(shí)代,課程開始了最小平方研究。1794年,他讀了數(shù)學(xué)家蘭伯特(j . h . Lambert,1728 1777)的作品,討論了如何使用平均法確定觀察值(yi,Xi)中線性關(guān)系y= x的兩個(gè)系數(shù)。1795年,以殘差平方和西格瑪(I-a-bxi)2為最小值得到的a和b估計(jì)了和。1798年完成最小二乘法的整體思維結(jié)構(gòu)于1809年正式發(fā)表。2、發(fā)現(xiàn)高斯分布調(diào)查、觀察或測(cè)量的誤差是不可避免的,而且一般無法掌握??扑雇ㄟ^他豐富的天文觀測(cè)和從1821年到1825年測(cè)量土地的經(jīng)驗(yàn),發(fā)現(xiàn)了觀察值x和實(shí)際值的誤差變異,極大地服從了現(xiàn)代人最熟悉的正規(guī)分布。他利用最大似然法和其他數(shù)學(xué)知識(shí)推導(dǎo)了測(cè)量誤差的概率分布公式。“誤差分布曲線”一詞是科斯莫斯提出的,后代為了紀(jì)念他,將此分布曲線稱為高斯分布曲線,即今天的正態(tài)分布曲線。高斯發(fā)現(xiàn)的一般誤差概率分布曲線及其所產(chǎn)生的天文觀測(cè)誤差的測(cè)量方法在理論上和應(yīng)用上都具有十分重要的意義。二、現(xiàn)代技術(shù)統(tǒng)計(jì)近代技術(shù)統(tǒng)計(jì)形成時(shí)期大約是19世紀(jì)中葉到20世紀(jì)上半葉。這種“描述”的特征最初是由研究生物進(jìn)化的學(xué)者組成的群體確定的,因此歷史上稱他們?yōu)樯锝y(tǒng)計(jì)學(xué)。生物統(tǒng)計(jì)學(xué)派的創(chuàng)始人是英國(guó)的戈登(F. Galton,1822-1911),隊(duì)長(zhǎng)是戈登的學(xué)生比爾森(K.Pearson,1857-1936)。(a)戈登的主要貢獻(xiàn)1、為了研究早期生物統(tǒng)計(jì)學(xué)人類智能的遺傳問題,高利登仔細(xì)閱讀了300多人的傳記,初步確定了其中有多少人的親屬關(guān)系及關(guān)系大致緊密。然后在知名人士組個(gè)別調(diào)查,從整體上查明了智力遺傳學(xué)的規(guī)律性。為了獲得更多有關(guān)人的特性和能力的統(tǒng)計(jì)資料,高爾頓從1882年開始成立了“人體測(cè)量實(shí)驗(yàn)室”。連續(xù)6年測(cè)量了9337名“身高、體重、寬度、呼吸力、牽引力和壓力、掌摑速度、聽覺、視力、色覺和其他個(gè)人信息”,深入研究了這些數(shù)據(jù)中隱藏的內(nèi)在關(guān)系,得出了“祖先遺傳規(guī)律”。他努力探索描述和比較大量數(shù)據(jù)的方法和方法,引入了重要的統(tǒng)計(jì)概念和方法,如中數(shù)、百分位數(shù)、四分位數(shù)、四分位數(shù)、分布、相關(guān)性、回歸等。1901年,戈登和他的學(xué)生比爾森為生物計(jì)量學(xué) (Biometrika)雜志撰寫的創(chuàng)刊中,首次為他們使用的統(tǒng)計(jì)方法提出了“生物統(tǒng)計(jì)”(biology)一詞。戈登解釋說:“所謂的生物統(tǒng)計(jì)學(xué)是適用于生物界的現(xiàn)代統(tǒng)計(jì)方法?!笨锤甑呛碗S后的研究室,他們把生物統(tǒng)計(jì)看作應(yīng)用統(tǒng)計(jì)。其研究范圍是對(duì)生物科學(xué)的問題進(jìn)行統(tǒng)計(jì)研究,更重要的是開發(fā)生物科學(xué)應(yīng)用中的統(tǒng)計(jì)方法本身。2、對(duì)統(tǒng)計(jì)的貢獻(xiàn)(1)戈登首次統(tǒng)計(jì)接近變異是進(jìn)化論中的重要概念,并領(lǐng)導(dǎo)了英國(guó)生物統(tǒng)計(jì)學(xué)派的創(chuàng)立。1889年,戈登將整體定量測(cè)定法引入遺傳研究。戈登發(fā)現(xiàn),通過整體測(cè)量,可以確定對(duì)象或植物的每種類型的平均類型。在一個(gè)恒星中,所有的物體圍繞這個(gè)平均類型,以它為軸,向多方面變異。這就是他在遺傳的天賦這本書里提出的平均偏差法則。(2)“相關(guān)”統(tǒng)計(jì)相關(guān)法律是戈登制定的。首先,他測(cè)量了甜豌豆的大小,發(fā)現(xiàn)后代有遺傳后“回雙親”的現(xiàn)象。1877年收集了很多身體長(zhǎng)度的數(shù)據(jù),計(jì)算了高個(gè)子和矮個(gè)子,高個(gè)子的父母的后代各有多少個(gè)高個(gè)子和矮個(gè)子的孩子,在一定程度上知道父母高個(gè)子,父母矮個(gè)子的后代矮個(gè)子的事實(shí),在父母和子女之間的長(zhǎng)度上將其具體化為數(shù)量關(guān)系。1888年,戈登在相關(guān)與人體主要測(cè)量一文中充分論述了“相關(guān)”的統(tǒng)計(jì)重要性,并提出了戈?duì)柕窍嚓P(guān)函數(shù)(即目前常用的相關(guān)系數(shù))的計(jì)算公式。戈?duì)柕窃?870年研究人類身體長(zhǎng)度的遺傳時(shí)發(fā)現(xiàn),高個(gè)子父母的子女傾向于低于父母的身體長(zhǎng)度。相反,短父母的子女們的身體長(zhǎng)度傾向于高于父母的長(zhǎng)度。從整體來看,高個(gè)子的人“回歸”了一般身高的期待,矮個(gè)子的人則相反的“回歸”。這是統(tǒng)計(jì)上“回歸”的初始含義。1886年,戈登在論文中正式提出了“從遺傳的身體長(zhǎng)度到中間身體長(zhǎng)度的回歸”的概念。(b)比爾森的主要貢獻(xiàn)比爾森在生物統(tǒng)計(jì)學(xué)上傾注了心血,上升到了通用方法學(xué)的高度。比爾森的生活是統(tǒng)計(jì)學(xué)的一生,他對(duì)統(tǒng)計(jì)做出了巨大貢獻(xiàn):1、從可變數(shù)據(jù)處理生物統(tǒng)計(jì)中獲取的數(shù)據(jù)往往是無序的,很難知道原因。為此,比爾森首次探索了處理數(shù)據(jù)的方法,他開創(chuàng)的頻率分布圖和頻率分布圖現(xiàn)在成為統(tǒng)計(jì)方法最基本的手段之一。據(jù)悉,分布曲線的匹配在19世紀(jì)以前用頻率分布解釋了變異值,最終以正態(tài)分布曲線出現(xiàn)。但是比爾森注意到在生物統(tǒng)計(jì)學(xué)的經(jīng)驗(yàn)分布中,對(duì)很多生物的測(cè)量不是正態(tài)分布,而是經(jīng)常以偏法分布,甚至是坡度很多。都不是單峰,也不是單峰。說明“現(xiàn)狀”信念不可靠。1894年,他在一篇名為“不對(duì)稱頻率曲線的分解”的文章中,首先將不對(duì)稱觀測(cè)曲線分解成幾條規(guī)則曲線。他利用稱為“相對(duì)梯度”的方法獲得了12種分布函數(shù)類型:正態(tài)分布、矩形分布、j型分布、u型分布或貝爾分布。經(jīng)過r . fisher的進(jìn)一步研究,biersheng分布曲線、型出現(xiàn)在小樣本理論中。推導(dǎo)比爾森曲線系統(tǒng)的方法缺乏理論基礎(chǔ),但給了很多啟示。3.卡方檢察官于1900年獨(dú)立重新發(fā)現(xiàn)了比爾森的分布,并提出了著名的卡方檢驗(yàn)法(Test of)。比爾森得到了統(tǒng)計(jì):=(實(shí)際次數(shù)-理論數(shù))2/證明了當(dāng)理論數(shù)和觀測(cè)值足夠多時(shí)總是近似服從自由度為(k-1)的分布。其中k表示要拆分的組數(shù)。在自然現(xiàn)象的范圍內(nèi),檢驗(yàn)法被廣泛使用。由r .費(fèi)雪補(bǔ)充,小樣本成為推斷統(tǒng)計(jì)的早期方法之一。4、回歸及相關(guān)開發(fā)回歸及相關(guān),經(jīng)過birson的進(jìn)一步開發(fā),在這兩個(gè)概念生物統(tǒng)計(jì)學(xué)領(lǐng)域,它被推進(jìn)為一般統(tǒng)計(jì)方法的重要概念。1896年,他在進(jìn)化論的數(shù)學(xué)研究:回歸、遺傳、隨機(jī)配對(duì)一文中寫道,仍然廣泛使用的線性相關(guān)計(jì)算公式:比爾幸存的回歸計(jì)算公式:=a bx(其中a和b根據(jù)最小二乘法計(jì)算得出),回歸系數(shù)的計(jì)算公式:y隨著x的變化而變化,(如果x與y一起變更,則輸入(x-)/-(y-)2。比爾的生存從1897年到1905年,不僅發(fā)展了阿爾高登的理論,還在數(shù)學(xué)上發(fā)展了相關(guān)的相關(guān)、總相關(guān)、相關(guān)比例等概念。三、現(xiàn)代推理統(tǒng)計(jì)現(xiàn)代推斷統(tǒng)計(jì)形成時(shí)間大約是20世紀(jì)初葉到20世紀(jì)中葉。人類歷史進(jìn)入20世紀(jì)后,社會(huì)領(lǐng)域和自然領(lǐng)域?qū)y(tǒng)計(jì)的要求都更大。各種事物和現(xiàn)象之間復(fù)雜的數(shù)量關(guān)系和一系列未知的數(shù)量變化僅僅靠記錄或技術(shù)很難看到效果。因此,把握事物的整體真實(shí)關(guān)系,預(yù)測(cè)未來發(fā)展的“推論”方法層出不窮。從技術(shù)統(tǒng)計(jì)中學(xué)習(xí)推理是統(tǒng)計(jì)發(fā)展過程中的一大飛躍。統(tǒng)計(jì)發(fā)展的這一重大變化是在農(nóng)業(yè)現(xiàn)場(chǎng)試驗(yàn)領(lǐng)域進(jìn)行的。因此,歷史上被稱為農(nóng)業(yè)試驗(yàn)學(xué)。對(duì)確立現(xiàn)代推理統(tǒng)計(jì)的最大貢獻(xiàn)是英國(guó)統(tǒng)計(jì)學(xué)家戈塞特(W.S. Gosset,1876-1937年)和費(fèi)舍爾(r . a . fisher,1890-1962年)。(a)戈塞特的t檢驗(yàn)和小樣本思想1908年,戈塞特首次以學(xué)生的筆名在生物計(jì)量學(xué)雜志上發(fā)表了平均概率誤差。這篇文章提供了學(xué)生t檢驗(yàn)的依據(jù),因此很多統(tǒng)計(jì)學(xué)家認(rèn)為1908年是統(tǒng)計(jì)推理理論發(fā)展史上的里程碑。之后,高爾塞連續(xù)發(fā)表了相關(guān)系數(shù)的概率誤差(1909)、隨機(jī)樣本平均分布(1909)、來自無限總體隨機(jī)樣本平均的概率估計(jì)表(1917)等。他比較了這些論文中的第一、平均誤差和標(biāo)準(zhǔn)誤差兩種計(jì)算方法;其次,研究了泊松分布的樣本誤差問題。第三,建立了相關(guān)系數(shù)的抽樣分布。第四,帶來了“學(xué)生”分布,即t分布。這些論文的完成為“小樣本理論”奠定了基礎(chǔ)。之后為樣品數(shù)據(jù)的統(tǒng)計(jì)分析和解釋開辟了新的道路。由于戈塞特的理論,統(tǒng)計(jì)學(xué)開始從大標(biāo)本發(fā)展到小標(biāo)本,從描寫發(fā)展到推理,有些人把戈塞特譽(yù)為推理的先驅(qū)。(b) R .費(fèi)舍統(tǒng)計(jì)理論和方法費(fèi)雪一生寫了329篇論文。世界各國(guó)最普及的統(tǒng)計(jì)著作有:1925年出版的供研究人員用的統(tǒng)計(jì)方法,1930年出版的自然選擇的遺傳原理,1935年出版的試驗(yàn)設(shè)計(jì),1938年和耶特聯(lián)合出版的供生物學(xué)、農(nóng)學(xué)與醫(yī)學(xué)研究用的統(tǒng)計(jì)表,1938年出版的統(tǒng)計(jì)估計(jì)理論,1950年出版的對(duì)數(shù)理統(tǒng)計(jì)的貢獻(xiàn)當(dāng)時(shí)他在統(tǒng)計(jì)學(xué)上處于世界領(lǐng)先地位,他的貢獻(xiàn)是多方面的。1、通用方法r .費(fèi)雪強(qiáng)調(diào),統(tǒng)計(jì)學(xué)是對(duì)所有自然現(xiàn)象或社會(huì)生活現(xiàn)象的研究、統(tǒng)計(jì)方法及其計(jì)算方法“和其他數(shù)學(xué)科目一樣,對(duì)所有問題的研究應(yīng)用相同的公式”的一般方法。他指出:“統(tǒng)計(jì)學(xué)是應(yīng)用數(shù)學(xué)最重要的部分,可以看作是加工觀察到的材料的數(shù)學(xué)?!?、“無限假設(shè)”r .費(fèi)雪認(rèn)為,研究包括社會(huì)經(jīng)濟(jì)現(xiàn)象在內(nèi)的各種事物的現(xiàn)象時(shí),必須拋棄有關(guān)具體物質(zhì)內(nèi)容的信息,讓統(tǒng)計(jì)只涉及“統(tǒng)計(jì)總綱”。例如,“如果已經(jīng)有1萬名新兵的信息,統(tǒng)計(jì)調(diào)查的對(duì)象不是全體新兵,而是各種身體長(zhǎng)度大小的總和。”.顯然,r .費(fèi)雪只對(duì)構(gòu)成整個(gè)統(tǒng)計(jì)元素的特定符號(hào)感興趣,而對(duì)每個(gè)元素本身沒有興趣。其目的是簡(jiǎn)化問題,使其易于統(tǒng)計(jì)處理。他在1922年寫的理論統(tǒng)計(jì)學(xué)的數(shù)學(xué)基礎(chǔ)一書中提出了“無限總體假設(shè)”的重要概念?!凹僭O(shè)的無限總體,即現(xiàn)有數(shù)據(jù)就是那個(gè)隨機(jī)樣本。”.3,采樣分布r . fisher(r)從研究概率分布開始。1915年,他在統(tǒng)計(jì)方法和科學(xué)推斷雜志上發(fā)表了無限總體樣本相關(guān)系數(shù)值的頻率分布。這篇論文對(duì)相關(guān)系數(shù)的一般公式進(jìn)行了論證,對(duì)以后整體推理統(tǒng)計(jì)的發(fā)展將有所貢獻(xiàn)。這篇論文被稱為現(xiàn)代抽象統(tǒng)計(jì)的第一篇論文。1922年,r .皮雪導(dǎo)出了相關(guān)系數(shù)r的z分布,隨后還準(zhǔn)備了生物計(jì)量學(xué)。1924年,r .皮雪綜合研究了t .分布、分布、z .分布,使皮氏生的檢查也適用于小樣本。1938
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 組成原理課程設(shè)計(jì)摘要
- 網(wǎng)購(gòu)數(shù)據(jù)庫(kù)課程設(shè)計(jì)
- 自動(dòng)化課程設(shè)計(jì)理論
- 蘇教版六年級(jí)科學(xué)上冊(cè)第3單元期末專項(xiàng)復(fù)習(xí)
- 自動(dòng)售檢票課程設(shè)計(jì)過程
- 狀物類作文課程設(shè)計(jì)
- 離騷課程設(shè)計(jì)高中
- 物流管理系統(tǒng)課程設(shè)計(jì)sql
- 2025年度新能源儲(chǔ)能系統(tǒng)購(gòu)銷合同3篇
- 病理生理學(xué)課程設(shè)計(jì)
- 環(huán)境保護(hù)水土保持保證體系及措施
- 地下室頂板預(yù)留洞口施工方案標(biāo)準(zhǔn)版
- 2023-2024學(xué)年成都市武侯區(qū)六上數(shù)學(xué)期末達(dá)標(biāo)測(cè)試試題含答案
- 軍事思想論文范文(通用6篇)
- (完整版)EORTC生命質(zhì)量測(cè)定量表QLQ-C30(V3.0)
- 七年級(jí)體育與健康 《足球》單元作業(yè)設(shè)計(jì)
- 毛細(xì)管升高法測(cè)量液體表面張力系數(shù)
- 室內(nèi)覆蓋方案設(shè)計(jì)與典型場(chǎng)景
- 放射性粒子植入自我評(píng)估報(bào)告
- 2023年山西云時(shí)代技術(shù)有限公司招聘筆試題庫(kù)及答案解析
- 浙大中控DCS系統(tǒng)介紹(簡(jiǎn)潔版)
評(píng)論
0/150
提交評(píng)論