武漢理工大學(xué)應(yīng)用數(shù)理統(tǒng)計(jì)備考資料.ppt_第1頁(yè)
武漢理工大學(xué)應(yīng)用數(shù)理統(tǒng)計(jì)備考資料.ppt_第2頁(yè)
武漢理工大學(xué)應(yīng)用數(shù)理統(tǒng)計(jì)備考資料.ppt_第3頁(yè)
武漢理工大學(xué)應(yīng)用數(shù)理統(tǒng)計(jì)備考資料.ppt_第4頁(yè)
武漢理工大學(xué)應(yīng)用數(shù)理統(tǒng)計(jì)備考資料.ppt_第5頁(yè)
已閱讀5頁(yè),還剩19頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、應(yīng) 用 數(shù) 理 統(tǒng) 計(jì),武漢理工大學(xué)數(shù)學(xué)系,楚楊杰,緒 論,1. 數(shù)理統(tǒng)計(jì)的發(fā)展 2. 數(shù)理統(tǒng)計(jì)的應(yīng)用 3. 本課程學(xué)習(xí)內(nèi)容 4. 成績(jī)?cè)u(píng)定方法 5. 參考文獻(xiàn),1. 數(shù)理統(tǒng)計(jì)的發(fā)展,現(xiàn)今通行的統(tǒng)計(jì)學(xué)(Statistics) 一詞源出于意大利文Stato, 其詞根兼有“國(guó)家”和“情況”的意義.,統(tǒng)計(jì)學(xué)家 ( statistician) 一詞源出意文statista 當(dāng)時(shí)理解為“處理國(guó)務(wù)的人”,按這個(gè)涵義極廣的理解, 統(tǒng)計(jì)學(xué)就是“國(guó)情學(xué)”, 這流行于16世紀(jì)的意大利, 后來傳播到法、德、荷等歐陸國(guó)家.,現(xiàn)代意義上使用“統(tǒng)計(jì)學(xué)”一詞的, 是英國(guó)學(xué)者辛克萊, 在其所著The statistical

2、Account of Scotland 1791- 1799一書中.,有著作出版并對(duì)后世統(tǒng)計(jì)學(xué)發(fā)展有重大影響的, 要推英國(guó)學(xué)者格朗特, 他在1662 年發(fā)表的關(guān)于死亡公報(bào)的自然和政治觀察一書, 是關(guān)于描述統(tǒng)計(jì)的開山之作, 有的學(xué)者甚至把此書的出版看作統(tǒng)計(jì)史的起點(diǎn).,1) 古典統(tǒng)計(jì):國(guó)情學(xué).政治算術(shù)1750, 人口統(tǒng)計(jì), 政治算術(shù),威廉佩蒂(W illian Pet ty, 1623- 1687) 是17 世紀(jì)英國(guó)政治經(jīng)濟(jì)學(xué)家,建立“政治算術(shù)”, 即將統(tǒng)計(jì)方法應(yīng)用于廣泛的社會(huì)、經(jīng)濟(jì)問題的分析, 而不是只局限于人口統(tǒng)計(jì)問題. 不依靠抽象的話語和看似靈巧的推理, 一切讓數(shù)字說話, 他的思想受到英國(guó)偉

3、大的科學(xué)-哲學(xué)家培根(Francis Bacon. 1651- 1626) 很大的影響, 培根的實(shí)證科學(xué)思想, 即主張科學(xué)理論應(yīng)以實(shí)際觀察為依據(jù)并接受其檢驗(yàn).,英國(guó)學(xué)者格朗特, 1662 年發(fā)表的關(guān)于死亡公報(bào)的自然和政治觀察一書, 是關(guān)于描述統(tǒng)計(jì)的開山之作.格朗特的工作, 在歐洲大陸也很有影響, 如巴黎在1667 年開始發(fā)布類似于倫敦死亡公報(bào)的材料。這方面的活動(dòng)促成了在一些主要國(guó)家中建立政府統(tǒng)計(jì)部門., 天文觀測(cè),16 世紀(jì)著名的丹麥天文學(xué)家第谷在長(zhǎng)達(dá)25 年的時(shí)間內(nèi)對(duì)一些天體進(jìn)行重復(fù)觀測(cè)以資比較, 由此對(duì)觀測(cè)誤差的量級(jí)獲得了解,所得數(shù)據(jù)成為開普勒(15711630) 日后建立行星運(yùn)動(dòng)定律的基

4、礎(chǔ), 而這又對(duì)牛頓建立其萬有引力的學(xué)說起了極大的作用。不過, 第谷和開普勒都還沒有提及建立隨機(jī)觀測(cè)誤差的概率理論的問題。,但開普勒在1619 年發(fā)表的著作和諧的世界中提出了一些建模的原則, 其中有一條是“模型選擇的最終標(biāo)準(zhǔn)是其與觀察數(shù)據(jù)的符合程度”, 這“符合程度”的提法, 蘊(yùn)含了誤差概率理論的問題。,偉大的天文學(xué)家伽利略(15641642) 是第一個(gè)在其著作中提出隨機(jī)誤差這個(gè)概念, 并對(duì)之有所討論的學(xué)者。他在1632 年出版的著作關(guān)于兩個(gè)主要世界系統(tǒng)的對(duì)話 托雷密和哥白尼中提及這個(gè)問題。他是用“觀測(cè)誤差”這個(gè)名稱。他沒有提出“隨機(jī)”和“分布”這樣的概念, 但他所描述的“觀測(cè)誤差”的性質(zhì), 實(shí)

5、際上即我們現(xiàn)在所理解的隨機(jī)誤差分布, 他提出了以下幾點(diǎn):,1所有觀測(cè)值都可以有誤差, 其來源可歸因于觀測(cè)者、儀器工具以及觀測(cè)條件。,3小誤差出現(xiàn)得比大誤差更頻繁。,2觀測(cè)誤差對(duì)稱地分布在0 的兩側(cè)按: 這當(dāng)然假定已排除系統(tǒng)誤差的情況, 并明確表明他指的是隨機(jī)誤差。,2) 統(tǒng)計(jì)思想與方法的形成17501900,在各實(shí)用領(lǐng)域中的學(xué)者因工作上的需要而分頭發(fā)展了一些分析數(shù)據(jù)的方法,即統(tǒng)計(jì)方法。最主要的有3 個(gè)方面:,天文和測(cè)地學(xué),因誤差分析問題而發(fā)明最小二乘法和正態(tài)誤差分布,地球繞南北極的軸線自轉(zhuǎn), 因離心力的作用, 地球并非一個(gè)正園球, 而是略有橢度.,早在18世紀(jì)初, 通過恒星去確定船的緯度已有了

6、相當(dāng)?shù)木? 但確定經(jīng)度的問題則更困難.,土星和木星都是太陽(yáng)系的大行星, 由于引力而對(duì)各自的運(yùn)動(dòng)軌道產(chǎn)生的影響 ,計(jì)算其軌道是18世紀(jì)中許多天文學(xué)家和數(shù)學(xué)家關(guān)心的問題.,最二乘法在19世紀(jì)初發(fā)明后, 很快得到歐洲一些國(guó)家的天文和測(cè)地學(xué)工作者的廣泛使用, 1837年出版的不列顛百科全書第7版, 收進(jìn)有關(guān)這個(gè)方法的介紹,在電子計(jì)算機(jī)出現(xiàn)以前, 當(dāng)參數(shù)個(gè)數(shù)較大時(shí), 計(jì)算的任務(wù)還是很繁重, 1958年我國(guó)某研究所計(jì)算一個(gè)煉鐵方面的課題, 涉及用最小二乘法解13個(gè)自變量的線性回歸, 三十余人用電動(dòng)計(jì)算機(jī)算, 夜以繼日花了一個(gè)多月的時(shí)間.,勒讓德(1752. 9. 181833. 1. 10) 是法國(guó)大數(shù)

7、學(xué)家, 在數(shù)學(xué)的許多領(lǐng)域,包括橢園積分, 數(shù)論和幾何等方面, 都有重大的貢獻(xiàn)。最小二乘法最先出現(xiàn)在他于1805年發(fā)表的一本題為計(jì)算慧星軌道的新方法的著作的附錄中.美國(guó)統(tǒng)計(jì)學(xué)家斯蒂格勒認(rèn)為最小二乘法之于數(shù)理統(tǒng)計(jì)學(xué), 有如微積分之于數(shù)學(xué).,不少統(tǒng)計(jì)學(xué)著作把最小二乘法的發(fā)明歸功于德國(guó)數(shù)學(xué)家高斯, 但第一個(gè)公開用書面的形式發(fā)表這個(gè)方法的, 是法國(guó)數(shù)學(xué)家勒讓德, 時(shí)間是1805年.,勒讓德的工作沒有涉及最小二乘法的誤差分析問題.,1809 年, 高斯(17771855) 發(fā)表了其數(shù)學(xué)和天體力學(xué)的名著繞日天體運(yùn)動(dòng)的理論.此書寫了一節(jié)有關(guān)“數(shù)據(jù)結(jié)合” 的問題, 實(shí)際涉及的就是這個(gè)誤差分布的確定問題.,高斯這

8、項(xiàng)工作對(duì)后世的影響極大, 它使正態(tài)分布同時(shí)有了“高斯分布”的名稱,正態(tài)分布統(tǒng)治了19 世紀(jì)的統(tǒng)計(jì)學(xué).后世之所以多將最小二乘法的發(fā)明權(quán)歸之于他, 也是出于這一工作.高斯是一個(gè)偉大的數(shù)學(xué)家, 重要的貢獻(xiàn)不勝枚舉.原德國(guó)10 馬克的鈔票上印有高斯的頭像, 其上還印有正態(tài)分布的密度曲線.這充分說明了高斯分布對(duì)人類科學(xué)貢獻(xiàn)影響影響之大.,天文學(xué)家最早關(guān)心使用算術(shù)平均的合理性問題, 并從誤差分布理論的角度來考察這個(gè)問題。誤差理論的基本問題是指隨機(jī)測(cè)量誤差服從怎樣的概率規(guī)律.,辛普森(17101761),拉格朗日(17361813),拉普拉斯(17491827)等著名數(shù)學(xué)家都曾致力于尋找誤差分布的問題, 但

9、進(jìn)展甚微., 人口學(xué),19 世紀(jì)即開始孕育了抽樣調(diào)查的思想.這也在20 世紀(jì)得到發(fā)揚(yáng)光大,成為現(xiàn)今統(tǒng)計(jì)方法中的重要組成部分.,魁特奈特(1796 1874比利時(shí)) 是19 世紀(jì)最有影響的統(tǒng)計(jì)學(xué)家之一. 倡導(dǎo)并身體力行將正態(tài)分布用于連續(xù)性數(shù)據(jù)的分析.他的這一努力使正態(tài)分布在19 世紀(jì)統(tǒng)計(jì)應(yīng)用中大為流行.,拉普拉斯提出“代表性抽樣”,1802 年,拉普拉斯受法國(guó)政府的委托,用其“比例法”,通過抽樣對(duì)法國(guó)人口總數(shù)進(jìn)行估計(jì)提出在國(guó)內(nèi)選擇30 個(gè)左右的地區(qū),要求這些地區(qū)盡可能均勻地分布在國(guó)內(nèi),以使結(jié)果不受局部地區(qū)的特殊性的影響.,凱爾在19 世紀(jì)最后二十余年中領(lǐng)導(dǎo)了挪威關(guān)于全國(guó)人口和農(nóng)業(yè)的普查工作。在這

10、段期間他發(fā)展了“代表性抽樣”的思想.所謂代表性抽樣,是指從總體中抽出的一組可代表該總體(在選定的指標(biāo)上) 的樣本,是一個(gè)“小型化”了的總體。,生物學(xué),特別是遺傳學(xué),英國(guó)學(xué)者高爾頓在1874 到1890 年間的工作,引進(jìn)了相關(guān)和回歸的思想。其重大意義在于它開創(chuàng)了分析多維數(shù)據(jù)的統(tǒng)計(jì)方法。此前的統(tǒng)計(jì)方法都是單指標(biāo)性的,不能顧及指標(biāo)間的相互關(guān)系。而在實(shí)用問題中一般涉及 多個(gè)彼此相依的指標(biāo),孤立地分析單個(gè)指標(biāo)無法得出符合實(shí)際的結(jié)論。高爾頓的工作經(jīng)過埃其渥斯、卡皮爾遜和約爾在數(shù)學(xué)上的整理,到20 世紀(jì)又經(jīng)過費(fèi)歇爾等一批學(xué)者的深化,直到目前仍不失為應(yīng)用統(tǒng)計(jì)方法中的主流方向之一和理論統(tǒng)計(jì)學(xué)中的精華。,3) 統(tǒng)

11、計(jì)學(xué)科理論的形成約19001950,他在英國(guó)一個(gè)農(nóng)業(yè)試驗(yàn)站工作了十多年,從事農(nóng)業(yè)試驗(yàn)及其統(tǒng)計(jì)分析的研究工作.提出了用隨機(jī)的方法分配田間試驗(yàn)小區(qū)的論據(jù)以及進(jìn)行這種試驗(yàn)設(shè)計(jì)的若干原則,其中的“劃分區(qū)組” 與抽樣調(diào)查中的“分層”的思想一致,即在隨機(jī)化的設(shè)計(jì)中融入系統(tǒng)性因子的作用以降低由隨機(jī)化帶來的誤差。,以費(fèi)歇爾,卡皮爾遜,奈曼,歐根皮爾遜和瓦爾德等為代表的統(tǒng)計(jì)學(xué)大師建立了數(shù)理統(tǒng)計(jì)學(xué)理論框架.使數(shù)理統(tǒng)計(jì)學(xué)被承認(rèn)為一門數(shù)學(xué)上嚴(yán)整的學(xué)科,1921 年費(fèi)歇爾發(fā)表了題為“理論統(tǒng)計(jì)學(xué)的數(shù)學(xué)基礎(chǔ)的論”,他一般性地規(guī)定了數(shù)理統(tǒng)計(jì)學(xué)的任務(wù)為模型估計(jì)與抽樣分布,并引進(jìn)了若干諸如相合性等重要概念,自此數(shù)理統(tǒng)計(jì)學(xué)問題有了

12、統(tǒng)一的數(shù)學(xué)提法,可以說費(fèi)歇爾制定的框架的基本精神一直沿用至今.,奈曼在1934 年發(fā)表論文關(guān)于代表性方法的兩個(gè)不同方面: 分層抽樣和目的性抽樣。在此文中奈曼對(duì)目的性抽樣從理論上作了批評(píng),把與分層相結(jié)合的隨機(jī)抽樣建立在一個(gè)嚴(yán)格的理論基礎(chǔ)上,并發(fā)展了一種不依靠貝葉斯假設(shè)的估計(jì)方法,這是他發(fā)展一個(gè)全面的區(qū)間估計(jì)理論的重要一環(huán)。,印度著名統(tǒng)計(jì)學(xué)家馬哈拉諾比斯對(duì)抽樣方法的理論和實(shí)踐也作出過重要的貢獻(xiàn),1937 年奈曼發(fā)表了關(guān)于置信區(qū)間估計(jì)的奠基性論文,這段時(shí)期其中包含了奈曼- 皮爾遜假設(shè)檢驗(yàn)理論的建立。,1950年瓦爾德出版了統(tǒng)計(jì)決策函數(shù)一書, 他把一切數(shù)理統(tǒng)計(jì)問題歸化為一個(gè)數(shù)學(xué)優(yōu)化問題,這一思想起源于

13、奈曼- 皮爾遜關(guān)于假設(shè)檢驗(yàn)的理論,而瓦爾德將其推廣到其他領(lǐng)域.瓦爾德的思想對(duì)1950 年以后的數(shù)理統(tǒng)計(jì)學(xué)發(fā)展起了不小的影響,且他提出的損失函數(shù)的概念溝通了統(tǒng)計(jì)方法與經(jīng)濟(jì)決策的聯(lián)系,自30 年代以來,抽樣調(diào)查方法受到包括美國(guó)在內(nèi)的一些國(guó)家的重視,其應(yīng)用也變得經(jīng)常。戰(zhàn)后建立的聯(lián)合國(guó),也于1947 年在其統(tǒng)計(jì)司中建立了一個(gè)抽樣分委員會(huì),發(fā)布過一些指導(dǎo)性文件,對(duì)抽樣調(diào)查方法在全球的應(yīng)用和推廣起了很大的作用,4) 統(tǒng)計(jì)理論的深化與應(yīng)用1950,這個(gè)時(shí)期也是數(shù)理統(tǒng)計(jì)學(xué)走向高度數(shù)學(xué)化的時(shí)期,數(shù)理統(tǒng)計(jì)學(xué)研究?jī)?nèi)容中純數(shù)學(xué)性的內(nèi)生性問題的比重大為增加.,把數(shù)理統(tǒng)計(jì)學(xué)比喻為一個(gè)建筑物,則這個(gè)時(shí)期的成就在于其內(nèi)部裝修

14、一些重要的理論和方法,如極大似然估計(jì)在此前只有一個(gè)粗糙的形態(tài),在這個(gè)時(shí)期達(dá)到數(shù)學(xué)上的嚴(yán)格化,參數(shù)估計(jì)和非參數(shù)統(tǒng)計(jì)的精細(xì)發(fā)展也到這個(gè)時(shí)期才完成.截尾數(shù)據(jù)的可靠性分析與生存分析包括時(shí)間序列分析在內(nèi)的隨機(jī)過程統(tǒng)計(jì)和貝葉斯統(tǒng)計(jì)等理論的重大進(jìn)展也產(chǎn)生,這個(gè)時(shí)期,另外社會(huì)經(jīng)濟(jì)的發(fā)展推動(dòng)了統(tǒng)計(jì)學(xué)在各領(lǐng)域的廣泛應(yīng)用,而計(jì)算機(jī)的發(fā)明及其普遍應(yīng)用使許多需要大量繁雜的計(jì)算的統(tǒng)計(jì)方法的使用成為可能這些又反過來推動(dòng)了數(shù)理統(tǒng)計(jì)學(xué)中新問題的提出和研究,2. 數(shù)理統(tǒng)計(jì)的應(yīng)用,大量的原始數(shù)據(jù)如果不經(jīng)過有其目的的整理、分類、排比、分析, 并通過適當(dāng)?shù)男问奖硎境鰜? 就好比一堆沒有經(jīng)過冶煉的礦物, 沒有什么用處.,在生產(chǎn)實(shí)踐和科學(xué)

15、實(shí)驗(yàn)中,經(jīng)常會(huì)遇到大量的各種不同類型的數(shù)據(jù).這些數(shù)據(jù)為我們提供了很有用的信息,它可以幫助我們認(rèn)識(shí)事物的內(nèi)在規(guī)律、研究事物之間的關(guān)系、預(yù)測(cè)事物的可能發(fā)展,是指導(dǎo)生產(chǎn)實(shí)踐和科學(xué)實(shí)驗(yàn)的重要依據(jù).,原始數(shù)據(jù)中有用的信息并非一目了然,而是蘊(yùn)藏在大量的數(shù)據(jù)之中,要想從這大量的數(shù)據(jù)中找到有用的信息,必須對(duì)數(shù)據(jù)進(jìn)行分析整理,去偽存真、去粗取精、由表及里、抓住主要矛盾,盡可能充分地、正確地從數(shù)據(jù)中提取出有用的信息,數(shù)理統(tǒng)計(jì)學(xué)為我們分析、處理數(shù)據(jù)提供了許多有用的統(tǒng)計(jì)方法.,數(shù)理統(tǒng)計(jì)學(xué)是“收集和分析帶隨機(jī)性的數(shù)據(jù)的科學(xué) 和藝術(shù)”,觀測(cè)得到的數(shù)據(jù)難免存在誤差,如實(shí)驗(yàn)誤差(隨機(jī)誤差,系統(tǒng)誤差,過失誤差), 對(duì)數(shù)據(jù)分析處

16、理時(shí),也會(huì)產(chǎn)生一些計(jì)算誤差(截?cái)嗾`差, 舍入誤差).因誤差的普遍存在,我們有必要對(duì)誤差及含有誤差的數(shù)據(jù)處理問題進(jìn)行研究。,用統(tǒng)計(jì)方法解決實(shí)際問題時(shí),首先要建立它的統(tǒng)計(jì)數(shù)學(xué)模型,也就是要把這個(gè)具體問題經(jīng)過抽象化簡(jiǎn),建立有關(guān)量應(yīng)滿足的統(tǒng)計(jì)關(guān)系式即制定描述這些量的統(tǒng)計(jì)數(shù)學(xué)模型。,系 統(tǒng),1) 系統(tǒng)參數(shù)辨識(shí): 參數(shù)估計(jì),假設(shè)檢驗(yàn),3) 系統(tǒng)輸入輸出相關(guān)分析:多元相關(guān)分析,4) 決策分析:多元統(tǒng)計(jì)分析,判別分析,5) 散亂數(shù)據(jù)分析:統(tǒng)計(jì)規(guī)律的挖掘,2) 系統(tǒng)影響分析:方差分析,正交試驗(yàn)設(shè)計(jì),3.本課程學(xué)習(xí)內(nèi)容,第一章 抽樣分布 第二章 參數(shù)估計(jì) 第三章 假設(shè)檢驗(yàn) 第四章 方差分析 第五章 正交試驗(yàn)設(shè)計(jì),第一部分: 數(shù)理統(tǒng)計(jì)基礎(chǔ),第六章 線性回歸分析 第七章 主成分分析 典型相關(guān)分析 第八章 因子分析,第二部分:多元線性統(tǒng)計(jì)模型,第九章 判別分析 第十章 聚類分析,第三部分: 統(tǒng)計(jì)模式識(shí)別方法,4. 成績(jī)?cè)u(píng)定方

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論