




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、數(shù)理統(tǒng)計在化學中的應用 數(shù)理統(tǒng)計方法在化學中的應用數(shù)理統(tǒng)計方法在化學中的應用 李振華 復旦大學化學系表面化學實驗室 李振華制造 講義 nhttp:/ m 李振華制造 緒論緒論 n統(tǒng)計方法是一種用于收集、表示、分析和解釋通過 觀察和實驗而得到的基本數(shù)據(jù)的方法,是人類認識 自然和社會的重要手段。 上海股票市場收益率分布模型統(tǒng)計研究 在運用正態(tài)分布假設的GARCH模型來描述金融收益序列的條件分布時,正態(tài)分布假 設常常被拒絕,人們用一些具有尖峰、厚尾特性的分布,如t分布、GED分 布 來替代正態(tài)分布假設,從而得到一系列GARCH模型的擴展形式,如GARCH-t 模型、GARCH-GED模型等。本文依據(jù)
2、嚴密的統(tǒng)計分析方法選擇了 GARCH- t(1,1)模型描述上證綜指對數(shù)收益率序列的分布。最后,根據(jù)各項模型檢驗結(jié)果 說明,用GARCH-t(1,1)模型描述上證綜指收益率序 列是有充分理由的。 統(tǒng)計定價模型與股票投資決策2007年 第15期 ,作者: 高祥寶, 閆惠敏 數(shù)理統(tǒng)計在化學中的應用3 李振華制造 韓寒代筆之爭 /448946/3.html 首先從邏輯角度講,方舟子應該證明 P( A | F) 大于一個很大的值如95% 。這里 A是方的假 設, 比如 “三重門是韓父寫的”F是所有可觀測的客觀事實的集合。這里方可以用兩種 方法去證明P(A|F) 9
3、5%. 第一種是找到一些列的獨立證據(jù)F1,F2, F3每一個證據(jù) P(A|Fi) 都很大,比如他能找到證人證明什么時間,什么地點由什么證人看到了聽說了韓父代 寫,或者手稿上的字跡能證明是韓父的。這些都是硬的證據(jù),方?jīng)]有。這沒有關(guān)系,方可以采 用另外一種方法證明,那就是對于某一個事實Fk, 如果 P( Fk|a ) 很小,這里a是A的補集。(也 就是a =”三重門是韓寒自己寫的“)那么通過貝耶斯公式反推P( A | F),如果P( Fk|a )足夠小 ,那么P( A | F)是可以大于95%的。這種也是方一直在采用的方法,但使用這種方法的問題 在于,根據(jù)公式,P ( A | F) = P(AF)
4、/P(F) = ( P(F1|A)*P(F2|A)*P(Fn|A)*P(A) ) / (P(F1|A)*P(F2|A)*P(Fn|A)*P(A) + (P(F1|a)*P(F2|a)*P(Fn|a)*P(a) )也就是說,如果F由很多n 個獨立的事實組成,那么,你如果只找到了個很小的P( Fk|a )是不能推斷P( A | F)很大的。也 就是說,如果這里有100萬個事實,你找到了100個 令人質(zhì)疑的事實 根本沒用,除非你的那些 令人質(zhì)疑的事實的概率極其小 。 這也就是我們金融領(lǐng)域常說的金融領(lǐng)域常說的data mining. 也就是,在同一個sample里不停的用各種方法去 找股票的規(guī)律,最后
5、你總能找到“一些”的規(guī)律,比如,“每個月的第一天股價總是上升的” 之類的。你用統(tǒng)計方法做假設檢驗, t-value都好高,但是沒用,因為你是先看到了Sample再做 的檢驗。同理,方舟子把韓寒的資料不停的翻,不停的找,總能找出點什么異常的,但是這根 本無法證明什么。除非方舟子可以做 out of sample test. 比如,方舟子用他的假設來推斷一些事 實存在于他還沒看過的/不知道的韓寒的書,資料,或者事件,那才能算得上證據(jù)。不然的話 ,今天證明這個,明天證明那個,不過就是一個不過就是一個data mining 的游戲而已的游戲而已。 李振華制造 韓寒代筆之爭 http:/ 【例四】假設有
6、一個要證明韓寒作品有代筆的實驗。 零假設:韓寒作品沒有代筆 備擇假設:韓寒作品 有代筆 選擇顯著性水平=?(且預設檢驗力1-= ?) 選擇樣本、收集數(shù)據(jù),計算p值。 若p,則無法拒絕 零假設。 李振華制造 紅樓夢前80回與后40回作者之爭 n早在 1980 年,在美國威斯康星大學召開的“首屆 國際紅樓夢研討會”上,該校華裔學者陳炳藻 教授首次報告了他在這方面的研究工作(見 4 , 5 ),此后還出版了專著(見 6 )。陳教授將 紅樓夢 120 回分為三組,每組 40 回,并將兒 女英雄傳作為對照組進行比較研究。他從每組中 任取 8 萬字,挑出名詞、動詞、形容詞、副詞、虛 詞這 5 種詞,然后運
7、用統(tǒng)計學方法算出各組之間用 詞的相關(guān)程度,結(jié)果發(fā)現(xiàn):紅樓夢前 80 回 與后 40 回所用詞匯的相關(guān)程度遠遠超過紅樓夢 與兒女英雄傳所用詞匯的相關(guān)程度,并由此 推斷:前 80 回與后 40 回均為曹雪芹一人所作。 李振華制造 紅樓夢前80回與后40回作者之爭 n但是,我國華東師范大學陳大康教授得出了迥異的結(jié)論 (1987 , 7) 。他也把紅樓夢 120 回分成三組,每組 40 回,并統(tǒng)計了其中所含詞、字、句等 88 個項目。他發(fā)現(xiàn), 這些詞在前兩組出現(xiàn)的規(guī)律相同,而與后 40 回卻不一致; 關(guān)于用字特點和句式規(guī)律,前兩組也是驚人的吻合,而后 40 回則迥異。由此推斷:后 40 回非曹雪芹所作
8、(但含有少 量殘稿) n本文以數(shù)據(jù)分析為基礎(chǔ),以統(tǒng)計學中“兩個獨立二項總體 的等價性檢驗”為基本方法,很清楚明確地證明:紅樓 夢前 80 回與后 40 回在飲食與花卉的描寫上確實存在非 常顯著的差異;在樹木的描寫上也存在明顯差異。不過, 這種差異還不能說明紅樓夢前 80 回與后 40 回出自不 同的作者。 李振華制造 數(shù)理統(tǒng)計在化學中的應用 n統(tǒng)計學是“對令人困惑費解的問題做出 數(shù)字設想的藝術(shù)?!?-美國David Freedman n統(tǒng)計學是一門處理數(shù)據(jù)中變異性的科學 和藝術(shù)。 -John M.LastA Dictionary of Epidemiology 科學與藝術(shù)的不同在于不同的人處理
9、相同的問題可能得到不同的結(jié)果 李振華制造 數(shù)理統(tǒng)計在化學中的應用 實驗化學的基礎(chǔ)是測量 n實驗化學學科作為一門實驗科學,一直被認為是有 著很大欠缺的,那就是欠缺嚴格性、邏輯性以及精 確性的理論。 n測量具有隨機可變性、不確定性、模糊性。統(tǒng)計學 可解決前兩種問題. 李振華制造 數(shù)理統(tǒng)計在化學中的應用 測量的重要性 n在美國芝加哥大學社會科學研究館的正面,刻有這 樣一段銘文:“假若你不能測量,你的知識就是貧 乏和不能令人滿意的?!?n實際上,這句話還應該這樣來補充:“假如你只懂 得測量,那么你對世界的認識將是可憐的?!?李振華制造 數(shù)理統(tǒng)計在化學中的應用 不能片面強調(diào)測量的精確性 n長期以來,我們
10、已習慣于把科學知識看成是許多確 實無誤的陳述的集合,化學中同樣也是這樣,充斥 著決定論。 n片面地追求所謂精確性,其結(jié)果只能是將認識過程 中的某一部分加以近似化、簡單化,最終常會走向 形而上學,乃至神秘主義。 李振華制造 數(shù)理統(tǒng)計在化學中的應用 二二.統(tǒng)計學的歷史及作用統(tǒng)計學的歷史及作用 n 統(tǒng)計學的歷史一般認為開始于十七世紀中葉,最 初的統(tǒng)計學出現(xiàn)在德國和英國,被稱為古典統(tǒng)計學 。統(tǒng)計學的發(fā)展史上曾形成過記述學派、政治算術(shù) 學派、數(shù)理學派這三個主要學派。十九世紀中葉, 數(shù)理學派的代表人物比利時科學家凱特勒(L.A.J. Quetelet)將概率論正式引進到統(tǒng)計學中之后,也 就開始了數(shù)理統(tǒng)計學
11、的發(fā)展時期。 李振華制造 數(shù)理統(tǒng)計在化學中的應用 數(shù)理統(tǒng)計在科學研究中得到了極其廣泛的應用數(shù)理統(tǒng)計在科學研究中得到了極其廣泛的應用 n主要地是由于以下幾個原因: 1. 窺一斑而知全豹:窺一斑而知全豹:科學實驗的研究對象具體地只能是 極小一部分樣品,研究的最后結(jié)果也只能是從這一小 部分樣品的研究結(jié)果出發(fā)來作出統(tǒng)計推斷,也就是運 用數(shù)理統(tǒng)計方法推斷出研究對象的全體來。 2. 歸納規(guī)律:歸納規(guī)律:科學實驗中不可避免地會存在著大量隨機 誤差的問題,要從這些隨機現(xiàn)象中去得出準確可靠的 研究結(jié)果,這只能依賴于數(shù)理統(tǒng)計的方法和原理。 3. 優(yōu)化和試驗設計:優(yōu)化和試驗設計:科學實驗經(jīng)常要進行各種條件試驗 ,諸
12、如合成路線、配方設計、工藝條件、壽命試驗等 等,這就需要運用統(tǒng)計的原理和方法來進行優(yōu)化和實 驗設計。 李振華制造 數(shù)理統(tǒng)計在化學中的應用 數(shù)理統(tǒng)計在科學研究中得到了極其廣泛的應用數(shù)理統(tǒng)計在科學研究中得到了極其廣泛的應用 4. 函數(shù)關(guān)系:函數(shù)關(guān)系:科學實驗中總要研究各個變量之 間的關(guān)系,并進而進行科學的預測和推斷, 而這些是離不開數(shù)理統(tǒng)計方法的應用的。 5. 數(shù)據(jù)處理:數(shù)據(jù)處理:隨著現(xiàn)代科學研究的發(fā)展,各種 測量儀器的計算機化給我們帶來了“數(shù)據(jù)爆 炸”,如何來處理這些大量的數(shù)據(jù),并要能 從這些數(shù)據(jù)中獲取更多的甚至意想不到的信 息,只有數(shù)學和統(tǒng)計學技術(shù)才能給我們以可 靠的保證。 李振華制造 數(shù)理統(tǒng)
13、計在化學中的應用 三三.統(tǒng)計方法在化學中應用的意義統(tǒng)計方法在化學中應用的意義 n應該說化學這一學科基本上還是一門實驗學科,因 此化學工作者掌握數(shù)理統(tǒng)計的原理及其應用的必要 性和實際意義也就顯得尤為重要。只有正確地運用 數(shù)理統(tǒng)計方法,才能夠幫助我們在化學實驗中,從 表面雜亂無章的現(xiàn)象里去尋找出有意義的統(tǒng)計結(jié)論 來;才能使我們能更有成效地進行各門化學領(lǐng)域中 的科學研究,確??茖W研究取得可靠、準確的結(jié)果 并進而得以發(fā)現(xiàn)客觀規(guī)律;才能使我們從大量的實 驗數(shù)據(jù)、實驗資料中去揭示和獲取更多的化學信息 。 李振華制造 數(shù)理統(tǒng)計在化學中的應用 第一章第一章 隨機變量和分布函數(shù)隨機變量和分布函數(shù) 第一節(jié) 幾個基
14、本的統(tǒng)計學概念 1-1 總體和樣本 1-2 隨機現(xiàn)象 1-3 隨機變量 離散型隨機變量 連續(xù)型隨機變量 李振華制造 數(shù)理統(tǒng)計在化學中的應用 第一章第一章 第一節(jié)第一節(jié) $1.1 總體和樣本 n總體:滿足指定條件的眾多數(shù)據(jù) 的集合 n有限總體 n無限總體 n樣本:從總體中抽取一部分實測 的個體或單位的集合 n容量:樣本中含有個體的數(shù)目 n樣品:組成樣本的每一單位或 個體 樣本樣本 總體總體 樣品樣品 李振華制造 數(shù)理統(tǒng)計在化學中的應用 第一章第一章 第一節(jié)第一節(jié) $1.1.1 必然事件與隨機事件 必然事件:滿足一定條件后一定發(fā)生或一定不 發(fā)生的事件 隨機事件:滿足一定條件后不一定發(fā)生的事件 李振
15、華制造 數(shù)理統(tǒng)計在化學中的應用 $1.1.2頻率和概率(幾率)頻率和概率(幾率) 頻率:頻率: ( ) ( ) ( ) A A nf A f A Nf A 概率:概率: lim A N n P N 0 P 1 必然事件: P = 1 不可能事件:P = 0 李振華制造 數(shù)理統(tǒng)計在化學中的應用 Table 硬幣投擲實驗 李振華制造 數(shù)理統(tǒng)計在化學中的應用 第一章第一章 第一節(jié)第一節(jié) $1.1.3 隨機變量 實驗中所可能出現(xiàn)的結(jié)果的量(X)。 n離散型隨機變量 隨機變量的取值僅僅是有限個,或是可列的 無窮多個。 n連續(xù)型隨機變量 隨機變量的取值是充滿某一區(qū)間的,并且落 在任一區(qū)間的
16、概率也是確定的。 n隨機變量所取的數(shù)值:x 李振華制造 $1.2 分布函數(shù) 第二節(jié) 分布函數(shù) $1.2.1 分布函數(shù)的定義、類型和性質(zhì) $1.2.2 概率密度函數(shù) 數(shù)理統(tǒng)計在化學中的應用 李振華制造 $1.2 $1.2 分布函數(shù)分布函數(shù) $1.2.1 分布函數(shù)的定義、類型和性質(zhì)分布函數(shù)的定義、類型和性質(zhì) n累積分布函數(shù)累積分布函數(shù)(Cumulative Distribution Function, CDF): 設設x是一任意實數(shù)或事件,是一任意實數(shù)或事件,X取得小等于取得小等于x的數(shù)值,的數(shù)值, 的概率為的概率為P(X x), F(x) (= P(X x) )就稱為隨機變量就稱為隨機變量X 的
17、的累積分布函數(shù)累積分布函數(shù),記為:,記為: F(x) = P(X x) 數(shù)理統(tǒng)計在化學中的應用 李振華制造 $1.2 $1.2 分布函數(shù)分布函數(shù) $1.2.1 分布函數(shù)的定義、類型和性質(zhì)分布函數(shù)的定義、類型和性質(zhì) 對于任意實數(shù)對于任意實數(shù)x1, x2, 且且x1 x1時,時,F(xiàn)(x2) F(x1) F(x)為右連續(xù)為右連續(xù) 李振華制造 $1.2 $1.2 分布函數(shù)分布函數(shù) $1.2.2 概率密度分布函數(shù)(Probability Density Function, PDF) 對于一維連續(xù)實隨機變量x,任何一個滿足下列條件 的函數(shù)f(x)都可以被定義為其概率密度函數(shù): 數(shù)理統(tǒng)計在化學中的應用 (
18、)0, ( )1 f xx f x dx ( )()( ) x F xP Xxf x dx 顯然顯然 ( ) ( ) dF x f x dx 李振華制造 $1.2.3 $1.2.3 概率質(zhì)量函數(shù)概率質(zhì)量函數(shù) n概率質(zhì)量函數(shù)(Probability Mass Function, PMF): 是離散隨機變量在各特定取值上的概率 概率質(zhì)量函數(shù)和概率密度函數(shù)不同之處在于:概率密 度函數(shù)是對連續(xù)隨機變量定義的,本身不是概率,只 有對連續(xù)隨機變量的取值進行積分后才是概率。 離散隨機變量概率質(zhì)量函數(shù)的不連續(xù)性決定了其累積 分布函數(shù)也不連續(xù)。 數(shù)理統(tǒng)計在化學中的應用 李振華制造 $1.2.4 $1.2.4 平
19、均值,期望值,偏差,方差平均值,期望值,偏差,方差 n 均值,期望值均值,期望值 平均值 數(shù)理統(tǒng)計在化學中的應用 / i Xx n X的期望值的期望值(expectation value),有時用,有時用 來表示來表示 () ii E XPx 如果如果x是連續(xù)型隨機變量:是連續(xù)型隨機變量: ()( )E Xf x xdx 李振華制造 $1.2.3 $1.2.3 量度數(shù)據(jù)離散程度量度數(shù)據(jù)離散程度(dispersion)(dispersion)的統(tǒng)計量的統(tǒng)計量 n 極差極差 一組數(shù)據(jù)中最大值和最小值之差 數(shù)理統(tǒng)計在化學中的應用 maxmin RXX n 平均絕對偏差平均絕對偏差 1 1 n i i
20、 dXX n n 方差方差(Variance) 樣本方差樣本方差2 2 1 1 1 n i i SXX n 李振華制造 $1.2.3 量度數(shù)據(jù)離散程度的統(tǒng)計量 n方差(Variance) 總體方差 數(shù)理統(tǒng)計在化學中的應用 2 22 1 1 () n i i E SX n n標準差(Standard Deviation) =標準差方差 2 = SS 2, 樣本標準差 ,總體標準差 n相對標準差(Relative Standard Deviation) Rel = /SS X 樣本方差 S2 是對總 體方差2的無偏估計 李振華制造 $1.2.3 $1.2.3 量度數(shù)據(jù)離散程度的統(tǒng)計量量度數(shù)據(jù)離散程
21、度的統(tǒng)計量 n連續(xù)性隨機變量的標準差連續(xù)性隨機變量的標準差 數(shù)理統(tǒng)計在化學中的應用 2 ( )xf x dx 李振華制造 數(shù)理統(tǒng)計在化學中的應用 $1.3 化學中常用的分布函數(shù)化學中常用的分布函數(shù) $1.3.1 二項式分布二項式分布 $1.3.2 泊松分布泊松分布 $1.3.3 麥克斯威爾分布麥克斯威爾分布 李振華制造 $1.3.1 二項式分布 每次試驗只有兩種可能結(jié)果而不受以前試驗結(jié)果影響 的分布。其中一種事件的概率p,另一種的概率q(1- q)。 如果在n次獨立試驗下,求A出現(xiàn)次數(shù)x的概率分布, 這一分布的概率質(zhì)量函數(shù)即為: P(x) = Cnx px qn-x (x = 0,1,2 n,
22、0p1 ) 這個概率函數(shù)給出的分布就叫做二項式分布,即二項 式(p+q)n的展開式。二項分布常用于軍事射擊和工業(yè) 檢查中,在化學中可用于計算質(zhì)譜中同位素峰的強度 比以及根據(jù)塔板理論推導氣液色譜的流出曲線。 數(shù)理統(tǒng)計在化學中的應用 李振華制造 二項式分布 數(shù)理統(tǒng)計在化學中的應用 李振華制造 例1-2色譜的塔板理論 1在柱內(nèi)一小段高度內(nèi)組分分配瞬間達平 衡(H理論塔板高度) 2載氣非連續(xù)而是間歇式(脈動式)進入 色譜柱,每次進氣一個塔板體積 3樣品和載氣均加在第0號塔板上,且忽 略樣品沿柱方向的縱向擴散 4分配系數(shù)在各塔板上是常數(shù) 根據(jù)塔板理論,待分離組分流出色譜柱 時的濃度沿時間呈現(xiàn)二項式分布,
23、當色 譜柱的塔板數(shù)很高的時候,二項式分布 趨于正態(tài)分布。 楊世鉞, 色譜法溶質(zhì)以 二項式展開分布的簡明 推導, 化學通報, 1989, 02, 47-49. 李振華制造 例例1-3 有一化學藥品的混合過程在正常情況下會有有一化學藥品的混合過程在正常情況下會有10%的可能混合不的可能混合不 合格,今在一批藥品中抽驗合格,今在一批藥品中抽驗8個樣品,發(fā)現(xiàn)有個樣品,發(fā)現(xiàn)有2個不合要求,檢個不合要求,檢 驗員欲拒收整批藥品,試問這一決定是否正確?驗員欲拒收整批藥品,試問這一決定是否正確? 數(shù)理統(tǒng)計在化學中的應用 解:解: P(x=2) = Cnx px qn-x = C82 0.12 0.910-2
24、= 0.149 計算表明,在總體合不格率為計算表明,在總體合不格率為10%的情況下抽檢出兩個不合格的情況下抽檢出兩個不合格 的概率為的概率為14.9%,因此不應拒收這批藥品。,因此不應拒收這批藥品。 李振華制造 數(shù)理統(tǒng)計在化學中的應用 $1.3.2 泊松分布泊松分布 當某事件出現(xiàn)的概率很低當某事件出現(xiàn)的概率很低(P1)時,二項分布就成為泊松分布。由法國數(shù)學家時,二項分布就成為泊松分布。由法國數(shù)學家 Poisson于于1838年發(fā)表。年發(fā)表。 泊松分布適合于描述單位時間內(nèi)隨機事件發(fā)生的次數(shù)泊松分布適合于描述單位時間內(nèi)隨機事件發(fā)生的次數(shù) 。如某一服務設施在一定時間內(nèi)到達的人數(shù),電話交。如某一服務設
25、施在一定時間內(nèi)到達的人數(shù),電話交 換機接到呼叫的次數(shù),汽車站臺的候客人數(shù),機器出換機接到呼叫的次數(shù),汽車站臺的候客人數(shù),機器出 現(xiàn)的故障數(shù),自然災害發(fā)生的次數(shù)等等?,F(xiàn)的故障數(shù),自然災害發(fā)生的次數(shù)等等。 李振華制造 泊松分布泊松分布 n泊松分布的概率質(zhì)量函數(shù)為:泊松分布的概率質(zhì)量函數(shù)為: (x = 0,1,2, 為參數(shù))為參數(shù)) : 單位時間單位時間(或單位面積或單位面積)內(nèi)隨機事件的平均發(fā)生數(shù)內(nèi)隨機事件的平均發(fā)生數(shù) n性質(zhì):性質(zhì): x的期望值等于方差即:的期望值等于方差即: = = 2: 數(shù)理統(tǒng)計在化學中的應用 () ! x P Xxe x 李振華制造 數(shù)理統(tǒng)計在化學中的應用 0 0.1 0.
26、2 0.3 0.4 051015x P =1 =2 =3 = 6 PMFCDF 李振華制造 數(shù)理統(tǒng)計在化學中的應用 例例1-4 400ml微生物溶液中含微生物的濃度是微生物溶液中含微生物的濃度是 0.5只只/毫升,抽出毫升,抽出1毫升,其中所含微生物的毫升,其中所含微生物的 只數(shù)只數(shù)x服從什么分布?含服從什么分布?含3只及只及3只以上微生物只以上微生物 的可能性有多少?的可能性有多少? 解:溶液中總共有微生物解:溶液中總共有微生物n = 0.5400 = 200只,只, 每一只微生物落入抽檢的每一只微生物落入抽檢的1毫升溶液中的概率毫升溶液中的概率 p = 1/400,不落入的概率,不落入的概
27、率q = 399/400。如看。如看 有幾只微生物落入抽檢的有幾只微生物落入抽檢的1毫升溶液中就相當毫升溶液中就相當 于一個于一個n = 200時的獨立試驗模型,所以時的獨立試驗模型,所以x服服 從二項分布。從二項分布。 李振華制造 數(shù)理統(tǒng)計在化學中的應用 由于由于 = np = 0.5比較小,可以用泊松分布來近似計算比較小,可以用泊松分布來近似計算 。 P(n3) = 1 - P(n3) = 1 - P(n=0) - P(n=1) - P(n=2) = 1 e-0.5 0.5e-0.5 0.52e-0.5 /2 = 1 - 0.6065 - 0.3033 - 0.0758 = 0.0144
28、因為概率很小,在因為概率很小,在0.5只只/毫升條件下,抽檢毫升條件下,抽檢1毫升是不毫升是不 大可能發(fā)現(xiàn)大可能發(fā)現(xiàn)3只或只或3只以上的。如真抽到,就說明并不只以上的。如真抽到,就說明并不 是這個濃度,而是大大超過了是這個濃度,而是大大超過了. () ! x P Xxe x 李振華制造 數(shù)理統(tǒng)計在化學中的應用 $1.3.3 麥克斯威爾分布麥克斯威爾分布 n直角坐標下速度的概率密度分布直角坐標下速度的概率密度分布 222 B 3/2() 2 B ( ) 2 xyz m vvv k T xyz m f v dv dv dve k T n球坐標下速度的概率密度分布球坐標下速度的概率密度分布 2 B
29、3/2 22 B ( )sin 2 mv k T m f v dvd dev k T n速率的概率密度分布速率的概率密度分布 2 B 3/2 22 B ( )4 2 mv k T m f v dvev k T 李振華制造 數(shù)理統(tǒng)計在化學中的應用 n第二章第二章 正態(tài)分布正態(tài)分布 n$2.1 頻率和概率頻率和概率 李振華制造 數(shù)理統(tǒng)計在化學中的應用 李振華制造 數(shù)理統(tǒng)計在化學中的應用 李振華制造 數(shù)理統(tǒng)計在化學中的應用 圖圖2-1 測量數(shù)據(jù)的頻率密度直方圖。測量數(shù)據(jù)的頻率密度直方圖。 李振華制造 數(shù)理統(tǒng)計在化學中的應用 圖圖2-1 頻率密度分布逐漸接近正態(tài)分布示意頻率密度分布逐漸接近正態(tài)分布示意
30、 李振華制造 數(shù)理統(tǒng)計在化學中的應用 $2.2 正態(tài)分布(正態(tài)分布( 高斯分布)與正態(tài)曲線高斯分布)與正態(tài)曲線 假設在一定條件下,對某一個量假設在一定條件下,對某一個量x進行無限多次進行無限多次 重復的等精度測量,得到一系列數(shù)據(jù)重復的等精度測量,得到一系列數(shù)據(jù)x1,x2, xn, 則各測量值的頻數(shù)密度分布將會從鋸齒形圖(見直方則各測量值的頻數(shù)密度分布將會從鋸齒形圖(見直方 形圖)轉(zhuǎn)變成為一條平滑的曲線,該曲線的分布就稱形圖)轉(zhuǎn)變成為一條平滑的曲線,該曲線的分布就稱 為正態(tài)分布。因為正態(tài)分布。因為隨機誤差是服從正態(tài)分布的,所以為隨機誤差是服從正態(tài)分布的,所以 正態(tài)分布又常稱為(隨機)誤差分布。正
31、態(tài)分布又常稱為(隨機)誤差分布。 李振華制造 數(shù)理統(tǒng)計在化學中的應用 正態(tài)分布的歷史正態(tài)分布的歷史 正態(tài)分布最早是棣莫佛在正態(tài)分布最早是棣莫佛在1734年發(fā)表的一篇關(guān)于二項分布年發(fā)表的一篇關(guān)于二項分布 文章中提出的。拉普拉斯在文章中提出的。拉普拉斯在1812年發(fā)表的年發(fā)表的分析概率論分析概率論中中 對棣莫佛的結(jié)論作了擴展?,F(xiàn)在這一結(jié)論通常被稱為棣莫佛對棣莫佛的結(jié)論作了擴展?,F(xiàn)在這一結(jié)論通常被稱為棣莫佛 拉普拉斯定理。拉普拉斯定理。 拉普拉斯在誤差分析試驗中使用了正態(tài)分布。勒讓德于拉普拉斯在誤差分析試驗中使用了正態(tài)分布。勒讓德于 1805年引入最小二乘法這一重要方法;而高斯則宣稱他早在年引入最小
32、二乘法這一重要方法;而高斯則宣稱他早在 1794年就使用了該方法,并通過假設誤差服從正態(tài)分布給出年就使用了該方法,并通過假設誤差服從正態(tài)分布給出 了嚴格的證明。了嚴格的證明。 正態(tài)分布這個名字還被正態(tài)分布這個名字還被Charles S. Peirce, Francis Galton, Wilhelm Lexis在在1875分別獨立的使用。這個術(shù)語是不幸的,分別獨立的使用。這個術(shù)語是不幸的, 因為它反應和鼓勵了一種謬誤,即很多概率分布都是正態(tài)的因為它反應和鼓勵了一種謬誤,即很多概率分布都是正態(tài)的 。 這個分布被稱為這個分布被稱為“正態(tài)正態(tài)”或者或者“高斯高斯”正好是正好是Stigler名字名字
33、由來法則的一個例子,這個法則說由來法則的一個例子,這個法則說“沒有科學發(fā)現(xiàn)是以它最沒有科學發(fā)現(xiàn)是以它最 初的發(fā)現(xiàn)者命名的初的發(fā)現(xiàn)者命名的”。 李振華制造 數(shù)理統(tǒng)計在化學中的應用 中心極限定理中心極限定理 數(shù)學家們對正態(tài)分布曲線做了將近有數(shù)學家們對正態(tài)分布曲線做了將近有300年的研究,年的研究, 證明了當每次測量都受到很多微小隨機因素的影響時證明了當每次測量都受到很多微小隨機因素的影響時 ,測量的總誤差就具有正態(tài)分布,當然對于這種斷定,測量的總誤差就具有正態(tài)分布,當然對于這種斷定 不應在沒有證據(jù)的情況下就予以接受。不應在沒有證據(jù)的情況下就予以接受。 統(tǒng)計學告訴我們,只要測量的次數(shù)統(tǒng)計學告訴我們,
34、只要測量的次數(shù)n足夠多,樣本平足夠多,樣本平 均值的分布總可均值的分布總可服從正態(tài)分布,而不論它原來是什么服從正態(tài)分布,而不論它原來是什么 分布。這就是分布。這就是中心極限定理中心極限定理。 中心極限定理的重要意義在于,根據(jù)這一定理的結(jié)論中心極限定理的重要意義在于,根據(jù)這一定理的結(jié)論 ,其他概率分布可以用正態(tài)分布作為近似。,其他概率分布可以用正態(tài)分布作為近似。 二項式二項式泊松泊松 李振華制造 數(shù)理統(tǒng)計在化學中的應用 智商分布曲線 IQ test: http:/www.iqtest.dk/main.swf 李振華制造 IQ nRichard Herrnstein and Charles Mur
35、ray The Bell Curve (1994) 智商70%左右來源于遺傳,和環(huán)境關(guān)系不大 nLeon J. Kamin (1927-) Now: Indiana University Chairman (1968): Department of Psychology at Princeton University The Science and Politics of IQ (1974) 李振華制造 IQ and Race nIn his 2006 book Race Differences in Intelligence Lynn adopted the ten-category cla
36、ssification scheme of human genetic variation introduced in The History and Geography of Human Genes by Luigi Cavalli-Sforza and colleagues. Lynn argues that mean IQ varies by genetic clusters, or race. According to his calculations, the East Asian cluster (Chinese, Japanese and Koreans) has the hig
37、hest mean IQ at 105, followed by Europeans (100), Inuit-Eskimos (91), South East Asians (87), Native American Indians (87), Pacific Islanders (85), South Asians (2) ( -2 , +2 ); (3) ( -3 , +3 ); 李振華制造 數(shù)理統(tǒng)計在化學中的應用 例例2-3根據(jù)資料,根據(jù)資料,30-40歲男子血清膽固醇值歲男子血清膽固醇值(mmol/l) 極近正態(tài)分布極近正態(tài)分布N(4.72,0.77), 試求:該年齡健康男子血清膽固
38、醇值試求:該年齡健康男子血清膽固醇值(1)大于大于6.20的概的概 率;率;(2)大于大于4.00且小于且小于5.50的概率。的概率。 李振華制造 數(shù)理統(tǒng)計在化學中的應用 李振華制造 數(shù)理統(tǒng)計在化學中的應用 n第四節(jié)第四節(jié) 和正態(tài)分布有關(guān)的一些樣本分布和正態(tài)分布有關(guān)的一些樣本分布 李振華制造 自由度 統(tǒng)計學上的自由度(degree of freedom, df),是指 當以樣本的統(tǒng)計量來估計總體的參數(shù)時, 樣本中獨立獨立 或能自由變化或能自由變化的資料的個數(shù),稱為該統(tǒng)計量的自由度 。這里我們用k或v來表示。 例如,在估計總體的平均數(shù)時,樣本中的k個數(shù)全 部加起來, 其中任何一個數(shù)都和其他資料相
39、獨立,從 其中抽出任何一個數(shù)都不影響其他資料(這也是隨機 抽樣所要求的)。 因此一組資料中每一個資料都是獨 立的,所以自由度就是估計總體參數(shù)時獨立資料的數(shù) 目,而平均數(shù)是根據(jù)k個獨立資料來估計的,因此自由 度為k。 李振華制造 數(shù)理統(tǒng)計在化學中的應用 學生t-分布(Students t-distribution) 實際工作中,難以做到測量無限多的樣本。在小實際工作中,難以做到測量無限多的樣本。在小 樣本的情況下,樣本的情況下, 未知,如果用測定樣本所得到的標未知,如果用測定樣本所得到的標 準偏差準偏差S來代替,此時測量值及其偏差就不再符合正來代替,此時測量值及其偏差就不再符合正 態(tài)分布了。態(tài)分
40、布了。 1908年,英國統(tǒng)計學家年,英國統(tǒng)計學家W.S. Gosset證明了:在未證明了:在未 知知 而以樣本的標準差而以樣本的標準差S去代替時,此時遵守的將是去代替時,此時遵守的將是t- 分布。分布。 若若x1,x2, xn是由服從正態(tài)分布的總體中隨機抽是由服從正態(tài)分布的總體中隨機抽 取的樣本值,取的樣本值, 李振華制造 數(shù)理統(tǒng)計在化學中的應用 那么統(tǒng)計量那么統(tǒng)計量 n如果知道總體平均值,即期望值,和標準差,則 可定義: / n X T Sn / n X Z n 李振華制造 t-分布的幾率密度分布函數(shù) nv是自由度 n注意:對于一個容量是n的樣本,其v=n-1。 2(1)/2 (1)/2)
41、( )(1/ ) ( /2) v v f ttv vv 1 0 ( ) at ate dt 李振華制造 數(shù)理統(tǒng)計在化學中的應用 t-分布的概率密度函數(shù)(PDF) 李振華制造 數(shù)理統(tǒng)計在化學中的應用 t-分布的累積分布函數(shù)(CDF) 李振華制造 數(shù)理統(tǒng)計在化學中的應用 t-分布的應用分布的應用t檢驗檢驗(Students t-test) n學生學生t t分布應用在當對呈正態(tài)分布的母群體分布應用在當對呈正態(tài)分布的母群體( (總體總體) )的均值進的均值進 行估計。它是對兩個樣本均值差異進行顯著性測試的學生行估計。它是對兩個樣本均值差異進行顯著性測試的學生t t 檢驗的基礎(chǔ)。檢驗的基礎(chǔ)。t t檢驗改
42、進了檢驗改進了Z Z檢驗檢驗( (Z Z-test)-test),不論樣本數(shù)量大,不論樣本數(shù)量大 或小皆可應用。在樣本數(shù)量大(超過或小皆可應用。在樣本數(shù)量大(超過120120等)時,可以應用等)時,可以應用 Z Z檢驗,但檢驗,但Z Z檢驗用在小的樣本會產(chǎn)生很大的誤差,因此樣檢驗用在小的樣本會產(chǎn)生很大的誤差,因此樣 本很小的情況下得改用學生本很小的情況下得改用學生t t檢驗。檢驗。 n當當總體的標準差是未知的但卻又需要估計時,我們可以運總體的標準差是未知的但卻又需要估計時,我們可以運 用學生用學生t t分布。分布。t t- -分布有著廣泛的應用。從上式可以得到分布有著廣泛的應用。從上式可以得到
43、 / n X T Sn n S Xt n 李振華制造 t檢驗臨界值表 n單側(cè)Ptt(v) = 或 Pt0) n雙側(cè)P|t|t(v)= 50.050.0250.0250.010.010.0050.0050.00050.0005 v 0.10.050.050.020.020.010.010.0010.001 1 13.078 3.078 6.314 6.314 12.706 12.706 31.821 31.821 63.657 63.657 636.619 636.619 2 21.886 1.886 2.920 2.920 4.303 4.303 6.965
44、 6.965 9.925 9.925 31.599 31.599 3 31.638 1.638 2.353 2.353 3.182 3.182 4.541 4.541 5.841 5.841 12.924 12.924 4 41.533 1.533 2.132 2.132 2.776 2.776 3.747 3.747 4.604 4.604 8.610 8.610 5 51.476 1.476 2.015 2.015 2.571 2.571 3.365 3.365 4.032 4.032 6.869 6.869 6 61.440 1.440 1.943 1.943 2.447 2.447 3.143 3.143 3.707 3.707 5.959 5.959 李振華制造 數(shù)理統(tǒng)計在化學中的應用 卡方分布(卡方分布(2 -分布)分布) 卡方分布是統(tǒng)計學中的一種機率分布,它廣泛的運 用于檢測數(shù)學模型是否適合所得的數(shù)據(jù),以及數(shù)據(jù)間 的相關(guān)性。數(shù)據(jù)并不需要呈正態(tài)分布。 如果從一個正態(tài)總體中,抽取出隨機變量Xi, 則各 隨機變量Xi與總體均值之差對總體標準差的比值, 即Zi = (xi )/ ,也服從正態(tài)分布,它們的平方和稱 為2 2 2 2 1 () k i
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 歐洲招商活動方案
- 武侯區(qū)法治教育活動方案
- 永年過年活動方案
- 畢業(yè)年級教研活動方案
- 汽修洗車策劃活動方案
- 樓盤銀行圈層活動方案
- 氏族祭祖活動方案
- 汽貿(mào)店圣誕活動方案
- 母親節(jié)活動糕點活動方案
- 水頭志愿活動方案
- 大學英語四六級詞匯表
- 黑龍江省2024年普通高校招生體育類本科批院校專業(yè)組投檔分數(shù)線(歷史類)
- 水閘地基施工方案
- 企業(yè)數(shù)字化轉(zhuǎn)型服務協(xié)議
- 《建立合適邊界:親子教育課件》
- DB37-T 4516-2022 高速公路邊坡光伏發(fā)電工程技術(shù)規(guī)范
- 變電所設備更換申請報告
- 2023年遺傳學考試題庫(含答案)
- 課題申報參考:基于多模態(tài)大數(shù)據(jù)的大學生心理危機預警機制研究
- 《消費者行為學》教學大綱
- 《礦井扇風機》課件
評論
0/150
提交評論