版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
試驗設計及優(yōu)化-統(tǒng)計學基礎試驗設計及優(yōu)化-統(tǒng)計學基礎1試驗設計與數(shù)據(jù)處理概述—定義狹義的試驗設計主要是指試驗單位(試驗單元)的選取、重復數(shù)目的確定、試驗單位的分組和試驗處理的安排。
合理的試驗設計能控制和降低試驗誤差,提高試驗的精確性,為統(tǒng)計分析獲得試驗處理效應和試驗誤差的無偏估計提供必要的數(shù)據(jù)。數(shù)據(jù)處理:研究試驗測量或觀察值的分析計算處理方法.
承認并盡量排除偶然因素的干擾,將處理間是否存在本質(zhì)差異揭示出來.可以揭示出試驗指標或性狀間的內(nèi)在聯(lián)系試驗設計與數(shù)據(jù)處理概述—定義狹義的試驗設計主要是指試驗單位2試驗設計與數(shù)據(jù)處理概述—發(fā)展20世紀20年代,費歇(英國)提出方差分析,并應用于生物學、農(nóng)業(yè)、遺傳學等領域,使得試驗設計成為統(tǒng)計學的一個分支。20世紀50年代,田口玄一(日本)深入淺出的解說了正交試驗表格,使其廣泛使用。我國:華羅庚積極倡導和普及優(yōu)選法
王元和方開泰提出均勻設計近年,出現(xiàn)了各種應用軟件:SAS(統(tǒng)計分析系統(tǒng))、SPSS(社會科學統(tǒng)計包)、MatlabOrigin、Excel試驗設計與數(shù)據(jù)處理概述—發(fā)展20世紀20年代,費歇(英國)提3試驗設計與數(shù)據(jù)處理概述—意義實驗—變化規(guī)律—實用目的實驗目的、影響因素、--選擇方法—科學安排實驗誤差分析—可靠性確定因素主次—抓住主要矛盾因素與結果間的函數(shù)關系,預測實驗結果實驗因素對實驗結果的影響規(guī)律確定最優(yōu)實驗方案試驗設計與數(shù)據(jù)處理概述—意義實驗—變化規(guī)律—實用目的4本課程主要框架統(tǒng)計學基礎(講課4學時)數(shù)據(jù)的統(tǒng)計檢驗(講課4學時)方差分析(講課4學時,上機2學時)回歸分析(講課4學時,上機2學時)正交試驗設計(講課4學時,上機2學時)均勻設計(講課4學時,上機2學時)本課程主要框架統(tǒng)計學基礎(講課4學時)5統(tǒng)計學基礎(一)統(tǒng)計學中的常用術語誤差的表示法及分類隨機誤差的正態(tài)分布及標準正態(tài)分布統(tǒng)計學基礎(一)統(tǒng)計學中的常用術語6統(tǒng)計學中的常用術語—總體與樣本總體:根據(jù)研究目的確定的研究對象的全體個體:總體中的每一個研究單位樣本:依據(jù)一定方法由總體中抽取部分個體所組成的集合有限總體:含有有限個個體的總體無限總體:包含有無限多個個體的總體樣本容量:樣本中所包含的個體數(shù)目頻率:在n次測定中,隨機事件A出現(xiàn)了nA次,則F(A)=nA/n稱為隨機事件A在n次實驗中出現(xiàn)的頻率.統(tǒng)計學基礎(一)統(tǒng)計學中的常用術語—總體與樣本總體:根據(jù)研究目的確定的研究對7統(tǒng)計學中的常用術語概率:隨機事件A發(fā)生的可能性大小P(A).頻率的極限為概率.必然事件P=1;不可能事件P=0;隨機事件0<P<1試驗研究的目的:了解總體,然而能觀測到的卻是樣本,通過樣本來推斷總體是統(tǒng)計分析的基本特點。隨機抽取:是指總體中的每一個個體都有同等的機會被抽取到樣本中統(tǒng)計分析的特點--有很大的可靠性但有一定的錯誤率真值:某量的客觀值或實際值統(tǒng)計學基礎(一)統(tǒng)計學中的常用術語概率:隨機事件A發(fā)生的可能性大小P(A).8統(tǒng)計學中的常用術語—平均值算術平均值:觀察值的總和除以其個數(shù).代表性較高
統(tǒng)計學基礎(一)若沒有系統(tǒng)誤差,則總體平均值μ就是真實值總體平均值:加權平均值P3:為了增加結果的可靠性,對出現(xiàn)頻率大或誤差較小的測量值乘以一個與頻率或誤差相關的較大的數(shù),對出現(xiàn)頻率小或誤差較大的數(shù)乘以一個與頻率或誤差相關的較小的數(shù).這個數(shù)就叫權.P4,P41-1統(tǒng)計學中的常用術語—平均值算術平均值:觀察值的總和除統(tǒng)計學基9統(tǒng)計學中的常用術語—平均值統(tǒng)計學基礎(一)中位值:是將一系列測定數(shù)據(jù)按大小順序排列是中間的那個數(shù)值(奇數(shù)次測定)。如測定次數(shù)為偶數(shù)次,則中位值為正中兩個值的平均值,其優(yōu)點是求法簡便而又直觀。例:求下列數(shù)據(jù)的平均值和中位值。
20.06,20.10,20.08,20.20。統(tǒng)計學中的常用術語—平均值統(tǒng)計學基礎(一)中位值:是將一系列10誤差的表示法絕對誤差:實驗值與真值之差△x=x-xt(P5,P41-2)相對誤差:ER=△x/xt≈△x/x(P7:例1-3,1-4.)統(tǒng)計學基礎(一)例:有一已知含糖量為24.36%的奶粉,進行數(shù)次測定所得的平均值為24.31%,計算這個平均值的絕對誤差和相對誤差。精密度(Precision)是指在相同條件下,對同一量進行多次重復測定時,測定值的離散程度。表達測定數(shù)據(jù)的重現(xiàn)性,它是反映隨機誤差大小的一個量,測定值越集中,測定精密度越高。精密度通常用偏差來量度。偏差是用測定值與一系列測定數(shù)據(jù)的平均值之差來表示。誤差的表示法絕對誤差:實驗值與真值之差△x=x-xt(P511精密度和準確度統(tǒng)計學基礎(一)二者均好精密度好二者皆不好????甲乙丙真值24.05%24.15%24.25%24.35%24.45%丁精密度和準確度統(tǒng)計學基礎(一)二者均好甲乙丙真值12誤差的表示法偏差:di=xi-x平均偏差:統(tǒng)計學基礎(一)標準偏差:特點:簡單;但大偏差得不到應有反映。誤差的表示法偏差:di=xi-x統(tǒng)計學基礎(一)標準偏差:特13誤差的分類統(tǒng)計學基礎(一)系統(tǒng)誤差,系統(tǒng)誤差是由較確定的原因引起的,可校正和消除。(正確度)隨機誤差,隨機誤差是由不確定原因引起的,不可避免和消除。(精密度:極差,標準差,方差)過失誤差,過失誤差是指一種顯然與事實不符的誤差,必須避免和剔除。準確度:正確度+精密度隨機誤差是由一些偶然因素造成的誤差,其大小、方向都不固定,難以預計,不能測量也無法消除。它的出現(xiàn)似乎很不規(guī)律,但實質(zhì)上,它的出現(xiàn)和分布服從統(tǒng)計規(guī)律誤差的分類統(tǒng)計學基礎(一)系統(tǒng)誤差,系統(tǒng)誤差是由較確定的原因14減小誤差-提高準確度1.選擇合適的分析方法(根據(jù)被測物含量、共存元素的干擾情況)。2.減少分析過程的誤差。
A.減小測量誤差。
B.增加平行測定的次數(shù),減小隨機誤差。
C.消除測量中的系統(tǒng)誤差。統(tǒng)計學基礎(一)減小誤差-提高準確度1.選擇合適的分析方法(根據(jù)被測物含量、15隨機誤差的正態(tài)(高斯)分布N(μ,σ2)統(tǒng)計學基礎(一)正態(tài)分布的數(shù)學表達式:隨機誤差的分布規(guī)律:1)偏差大小相等、符號相反的測定值出現(xiàn)的概率大致相等2)偏差小的測定值比偏差較大的測定值出現(xiàn)的概率大,偏差很大的測定值出現(xiàn)的概率極小,趨近于03)大多數(shù)測定值集中在μ的附近,所以為最可信賴值或最佳值有界性,單峰性,對稱性,補償性概率密度函數(shù)y隨機誤差的正態(tài)(高斯)分布N(μ,σ2)統(tǒng)計學基礎(一)正態(tài)16隨機誤差的標準正態(tài)分布N(0,1)統(tǒng)計學基礎(一)標準正態(tài)分布的數(shù)學表達式:
令則又則隨機誤差的標準正態(tài)分布N(0,1)統(tǒng)計學基礎(一)標準正態(tài)分17隨機誤差的標準正態(tài)分布統(tǒng)計學基礎(一)
所以分析化學中以誤差±2σ作為允許的最大誤差,大于±2σ出現(xiàn)的機會不到5%,同時誤差在±3σ以內(nèi)的測定有99.74%的機會出現(xiàn),即誤差大于±3σ的測定只有0.26%(1000次測定才不到3次)。從計算結果可知,95%以上的測量值都會落在范圍內(nèi),隨機誤差x-μ超過的大誤差(或測量值)出現(xiàn)的概率<0.3%,一般化學分析是作幾次測定,所以可以認為實際上是不可能出現(xiàn)的,如一旦出現(xiàn),可認為其不是由于隨機因素引起的,應棄去隨機誤差的標準正態(tài)分布統(tǒng)計學基礎(一)所以分析化學中以誤差18統(tǒng)計學基礎(二)
-區(qū)間估計和分析結果的表達有限次測定的統(tǒng)計處理預測分析數(shù)據(jù)和置信度總體平均值的區(qū)間估計測定結果不確定度和分析結果的表達有效數(shù)字的取舍誤差的傳遞統(tǒng)計學基礎(二)
-區(qū)間估計和分析結果的表達有限次19有限次測定的統(tǒng)計處理統(tǒng)計學基礎(二)正態(tài)分布是無限次測量數(shù)據(jù)的分布規(guī)律,而實際測定只能是有限次,其分布規(guī)律不可能完全相同。英國的統(tǒng)計學家兼化學家戈塞特(W.S.GOSSET)提出了t分布規(guī)律平均值的標準偏差有限次測定的統(tǒng)計處理統(tǒng)計學基礎(二)正態(tài)分布是無限次測量數(shù)據(jù)20有限次測定的統(tǒng)計處理統(tǒng)計學基礎(二)μ-總體平均值,無系統(tǒng)誤差時就是真值縱坐標仍為概率密度,橫坐標為t,t分布曲線與正態(tài)分布曲線相似t分布曲線隨自由度f(f=n-1)而改變,當時,,t分布曲線即標準正態(tài)分布曲線。有限次測定的統(tǒng)計處理統(tǒng)計學基礎(二)μ-總體平均值,無系統(tǒng)誤21有限次測定的統(tǒng)計處理統(tǒng)計學基礎(二)與標準正態(tài)分布曲線一樣,t分布曲線下面一定范圍內(nèi)的面積,即是該范圍內(nèi)測定值出現(xiàn)的概率,但應注意,對于標準正態(tài)分布曲線,只要u值一定,相應的概率也就一定;但對于t分布曲線,當t一定時,由于f不同,相應曲線所包括的面積,即概率也就不同。為此引入置信度的概念,置信度P-人們對所作判斷的把握程度,其實質(zhì)為某事件出現(xiàn)的概率,在此表示某一t值時,平均值落在()區(qū)間內(nèi)的概率。落在此范圍之外的概率為(1-P)稱為顯著性水平,用α表示。不同概率P與f值所對應的t值,表示為tα,f。如t0.05,10
代表置信度95%,自由度為10時的t值。Page221(附錄三)t與u(n>20,已很接近)有限次測定的統(tǒng)計處理統(tǒng)計學基礎(二)與標準正態(tài)分布曲線一樣,22預測分析數(shù)據(jù)和置信度根據(jù)統(tǒng)計學的理論,可以期望使真值以指定的概率落在測定平均值附近的一個界限內(nèi),這個界限被稱為置信界限。如,測定某食品中水的含量,報告為:%H2O(95%)=71.38±0.22%這個報告能比較明確地說明數(shù)據(jù)的合理性,既不絕對化而又很明確地回答問題。統(tǒng)計學基礎(二)
預測分析數(shù)據(jù)和置信度根據(jù)統(tǒng)計學的理論,可以期望使真值以指定的23預測分析數(shù)據(jù)和置信度①測定的平均值為71.38%。②有95%的把握認為試樣的含水量落在71.38±0.22%這個范圍內(nèi)。③要求有95%的把握,這稱之為置信水平,表示對可靠性要求的準則。在分析化學中常按95%的置信水平來要求。④±0.22%稱之為置信區(qū)間,其大小取決于測定的總體標準偏差σ和置信水平的選擇,平均值的置信區(qū)間還與測定次數(shù)有關。另外,α=1-95%=5%.顯著性水平統(tǒng)計學基礎(二)
預測分析數(shù)據(jù)和置信度①測定的平均值為71.38%。統(tǒng)計學24總體平均值的區(qū)間估計在一定置信度上,根據(jù)(樣本)估計μ(總體平均值)可能存在的區(qū)間,當,,顯然做不到,少數(shù)測量得到的總帶有一定的不確定性,所以只能在一定置信度上,根據(jù)對μ可能存在的區(qū)間作出估計由t分布式
這表示在一定置信度下,以平均值為中心,包括總體平均值μ范圍,就叫平均值的置信區(qū)間。統(tǒng)計學基礎(二)
總體平均值的區(qū)間估計在一定置信度上,根據(jù)(樣本)估計μ25總體平均值的區(qū)間估計例:已知=35.21%,S=0.06%,n=4,求P=0.95,0.99時,平均值的置信區(qū)間解:P=0.95,t0.025,3
=3.18統(tǒng)計學基礎(二)
理解為:在區(qū)間中包括總體平均值μ的把握(概率)有95%。P=0.99t0.005,3=?μ總體平均值的區(qū)間估計例:已知=35.21%,S=0.06%,26總體平均值的區(qū)間估計統(tǒng)計學基礎(二)
置信度越高,t曲線下面積越大,置信區(qū)間就越大,即所估計的區(qū)間包括真值的可能性也就越大。但P=100%,則意味著區(qū)間無限大,肯定會包括,這樣的區(qū)間毫無意義;分析中通常將P定在95%或90%。例1測某鐵礦樣中的含量,得:37.45%,37.30%,37.20%,37.50%,37.25%,報告分析結果(P=95%)例2測定結果47.64%、47.69%、47.52%、47.55%,計算置信度為90%、95%、99%時總體平均值的置信區(qū)間?總體平均值的區(qū)間估計統(tǒng)計學基礎(二)
置信度越高,t曲線下面27測定結果不確定度和分析結果的表達統(tǒng)計學基礎(二)
一般分析結果的統(tǒng)計表示法多次重復測定得到一系列測定值,在報告分析結果時,要反映出數(shù)據(jù)的集中趨勢和分散性,一般采用下列四項值,①x是總體μ的最佳估計值,反映數(shù)據(jù)的集中趨勢。②S-是σ的估計值,反映數(shù)據(jù)的離散程度。③測定次數(shù)n-用于求自由度f,反映數(shù)據(jù)的可靠程度。④置信區(qū)間。測定結果不確定度和分析結果的表達統(tǒng)計學基礎(二)
一般分析結28有效數(shù)字的取舍記錄一個測量值時,數(shù)據(jù)中只應保留一位不確定的數(shù)字.有效數(shù)字:包括全部可靠數(shù)字及一位不確定數(shù)字在內(nèi)的所有數(shù)字運算中采取四舍六入五成雙的原則舍去多于數(shù)字幾個數(shù)相加減時,有效數(shù)字的位數(shù)決定于絕對誤差最大的一個數(shù).幾個數(shù)相乘除時,以有效數(shù)字位數(shù)最少(相對誤差最大)的為標準.在乘,除,開方,乘方時,若第一位有效數(shù)字等于8或大于8時,則有效數(shù)字可多記一位(如8.01ml,可計為四位)常數(shù)可認為無限位.對數(shù)如pH=2.00統(tǒng)計學基礎(二)
有效數(shù)字的取舍記錄一個測量值時,數(shù)據(jù)中只應保留一位不確定的數(shù)29有效數(shù)字的取舍正確記錄有效數(shù)值(萬分之一天平,50ml移液管)正確計算和表達分析結果(先計算,后修約;先修約,后計算)0.0124+20.12+1.236+3.245+4.255=?0.0124*20.14*1.2364=?P41-11統(tǒng)計學基礎(二)
有效數(shù)字的取舍正確記錄有效數(shù)值(萬分之一天平,50ml移液管30誤差的傳遞一、系統(tǒng)誤差的傳遞規(guī)律1.加減法:設R為計算結果,A、B、C為三個測量數(shù)據(jù),它們的絕對系統(tǒng)誤差為EA、EB、EC,對分析結果的絕對系統(tǒng)誤差為ER,其計算關系式為:結果的絕對誤差是各步驟絕對誤差的代數(shù)和統(tǒng)計學基礎(二)
若則若則誤差的傳遞一、系統(tǒng)誤差的傳遞規(guī)律統(tǒng)計學基礎(二)
若則若則31誤差的傳遞一、系統(tǒng)誤差的傳遞規(guī)律統(tǒng)計學基礎(二)
2.乘除法:設R為計算結果,A、B、C為三個測量數(shù)據(jù),它們的系統(tǒng)誤差為EA、EB、EC,對分析結果的系統(tǒng)誤差為ER,其計算關系式為:結果的相對誤差是各步驟相對誤差的代數(shù)和。注意:如分析結果計算公式中同時有四則運算,先計算加減后計算乘除?。。。。≌`差的傳遞一、系統(tǒng)誤差的傳遞規(guī)律統(tǒng)計學基礎(二)
2.乘除法32誤差的傳遞例:X=(A-C)/G已知:EA=EC=0.1EG=0.001A=80.0C=1.0G=1.0求X,EX,X校正各為多少?解:①
X=79.0②EA-C=EA-EC=0統(tǒng)計學基礎(二)
誤差的傳遞例:X=(A-C)/G已知:EA=EC=0.33誤差的傳遞一、系統(tǒng)誤差的傳遞規(guī)律統(tǒng)計學基礎(二)
3.指數(shù)關系4.對數(shù)關系誤差的傳遞一、系統(tǒng)誤差的傳遞規(guī)律統(tǒng)計學基礎(二)
3.指數(shù)關34誤差的傳遞一、偶然誤差的傳遞規(guī)律統(tǒng)計學基礎(二)
1.加減法結果的標準偏差的平方是各測量值標準偏差的平方總和誤差的傳遞一、偶然誤差的傳遞規(guī)律統(tǒng)計學基礎(二)
1.加減法352.乘除法結果的相對標準偏差的平方是各測量值相對標準偏差的平方總和2.乘除法363.指數(shù)關系3.指數(shù)關系374.對數(shù)關系4.對數(shù)關系38例設天平稱量時的標準偏差s=0.10mg,求稱量試樣時的標準偏差sm?解:稱量質(zhì)量m是稱量兩次的差值例設天平稱量時的標準偏差s=0.10mg,求稱量試樣時的39例移取NaOH溶液25.00mL,用0.1000mol·L-1HCl標準溶液滴定消耗30.00mL。已知移取時s1=0.02mL,每次讀取滴定管讀數(shù)時s2=0.01mL,計算標定NaOH溶液時的標準偏差sc?解:P22,1-17,1-18例移取NaOH溶液25.00mL,用0.1000mol·L40作業(yè)P41:1,4,5作業(yè)P41:1,4,541試驗設計及優(yōu)化-統(tǒng)計學基礎試驗設計及優(yōu)化-統(tǒng)計學基礎42試驗設計與數(shù)據(jù)處理概述—定義狹義的試驗設計主要是指試驗單位(試驗單元)的選取、重復數(shù)目的確定、試驗單位的分組和試驗處理的安排。
合理的試驗設計能控制和降低試驗誤差,提高試驗的精確性,為統(tǒng)計分析獲得試驗處理效應和試驗誤差的無偏估計提供必要的數(shù)據(jù)。數(shù)據(jù)處理:研究試驗測量或觀察值的分析計算處理方法.
承認并盡量排除偶然因素的干擾,將處理間是否存在本質(zhì)差異揭示出來.可以揭示出試驗指標或性狀間的內(nèi)在聯(lián)系試驗設計與數(shù)據(jù)處理概述—定義狹義的試驗設計主要是指試驗單位43試驗設計與數(shù)據(jù)處理概述—發(fā)展20世紀20年代,費歇(英國)提出方差分析,并應用于生物學、農(nóng)業(yè)、遺傳學等領域,使得試驗設計成為統(tǒng)計學的一個分支。20世紀50年代,田口玄一(日本)深入淺出的解說了正交試驗表格,使其廣泛使用。我國:華羅庚積極倡導和普及優(yōu)選法
王元和方開泰提出均勻設計近年,出現(xiàn)了各種應用軟件:SAS(統(tǒng)計分析系統(tǒng))、SPSS(社會科學統(tǒng)計包)、MatlabOrigin、Excel試驗設計與數(shù)據(jù)處理概述—發(fā)展20世紀20年代,費歇(英國)提44試驗設計與數(shù)據(jù)處理概述—意義實驗—變化規(guī)律—實用目的實驗目的、影響因素、--選擇方法—科學安排實驗誤差分析—可靠性確定因素主次—抓住主要矛盾因素與結果間的函數(shù)關系,預測實驗結果實驗因素對實驗結果的影響規(guī)律確定最優(yōu)實驗方案試驗設計與數(shù)據(jù)處理概述—意義實驗—變化規(guī)律—實用目的45本課程主要框架統(tǒng)計學基礎(講課4學時)數(shù)據(jù)的統(tǒng)計檢驗(講課4學時)方差分析(講課4學時,上機2學時)回歸分析(講課4學時,上機2學時)正交試驗設計(講課4學時,上機2學時)均勻設計(講課4學時,上機2學時)本課程主要框架統(tǒng)計學基礎(講課4學時)46統(tǒng)計學基礎(一)統(tǒng)計學中的常用術語誤差的表示法及分類隨機誤差的正態(tài)分布及標準正態(tài)分布統(tǒng)計學基礎(一)統(tǒng)計學中的常用術語47統(tǒng)計學中的常用術語—總體與樣本總體:根據(jù)研究目的確定的研究對象的全體個體:總體中的每一個研究單位樣本:依據(jù)一定方法由總體中抽取部分個體所組成的集合有限總體:含有有限個個體的總體無限總體:包含有無限多個個體的總體樣本容量:樣本中所包含的個體數(shù)目頻率:在n次測定中,隨機事件A出現(xiàn)了nA次,則F(A)=nA/n稱為隨機事件A在n次實驗中出現(xiàn)的頻率.統(tǒng)計學基礎(一)統(tǒng)計學中的常用術語—總體與樣本總體:根據(jù)研究目的確定的研究對48統(tǒng)計學中的常用術語概率:隨機事件A發(fā)生的可能性大小P(A).頻率的極限為概率.必然事件P=1;不可能事件P=0;隨機事件0<P<1試驗研究的目的:了解總體,然而能觀測到的卻是樣本,通過樣本來推斷總體是統(tǒng)計分析的基本特點。隨機抽取:是指總體中的每一個個體都有同等的機會被抽取到樣本中統(tǒng)計分析的特點--有很大的可靠性但有一定的錯誤率真值:某量的客觀值或實際值統(tǒng)計學基礎(一)統(tǒng)計學中的常用術語概率:隨機事件A發(fā)生的可能性大小P(A).49統(tǒng)計學中的常用術語—平均值算術平均值:觀察值的總和除以其個數(shù).代表性較高
統(tǒng)計學基礎(一)若沒有系統(tǒng)誤差,則總體平均值μ就是真實值總體平均值:加權平均值P3:為了增加結果的可靠性,對出現(xiàn)頻率大或誤差較小的測量值乘以一個與頻率或誤差相關的較大的數(shù),對出現(xiàn)頻率小或誤差較大的數(shù)乘以一個與頻率或誤差相關的較小的數(shù).這個數(shù)就叫權.P4,P41-1統(tǒng)計學中的常用術語—平均值算術平均值:觀察值的總和除統(tǒng)計學基50統(tǒng)計學中的常用術語—平均值統(tǒng)計學基礎(一)中位值:是將一系列測定數(shù)據(jù)按大小順序排列是中間的那個數(shù)值(奇數(shù)次測定)。如測定次數(shù)為偶數(shù)次,則中位值為正中兩個值的平均值,其優(yōu)點是求法簡便而又直觀。例:求下列數(shù)據(jù)的平均值和中位值。
20.06,20.10,20.08,20.20。統(tǒng)計學中的常用術語—平均值統(tǒng)計學基礎(一)中位值:是將一系列51誤差的表示法絕對誤差:實驗值與真值之差△x=x-xt(P5,P41-2)相對誤差:ER=△x/xt≈△x/x(P7:例1-3,1-4.)統(tǒng)計學基礎(一)例:有一已知含糖量為24.36%的奶粉,進行數(shù)次測定所得的平均值為24.31%,計算這個平均值的絕對誤差和相對誤差。精密度(Precision)是指在相同條件下,對同一量進行多次重復測定時,測定值的離散程度。表達測定數(shù)據(jù)的重現(xiàn)性,它是反映隨機誤差大小的一個量,測定值越集中,測定精密度越高。精密度通常用偏差來量度。偏差是用測定值與一系列測定數(shù)據(jù)的平均值之差來表示。誤差的表示法絕對誤差:實驗值與真值之差△x=x-xt(P552精密度和準確度統(tǒng)計學基礎(一)二者均好精密度好二者皆不好????甲乙丙真值24.05%24.15%24.25%24.35%24.45%丁精密度和準確度統(tǒng)計學基礎(一)二者均好甲乙丙真值53誤差的表示法偏差:di=xi-x平均偏差:統(tǒng)計學基礎(一)標準偏差:特點:簡單;但大偏差得不到應有反映。誤差的表示法偏差:di=xi-x統(tǒng)計學基礎(一)標準偏差:特54誤差的分類統(tǒng)計學基礎(一)系統(tǒng)誤差,系統(tǒng)誤差是由較確定的原因引起的,可校正和消除。(正確度)隨機誤差,隨機誤差是由不確定原因引起的,不可避免和消除。(精密度:極差,標準差,方差)過失誤差,過失誤差是指一種顯然與事實不符的誤差,必須避免和剔除。準確度:正確度+精密度隨機誤差是由一些偶然因素造成的誤差,其大小、方向都不固定,難以預計,不能測量也無法消除。它的出現(xiàn)似乎很不規(guī)律,但實質(zhì)上,它的出現(xiàn)和分布服從統(tǒng)計規(guī)律誤差的分類統(tǒng)計學基礎(一)系統(tǒng)誤差,系統(tǒng)誤差是由較確定的原因55減小誤差-提高準確度1.選擇合適的分析方法(根據(jù)被測物含量、共存元素的干擾情況)。2.減少分析過程的誤差。
A.減小測量誤差。
B.增加平行測定的次數(shù),減小隨機誤差。
C.消除測量中的系統(tǒng)誤差。統(tǒng)計學基礎(一)減小誤差-提高準確度1.選擇合適的分析方法(根據(jù)被測物含量、56隨機誤差的正態(tài)(高斯)分布N(μ,σ2)統(tǒng)計學基礎(一)正態(tài)分布的數(shù)學表達式:隨機誤差的分布規(guī)律:1)偏差大小相等、符號相反的測定值出現(xiàn)的概率大致相等2)偏差小的測定值比偏差較大的測定值出現(xiàn)的概率大,偏差很大的測定值出現(xiàn)的概率極小,趨近于03)大多數(shù)測定值集中在μ的附近,所以為最可信賴值或最佳值有界性,單峰性,對稱性,補償性概率密度函數(shù)y隨機誤差的正態(tài)(高斯)分布N(μ,σ2)統(tǒng)計學基礎(一)正態(tài)57隨機誤差的標準正態(tài)分布N(0,1)統(tǒng)計學基礎(一)標準正態(tài)分布的數(shù)學表達式:
令則又則隨機誤差的標準正態(tài)分布N(0,1)統(tǒng)計學基礎(一)標準正態(tài)分58隨機誤差的標準正態(tài)分布統(tǒng)計學基礎(一)
所以分析化學中以誤差±2σ作為允許的最大誤差,大于±2σ出現(xiàn)的機會不到5%,同時誤差在±3σ以內(nèi)的測定有99.74%的機會出現(xiàn),即誤差大于±3σ的測定只有0.26%(1000次測定才不到3次)。從計算結果可知,95%以上的測量值都會落在范圍內(nèi),隨機誤差x-μ超過的大誤差(或測量值)出現(xiàn)的概率<0.3%,一般化學分析是作幾次測定,所以可以認為實際上是不可能出現(xiàn)的,如一旦出現(xiàn),可認為其不是由于隨機因素引起的,應棄去隨機誤差的標準正態(tài)分布統(tǒng)計學基礎(一)所以分析化學中以誤差59統(tǒng)計學基礎(二)
-區(qū)間估計和分析結果的表達有限次測定的統(tǒng)計處理預測分析數(shù)據(jù)和置信度總體平均值的區(qū)間估計測定結果不確定度和分析結果的表達有效數(shù)字的取舍誤差的傳遞統(tǒng)計學基礎(二)
-區(qū)間估計和分析結果的表達有限次60有限次測定的統(tǒng)計處理統(tǒng)計學基礎(二)正態(tài)分布是無限次測量數(shù)據(jù)的分布規(guī)律,而實際測定只能是有限次,其分布規(guī)律不可能完全相同。英國的統(tǒng)計學家兼化學家戈塞特(W.S.GOSSET)提出了t分布規(guī)律平均值的標準偏差有限次測定的統(tǒng)計處理統(tǒng)計學基礎(二)正態(tài)分布是無限次測量數(shù)據(jù)61有限次測定的統(tǒng)計處理統(tǒng)計學基礎(二)μ-總體平均值,無系統(tǒng)誤差時就是真值縱坐標仍為概率密度,橫坐標為t,t分布曲線與正態(tài)分布曲線相似t分布曲線隨自由度f(f=n-1)而改變,當時,,t分布曲線即標準正態(tài)分布曲線。有限次測定的統(tǒng)計處理統(tǒng)計學基礎(二)μ-總體平均值,無系統(tǒng)誤62有限次測定的統(tǒng)計處理統(tǒng)計學基礎(二)與標準正態(tài)分布曲線一樣,t分布曲線下面一定范圍內(nèi)的面積,即是該范圍內(nèi)測定值出現(xiàn)的概率,但應注意,對于標準正態(tài)分布曲線,只要u值一定,相應的概率也就一定;但對于t分布曲線,當t一定時,由于f不同,相應曲線所包括的面積,即概率也就不同。為此引入置信度的概念,置信度P-人們對所作判斷的把握程度,其實質(zhì)為某事件出現(xiàn)的概率,在此表示某一t值時,平均值落在()區(qū)間內(nèi)的概率。落在此范圍之外的概率為(1-P)稱為顯著性水平,用α表示。不同概率P與f值所對應的t值,表示為tα,f。如t0.05,10
代表置信度95%,自由度為10時的t值。Page221(附錄三)t與u(n>20,已很接近)有限次測定的統(tǒng)計處理統(tǒng)計學基礎(二)與標準正態(tài)分布曲線一樣,63預測分析數(shù)據(jù)和置信度根據(jù)統(tǒng)計學的理論,可以期望使真值以指定的概率落在測定平均值附近的一個界限內(nèi),這個界限被稱為置信界限。如,測定某食品中水的含量,報告為:%H2O(95%)=71.38±0.22%這個報告能比較明確地說明數(shù)據(jù)的合理性,既不絕對化而又很明確地回答問題。統(tǒng)計學基礎(二)
預測分析數(shù)據(jù)和置信度根據(jù)統(tǒng)計學的理論,可以期望使真值以指定的64預測分析數(shù)據(jù)和置信度①測定的平均值為71.38%。②有95%的把握認為試樣的含水量落在71.38±0.22%這個范圍內(nèi)。③要求有95%的把握,這稱之為置信水平,表示對可靠性要求的準則。在分析化學中常按95%的置信水平來要求。④±0.22%稱之為置信區(qū)間,其大小取決于測定的總體標準偏差σ和置信水平的選擇,平均值的置信區(qū)間還與測定次數(shù)有關。另外,α=1-95%=5%.顯著性水平統(tǒng)計學基礎(二)
預測分析數(shù)據(jù)和置信度①測定的平均值為71.38%。統(tǒng)計學65總體平均值的區(qū)間估計在一定置信度上,根據(jù)(樣本)估計μ(總體平均值)可能存在的區(qū)間,當,,顯然做不到,少數(shù)測量得到的總帶有一定的不確定性,所以只能在一定置信度上,根據(jù)對μ可能存在的區(qū)間作出估計由t分布式
這表示在一定置信度下,以平均值為中心,包括總體平均值μ范圍,就叫平均值的置信區(qū)間。統(tǒng)計學基礎(二)
總體平均值的區(qū)間估計在一定置信度上,根據(jù)(樣本)估計μ66總體平均值的區(qū)間估計例:已知=35.21%,S=0.06%,n=4,求P=0.95,0.99時,平均值的置信區(qū)間解:P=0.95,t0.025,3
=3.18統(tǒng)計學基礎(二)
理解為:在區(qū)間中包括總體平均值μ的把握(概率)有95%。P=0.99t0.005,3=?μ總體平均值的區(qū)間估計例:已知=35.21%,S=0.06%,67總體平均值的區(qū)間估計統(tǒng)計學基礎(二)
置信度越高,t曲線下面積越大,置信區(qū)間就越大,即所估計的區(qū)間包括真值的可能性也就越大。但P=100%,則意味著區(qū)間無限大,肯定會包括,這樣的區(qū)間毫無意義;分析中通常將P定在95%或90%。例1測某鐵礦樣中的含量,得:37.45%,37.30%,37.20%,37.50%,37.25%,報告分析結果(P=95%)例2測定結果47.64%、47.69%、47.52%、47.55%,計算置信度為90%、95%、99%時總體平均值的置信區(qū)間?總體平均值的區(qū)間估計統(tǒng)計學基礎(二)
置信度越高,t曲線下面68測定結果不確定度和分析結果的表達統(tǒng)計學基礎(二)
一般分析結果的統(tǒng)計表示法多次重復測定得到一系列測定值,在報告分析結果時,要反映出數(shù)據(jù)的集中趨勢和分散性,一般采用下列四項值,①x是總體μ的最佳估計值,反映數(shù)據(jù)的集中趨勢。②S-是σ的估計值,反映數(shù)據(jù)的離散程度。③測定次數(shù)n-用于求自由度f,反映數(shù)據(jù)的可靠程度。④置信區(qū)間。測定結果不確定度和分析結果的表達統(tǒng)計學基礎(二)
一般分析結69有效數(shù)字的取舍記錄一個測量值時,數(shù)據(jù)中只應保留一位不確定的數(shù)字.有效數(shù)字:包括全部可靠數(shù)字及一位不確定數(shù)字在內(nèi)的所有數(shù)字運算中采取四舍六入五成雙的原則舍去多于數(shù)字幾個數(shù)相加減時,有效數(shù)字的位數(shù)決定于絕對誤差最大的一個數(shù).幾個數(shù)相乘
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 課題申報參考:教材插圖智能設計美學的社會主義核心價值觀對齊研究
- 課題申報參考:建成環(huán)境對老年人公交及地鐵出行的時空動態(tài)影響及適老化建成環(huán)境優(yōu)化研究
- 二零二五版文化藝術用品采購合同模板3篇
- 二零二五年度房地產(chǎn)投資定金監(jiān)管協(xié)議4篇
- 二零二五年度煤炭運輸節(jié)能減排協(xié)議4篇
- 二零二五版爐渣清潔生產(chǎn)采購技術服務合同4篇
- 2025年度高壓供電線路維護服務協(xié)議范本3篇
- 2025版?zhèn)€人退股協(xié)議書:上市公司股份回購與股東退出協(xié)議4篇
- 深圳2025年度廠房租賃合同范本2篇
- 二零二五年度建筑安全評估師雇傭合同標準版3篇
- 化學-河南省TOP二十名校2025屆高三調(diào)研考試(三)試題和答案
- 智慧農(nóng)貿(mào)批發(fā)市場平臺規(guī)劃建設方案
- 林下野雞養(yǎng)殖建設項目可行性研究報告
- 2023年水利部黃河水利委員會招聘考試真題
- Python編程基礎(項目式微課版)教案22
- 01J925-1壓型鋼板、夾芯板屋面及墻體建筑構造
- 欠電費合同范本
- 《學習教育重要論述》考試復習題庫(共250余題)
- 網(wǎng)易云音樂用戶情感畫像研究
- 小學四年級奧數(shù)題平均數(shù)問題習題及答案
- 工作違紀違規(guī)檢討書范文
評論
0/150
提交評論