第五章數(shù)據(jù)統(tǒng)計分析1_第1頁
第五章數(shù)據(jù)統(tǒng)計分析1_第2頁
第五章數(shù)據(jù)統(tǒng)計分析1_第3頁
第五章數(shù)據(jù)統(tǒng)計分析1_第4頁
第五章數(shù)據(jù)統(tǒng)計分析1_第5頁
已閱讀5頁,還剩15頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

5放射性測量數(shù)據(jù)的統(tǒng)計分析

放射性測量的對象——放射性物質(zhì)放射性物質(zhì)的衰變是一種隨機過程,每個原子的衰變是完全獨立的,是無法預測的嚴格地說,并不存在“真正的”或“準確的”衰變率,只能應用統(tǒng)計學的方法來估計在一段時間內(nèi)最可能發(fā)生衰變的放射性原子數(shù)目環(huán)境放射性水平低,常受到本底的干擾,使得環(huán)境監(jiān)測數(shù)據(jù)的處理更為復雜5.1數(shù)理統(tǒng)計基礎(chǔ)知識數(shù)理統(tǒng)計方法:以概率論為基礎(chǔ),對大量的偶然現(xiàn)象的統(tǒng)計資料進行分析研究,得出這種現(xiàn)象概率的規(guī)律性,給與科學的解釋數(shù)理統(tǒng)計方法,是以樣本為依據(jù),運用數(shù)學模型來推斷總體的一門科學5.1.1總體和樣本

總體(母體)——研究對象的特征表征量的全體

樣本(子樣)——從總體中抽取出來的一部分樣品x1、x2、……、xn的測量值樣本容量——樣本中的樣品個數(shù)(n),即樣本的大小;

n>30

——大樣本一組數(shù)據(jù)——表征自總體中隨機抽出的一組樣本用樣品的分析結(jié)果說明被研究對象的整體——用樣本說明總體(母體)

分析學:以樣品的分析結(jié)果說明被研究對象

統(tǒng)計學:以樣本的分析結(jié)果說明總體5.1.2數(shù)據(jù)的特性及其分布環(huán)放監(jiān)測數(shù)據(jù)特性:①具有一定分散性(不可能完全相同)

②具有集中性的趨勢常遇到的三種分布:(1)泊松分布(浦阿松分布):離散型變量的一種分布

p(x)

P(x)——計數(shù)x出現(xiàn)的概率μ——泊松分布的均值(數(shù))μ>16時,泊松分布正態(tài)分布σ2=μ

σ=√μ

X(2)正態(tài)分布(Gauss分布)實驗的隨機差通常服從此分布

P(x)

標準正態(tài)分布μ——曲線最高點對應的橫坐標值測值的集中趨勢σ——測值的離散特性(大精密度差,分散,小精密度高)μ——正態(tài)分布中以σ為單位的離均差(x-μ)

N(μ,σ)N(0,1)(3)對數(shù)正態(tài)分布檢驗方法:在正態(tài)概率紙或?qū)?shù)概率紙上作圖,看能否得出一條直

線。(4)正態(tài)分布特征量與樣本特征量總體平均值μ——正態(tài)變量x的集中性樣本均值x——μ的估計值總體標準差σ——正態(tài)變量x的離散程度樣本標準差S——σ的估計量5.1.3統(tǒng)計量及其分布統(tǒng)計量——由樣本數(shù)據(jù)構(gòu)造出來的隨機變量,如樣本特征量x,S由x,S構(gòu)造的新量也是隨機變量由樣本總體的估計:建立相應的統(tǒng)計量統(tǒng)計量本身的分布確定統(tǒng)計量超出某個限值或臨界值的概率提出各種統(tǒng)計假設(shè)的檢驗方法對于正態(tài)分布N(μ,σ)來說,常用的統(tǒng)計量:x、S、u、t、ⅹ2、F其中x、S是樣本特征量,u、t、ⅹ2、F是新構(gòu)造出的統(tǒng)計量(1)樣本均值x的概率分布①若x~N(μ,σ2)x1、x2……X~N(μ,σ2/n)②n>30的大樣本,不管總體是何分布,X~N(μ,σ2/n)③樣本均數(shù)分布的均數(shù)等于原總體的分布μ④樣本均數(shù)分布的標準差σ被√n除所得的商:

多次測量的平均值比一次測量值更精確∴x估計μ(x=μ)(2)樣本標準差S的概率分布①通常S2=σ2,S=σ②標準差的標準差:σσ=σ/√2n

若X~N(μ,σ2),則S~N(σ,σ2/2n)。當n較大時,可把S當作σ的估計值

(3)統(tǒng)計量u及其分布①若總體~N(μ,σ),X~N(μ,σ/√n)作出統(tǒng)計量:②u~N(0,1)③對于大樣本,用來檢驗u=u0的假設(shè),單總體u檢驗④臨界值Uα,置信水平1-α,在正態(tài)分布函數(shù)表上可查出對應于α的Uα⑤構(gòu)造統(tǒng)計量~N(0,1)對于大樣本,用于檢驗μ1=μ2的假設(shè),雙總體檢驗,臨界值也是Uα(4)統(tǒng)計量t及其分布(學生分布)英化學家Gosset用student①測定次數(shù)有限,其隨機誤差不完全服從N(μ,σ2),而是服從類似正態(tài)分布的t分布

統(tǒng)計量

自由度為1、5及∞的t分布②t與置信概率和自由度df=n-1有關(guān),其數(shù)值稱為置信因子t。③當df∞,t=u,兩分布曲線一致。④小樣本時,t用來檢驗μ=μ0的假設(shè)——單總體t檢驗,查表臨界值tα⑤小樣本時,t也可用來檢驗μ1=μ2的假設(shè)——雙總體t檢驗注意:雙總體u檢驗、雙總體t檢驗都是以σ1

=σ2為前提條件(5)統(tǒng)計量X2及其分布①

服從自由度

df=n-1的X2分布②X2由正態(tài)分布導出的一個重要的抽樣分布,具有以下重要特征:?X2無定值,X2所取值自0——∞;?分布曲線左右不對稱,呈左偏;?X2分布曲線隨自由度df而變化。隨自由度逐漸增大,曲線漸趨對稱;?X2分布的總體平均值或期望值為n-1,總體標準差為。若各Xi的σi相等,即σi

=σ0則有③?檢驗在σ已知的特定實驗中得到的S值究竟是合理還是例外。

?檢驗一組n個觀測值是否和正態(tài)分布或其他分布一致。④查表,臨界值X2α(6)統(tǒng)計量F及其分布①要檢驗兩個總體方差是否一致,是否屬于同一正態(tài)分布,往往要進行F檢驗。②F服從自由度分別為n-1和n-2的F分布③F檢驗的臨界值Fα④F統(tǒng)計量值與Fα比較,判斷兩個測量的方差是否有顯著的差別。F分布5.1.4統(tǒng)計檢驗

先假設(shè)某一種總體具有某種參數(shù)或遵從某種分布等統(tǒng)計特性,然后再檢驗這個假設(shè)是否可信,這種方法稱為統(tǒng)計檢驗,或統(tǒng)計假設(shè)檢驗。

例:某測量裝置檢修前后的兩組本底;年均值m1,m2;有無變化?m1,m2~兩個泊松分布的總體,假設(shè)m1-m2=0;采用樣本來推斷是否拋棄該假設(shè)。(1)統(tǒng)計假設(shè)考兩類錯誤①統(tǒng)計檢驗步驟?先作出某種假設(shè)——原假設(shè)H0

,除H0外

,提出另一假設(shè)——備擇假設(shè)H1?根據(jù)樣本數(shù)據(jù)是否拒絕原假設(shè)H0?當拒絕H0時,就接受H1

②兩類錯誤:樣本數(shù)據(jù)是帶有隨機性的,根據(jù)樣本作出拒絕或接受某一假設(shè),難免犯錯。?第一類錯誤(拒真)——假設(shè)H0為真,拒絕;接受H1;概率α表示?第二類錯誤(存?zhèn)危僭O(shè)H0為偽,接受;拒絕H1;概率β表示?希望α、β均小,但二者是相矛盾的,要壓小α值,β值勢必上升例:同時間t測量CB,CS+B。判斷CS+B至少大CB多少才能判斷樣品含放射性,而拒真概率<α(例如α=0.05)令,X~N(0,1),μ是X的期望值(真值),σ標準差(未知),可用

作為它的估計值。原假設(shè)H0:μ=0(不含放射性)備樣假設(shè)H1:μ>0(含放射性)若觀測值X≥Xα,則接受H0,拒受H1

X≤Xα,則拒受H0,接受H0α——顯著性水平;1-α——置信度1-β——實驗的撿出力∴預定了α值,β就不能任意指定β值取決于α值和樣品實際所含的放射性。

α選擇視具體問題而定犯兩類錯誤的示意圖Lc——判斷限LD——探測限LQ——測定限③統(tǒng)計檢驗分為單側(cè)檢驗和雙側(cè)檢驗單側(cè)檢驗——專門檢查μ是否顯著地大于(或小于)μ0,其否定為μ>μ0

(或μ<μ0)雙側(cè)檢驗——只關(guān)心μ是否等于μ0,其原假設(shè)為μ=μ0,否定假設(shè)為μ≠μ0④常用α及時對應的Uα值和Uα/2值

α=0.05U0.05=1.64U0.025=1.96

α=0.01U0.01=2.33U0.005=2.58(2)顯著性檢驗與顯著性水平①顯著性檢驗——只提出一個原假設(shè)H0,不提備用假設(shè)

U≥Uα,拒絕H0;U<Uα,無顯著性差異,不適宜否定H0②顯著性水平——上述犯第一類錯誤的概率α③用途關(guān)于總體參數(shù)的檢驗關(guān)于分布類型的檢驗(“吻合度”檢驗)④(1-α)稱為置信水平,表示可以有多大的把握去否定一個假設(shè)(3)實例①總體均值與一已知值相等的統(tǒng)計檢驗測量值均值=已知值?檢驗方法:u,t檢驗法?μ檢驗法(已知真值,已知總體方差)[例1]已知:土壤中239Pu含量(μ0)4.47Bq/g,n=5次測量均值x=4.364Bq/g,試分析是否存在系統(tǒng)誤差?取α=0.05

原假設(shè)H0:“μ是否等于μ0”

雙側(cè)檢驗查U表U0.025=1.96U=2.19>1.96,∴否定原假設(shè)H0μ≠4.47Bq/g,該分析中存在系統(tǒng)誤差(1-α)=95%?t檢驗法

(測量的總體方差未知用樣本方差S2來估計總體方差σ2

用t檢驗)[例2]已知:土壤中鈾含量~N(μ,σ2),以往大量樣品分析得到μ0=1.23μg/g;現(xiàn)取樣分析,n=20個,x=1.35μg/g,S=0.24μg/g;

現(xiàn)在水平≥以往水平?試進行顯著性檢驗(取α=0.05)解:原假設(shè)H0:μ≤μ0(單側(cè)檢驗)

構(gòu)造統(tǒng)計量:df=n-1=19,查t表得:tα(19)=1.729∵t=2.23

>tα(19)

=1.729,故拒絕μ≤μ0的假設(shè)結(jié)論為目前該土壤中鈾含量的水平顯著地大于以往的本底水平(1-α)=95%②兩總體均值之差等于一已知值和兩總體均值相等的統(tǒng)計檢驗常用來比較不同條件下的兩組測量數(shù)據(jù)之間是否存在差異。?μ檢驗法(總體方差已知)[例3]茶葉樣Ⅰ、Ⅱ中90Sr的含量:XⅠ=66.64Bq/kg,nⅠ=4;XⅡ=66.6Bq/kg,nⅡ=6;已知兩樣本標準都和總體標準差σ=0.061無顯著差別。問:Ⅰ、Ⅱ號茶葉中90Sr是同一種茶葉分別裝在兩個瓶里,還是兩種不同的茶葉樣(α=0.05)解:原假設(shè)H0:μ1=μ2(雙側(cè)檢驗)∵σ總體已知且不變,∴兩平均值差的方差為令α=0.05,查μ表得:μ0.05/2=1.96。μ<1.96故接受原假設(shè)。無顯著性差別,沒有理由認為兩樣本不是同一種。?t檢驗法(總體方差未知),σ12與σ22未知,只能用S12和S22估計之[例4]例2中,X=1.23μg/g,S=0.25μg/g,n=22個,試進行顯著性檢驗(取α=0.1,雙測檢驗)[解]構(gòu)造統(tǒng)計量:查t0.05,40=2.201

t>t0.05(tα/2)

拒絕原假設(shè)H0即現(xiàn)在水平不同于原水平[例5]在A、B兩點采集大氣沉降物樣品25個,測量樣品α放射性活度(×10-12Ci/m2天)

兩批數(shù)據(jù)均~N(μ,σ2):

A:n=25,X=24.0,S=13.0B:n=25,X=16.7,S=7.7試比較A、B放射性水平有無顯著性差別(取α=0.05)

首先檢驗總體方差是否相等,即σ12=σ22,構(gòu)造統(tǒng)計量F:雙測檢驗:查F臨界值表中Fα/2,當自由度df1=df2=25-1=24,F(xiàn)0.025=2.269

本例的F>F0.025,拒絕σ12=σ22的假設(shè),∵不具備方差齊性的條件

∴不能用下面公式構(gòu)造的統(tǒng)計量:

而應選用

Aspin-Welch檢驗公式:查t分布的雙測分位表,當df=39時,t0.05/2=2.023本例t>t0.05/2,拒絕原假設(shè)μ1=μ2,即兩采樣點上平均水平差異顯著(置信水平95%)[例6]兩實驗室共同分析就批數(shù)據(jù),分析成對進行,是比較兩實驗室結(jié)果之間有無差異

批數(shù)123456789A93.0892.5991.3691.6091.9193.4992.0392.8091.03B92.9792.8591.8692.1792.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論