第二章 環(huán)境數(shù)據(jù)統(tǒng)計(jì)與分析課件_第1頁(yè)
第二章 環(huán)境數(shù)據(jù)統(tǒng)計(jì)與分析課件_第2頁(yè)
第二章 環(huán)境數(shù)據(jù)統(tǒng)計(jì)與分析課件_第3頁(yè)
第二章 環(huán)境數(shù)據(jù)統(tǒng)計(jì)與分析課件_第4頁(yè)
第二章 環(huán)境數(shù)據(jù)統(tǒng)計(jì)與分析課件_第5頁(yè)
已閱讀5頁(yè),還剩159頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第二章環(huán)境數(shù)據(jù)

統(tǒng)計(jì)與分析第二章環(huán)境數(shù)據(jù)

統(tǒng)計(jì)與分析12環(huán)境數(shù)據(jù)統(tǒng)計(jì)與分析2.1數(shù)據(jù)統(tǒng)計(jì)與分析的基本范疇2.2常用的統(tǒng)計(jì)指標(biāo)2.3環(huán)境樣本特征推斷2.4參數(shù)估計(jì)2.5顯著性檢驗(yàn)2.6直線相關(guān)與直線回歸2.7環(huán)境數(shù)據(jù)統(tǒng)計(jì)與分析的計(jì)算機(jī)處理2.8可疑值的取舍2環(huán)境數(shù)據(jù)統(tǒng)計(jì)與分析2.1數(shù)據(jù)統(tǒng)計(jì)與分析的基本范疇22.1數(shù)據(jù)統(tǒng)計(jì)與分析的基本范疇2.1.1總體與樣本

統(tǒng)計(jì)學(xué)中,把性質(zhì)相同的研究對(duì)象的所有觀測(cè)結(jié)果的集合稱(chēng)為總體(population)。總體又分為無(wú)限總體和有限總體。 在實(shí)際工作中,常常是從被研究的總體中隨機(jī)抽取部分觀測(cè)結(jié)果進(jìn)行研究。每個(gè)部分觀測(cè)結(jié)果的集合稱(chēng)為樣本。 從總體中隨機(jī)抽取樣本用以推斷總體的方法稱(chēng)為抽樣研究。

2.1數(shù)據(jù)統(tǒng)計(jì)與分析的基本范疇2.1.1總體與樣本32.1.2參數(shù)與統(tǒng)計(jì)量統(tǒng)計(jì)指標(biāo) 統(tǒng)計(jì)學(xué)中,把根據(jù)規(guī)定的函數(shù)關(guān)系計(jì)算出的描述總體或樣本特征的函數(shù)值稱(chēng)為統(tǒng)計(jì)指標(biāo)(index)。參數(shù) 由總體資料計(jì)算出的統(tǒng)計(jì)指標(biāo)稱(chēng)為參數(shù)(parameter),用于描述總體特征。統(tǒng)計(jì)量 由樣本資料計(jì)算出的統(tǒng)計(jì)指標(biāo)稱(chēng)為統(tǒng)計(jì)量(statistic),用于描述樣本特征。2.1.2參數(shù)與統(tǒng)計(jì)量統(tǒng)計(jì)指標(biāo)42.1.3變異與誤差變異(variation) 變異指觀測(cè)結(jié)果之間實(shí)際存在的差異。誤差(error) 誤差指觀測(cè)結(jié)果與真實(shí)值之差及統(tǒng)計(jì)量與參數(shù)之差。過(guò)失誤差(grosserror)——過(guò)失誤差可以避免;系統(tǒng)誤差(systematicerror)——系統(tǒng)誤差可以減少;隨機(jī)誤差(randomerror)——隨機(jī)誤差無(wú)法消除。2.1.3變異與誤差變異(variation)52.2常用的統(tǒng)計(jì)指標(biāo)2.2.1平均數(shù)2.2.2變異數(shù)2.2.3相對(duì)數(shù)2.2常用的統(tǒng)計(jì)指標(biāo)2.2.1平均數(shù)62.2.1平均數(shù)定義 平均數(shù)(average)是表示觀測(cè)值的平均水平的統(tǒng)計(jì)指標(biāo),常用的有算術(shù)平均數(shù)、幾何均數(shù)及中位數(shù)。2.2.1平均數(shù)定義72.2.1.1算術(shù)均數(shù)定義 算術(shù)均數(shù)(arithmeticmean),簡(jiǎn)稱(chēng)均數(shù),常用、希臘字母μ表示,表示樣本均數(shù),μ表示總體均數(shù)。均數(shù)適用于正態(tài)分布資料統(tǒng)計(jì)。計(jì)算方法直接計(jì)算法頻數(shù)-加權(quán)計(jì)算法2.2.1.1算術(shù)均數(shù)定義8直接計(jì)算法 當(dāng)觀察值的個(gè)數(shù)不多時(shí),將所有觀察值x1,x2,x3,…,xn直接相加,其和除以觀察值的個(gè)數(shù)n,即為均數(shù)。 計(jì)算公式: 式中, 算術(shù)平均數(shù) x1,…,xn 各觀察值 ∑ 求和符號(hào) ∑x 觀察值總和 n 觀察值的個(gè)數(shù)直接計(jì)算法9頻數(shù)-加權(quán)計(jì)算法

對(duì)一個(gè)隨機(jī)事件作重復(fù)觀察,其中某觀察值出現(xiàn)的次數(shù)稱(chēng)頻數(shù); 各觀察值對(duì)應(yīng)的頻數(shù)稱(chēng)為頻數(shù)分布;顯示各觀察值對(duì)應(yīng)的頻數(shù)的表格稱(chēng)為頻數(shù)分布表,簡(jiǎn)稱(chēng)頻數(shù)表。頻數(shù)-加權(quán)計(jì)算法10

頻數(shù)-加權(quán)計(jì)算法計(jì)算步驟

①計(jì)算全距 找出觀察值中的最大值、最小值,并計(jì)算全距(range),全距=最大值-最小值。 ②定組段數(shù) 一般取8~15個(gè)為宜,多取10個(gè),組段數(shù)太多,計(jì)算較繁,組段數(shù)過(guò)少則誤差較大。 ③定組距(classinterval) 相鄰兩組段下限值之差為組距(classinterval)。各組段的組距可以相等,也可以不等。若擬定為相等組距,則組距=全距/組段數(shù),為便于觀察值歸組,組距常取整數(shù)。頻數(shù)-加權(quán)計(jì)算法計(jì)算步驟11

④定組段(classrange) 即定各組數(shù)據(jù)的上下限,俗稱(chēng)“封口”。通常,某組段的最小值為下限(lowerlimit),相鄰較大組段的下限即本組段的上限(upperlimit)。第一組段應(yīng)包括最小值,最末組段應(yīng)包括最大值。

⑤計(jì)數(shù)(fi) 劃分組段后,將原始數(shù)據(jù)以適當(dāng)方式劃記計(jì)數(shù)(常用“正”字法)歸組。得頻數(shù)分布表。

⑥計(jì)算組中值(Classmid-value)(xi) 組中值= ⑦計(jì)算均數(shù)

將各組段的頻數(shù)與組中值之積相加求和,再除以總頻數(shù)即得均數(shù)。

第二章環(huán)境數(shù)據(jù)統(tǒng)計(jì)與分析課件122.2.1.2幾何均數(shù)定義

幾何均數(shù)(geometricmean,G),也叫倍數(shù)均數(shù),當(dāng)觀察值相差較大甚至成倍數(shù)關(guān)系時(shí),如用算術(shù)均數(shù)表示其平均水平時(shí)受少數(shù)特大或特小值影響較大,則用幾何均數(shù)來(lái)表示其平均水平。計(jì)算步驟

先對(duì)觀察值取數(shù)值,計(jì)算對(duì)數(shù)值的均數(shù)后,再查反對(duì)數(shù),即得幾何均數(shù)。計(jì)算方法直接計(jì)算法頻數(shù)表法2.2.1.2幾何均數(shù)定義13直接計(jì)算法直接計(jì)算法14頻數(shù)表法 當(dāng)觀察值較多時(shí),可先編頻數(shù)表,再按頻數(shù)表計(jì)算幾何均數(shù)。頻數(shù)表法152.2.1.3中位數(shù)定義

中位數(shù)(median,M,Md)指全部觀察值按大小順序排列,居于中間位置的數(shù)值。 偏態(tài)分布資料,一端或兩端有不確定數(shù)值分布的資料,分布情況不清的資料,適宜用中位數(shù)統(tǒng)計(jì)。計(jì)算方法直接計(jì)算法頻數(shù)表法2.2.1.3中位數(shù)定義16直接計(jì)算法

樣本含量n較少時(shí),先將觀察值按大小順序排列,再進(jìn)行計(jì)算。

直接計(jì)算法17頻數(shù)表法 中位數(shù)是一個(gè)特定的百分位數(shù),在全部觀察值中有一半比它大,一半比它小。當(dāng)例數(shù)較多時(shí),先將觀察值編制頻數(shù)表,再按公式計(jì)算。

頻數(shù)表法182.2.2變異數(shù)定義

變異數(shù)是表示觀察值變異水平的統(tǒng)計(jì)指標(biāo),常用指標(biāo)有極差、方差、標(biāo)準(zhǔn)差和變異系數(shù)等。

2.2.2變異數(shù)定義192.2.2.1極差定義

亦稱(chēng)全距(rangc,R),即一組觀察值中最大值與最小值之差。R=Xmax-Xmin特點(diǎn)

全距反映了變異的范圍,極差大,變異度大;極差小,變異度小。缺點(diǎn)

用極差表示變異程度的大小簡(jiǎn)單明了,但它僅考慮了觀察值的最大值和最小值,而沒(méi)有考慮其他數(shù)值,因此是不夠全面的。

2.2.2.1極差定義202.2.2.2方差

要克服全距的缺點(diǎn),必須全面考慮到每個(gè)觀察值。 首先考慮用每一個(gè)觀察值與均數(shù)之差的和即離均差總和Σ(x-)來(lái)描述。 再考慮用離均差平方和∑(x-)2來(lái)描述。 最終考慮用離均差平方和的均數(shù)即方差S2來(lái)描述。

2.2.2.2方差 要克服全距的缺點(diǎn),必須全面考慮到每212.2.2.3標(biāo)準(zhǔn)差定義

為了保持與原觀察值及其均數(shù)的單位一致,將方差開(kāi)平方,即得標(biāo)準(zhǔn)差,以S表示。特點(diǎn)

標(biāo)準(zhǔn)差直接表示觀察值分布的離散程度,間接反映樣本的代表性。 在觀察單位數(shù)相同,均數(shù)相近條件下,標(biāo)準(zhǔn)差較大,表明觀察值的變異程度較大,即觀察值圍繞均數(shù)的分布較離散,因而樣本的代表性較差;反之,標(biāo)準(zhǔn)差較小,表明觀察值的變異程度較小,觀察值圍繞均數(shù)的分布較密集,樣本的代表性好。2.2.2.3標(biāo)準(zhǔn)差定義222.2.2.4變異系數(shù)定義 對(duì)均數(shù)相差較大或性質(zhì)不同的資料,不能直接用標(biāo)準(zhǔn)差比較變異程度的大小,要用變異系數(shù)作比較。特點(diǎn)

與標(biāo)準(zhǔn)差一樣,變異系數(shù)愈大,表明觀察值的變異程度愈大,變異系數(shù)愈小,表明變異程度愈小。

2.2.2.4變異系數(shù)定義232.2.3相對(duì)數(shù)定義

環(huán)境研究直接觀測(cè)到的數(shù)據(jù)稱(chēng)為絕對(duì)數(shù),絕對(duì)數(shù)雖然能反映調(diào)查中所發(fā)現(xiàn)的某種現(xiàn)象的絕對(duì)水平,但作深入分析時(shí),僅看絕對(duì)數(shù)是不夠的,必須考慮使用相對(duì)數(shù)(relativenumber),即兩個(gè)有聯(lián)系的指標(biāo)之比。 常用相對(duì)數(shù)有率、比等。

2.2.3相對(duì)數(shù)定義242.2.3.1率定義

率(rate)是某一現(xiàn)象發(fā)生的頻度(頻繁程度)或強(qiáng)度,通常指在一定條件下某種現(xiàn)象實(shí)際發(fā)生的次數(shù)與可能發(fā)生該現(xiàn)象的總次數(shù)之比。率=

率的比例基數(shù)可用100、1000、10,000、100,000等分別稱(chēng)為百分率,千分率,萬(wàn)分率,或十萬(wàn)分率。環(huán)境監(jiān)測(cè)常用的率有:

檢出率= 回收率= 最高濃度出現(xiàn)率= 殘留率= 超標(biāo)率=

2.2.3.1率定義252.2.3.2構(gòu)成比定義

構(gòu)成比(constitutionratio)是事物內(nèi)部某種構(gòu)成部分對(duì)總體之比。說(shuō)明部分在總體中所占的比重,是一種用來(lái)表示事物內(nèi)部各構(gòu)成情況的指標(biāo)。 構(gòu)成比=

2.2.3.2構(gòu)成比定義262.2.3.3相對(duì)比定義

相對(duì)比(relativeratio)指兩個(gè)有關(guān)聯(lián)的同類(lèi)指標(biāo)的比。以倍數(shù)或百分?jǐn)?shù)(%)來(lái)表示,其計(jì)算式: 相對(duì)比=常用的相對(duì)比有倍數(shù)、指數(shù)、系數(shù)等。

2.2.3.3相對(duì)比定義27倍數(shù) 在大氣監(jiān)測(cè)中,經(jīng)常用測(cè)定值與國(guó)家衛(wèi)生標(biāo)準(zhǔn)值的比較來(lái)評(píng)價(jià)車(chē)間、工廠或大氣的污染程度。指數(shù)(index) 環(huán)境保護(hù)研究中,指數(shù)是環(huán)境污染物的實(shí)測(cè)濃度對(duì)該污染物在環(huán)境中的容許濃度的比值,是環(huán)境質(zhì)量評(píng)價(jià)的常用手段。

I=

I:環(huán)境質(zhì)量指數(shù) C:污染物實(shí)測(cè)平均濃度 S:污染物容許標(biāo)準(zhǔn)。系數(shù) 如排毒系數(shù),環(huán)境污染物的排放濃度對(duì)該污染物的排放標(biāo)準(zhǔn)的比值,用于表示各種污染物和污染源對(duì)環(huán)境的毒害的潛在能力。倍數(shù)282.3環(huán)境樣本特征推斷環(huán)境樣本特征 主要指環(huán)境樣本的分布形式和環(huán)境樣本的正常值范圍等,可以利用獲得的統(tǒng)計(jì)量進(jìn)行統(tǒng)計(jì)處理,完成上述推斷工作。2.3環(huán)境樣本特征推斷環(huán)境樣本特征292.3.1樣本特征推斷的理論基礎(chǔ)--正態(tài)分布定義 正態(tài)分布(normaldistribution)又稱(chēng)高斯分布(GaussianDistribution),是以均數(shù)為中心的對(duì)稱(chēng)鐘型分布。 正態(tài)曲線是一條高峰位于中央,兩側(cè)完全對(duì)稱(chēng)并逐漸下降但永遠(yuǎn)不與橫軸相交的鐘形曲線 正態(tài)曲線由和兩個(gè)參數(shù)決定,為總體均數(shù),為總體標(biāo)準(zhǔn)差。決定正態(tài)曲線的位置,決定正態(tài)曲線形狀。2.3.1樣本特征推斷的理論基礎(chǔ)--正態(tài)分布定義302.3.2樣本特征推斷樣本分布形式的判定確定正常值范圍確定樣本所代表總體的理論頻數(shù)分布2.3.2樣本特征推斷樣本分布形式的判定312.4參數(shù)估計(jì)定義 探知研究對(duì)象的總體特征是環(huán)境研究的主要目標(biāo),由于總體龐大的原因,直接計(jì)算參數(shù)是極其困難的,因此,往往用樣本統(tǒng)計(jì)量來(lái)估計(jì)總體參數(shù),這個(gè)過(guò)程稱(chēng)為參數(shù)估計(jì)(estimationofparameter)。 本節(jié)主要討論總體均數(shù)估計(jì)的基本問(wèn)題??傮w均數(shù)估計(jì)分為點(diǎn)估計(jì)和區(qū)間估計(jì)。 點(diǎn)估計(jì)(pointestimation)是根據(jù)一個(gè)樣本求出總體參數(shù)的具體數(shù)值,常用根據(jù)極大似然法原理導(dǎo)出的公式計(jì)算極大似然估計(jì)量。 由于存在變異和抽樣的隨機(jī)性,用不同的樣本推斷總體時(shí),可能得到不同的參數(shù)估計(jì)值。因此更穩(wěn)妥的辦法是采用區(qū)間估計(jì)。2.4參數(shù)估計(jì)定義322.4.1總體均數(shù)區(qū)間估計(jì)的理論基礎(chǔ)――t分布

2.4.1.1抽樣誤差定義 對(duì)樣本的統(tǒng)計(jì)結(jié)果與總體的“真實(shí)”之間必然存在差異,這種由于抽樣而引起的樣本與總體之間的差異稱(chēng)為抽樣誤差。標(biāo)準(zhǔn)誤差

樣本均數(shù)的標(biāo)準(zhǔn)差稱(chēng)為標(biāo)準(zhǔn)誤差,。計(jì)算公式為:

在實(shí)際工作中,總體標(biāo)準(zhǔn)差常屬未知,只能用樣本標(biāo)準(zhǔn)差S代替作為最佳的無(wú)偏估計(jì),于是標(biāo)準(zhǔn)誤的計(jì)算公式變?yōu)椋?.4.1總體均數(shù)區(qū)間估計(jì)的理論基礎(chǔ)――t分布2.4.332.4.1.2描述樣本均數(shù)的分布――t分布

從一個(gè)均數(shù)為,標(biāo)準(zhǔn)差為的正態(tài)總體中,隨機(jī)抽取含量為n的樣本,可計(jì)算樣本均數(shù),樣本標(biāo)準(zhǔn)誤,則將樣本均數(shù)與總體均數(shù)的離差以樣本標(biāo)準(zhǔn)誤為單位,得正態(tài)(離)差t=,若干樣本的t值就構(gòu)成統(tǒng)計(jì)上著名的t分布。 實(shí)際工作中總體標(biāo)準(zhǔn)差往往是不知道的,只能用樣本標(biāo)準(zhǔn)差S來(lái)代替,于是得 t==

2.4.1.2描述樣本均數(shù)的分布――t分布 從一個(gè)均數(shù)342.4.2總體均數(shù)的區(qū)間估計(jì)區(qū)間估計(jì)(intervalestimation) 按預(yù)先給定的概率,由一個(gè)樣本均數(shù)及其標(biāo)準(zhǔn)誤求出總體均數(shù)數(shù)值范圍的過(guò)程?!邦A(yù)先給定的概率” 也稱(chēng)為可信度、可信水平、可信系數(shù),符號(hào)為1-α,常取0.99或0.95?!翱傮w均數(shù)數(shù)值范圍” 也稱(chēng)為可信區(qū)間,符號(hào)為CI。其含義是:由一個(gè)樣本均數(shù)及其標(biāo)準(zhǔn)誤求出的被估計(jì)參數(shù)值有0.99或0.95的可能在此數(shù)值范圍內(nèi),或由若干個(gè)樣本均數(shù)及其標(biāo)準(zhǔn)誤求出的若干個(gè)被估計(jì)參數(shù)值中,有99%或95%的個(gè)數(shù)可能在此數(shù)值范圍內(nèi)。

2.4.2總體均數(shù)的區(qū)間估計(jì)區(qū)間估計(jì)(interval352.4.3總體率的區(qū)間估計(jì) 可仿照總體均數(shù)的可信區(qū)間估計(jì)的方法來(lái)估計(jì)總體率的所在范圍,即求總體率的可信區(qū)間,我們介紹兩種方法。正態(tài)近似法

當(dāng)n足夠大,且p和(1-p)不接近零,有np和n(1-p)均大于5時(shí),總體率的可信區(qū)間為: 式中uα為可信度1-α?xí)r的標(biāo)準(zhǔn)正態(tài)離差,由u界值得知,如99%可信區(qū)間時(shí),α=0.01,uα=2.58,95%可信區(qū)間時(shí),α=0.05,uα=1.96。

查表法

當(dāng)n≤1000,p≥l%時(shí),可查附表3(百分率的可信限表),得到總體率的可信區(qū)間。

2.4.3總體率的區(qū)間估計(jì) 可仿照總體均數(shù)的可信區(qū)間估362.5顯著性檢驗(yàn)兩均數(shù)差異顯著性檢驗(yàn)樣本均數(shù)與總體均數(shù)的差異顯著性檢驗(yàn)兩樣本均數(shù)的差異顯著性檢驗(yàn)兩個(gè)幾何級(jí)數(shù)樣本均數(shù)的差異顯著性檢驗(yàn)配對(duì)資料的差異顯著性檢驗(yàn)兩個(gè)大樣本均數(shù)的顯著性檢驗(yàn)——u檢驗(yàn)方差不齊的兩樣本均數(shù)差異的顯著性檢驗(yàn)——tˊ檢驗(yàn)2.5顯著性檢驗(yàn)兩均數(shù)差異顯著性檢驗(yàn)372.5.1顯著性檢驗(yàn)的含義與一般步驟含義 在回答樣本與總體是否有本質(zhì)差異或差異是否有顯著時(shí),必須考慮:樣本與總體差異無(wú)顯著性和樣本與總體差異有顯著性2種情況。究竟屬于那種情況,需通過(guò)差異顯著性檢驗(yàn)來(lái)回答。顯著性檢驗(yàn)的步驟建立“檢驗(yàn)假設(shè)”確定檢驗(yàn)水準(zhǔn)選擇檢驗(yàn)方法和計(jì)算統(tǒng)計(jì)量確定概率做出推斷結(jié)論2.5.1顯著性檢驗(yàn)的含義與一般步驟含義382.5.2兩均數(shù)差異顯著性檢驗(yàn)2.5.2.1兩均數(shù)差異顯著性檢驗(yàn)的基本思路 t檢驗(yàn)是檢驗(yàn)兩均數(shù)間差異顯著性的基本方法。 按式(2.20)計(jì)算統(tǒng)計(jì)量t值后,與根據(jù)相應(yīng)自由度查附表2(t值表)所得的t界值進(jìn)行比較,判斷均數(shù)間差異的顯著性。 ∣t∣﹤t0.05(v)P﹥0.05差異無(wú)顯著性 若t0.05(v)≤∣t∣﹤t0.01(v)則0.05≥P﹥0.01即差異有顯著性 ∣t∣≥t0.01(v)P≤0.01差異有極顯著性 當(dāng)v(自由度)﹥50時(shí),可直接采用正態(tài)分布臨界值1.96或2.58來(lái)判斷P大于還是小于0.05或0.01。2.5.2兩均數(shù)差異顯著性檢驗(yàn)2.5.2.1兩均數(shù)392.5.2.2樣本均數(shù)與總體均數(shù)的差異顯著性檢驗(yàn)【例2.17】解題步驟:建立檢驗(yàn)假設(shè)計(jì)算t值確定p值結(jié)果判斷2.5.2.2樣本均數(shù)與總體均數(shù)的差異顯著性檢驗(yàn)【例402.5.2.3兩樣本均數(shù)的差異顯著性檢驗(yàn)

兩樣本均數(shù)比較是最常見(jiàn)的統(tǒng)計(jì)比較研究,又稱(chēng)成組比較,其目的是推斷兩樣本分別代表的總體均數(shù)μ1與μ2是否相等。

采用下面的公式來(lái)檢驗(yàn)兩均數(shù)的差異是否有顯著性。2.5.2.3兩樣本均數(shù)的差異顯著性檢驗(yàn) 兩樣本均數(shù)412.5.2.4兩個(gè)幾何級(jí)數(shù)樣本均數(shù)的差異顯著性檢驗(yàn) 檢驗(yàn)兩個(gè)幾何均數(shù)的差別是否有顯著性,所采用的方法,仍然是t檢驗(yàn)法,只是將所有數(shù)值全部轉(zhuǎn)換為對(duì)數(shù)值進(jìn)行計(jì)算。2.5.2.4兩個(gè)幾何級(jí)數(shù)樣本均數(shù)的差異顯著性檢驗(yàn) 422.5.2.5配對(duì)資料的差異顯著性檢驗(yàn) 在實(shí)驗(yàn)研究中,常采用配對(duì)比較的方法。配對(duì)研究的目的是比較兩種處理方法或?qū)嶒?yàn)前后的結(jié)果有無(wú)差異。 配對(duì)資料的實(shí)驗(yàn)設(shè)計(jì)有兩種:①同體配對(duì),實(shí)驗(yàn)對(duì)象自身對(duì)比;②非同體配對(duì)。

2.5.2.5配對(duì)資料的差異顯著性檢驗(yàn) 在實(shí)驗(yàn)研究中432.5.2.6兩個(gè)大樣本均數(shù)的顯著性檢驗(yàn)—u檢驗(yàn) 當(dāng)兩個(gè)樣本的觀察單位數(shù)較多時(shí)(每組n﹥50),資料分布基本近似于正態(tài)分布,可以用u檢驗(yàn)。 計(jì)算出u值后,直接根據(jù)表2.13u檢驗(yàn)的檢驗(yàn)水準(zhǔn)表作出結(jié)果判斷。2.5.2.6兩個(gè)大樣本均數(shù)的顯著性檢驗(yàn)—u檢驗(yàn) 442.5.2.7方差不齊的兩樣本均數(shù)差異的顯著性檢驗(yàn)——tˊ檢驗(yàn) 使用t檢驗(yàn)的前提條件是兩個(gè)總體的方差相等,。 事實(shí)上,即使兩個(gè)總體方差相等,樣本方差也會(huì)因?yàn)槌闃佣霈F(xiàn)波動(dòng),因此必需對(duì)兩組樣本進(jìn)行方差齊性檢驗(yàn)。如果方差齊性檢驗(yàn)顯示方差不齊時(shí),則不能直接采用t檢驗(yàn),需要用校正t檢驗(yàn)法(tˊ檢驗(yàn))。方差齊性檢驗(yàn)計(jì)算F統(tǒng)計(jì)量查附表4(方差齊性F界值表)做出兩總體方差是否相等的推斷tˊ檢驗(yàn)

計(jì)算均數(shù)標(biāo)準(zhǔn)誤平方計(jì)算兩樣本均數(shù)差數(shù)的標(biāo)準(zhǔn)誤計(jì)算tˊ值求tˊ顯著性界限的近似值2.5.2.7方差不齊的兩樣本均數(shù)差異的顯著性檢驗(yàn)——t452.5.3

多均數(shù)差異的顯著性檢驗(yàn)——F檢驗(yàn)

在環(huán)境研究工作中,經(jīng)常有兩個(gè)以上的均數(shù)需要同時(shí)進(jìn)行比較,這時(shí),若應(yīng)用上述的t檢驗(yàn)法,則必須對(duì)每?jī)蓚€(gè)均數(shù)進(jìn)行t檢驗(yàn),比較繁瑣。而應(yīng)用F檢驗(yàn)法(即方差分析法)可使顯著性檢驗(yàn)大為簡(jiǎn)化。 方差分析又稱(chēng)變異數(shù)分析,其基本思想是把全部觀察值之間總變異,按設(shè)計(jì)和需要分為二個(gè)或多個(gè)組成部分進(jìn)行分析??傋儺惖姆诸?lèi)在單因素的完全隨機(jī)設(shè)計(jì)的實(shí)驗(yàn)資料中,總變異可分為組內(nèi)變異和組間變異。在配伍組設(shè)計(jì)的資料中,總變異可分為處理組間變異、配伍組間變異及誤差三部分。在2×2析因設(shè)計(jì)資料中,總變異可分為兩個(gè)因素的兩個(gè)組間變異、兩因素交互作用及誤差四部分。2.5.3

多均數(shù)差異的顯著性檢驗(yàn)——F檢驗(yàn) 462.5.3.1單因素多個(gè)樣本均數(shù)比較比較步驟檢驗(yàn)假設(shè)計(jì)算校正數(shù)確定P值結(jié)果判斷2.5.3.1單因素多個(gè)樣本均數(shù)比較比較步驟472.5.3.2兩因素多個(gè)樣本均數(shù)比較比較步驟列計(jì)算表計(jì)算校正數(shù)(C)計(jì)算離均差平方和(SS)計(jì)算自由度計(jì)算均方(MS)計(jì)算F值確定P值并判斷結(jié)果2.5.3.2兩因素多個(gè)樣本均數(shù)比較比較步驟482.5.3.3多組均數(shù)間兩兩比較 資料經(jīng)F檢驗(yàn)后,各組均數(shù)間的差異為無(wú)顯著性,則不須作進(jìn)一步的統(tǒng)計(jì)處理;如果各組均數(shù)間的差異有顯著意義,則須作進(jìn)一步的分析,以檢驗(yàn)兩兩均數(shù)間的差異哪些是有顯著性的。比較步驟檢驗(yàn)假設(shè)計(jì)算q值求處理數(shù)(a)根據(jù)誤差的自由度及處理數(shù)(a)查附表6(q值表),得q的顯著界值。確定P值與判斷結(jié)果2.5.3.3多組均數(shù)間兩兩比較 資料經(jīng)F檢驗(yàn)后,各組492.5.4兩率差異的顯著性檢驗(yàn)2.5.4.1率的抽樣誤差定義 樣本率與總體率間的差異情況是由于抽樣造成的,稱(chēng)為率的抽樣誤差。公式 率的抽樣誤差可用率的標(biāo)準(zhǔn)誤來(lái)表示。2.5.4兩率差異的顯著性檢驗(yàn)2.5.4.1率的抽502.5.4.2大樣本率與總體率差異的顯著性檢驗(yàn)——u檢驗(yàn) 通常,樣本率與總體率之間進(jìn)行比較時(shí),如樣本含量較大(一般大于50),可采用u檢驗(yàn)。 再依據(jù)表作判斷。2.5.4.2大樣本率與總體率差異的顯著性檢驗(yàn)——u檢驗(yàn)512.5.4.3兩大樣本率的差異顯著性檢驗(yàn)——u檢驗(yàn)公式 檢驗(yàn)兩個(gè)樣本率的差異是否顯著時(shí),可用公式:2.5.4.3兩大樣本率的差異顯著性檢驗(yàn)——u檢驗(yàn)公式522.5.4.4兩大樣本率的差異顯著性檢驗(yàn)——四格表檢驗(yàn)檢驗(yàn)范圍 檢驗(yàn)(卡方檢驗(yàn))常用以檢驗(yàn)兩個(gè)率或多個(gè)率之間的差別,兩組或多組資料內(nèi)部構(gòu)成之間的差別,理論分布數(shù)列與實(shí)際觀察分布數(shù)列之間的差別,兩個(gè)觀察數(shù)列之間的差別是否有顯著性等。公式 檢驗(yàn)的基本公式:X2= 式中A實(shí)際數(shù) T理論數(shù)

檢驗(yàn)步驟:(1)檢驗(yàn)假設(shè)(2)計(jì)算值(3)確定概率,做出判斷

2.5.4.4兩大樣本率的差異顯著性檢驗(yàn)——四格表53四格表專(zhuān)用公式法 四格表專(zhuān)用公式是從基本公式推導(dǎo)出來(lái)的,故兩者計(jì)算的結(jié)果是相同的。四格表的形式:四格表專(zhuān)用公式:四格表專(zhuān)用公式法542.5.4.5n>40且有一個(gè)理論數(shù)小于5的兩率差異顯著性檢驗(yàn)——四格表校正值檢驗(yàn)

公式

= = 2.5.4.5n>40且有一個(gè)理論數(shù)小于5的兩率差異顯著552.5.4.6n<40且有一個(gè)理論數(shù)小于5的兩率差異顯著性檢驗(yàn)——精確檢驗(yàn)法

四格表中有實(shí)際值為零時(shí),計(jì)算概率的公式為: P= 式中!階乘,規(guī)定0?。?。四格表中無(wú)實(shí)際值為零時(shí) 【例2.31】2.5.4.6n<40且有一個(gè)理論數(shù)小于5的兩率差異顯著562.5.5多率的差異顯著性檢驗(yàn)——行×列的檢驗(yàn)定義 當(dāng)資料的組數(shù)或處理方法超過(guò)兩組(即行數(shù)或列數(shù)超過(guò)兩組)時(shí),通稱(chēng)為行×列表或稱(chēng)R×C表,其檢驗(yàn)方法,可用的基本公式法,也可采用行×列表專(zhuān)用公式法。公式 行×列表專(zhuān)用公式為:2.5.5多率的差異顯著性檢驗(yàn)——行×列的檢驗(yàn)定572.5.6配對(duì)計(jì)數(shù)資料的差異顯著性檢驗(yàn)——檢驗(yàn)通過(guò)配對(duì)的方法進(jìn)行實(shí)驗(yàn),如每一對(duì)實(shí)驗(yàn)對(duì)象分別給予不同的處理,或同一實(shí)驗(yàn)對(duì)象,先后給予不同的處理,既可獲得計(jì)量資料,也可獲得計(jì)數(shù)資料,這類(lèi)計(jì)數(shù)資料的率的差別顯著性檢驗(yàn),采用配對(duì)的檢驗(yàn)法。公式 計(jì)算公式: = 當(dāng)b+c<40時(shí),則改用校正公式: =2.5.6配對(duì)計(jì)數(shù)資料的差異顯著性檢驗(yàn)——檢驗(yàn)582.6直線相關(guān)與直線回歸相關(guān)(correlation)

相關(guān)指兩事物或兩變量之間呈現(xiàn)某種相依變動(dòng)關(guān)系。 相關(guān)有直線相關(guān)、曲線相關(guān)、多元線性相關(guān),直線相關(guān)是最簡(jiǎn)單的相關(guān)?;貧w(regression)

回歸原指樣本統(tǒng)計(jì)量向總體參數(shù)靠攏或回歸的現(xiàn)象,現(xiàn)指利用方程描述變量變化的數(shù)量關(guān)系。 回歸有直線回歸、曲線擬合、多元線性回歸,直線回歸是最簡(jiǎn)單的回歸。

2.6直線相關(guān)與直線回歸相關(guān)(correlation)592.6.1直線相關(guān)定義

如果相關(guān)散點(diǎn)圖顯示一個(gè)變量X由小到大變化,另一個(gè)變量Y亦相應(yīng)地呈直線由小到大(或由大到?。┳兓?,則這兩個(gè)變量間有直線關(guān)系;散點(diǎn)圖顯示的相關(guān)性質(zhì)和密切程度,由直線相關(guān)系數(shù)描述。這種直線關(guān)系以及分析這種直線關(guān)系的理論和方法,統(tǒng)稱(chēng)直線相關(guān)(linearcorrelation)。

2.6.1直線相關(guān)定義602.6.1.1相關(guān)散點(diǎn)圖與相關(guān)系數(shù)相關(guān) 以橫軸(X)代表汽車(chē)輛數(shù),以縱軸(Y)代表NO2濃度,繪制相關(guān)散點(diǎn)圖,見(jiàn)下圖。

從圖中可見(jiàn),隨著汽車(chē)輛數(shù)的增加,大氣中NO2的濃度也隨之增高,呈現(xiàn)從左下到右上的變化趨勢(shì)。我們稱(chēng)這種“從左下到右上的變化趨勢(shì)”為正相關(guān)。

2.6.1.1相關(guān)散點(diǎn)圖與相關(guān)系數(shù)相關(guān)61事實(shí)上,除正相關(guān)外,相關(guān)散點(diǎn)圖的散點(diǎn)分布還有多種情形,見(jiàn)下圖。

事實(shí)上,除正相關(guān)外,相關(guān)散點(diǎn)圖的散點(diǎn)分布還有多種情形62相關(guān)系數(shù)定量地表示變量間的線性相關(guān)程度及相關(guān)方向。相關(guān)系數(shù)沒(méi)有單位,其值在-1至+1之間。正相關(guān): 散點(diǎn)的Y值隨X值增加而上升,0<r≤1,如圖2.7(a);如果散點(diǎn)完全在一條直線上,則為完全正相關(guān),r=1,如上圖(b)。負(fù)相關(guān): 散點(diǎn)的Y值隨X值增加而減少,-l≤r<0,如上圖(c);如果散點(diǎn)完全在一條直線上,則為完全負(fù)相關(guān),r=-1,如上圖(d)。零相關(guān): 散點(diǎn)的X與Y的數(shù)值增減無(wú)一定規(guī)律,或Y值的變化不受X變化的影響,r=0,如上圖(e、f、g)。無(wú)線性相關(guān): 散點(diǎn)的X與Y的數(shù)值增減服從非直線規(guī)律,r=0,如上圖(h)。相關(guān)系數(shù)632.6.1.2相關(guān)系數(shù)的計(jì)算計(jì)算公式

r==2.6.1.2相關(guān)系數(shù)的計(jì)算計(jì)算公式642.6.2相關(guān)系數(shù)的顯著性檢驗(yàn)定義

由于抽樣誤差的影響,從相關(guān)系數(shù)為零的總體中隨機(jī)抽取的樣本的相關(guān)系數(shù)不一定為零,檢驗(yàn)樣本相關(guān)系數(shù)不等于零的可能性,即稱(chēng)為相關(guān)系數(shù)的差異顯著性檢驗(yàn)。常用方法為檢驗(yàn)。2.6.2相關(guān)系數(shù)的顯著性檢驗(yàn)定義652.6.2.1計(jì)算法計(jì)算步驟(1)檢驗(yàn)假設(shè)

X與Y沒(méi)有相關(guān)關(guān)系,即總體相關(guān)系數(shù)=0,樣本相關(guān)系數(shù)r是從中抽取,r與的差別是由于抽樣誤差而引起。

(2)計(jì)算

(3)確定P值與判斷結(jié)果2.6.2.1計(jì)算法計(jì)算步驟662.6.2.2查表法椐自由度n′=n-2查附表8(相關(guān)系數(shù)r界值表),據(jù)界值與計(jì)算相關(guān)系數(shù)的比較結(jié)果判定。2.6.2.2查表法椐自由度n′=n-2查附表8(相關(guān)672.6.3直線回歸2.6.3.1直線回歸概述 環(huán)境研究中,常需由一個(gè)變量(自變量,X)推算另一個(gè)變量(因變量,Y)的估計(jì)值,稱(chēng)為回歸分析。 直線回歸(linearregression)分析的任務(wù)是,按照各點(diǎn)到直線的距離的平方和最小的要求,確定一條最接近于各點(diǎn)的直線(回歸直線),并建立這條直線的方程(回歸方程,regressionequation),以描述兩變量的變化規(guī)律或進(jìn)行變量推算。2.6.3直線回歸2.6.3.1直線回歸概述682.6.3.2回歸方程的建立 【例2.37】解題步驟:計(jì)算基本數(shù)據(jù):、、、、。相關(guān)系數(shù)r及其顯著性檢驗(yàn)。按(2.51)式計(jì)算回歸系數(shù)。按(2.53)式計(jì)算截距a。按(2.54)建立回歸方程=a+bX。顯示回歸線。2.6.3.2回歸方程的建立 【例2.37】692.6.3.3 回歸方程的顯著性檢驗(yàn)(1)單樣本回歸系數(shù)的顯著性檢驗(yàn) 回歸系數(shù)的顯著性檢驗(yàn)也用t檢驗(yàn)。 ①檢驗(yàn)假設(shè) ②計(jì)算標(biāo)準(zhǔn)估計(jì)誤差 ③計(jì)算、值 ④確定P值及結(jié)果判斷2.6.3.3 回歸方程的顯著性檢驗(yàn)(1)單樣本回歸系數(shù)70(2)兩樣本回歸系數(shù)的差異顯著性檢驗(yàn) 若通過(guò)兩個(gè)樣本,獲得兩個(gè)回歸系數(shù)b1和b2,回歸系數(shù)的標(biāo)準(zhǔn)誤分別為Sb1和Sb2,需對(duì)兩樣本之間的差異進(jìn)行顯著性檢驗(yàn)。 ①檢驗(yàn)假設(shè) ②按公式計(jì)算t值 ③確定P值及結(jié)果判斷(2)兩樣本回歸系數(shù)的差異顯著性檢驗(yàn)712.7環(huán)境數(shù)據(jù)統(tǒng)計(jì)與分析的計(jì)算機(jī)處理 2.7.1均數(shù)2.7.1.1算術(shù)均數(shù)直接計(jì)算法頻數(shù)-加權(quán)計(jì)算法2.7.1.2幾何均數(shù)直接計(jì)算法頻數(shù)表計(jì)算法

2.7環(huán)境數(shù)據(jù)統(tǒng)計(jì)與分析的計(jì)算機(jī)處理 2.7.1均數(shù)722.7.2中位數(shù)直接計(jì)算法頻數(shù)表計(jì)算法2.7.3變異數(shù)標(biāo)準(zhǔn)差變異系數(shù)2.7.2中位數(shù)732.7.4樣本特征推斷2.7.4.1樣本分布形式的判定輸入原始數(shù)據(jù)計(jì)算均值、標(biāo)準(zhǔn)差計(jì)算頻數(shù)并制作統(tǒng)計(jì)圖判定結(jié)果2.7.4樣本特征推斷742.7.4.2抽樣誤差輸入原始數(shù)據(jù)計(jì)算標(biāo)注誤2.7.4.3總體均數(shù)的區(qū)間估計(jì)輸入原始數(shù)據(jù)計(jì)算可信區(qū)間2.7.4.4總體率的區(qū)間估計(jì)輸入原始數(shù)據(jù)計(jì)算可信區(qū)間2.7.4.2抽樣誤差752.7.5顯著性檢驗(yàn)2.7.5.1樣本均數(shù)與總體均數(shù)的差異顯著性檢驗(yàn)輸入原始數(shù)據(jù)計(jì)算標(biāo)準(zhǔn)誤、t值、自由度等參數(shù)判斷顯著性2.7.5.2兩樣本均數(shù)的差異顯著性檢驗(yàn)輸入原始數(shù)據(jù)t檢驗(yàn)判斷差異顯著性2.7.5顯著性檢驗(yàn)2.7.5.1樣本均數(shù)與總體均數(shù)的762.7.5.3兩幾何級(jí)數(shù)的差異顯著性檢驗(yàn)2.7.5.4配對(duì)資料的差異顯著性檢驗(yàn)輸入原始數(shù)據(jù),計(jì)算、計(jì)算差數(shù)的均數(shù)、標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)誤、t值等判定結(jié)果2.7.5.5兩個(gè)大樣本均數(shù)的顯著性檢驗(yàn)——u檢驗(yàn)輸入原始數(shù)據(jù)計(jì)算u值判定結(jié)果2.7.5.3兩幾何級(jí)數(shù)的差異顯著性檢驗(yàn)772.7.5.6方差不齊的兩樣本均數(shù)差異的顯著性檢驗(yàn)--檢驗(yàn)輸入原始數(shù)據(jù)方差齊性檢驗(yàn)檢驗(yàn)2.7.5.7單因素多個(gè)樣本均數(shù)比較輸入原始數(shù)據(jù)計(jì)算和、均值、平方和、校正數(shù)、1/n、和的平方計(jì)算F值查表并判定結(jié)果2.7.5.6方差不齊的兩樣本均數(shù)差異的顯著性檢驗(yàn)--782.7.5.8兩因素多個(gè)樣本均數(shù)比較2.7.5.9大樣本率與總體率差異的顯著性檢驗(yàn)――u檢驗(yàn)2.7.5.10兩大樣本率的差異顯著性檢驗(yàn)――u檢驗(yàn)2.7.5.11兩大樣本率的差異顯著性檢驗(yàn)――四格表檢驗(yàn)2.7.5.12n>40且有一個(gè)理論數(shù)小于5的兩率差異顯著性檢驗(yàn)――四格表校正值檢驗(yàn)2.7.5.13n<40且有一個(gè)理論數(shù)小于5的兩率差異顯著性檢驗(yàn)――精確檢驗(yàn)法2.7.5.14多率的差異顯著性檢驗(yàn)――行×列的檢驗(yàn)2.7.5.15配對(duì)計(jì)數(shù)資料的差異顯著性檢驗(yàn)――檢驗(yàn)2.7.5.8兩因素多個(gè)樣本均數(shù)比較792.7.6直線相關(guān)與直線回歸2.7.6.1散點(diǎn)圖2.7.6.2相關(guān)系數(shù)計(jì)算2.7.6.3回歸方程的建立2.7.6.4回歸方程的顯著性檢驗(yàn)2.7.6直線相關(guān)與直線回歸2.7.6.1散點(diǎn)圖802.8可疑值的取舍

定義 前述環(huán)境數(shù)據(jù)統(tǒng)計(jì)與分析的前提,是數(shù)據(jù)均為可信數(shù)據(jù)。事實(shí)上,在一組觀察值中出現(xiàn)少數(shù)過(guò)大或過(guò)小的極端值,使人懷疑發(fā)生了錯(cuò)誤的情況時(shí)有發(fā)生,這種數(shù)值稱(chēng)為可疑值。可疑值的判斷方法 常用的有Chauvenet法、Smirnov法和Grubbs法,它們的計(jì)算方法相同,僅界值不同。經(jīng)模擬試驗(yàn),以Grubbs法效果較好。計(jì)算觀察值的均數(shù)、標(biāo)準(zhǔn)差、T值。查界值表作出判斷舍去可疑值2.8可疑值的取舍定義81演講完畢,謝謝觀看!演講完畢,謝謝觀看!82第二章環(huán)境數(shù)據(jù)

統(tǒng)計(jì)與分析第二章環(huán)境數(shù)據(jù)

統(tǒng)計(jì)與分析832環(huán)境數(shù)據(jù)統(tǒng)計(jì)與分析2.1數(shù)據(jù)統(tǒng)計(jì)與分析的基本范疇2.2常用的統(tǒng)計(jì)指標(biāo)2.3環(huán)境樣本特征推斷2.4參數(shù)估計(jì)2.5顯著性檢驗(yàn)2.6直線相關(guān)與直線回歸2.7環(huán)境數(shù)據(jù)統(tǒng)計(jì)與分析的計(jì)算機(jī)處理2.8可疑值的取舍2環(huán)境數(shù)據(jù)統(tǒng)計(jì)與分析2.1數(shù)據(jù)統(tǒng)計(jì)與分析的基本范疇842.1數(shù)據(jù)統(tǒng)計(jì)與分析的基本范疇2.1.1總體與樣本

統(tǒng)計(jì)學(xué)中,把性質(zhì)相同的研究對(duì)象的所有觀測(cè)結(jié)果的集合稱(chēng)為總體(population)??傮w又分為無(wú)限總體和有限總體。 在實(shí)際工作中,常常是從被研究的總體中隨機(jī)抽取部分觀測(cè)結(jié)果進(jìn)行研究。每個(gè)部分觀測(cè)結(jié)果的集合稱(chēng)為樣本。 從總體中隨機(jī)抽取樣本用以推斷總體的方法稱(chēng)為抽樣研究。

2.1數(shù)據(jù)統(tǒng)計(jì)與分析的基本范疇2.1.1總體與樣本852.1.2參數(shù)與統(tǒng)計(jì)量統(tǒng)計(jì)指標(biāo) 統(tǒng)計(jì)學(xué)中,把根據(jù)規(guī)定的函數(shù)關(guān)系計(jì)算出的描述總體或樣本特征的函數(shù)值稱(chēng)為統(tǒng)計(jì)指標(biāo)(index)。參數(shù) 由總體資料計(jì)算出的統(tǒng)計(jì)指標(biāo)稱(chēng)為參數(shù)(parameter),用于描述總體特征。統(tǒng)計(jì)量 由樣本資料計(jì)算出的統(tǒng)計(jì)指標(biāo)稱(chēng)為統(tǒng)計(jì)量(statistic),用于描述樣本特征。2.1.2參數(shù)與統(tǒng)計(jì)量統(tǒng)計(jì)指標(biāo)862.1.3變異與誤差變異(variation) 變異指觀測(cè)結(jié)果之間實(shí)際存在的差異。誤差(error) 誤差指觀測(cè)結(jié)果與真實(shí)值之差及統(tǒng)計(jì)量與參數(shù)之差。過(guò)失誤差(grosserror)——過(guò)失誤差可以避免;系統(tǒng)誤差(systematicerror)——系統(tǒng)誤差可以減少;隨機(jī)誤差(randomerror)——隨機(jī)誤差無(wú)法消除。2.1.3變異與誤差變異(variation)872.2常用的統(tǒng)計(jì)指標(biāo)2.2.1平均數(shù)2.2.2變異數(shù)2.2.3相對(duì)數(shù)2.2常用的統(tǒng)計(jì)指標(biāo)2.2.1平均數(shù)882.2.1平均數(shù)定義 平均數(shù)(average)是表示觀測(cè)值的平均水平的統(tǒng)計(jì)指標(biāo),常用的有算術(shù)平均數(shù)、幾何均數(shù)及中位數(shù)。2.2.1平均數(shù)定義892.2.1.1算術(shù)均數(shù)定義 算術(shù)均數(shù)(arithmeticmean),簡(jiǎn)稱(chēng)均數(shù),常用、希臘字母μ表示,表示樣本均數(shù),μ表示總體均數(shù)。均數(shù)適用于正態(tài)分布資料統(tǒng)計(jì)。計(jì)算方法直接計(jì)算法頻數(shù)-加權(quán)計(jì)算法2.2.1.1算術(shù)均數(shù)定義90直接計(jì)算法 當(dāng)觀察值的個(gè)數(shù)不多時(shí),將所有觀察值x1,x2,x3,…,xn直接相加,其和除以觀察值的個(gè)數(shù)n,即為均數(shù)。 計(jì)算公式: 式中, 算術(shù)平均數(shù) x1,…,xn 各觀察值 ∑ 求和符號(hào) ∑x 觀察值總和 n 觀察值的個(gè)數(shù)直接計(jì)算法91頻數(shù)-加權(quán)計(jì)算法

對(duì)一個(gè)隨機(jī)事件作重復(fù)觀察,其中某觀察值出現(xiàn)的次數(shù)稱(chēng)頻數(shù); 各觀察值對(duì)應(yīng)的頻數(shù)稱(chēng)為頻數(shù)分布;顯示各觀察值對(duì)應(yīng)的頻數(shù)的表格稱(chēng)為頻數(shù)分布表,簡(jiǎn)稱(chēng)頻數(shù)表。頻數(shù)-加權(quán)計(jì)算法92

頻數(shù)-加權(quán)計(jì)算法計(jì)算步驟

①計(jì)算全距 找出觀察值中的最大值、最小值,并計(jì)算全距(range),全距=最大值-最小值。 ②定組段數(shù) 一般取8~15個(gè)為宜,多取10個(gè),組段數(shù)太多,計(jì)算較繁,組段數(shù)過(guò)少則誤差較大。 ③定組距(classinterval) 相鄰兩組段下限值之差為組距(classinterval)。各組段的組距可以相等,也可以不等。若擬定為相等組距,則組距=全距/組段數(shù),為便于觀察值歸組,組距常取整數(shù)。頻數(shù)-加權(quán)計(jì)算法計(jì)算步驟93

④定組段(classrange) 即定各組數(shù)據(jù)的上下限,俗稱(chēng)“封口”。通常,某組段的最小值為下限(lowerlimit),相鄰較大組段的下限即本組段的上限(upperlimit)。第一組段應(yīng)包括最小值,最末組段應(yīng)包括最大值。

⑤計(jì)數(shù)(fi) 劃分組段后,將原始數(shù)據(jù)以適當(dāng)方式劃記計(jì)數(shù)(常用“正”字法)歸組。得頻數(shù)分布表。

⑥計(jì)算組中值(Classmid-value)(xi) 組中值= ⑦計(jì)算均數(shù)

將各組段的頻數(shù)與組中值之積相加求和,再除以總頻數(shù)即得均數(shù)。

第二章環(huán)境數(shù)據(jù)統(tǒng)計(jì)與分析課件942.2.1.2幾何均數(shù)定義

幾何均數(shù)(geometricmean,G),也叫倍數(shù)均數(shù),當(dāng)觀察值相差較大甚至成倍數(shù)關(guān)系時(shí),如用算術(shù)均數(shù)表示其平均水平時(shí)受少數(shù)特大或特小值影響較大,則用幾何均數(shù)來(lái)表示其平均水平。計(jì)算步驟

先對(duì)觀察值取數(shù)值,計(jì)算對(duì)數(shù)值的均數(shù)后,再查反對(duì)數(shù),即得幾何均數(shù)。計(jì)算方法直接計(jì)算法頻數(shù)表法2.2.1.2幾何均數(shù)定義95直接計(jì)算法直接計(jì)算法96頻數(shù)表法 當(dāng)觀察值較多時(shí),可先編頻數(shù)表,再按頻數(shù)表計(jì)算幾何均數(shù)。頻數(shù)表法972.2.1.3中位數(shù)定義

中位數(shù)(median,M,Md)指全部觀察值按大小順序排列,居于中間位置的數(shù)值。 偏態(tài)分布資料,一端或兩端有不確定數(shù)值分布的資料,分布情況不清的資料,適宜用中位數(shù)統(tǒng)計(jì)。計(jì)算方法直接計(jì)算法頻數(shù)表法2.2.1.3中位數(shù)定義98直接計(jì)算法

樣本含量n較少時(shí),先將觀察值按大小順序排列,再進(jìn)行計(jì)算。

直接計(jì)算法99頻數(shù)表法 中位數(shù)是一個(gè)特定的百分位數(shù),在全部觀察值中有一半比它大,一半比它小。當(dāng)例數(shù)較多時(shí),先將觀察值編制頻數(shù)表,再按公式計(jì)算。

頻數(shù)表法1002.2.2變異數(shù)定義

變異數(shù)是表示觀察值變異水平的統(tǒng)計(jì)指標(biāo),常用指標(biāo)有極差、方差、標(biāo)準(zhǔn)差和變異系數(shù)等。

2.2.2變異數(shù)定義1012.2.2.1極差定義

亦稱(chēng)全距(rangc,R),即一組觀察值中最大值與最小值之差。R=Xmax-Xmin特點(diǎn)

全距反映了變異的范圍,極差大,變異度大;極差小,變異度小。缺點(diǎn)

用極差表示變異程度的大小簡(jiǎn)單明了,但它僅考慮了觀察值的最大值和最小值,而沒(méi)有考慮其他數(shù)值,因此是不夠全面的。

2.2.2.1極差定義1022.2.2.2方差

要克服全距的缺點(diǎn),必須全面考慮到每個(gè)觀察值。 首先考慮用每一個(gè)觀察值與均數(shù)之差的和即離均差總和Σ(x-)來(lái)描述。 再考慮用離均差平方和∑(x-)2來(lái)描述。 最終考慮用離均差平方和的均數(shù)即方差S2來(lái)描述。

2.2.2.2方差 要克服全距的缺點(diǎn),必須全面考慮到每1032.2.2.3標(biāo)準(zhǔn)差定義

為了保持與原觀察值及其均數(shù)的單位一致,將方差開(kāi)平方,即得標(biāo)準(zhǔn)差,以S表示。特點(diǎn)

標(biāo)準(zhǔn)差直接表示觀察值分布的離散程度,間接反映樣本的代表性。 在觀察單位數(shù)相同,均數(shù)相近條件下,標(biāo)準(zhǔn)差較大,表明觀察值的變異程度較大,即觀察值圍繞均數(shù)的分布較離散,因而樣本的代表性較差;反之,標(biāo)準(zhǔn)差較小,表明觀察值的變異程度較小,觀察值圍繞均數(shù)的分布較密集,樣本的代表性好。2.2.2.3標(biāo)準(zhǔn)差定義1042.2.2.4變異系數(shù)定義 對(duì)均數(shù)相差較大或性質(zhì)不同的資料,不能直接用標(biāo)準(zhǔn)差比較變異程度的大小,要用變異系數(shù)作比較。特點(diǎn)

與標(biāo)準(zhǔn)差一樣,變異系數(shù)愈大,表明觀察值的變異程度愈大,變異系數(shù)愈小,表明變異程度愈小。

2.2.2.4變異系數(shù)定義1052.2.3相對(duì)數(shù)定義

環(huán)境研究直接觀測(cè)到的數(shù)據(jù)稱(chēng)為絕對(duì)數(shù),絕對(duì)數(shù)雖然能反映調(diào)查中所發(fā)現(xiàn)的某種現(xiàn)象的絕對(duì)水平,但作深入分析時(shí),僅看絕對(duì)數(shù)是不夠的,必須考慮使用相對(duì)數(shù)(relativenumber),即兩個(gè)有聯(lián)系的指標(biāo)之比。 常用相對(duì)數(shù)有率、比等。

2.2.3相對(duì)數(shù)定義1062.2.3.1率定義

率(rate)是某一現(xiàn)象發(fā)生的頻度(頻繁程度)或強(qiáng)度,通常指在一定條件下某種現(xiàn)象實(shí)際發(fā)生的次數(shù)與可能發(fā)生該現(xiàn)象的總次數(shù)之比。率=

率的比例基數(shù)可用100、1000、10,000、100,000等分別稱(chēng)為百分率,千分率,萬(wàn)分率,或十萬(wàn)分率。環(huán)境監(jiān)測(cè)常用的率有:

檢出率= 回收率= 最高濃度出現(xiàn)率= 殘留率= 超標(biāo)率=

2.2.3.1率定義1072.2.3.2構(gòu)成比定義

構(gòu)成比(constitutionratio)是事物內(nèi)部某種構(gòu)成部分對(duì)總體之比。說(shuō)明部分在總體中所占的比重,是一種用來(lái)表示事物內(nèi)部各構(gòu)成情況的指標(biāo)。 構(gòu)成比=

2.2.3.2構(gòu)成比定義1082.2.3.3相對(duì)比定義

相對(duì)比(relativeratio)指兩個(gè)有關(guān)聯(lián)的同類(lèi)指標(biāo)的比。以倍數(shù)或百分?jǐn)?shù)(%)來(lái)表示,其計(jì)算式: 相對(duì)比=常用的相對(duì)比有倍數(shù)、指數(shù)、系數(shù)等。

2.2.3.3相對(duì)比定義109倍數(shù) 在大氣監(jiān)測(cè)中,經(jīng)常用測(cè)定值與國(guó)家衛(wèi)生標(biāo)準(zhǔn)值的比較來(lái)評(píng)價(jià)車(chē)間、工廠或大氣的污染程度。指數(shù)(index) 環(huán)境保護(hù)研究中,指數(shù)是環(huán)境污染物的實(shí)測(cè)濃度對(duì)該污染物在環(huán)境中的容許濃度的比值,是環(huán)境質(zhì)量評(píng)價(jià)的常用手段。

I=

I:環(huán)境質(zhì)量指數(shù) C:污染物實(shí)測(cè)平均濃度 S:污染物容許標(biāo)準(zhǔn)。系數(shù) 如排毒系數(shù),環(huán)境污染物的排放濃度對(duì)該污染物的排放標(biāo)準(zhǔn)的比值,用于表示各種污染物和污染源對(duì)環(huán)境的毒害的潛在能力。倍數(shù)1102.3環(huán)境樣本特征推斷環(huán)境樣本特征 主要指環(huán)境樣本的分布形式和環(huán)境樣本的正常值范圍等,可以利用獲得的統(tǒng)計(jì)量進(jìn)行統(tǒng)計(jì)處理,完成上述推斷工作。2.3環(huán)境樣本特征推斷環(huán)境樣本特征1112.3.1樣本特征推斷的理論基礎(chǔ)--正態(tài)分布定義 正態(tài)分布(normaldistribution)又稱(chēng)高斯分布(GaussianDistribution),是以均數(shù)為中心的對(duì)稱(chēng)鐘型分布。 正態(tài)曲線是一條高峰位于中央,兩側(cè)完全對(duì)稱(chēng)并逐漸下降但永遠(yuǎn)不與橫軸相交的鐘形曲線 正態(tài)曲線由和兩個(gè)參數(shù)決定,為總體均數(shù),為總體標(biāo)準(zhǔn)差。決定正態(tài)曲線的位置,決定正態(tài)曲線形狀。2.3.1樣本特征推斷的理論基礎(chǔ)--正態(tài)分布定義1122.3.2樣本特征推斷樣本分布形式的判定確定正常值范圍確定樣本所代表總體的理論頻數(shù)分布2.3.2樣本特征推斷樣本分布形式的判定1132.4參數(shù)估計(jì)定義 探知研究對(duì)象的總體特征是環(huán)境研究的主要目標(biāo),由于總體龐大的原因,直接計(jì)算參數(shù)是極其困難的,因此,往往用樣本統(tǒng)計(jì)量來(lái)估計(jì)總體參數(shù),這個(gè)過(guò)程稱(chēng)為參數(shù)估計(jì)(estimationofparameter)。 本節(jié)主要討論總體均數(shù)估計(jì)的基本問(wèn)題。總體均數(shù)估計(jì)分為點(diǎn)估計(jì)和區(qū)間估計(jì)。 點(diǎn)估計(jì)(pointestimation)是根據(jù)一個(gè)樣本求出總體參數(shù)的具體數(shù)值,常用根據(jù)極大似然法原理導(dǎo)出的公式計(jì)算極大似然估計(jì)量。 由于存在變異和抽樣的隨機(jī)性,用不同的樣本推斷總體時(shí),可能得到不同的參數(shù)估計(jì)值。因此更穩(wěn)妥的辦法是采用區(qū)間估計(jì)。2.4參數(shù)估計(jì)定義1142.4.1總體均數(shù)區(qū)間估計(jì)的理論基礎(chǔ)――t分布

2.4.1.1抽樣誤差定義 對(duì)樣本的統(tǒng)計(jì)結(jié)果與總體的“真實(shí)”之間必然存在差異,這種由于抽樣而引起的樣本與總體之間的差異稱(chēng)為抽樣誤差。標(biāo)準(zhǔn)誤差

樣本均數(shù)的標(biāo)準(zhǔn)差稱(chēng)為標(biāo)準(zhǔn)誤差,。計(jì)算公式為:

在實(shí)際工作中,總體標(biāo)準(zhǔn)差常屬未知,只能用樣本標(biāo)準(zhǔn)差S代替作為最佳的無(wú)偏估計(jì),于是標(biāo)準(zhǔn)誤的計(jì)算公式變?yōu)椋?.4.1總體均數(shù)區(qū)間估計(jì)的理論基礎(chǔ)――t分布2.4.1152.4.1.2描述樣本均數(shù)的分布――t分布

從一個(gè)均數(shù)為,標(biāo)準(zhǔn)差為的正態(tài)總體中,隨機(jī)抽取含量為n的樣本,可計(jì)算樣本均數(shù),樣本標(biāo)準(zhǔn)誤,則將樣本均數(shù)與總體均數(shù)的離差以樣本標(biāo)準(zhǔn)誤為單位,得正態(tài)(離)差t=,若干樣本的t值就構(gòu)成統(tǒng)計(jì)上著名的t分布。 實(shí)際工作中總體標(biāo)準(zhǔn)差往往是不知道的,只能用樣本標(biāo)準(zhǔn)差S來(lái)代替,于是得 t==

2.4.1.2描述樣本均數(shù)的分布――t分布 從一個(gè)均數(shù)1162.4.2總體均數(shù)的區(qū)間估計(jì)區(qū)間估計(jì)(intervalestimation) 按預(yù)先給定的概率,由一個(gè)樣本均數(shù)及其標(biāo)準(zhǔn)誤求出總體均數(shù)數(shù)值范圍的過(guò)程。“預(yù)先給定的概率” 也稱(chēng)為可信度、可信水平、可信系數(shù),符號(hào)為1-α,常取0.99或0.95?!翱傮w均數(shù)數(shù)值范圍” 也稱(chēng)為可信區(qū)間,符號(hào)為CI。其含義是:由一個(gè)樣本均數(shù)及其標(biāo)準(zhǔn)誤求出的被估計(jì)參數(shù)值有0.99或0.95的可能在此數(shù)值范圍內(nèi),或由若干個(gè)樣本均數(shù)及其標(biāo)準(zhǔn)誤求出的若干個(gè)被估計(jì)參數(shù)值中,有99%或95%的個(gè)數(shù)可能在此數(shù)值范圍內(nèi)。

2.4.2總體均數(shù)的區(qū)間估計(jì)區(qū)間估計(jì)(interval1172.4.3總體率的區(qū)間估計(jì) 可仿照總體均數(shù)的可信區(qū)間估計(jì)的方法來(lái)估計(jì)總體率的所在范圍,即求總體率的可信區(qū)間,我們介紹兩種方法。正態(tài)近似法

當(dāng)n足夠大,且p和(1-p)不接近零,有np和n(1-p)均大于5時(shí),總體率的可信區(qū)間為: 式中uα為可信度1-α?xí)r的標(biāo)準(zhǔn)正態(tài)離差,由u界值得知,如99%可信區(qū)間時(shí),α=0.01,uα=2.58,95%可信區(qū)間時(shí),α=0.05,uα=1.96。

查表法

當(dāng)n≤1000,p≥l%時(shí),可查附表3(百分率的可信限表),得到總體率的可信區(qū)間。

2.4.3總體率的區(qū)間估計(jì) 可仿照總體均數(shù)的可信區(qū)間估1182.5顯著性檢驗(yàn)兩均數(shù)差異顯著性檢驗(yàn)樣本均數(shù)與總體均數(shù)的差異顯著性檢驗(yàn)兩樣本均數(shù)的差異顯著性檢驗(yàn)兩個(gè)幾何級(jí)數(shù)樣本均數(shù)的差異顯著性檢驗(yàn)配對(duì)資料的差異顯著性檢驗(yàn)兩個(gè)大樣本均數(shù)的顯著性檢驗(yàn)——u檢驗(yàn)方差不齊的兩樣本均數(shù)差異的顯著性檢驗(yàn)——tˊ檢驗(yàn)2.5顯著性檢驗(yàn)兩均數(shù)差異顯著性檢驗(yàn)1192.5.1顯著性檢驗(yàn)的含義與一般步驟含義 在回答樣本與總體是否有本質(zhì)差異或差異是否有顯著時(shí),必須考慮:樣本與總體差異無(wú)顯著性和樣本與總體差異有顯著性2種情況。究竟屬于那種情況,需通過(guò)差異顯著性檢驗(yàn)來(lái)回答。顯著性檢驗(yàn)的步驟建立“檢驗(yàn)假設(shè)”確定檢驗(yàn)水準(zhǔn)選擇檢驗(yàn)方法和計(jì)算統(tǒng)計(jì)量確定概率做出推斷結(jié)論2.5.1顯著性檢驗(yàn)的含義與一般步驟含義1202.5.2兩均數(shù)差異顯著性檢驗(yàn)2.5.2.1兩均數(shù)差異顯著性檢驗(yàn)的基本思路 t檢驗(yàn)是檢驗(yàn)兩均數(shù)間差異顯著性的基本方法。 按式(2.20)計(jì)算統(tǒng)計(jì)量t值后,與根據(jù)相應(yīng)自由度查附表2(t值表)所得的t界值進(jìn)行比較,判斷均數(shù)間差異的顯著性。 ∣t∣﹤t0.05(v)P﹥0.05差異無(wú)顯著性 若t0.05(v)≤∣t∣﹤t0.01(v)則0.05≥P﹥0.01即差異有顯著性 ∣t∣≥t0.01(v)P≤0.01差異有極顯著性 當(dāng)v(自由度)﹥50時(shí),可直接采用正態(tài)分布臨界值1.96或2.58來(lái)判斷P大于還是小于0.05或0.01。2.5.2兩均數(shù)差異顯著性檢驗(yàn)2.5.2.1兩均數(shù)1212.5.2.2樣本均數(shù)與總體均數(shù)的差異顯著性檢驗(yàn)【例2.17】解題步驟:建立檢驗(yàn)假設(shè)計(jì)算t值確定p值結(jié)果判斷2.5.2.2樣本均數(shù)與總體均數(shù)的差異顯著性檢驗(yàn)【例1222.5.2.3兩樣本均數(shù)的差異顯著性檢驗(yàn)

兩樣本均數(shù)比較是最常見(jiàn)的統(tǒng)計(jì)比較研究,又稱(chēng)成組比較,其目的是推斷兩樣本分別代表的總體均數(shù)μ1與μ2是否相等。

采用下面的公式來(lái)檢驗(yàn)兩均數(shù)的差異是否有顯著性。2.5.2.3兩樣本均數(shù)的差異顯著性檢驗(yàn) 兩樣本均數(shù)1232.5.2.4兩個(gè)幾何級(jí)數(shù)樣本均數(shù)的差異顯著性檢驗(yàn) 檢驗(yàn)兩個(gè)幾何均數(shù)的差別是否有顯著性,所采用的方法,仍然是t檢驗(yàn)法,只是將所有數(shù)值全部轉(zhuǎn)換為對(duì)數(shù)值進(jìn)行計(jì)算。2.5.2.4兩個(gè)幾何級(jí)數(shù)樣本均數(shù)的差異顯著性檢驗(yàn) 1242.5.2.5配對(duì)資料的差異顯著性檢驗(yàn) 在實(shí)驗(yàn)研究中,常采用配對(duì)比較的方法。配對(duì)研究的目的是比較兩種處理方法或?qū)嶒?yàn)前后的結(jié)果有無(wú)差異。 配對(duì)資料的實(shí)驗(yàn)設(shè)計(jì)有兩種:①同體配對(duì),實(shí)驗(yàn)對(duì)象自身對(duì)比;②非同體配對(duì)。

2.5.2.5配對(duì)資料的差異顯著性檢驗(yàn) 在實(shí)驗(yàn)研究中1252.5.2.6兩個(gè)大樣本均數(shù)的顯著性檢驗(yàn)—u檢驗(yàn) 當(dāng)兩個(gè)樣本的觀察單位數(shù)較多時(shí)(每組n﹥50),資料分布基本近似于正態(tài)分布,可以用u檢驗(yàn)。 計(jì)算出u值后,直接根據(jù)表2.13u檢驗(yàn)的檢驗(yàn)水準(zhǔn)表作出結(jié)果判斷。2.5.2.6兩個(gè)大樣本均數(shù)的顯著性檢驗(yàn)—u檢驗(yàn) 1262.5.2.7方差不齊的兩樣本均數(shù)差異的顯著性檢驗(yàn)——tˊ檢驗(yàn) 使用t檢驗(yàn)的前提條件是兩個(gè)總體的方差相等,。 事實(shí)上,即使兩個(gè)總體方差相等,樣本方差也會(huì)因?yàn)槌闃佣霈F(xiàn)波動(dòng),因此必需對(duì)兩組樣本進(jìn)行方差齊性檢驗(yàn)。如果方差齊性檢驗(yàn)顯示方差不齊時(shí),則不能直接采用t檢驗(yàn),需要用校正t檢驗(yàn)法(tˊ檢驗(yàn))。方差齊性檢驗(yàn)計(jì)算F統(tǒng)計(jì)量查附表4(方差齊性F界值表)做出兩總體方差是否相等的推斷tˊ檢驗(yàn)

計(jì)算均數(shù)標(biāo)準(zhǔn)誤平方計(jì)算兩樣本均數(shù)差數(shù)的標(biāo)準(zhǔn)誤計(jì)算tˊ值求tˊ顯著性界限的近似值2.5.2.7方差不齊的兩樣本均數(shù)差異的顯著性檢驗(yàn)——t1272.5.3

多均數(shù)差異的顯著性檢驗(yàn)——F檢驗(yàn)

在環(huán)境研究工作中,經(jīng)常有兩個(gè)以上的均數(shù)需要同時(shí)進(jìn)行比較,這時(shí),若應(yīng)用上述的t檢驗(yàn)法,則必須對(duì)每?jī)蓚€(gè)均數(shù)進(jìn)行t檢驗(yàn),比較繁瑣。而應(yīng)用F檢驗(yàn)法(即方差分析法)可使顯著性檢驗(yàn)大為簡(jiǎn)化。 方差分析又稱(chēng)變異數(shù)分析,其基本思想是把全部觀察值之間總變異,按設(shè)計(jì)和需要分為二個(gè)或多個(gè)組成部分進(jìn)行分析??傋儺惖姆诸?lèi)在單因素的完全隨機(jī)設(shè)計(jì)的實(shí)驗(yàn)資料中,總變異可分為組內(nèi)變異和組間變異。在配伍組設(shè)計(jì)的資料中,總變異可分為處理組間變異、配伍組間變異及誤差三部分。在2×2析因設(shè)計(jì)資料中,總變異可分為兩個(gè)因素的兩個(gè)組間變異、兩因素交互作用及誤差四部分。2.5.3

多均數(shù)差異的顯著性檢驗(yàn)——F檢驗(yàn) 1282.5.3.1單因素多個(gè)樣本均數(shù)比較比較步驟檢驗(yàn)假設(shè)計(jì)算校正數(shù)確定P值結(jié)果判斷2.5.3.1單因素多個(gè)樣本均數(shù)比較比較步驟1292.5.3.2兩因素多個(gè)樣本均數(shù)比較比較步驟列計(jì)算表計(jì)算校正數(shù)(C)計(jì)算離均差平方和(SS)計(jì)算自由度計(jì)算均方(MS)計(jì)算F值確定P值并判斷結(jié)果2.5.3.2兩因素多個(gè)樣本均數(shù)比較比較步驟1302.5.3.3多組均數(shù)間兩兩比較 資料經(jīng)F檢驗(yàn)后,各組均數(shù)間的差異為無(wú)顯著性,則不須作進(jìn)一步的統(tǒng)計(jì)處理;如果各組均數(shù)間的差異有顯著意義,則須作進(jìn)一步的分析,以檢驗(yàn)兩兩均數(shù)間的差異哪些是有顯著性的。比較步驟檢驗(yàn)假設(shè)計(jì)算q值求處理數(shù)(a)根據(jù)誤差的自由度及處理數(shù)(a)查附表6(q值表),得q的顯著界值。確定P值與判斷結(jié)果2.5.3.3多組均數(shù)間兩兩比較 資料經(jīng)F檢驗(yàn)后,各組1312.5.4兩率差異的顯著性檢驗(yàn)2.5.4.1率的抽樣誤差定義 樣本率與總體率間的差異情況是由于抽樣造成的,稱(chēng)為率的抽樣誤差。公式 率的抽樣誤差可用率的標(biāo)準(zhǔn)誤來(lái)表示。2.5.4兩率差異的顯著性檢驗(yàn)2.5.4.1率的抽1322.5.4.2大樣本率與總體率差異的顯著性檢驗(yàn)——u檢驗(yàn) 通常,樣本率與總體率之間進(jìn)行比較時(shí),如樣本含量較大(一般大于50),可采用u檢驗(yàn)。 再依據(jù)表作判斷。2.5.4.2大樣本率與總體率差異的顯著性檢驗(yàn)——u檢驗(yàn)1332.5.4.3兩大樣本率的差異顯著性檢驗(yàn)——u檢驗(yàn)公式 檢驗(yàn)兩個(gè)樣本率的差異是否顯著時(shí),可用公式:2.5.4.3兩大樣本率的差異顯著性檢驗(yàn)——u檢驗(yàn)公式1342.5.4.4兩大樣本率的差異顯著性檢驗(yàn)——四格表檢驗(yàn)檢驗(yàn)范圍 檢驗(yàn)(卡方檢驗(yàn))常用以檢驗(yàn)兩個(gè)率或多個(gè)率之間的差別,兩組或多組資料內(nèi)部構(gòu)成之間的差別,理論分布數(shù)列與實(shí)際觀察分布數(shù)列之間的差別,兩個(gè)觀察數(shù)列之間的差別是否有顯著性等。公式 檢驗(yàn)的基本公式:X2= 式中A實(shí)際數(shù) T理論數(shù)

檢驗(yàn)步驟:(1)檢驗(yàn)假設(shè)(2)計(jì)算值(3)確定概率,做出判斷

2.5.4.4兩大樣本率的差異顯著性檢驗(yàn)——四格表135四格表專(zhuān)用公式法 四格表專(zhuān)用公式是從基本公式推導(dǎo)出來(lái)的,故兩者計(jì)算的結(jié)果是相同的。四格表的形式:四格表專(zhuān)用公式:四格表專(zhuān)用公式法1362.5.4.5n>40且有一個(gè)理論數(shù)小于5的兩率差異顯著性檢驗(yàn)——四格表校正值檢驗(yàn)

公式

= = 2.5.4.5n>40且有一個(gè)理論數(shù)小于5的兩率差異顯著1372.5.4.6n<40且有一個(gè)理論數(shù)小于5的兩率差異顯著性檢驗(yàn)——精確檢驗(yàn)法

四格表中有實(shí)際值為零時(shí),計(jì)算概率的公式為: P= 式中!階乘,規(guī)定0?。?。四格表中無(wú)實(shí)際值為零時(shí) 【例2.31】2.5.4.6n<40且有一個(gè)理論數(shù)小于5的兩率差異顯著1382.5.5多率的差異顯著性檢驗(yàn)——行×列的檢驗(yàn)定義 當(dāng)資料的組數(shù)或處理方法超過(guò)兩組(即行數(shù)或列數(shù)超過(guò)兩組)時(shí),通稱(chēng)為行×列表或稱(chēng)R×C表,其檢驗(yàn)方法,可用的基本公式法,也可采用行×列表專(zhuān)用公式法。公式 行×列表專(zhuān)用公式為:2.5.5多率的差異顯著性檢驗(yàn)——行×列的檢驗(yàn)定1392.5.6配對(duì)計(jì)數(shù)資料的差異顯著性檢驗(yàn)——檢驗(yàn)通過(guò)配對(duì)的方法進(jìn)行實(shí)驗(yàn),如每一對(duì)實(shí)驗(yàn)對(duì)象分別給予不同的處理,或同一實(shí)驗(yàn)對(duì)象,先后給予不同的處理,既可獲得計(jì)量資料,也可獲得計(jì)數(shù)資料,這類(lèi)計(jì)數(shù)資料的率的差別顯著性檢驗(yàn),采用配對(duì)的檢驗(yàn)法。公式 計(jì)算公式: = 當(dāng)b+c<40時(shí),則改用校正公式: =2.5.6配對(duì)計(jì)數(shù)資料的差異顯著性檢驗(yàn)——檢驗(yàn)1402.6直線相關(guān)與直線回歸相關(guān)(correlation)

相關(guān)指兩事物或兩變量之間呈現(xiàn)某種相依變動(dòng)關(guān)系。 相關(guān)有直線相關(guān)、曲線相關(guān)、多元線性相關(guān),直線相關(guān)是最簡(jiǎn)單的相關(guān)。回歸(regression)

回歸原指樣本統(tǒng)計(jì)量向總體參數(shù)靠攏或回歸的現(xiàn)象,現(xiàn)指利用方程描述變量變化的數(shù)量關(guān)系。 回歸有直線回歸、曲線擬合、多元線性回歸,直線回歸是最簡(jiǎn)單的回歸。

2.6直線相關(guān)與直線回歸相關(guān)(correlation)1412.6.1直線相關(guān)定義

如果相關(guān)散點(diǎn)圖顯示一個(gè)變量X由小到大變化,另一個(gè)變量Y亦相應(yīng)地呈直線由小到大(或由大到?。┳兓?,則這兩個(gè)變量間有直線關(guān)系;散點(diǎn)圖顯示的相關(guān)性質(zhì)和密切程度,由直線相關(guān)系數(shù)描述。這種直線關(guān)系以及分析這種直線關(guān)系的理論和方法,統(tǒng)稱(chēng)直線相關(guān)(linearcorrelation)。

2.6.1直線相關(guān)定義1422.6.1.1相關(guān)散點(diǎn)圖與相關(guān)系數(shù)相關(guān) 以橫軸(X)代表汽車(chē)輛數(shù),以縱軸(Y)代表NO2濃度,繪制相關(guān)散點(diǎn)圖,見(jiàn)下圖。

從圖中可見(jiàn),隨著汽車(chē)輛數(shù)的增加,大氣中NO2的濃度也隨之增高,呈現(xiàn)從左下到右上的變化趨勢(shì)。我們稱(chēng)這種“從左下到右上的變化趨勢(shì)”為正相關(guān)。

2.6.1.1相關(guān)散點(diǎn)圖與相關(guān)系數(shù)相關(guān)143事實(shí)上,除正相關(guān)外,相關(guān)散點(diǎn)圖的散點(diǎn)分布還有多種情形,見(jiàn)下圖。

事實(shí)上,除正相關(guān)外,相關(guān)散點(diǎn)圖的散點(diǎn)分布還有多種情形144相關(guān)系數(shù)定量地表示變量間的線性相關(guān)程度及相關(guān)方向。相關(guān)系數(shù)沒(méi)有單位,其值在-1至+1之間。正相關(guān): 散點(diǎn)的Y值隨X值增加而上升,0<r≤1,如圖2.7(a);如果散點(diǎn)完全在一條直線上,則為完全正相關(guān),r=1,如上圖(b)。負(fù)相關(guān): 散點(diǎn)的Y值隨X值增加而減少,-l≤r<0,如上圖(c);如果散點(diǎn)完全在一條直線上,則為完全負(fù)相關(guān),r=-1,如上圖(d)。零相關(guān): 散點(diǎn)的X與Y的數(shù)值增減無(wú)一定規(guī)律,或Y值的變化不受X變化的影響,r=0,如上圖(e、f、g)。無(wú)線性相關(guān): 散點(diǎn)的X與Y的數(shù)值增減服從非直線規(guī)律,r=0,如上圖(h)。相關(guān)系數(shù)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論