第二章-環(huán)境數(shù)據(jù)統(tǒng)計(jì)與分析82頁P(yáng)PT課件_第1頁
第二章-環(huán)境數(shù)據(jù)統(tǒng)計(jì)與分析82頁P(yáng)PT課件_第2頁
第二章-環(huán)境數(shù)據(jù)統(tǒng)計(jì)與分析82頁P(yáng)PT課件_第3頁
第二章-環(huán)境數(shù)據(jù)統(tǒng)計(jì)與分析82頁P(yáng)PT課件_第4頁
第二章-環(huán)境數(shù)據(jù)統(tǒng)計(jì)與分析82頁P(yáng)PT課件_第5頁
已閱讀5頁,還剩77頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第二章 環(huán)境數(shù)據(jù)統(tǒng)計(jì)與分析2 環(huán)境數(shù)據(jù)統(tǒng)計(jì)與分析2.1 數(shù)據(jù)統(tǒng)計(jì)與分析的基本范疇2.2 常用的統(tǒng)計(jì)指標(biāo)2.3 環(huán)境樣本特征推斷2.4 參數(shù)估計(jì)2.5 顯著性檢驗(yàn)2.6 直線相關(guān)與直線回歸2.7 環(huán)境數(shù)據(jù)統(tǒng)計(jì)與分析的計(jì)算機(jī)處理2.8 可疑值的取舍2.1 數(shù)據(jù)統(tǒng)計(jì)與分析的基本范疇2.1.1 總體與樣本 統(tǒng)計(jì)學(xué)中,把性質(zhì)相同的研究對(duì)象的所有觀測結(jié)果的集合稱為總體(population)??傮w又分為無限總體和有限總體。 在實(shí)際工作中,常常是從被研究的總體中隨機(jī)抽取部分觀測結(jié)果進(jìn)行研究。每個(gè)部分觀測結(jié)果的集合稱為樣本。 從總體中隨機(jī)抽取樣本用以推斷總體的方法稱為抽樣研究。 2.1.2 參數(shù)與統(tǒng)計(jì)量統(tǒng)計(jì)指

2、標(biāo) 統(tǒng)計(jì)學(xué)中,把根據(jù)規(guī)定的函數(shù)關(guān)系計(jì)算出的描述總體或樣本特征的函數(shù)值稱為統(tǒng)計(jì)指標(biāo)(index)。參數(shù) 由總體資料計(jì)算出的統(tǒng)計(jì)指標(biāo)稱為參數(shù)(parameter),用于描述總體特征。統(tǒng)計(jì)量 由樣本資料計(jì)算出的統(tǒng)計(jì)指標(biāo)稱為統(tǒng)計(jì)量(statistic),用于描述樣本特征 。2.1.3 變異與誤差變異(variation) 變異指觀測結(jié)果之間實(shí)際存在的差異。誤差(error) 誤差指觀測結(jié)果與真實(shí)值之差及統(tǒng)計(jì)量與參數(shù)之差。過失誤差(gross error)過失誤差可以避免;系統(tǒng)誤差(systematic error)系統(tǒng)誤差可以減少;隨機(jī)誤差(random error)隨機(jī)誤差無法消除。 2.2 常用的

3、統(tǒng)計(jì)指標(biāo)2.2.1 平均數(shù)2.2.2 變異數(shù)2.2.3 相對(duì)數(shù)2.2.1 平均數(shù)定義 平均數(shù)(average)是表示觀測值的平均水平的統(tǒng)計(jì)指標(biāo),常用的有算術(shù)平均數(shù)、幾何均數(shù)及中位數(shù)。 2.2.1.1 算術(shù)均數(shù)定義 算術(shù)均數(shù)(arithmetic mean),簡稱均數(shù),常用、希臘字母表示,表示樣本均數(shù),表示總體均數(shù)。均數(shù)適用于正態(tài)分布資料統(tǒng)計(jì)。計(jì)算方法直接計(jì)算法頻數(shù)-加權(quán)計(jì)算法直接計(jì)算法 當(dāng)觀察值的個(gè)數(shù)不多時(shí),將所有觀察值x1,x2,x3,xn直接相加,其和除以觀察值的個(gè)數(shù)n,即為均數(shù)。 計(jì)算公式:式中, 算術(shù)平均數(shù) x1,xn 各觀察值 求和符號(hào) x 觀察值總和 n 觀察值的個(gè)數(shù) 頻數(shù)-加權(quán)計(jì)

4、算法 對(duì)一個(gè)隨機(jī)事件作重復(fù)觀察,其中某觀察值出現(xiàn)的次數(shù)稱頻數(shù); 各觀察值對(duì)應(yīng)的頻數(shù)稱為頻數(shù)分布;顯示各觀察值對(duì)應(yīng)的頻數(shù)的表格稱為頻數(shù)分布表,簡稱頻數(shù)表。 頻數(shù)-加權(quán)計(jì)算法計(jì)算步驟 計(jì)算全距找出觀察值中的最大值、最小值,并計(jì)算全距(range),全距最大值最小值。 定組段數(shù)一般取815個(gè)為宜,多取10個(gè),組段數(shù)太多,計(jì)算較繁,組段數(shù)過少則誤差較大。 定組距(class interval)相鄰兩組段下限值之差為組距(class interval)。各組段的組距可以相等,也可以不等。若擬定為相等組距,則組距全距/組段數(shù),為便于觀察值歸組,組距常取整數(shù)。 定組段(class range)即定各組數(shù)據(jù)的

5、上下限,俗稱“封口”。通常,某組段的最小值為下限(lower limit),相鄰較大組段的下限即本組段的上限(upper limit)。第一組段應(yīng)包括最小值,最末組段應(yīng)包括最大值。 計(jì)數(shù)(fi)劃分組段后,將原始數(shù)據(jù)以適當(dāng)方式劃記計(jì)數(shù)(常用“正”字法)歸組。得頻數(shù)分布表。 計(jì)算組中值(Class mid-value)(xi)組中值 計(jì)算均數(shù) 將各組段的頻數(shù)與組中值之積相加求和,再除以總頻數(shù)即得均數(shù)。 2.2.1.2 幾何均數(shù)定義幾何均數(shù)(geometric mean,G),也叫倍數(shù)均數(shù),當(dāng)觀察值相差較大甚至成倍數(shù)關(guān)系時(shí),如用算術(shù)均數(shù)表示其平均水平時(shí)受少數(shù)特大或特小值影響較大,則用幾何均數(shù)來表示

6、其平均水平。計(jì)算步驟先對(duì)觀察值取數(shù)值,計(jì)算對(duì)數(shù)值的均數(shù)后,再查反對(duì)數(shù),即得幾何均數(shù)。計(jì)算方法直接計(jì)算法頻數(shù)表法直接計(jì)算法頻數(shù)表法 當(dāng)觀察值較多時(shí),可先編頻數(shù)表,再按頻數(shù)表計(jì)算幾何均數(shù)。2.2.1.3 中位數(shù)定義中位數(shù)(median,M,Md)指全部觀察值按大小順序排列,居于中間位置的數(shù)值。 偏態(tài)分布資料,一端或兩端有不確定數(shù)值分布的資料,分布情況不清的資料,適宜用中位數(shù)統(tǒng)計(jì)。計(jì)算方法直接計(jì)算法頻數(shù)表法 直接計(jì)算法樣本含量n較少時(shí),先將觀察值按大小順序排列,再進(jìn)行計(jì)算。 頻數(shù)表法中位數(shù)是一個(gè)特定的百分位數(shù),在全部觀察值中有一半比它大,一半比它小。當(dāng)例數(shù)較多時(shí),先將觀察值編制頻數(shù)表,再按公式計(jì)算。

7、 2.2.2 變異數(shù)定義 變異數(shù)是表示觀察值變異水平的統(tǒng)計(jì)指標(biāo),常用指標(biāo)有極差、方差、標(biāo)準(zhǔn)差和變異系數(shù)等。 2.2.2.1 極差定義 亦稱全距(rangc,R),即一組觀察值中最大值與最小值之差。RXmaxXmin特點(diǎn) 全距反映了變異的范圍,極差大,變異度大;極差小,變異度小。缺點(diǎn) 用極差表示變異程度的大小簡單明了,但它僅考慮了觀察值的最大值和最小值,而沒有考慮其他數(shù)值,因此是不夠全面的。 2.2.2.2 方差要克服全距的缺點(diǎn),必須全面考慮到每個(gè)觀察值。首先考慮用每一個(gè)觀察值與均數(shù)之差的和即離均差總和(x )來描述。 再考慮用離均差平方和(x )2來描述。最終考慮用離均差平方和的均數(shù)即方差S2

8、來描述。 2.2.2.3 標(biāo)準(zhǔn)差定義為了保持與原觀察值及其均數(shù)的單位一致,將方差開平方,即得標(biāo)準(zhǔn)差,以S表示。特點(diǎn) 標(biāo)準(zhǔn)差直接表示觀察值分布的離散程度,間接反映樣本的代表性。 在觀察單位數(shù)相同,均數(shù)相近條件下,標(biāo)準(zhǔn)差較大,表明觀察值的變異程度較大,即觀察值圍繞均數(shù)的分布較離散,因而樣本的代表性較差;反之,標(biāo)準(zhǔn)差較小,表明觀察值的變異程度較小,觀察值圍繞均數(shù)的分布較密集,樣本的代表性好。2.2.2.4 變異系數(shù)定義對(duì)均數(shù)相差較大或性質(zhì)不同的資料,不能直接用標(biāo)準(zhǔn)差比較變異程度的大小,要用變異系數(shù)作比較。特點(diǎn)與標(biāo)準(zhǔn)差一樣,變異系數(shù)愈大,表明觀察值的變異程度愈大,變異系數(shù)愈小,表明變異程度愈小。 2.

9、2.3 相對(duì)數(shù)定義 環(huán)境研究直接觀測到的數(shù)據(jù)稱為絕對(duì)數(shù),絕對(duì)數(shù)雖然能反映調(diào)查中所發(fā)現(xiàn)的某種現(xiàn)象的絕對(duì)水平,但作深入分析時(shí),僅看絕對(duì)數(shù)是不夠的,必須考慮使用相對(duì)數(shù)(relative number),即兩個(gè)有聯(lián)系的指標(biāo)之比。 常用相對(duì)數(shù)有率、比等。 2.2.3.1 率定義率(rate)是某一現(xiàn)象發(fā)生的頻度(頻繁程度)或強(qiáng)度,通常指在一定條件下某種現(xiàn)象實(shí)際發(fā)生的次數(shù)與可能發(fā)生該現(xiàn)象的總次數(shù)之比。 率= 率的比例基數(shù)可用100、1000、10,000、100,000等分別稱為百分率,千分率,萬分率,或十萬分率。環(huán)境監(jiān)測常用的率有:檢出率 回收率 最高濃度出現(xiàn)率 殘留率 超標(biāo)率 2.2.3.2 構(gòu)成比定

10、義構(gòu)成比(constitution ratio)是事物內(nèi)部某種構(gòu)成部分對(duì)總體之比。說明部分在總體中所占的比重,是一種用來表示事物內(nèi)部各構(gòu)成情況的指標(biāo)。 構(gòu)成比 2.2.3.3 相對(duì)比定義相對(duì)比(relative ratio)指兩個(gè)有關(guān)聯(lián)的同類指標(biāo)的比。以倍數(shù)或百分?jǐn)?shù)()來表示,其計(jì)算式:相對(duì)比=常用的相對(duì)比有倍數(shù)、指數(shù)、系數(shù)等。 倍數(shù) 在大氣監(jiān)測中,經(jīng)常用測定值與國家衛(wèi)生標(biāo)準(zhǔn)值的比較來評(píng)價(jià)車間、工廠或大氣的污染程度。 指數(shù)(index) 環(huán)境保護(hù)研究中,指數(shù)是環(huán)境污染物的實(shí)測濃度對(duì)該污染物在環(huán)境中的容許濃度的比值,是環(huán)境質(zhì)量評(píng)價(jià)的常用手段。 I I :環(huán)境質(zhì)量指數(shù)C:污染物實(shí)測平均濃度S:污染

11、物容許標(biāo)準(zhǔn)。系數(shù) 如排毒系數(shù),環(huán)境污染物的排放濃度對(duì)該污染物的排放標(biāo)準(zhǔn)的比值,用于表示各種污染物和污染源對(duì)環(huán)境的毒害的潛在能力。2.3 環(huán)境樣本特征推斷環(huán)境樣本特征 主要指環(huán)境樣本的分布形式和環(huán)境樣本的正常值范圍等,可以利用獲得的統(tǒng)計(jì)量進(jìn)行統(tǒng)計(jì)處理,完成上述推斷工作。2.3.1 樣本特征推斷的理論基礎(chǔ)正態(tài)分布 定義正態(tài)分布(normal distribution)又稱高斯分布(Gaussian Distribution),是以均數(shù)為中心的對(duì)稱鐘型分布。正態(tài)曲線是一條高峰位于中央,兩側(cè)完全對(duì)稱并逐漸下降但永遠(yuǎn)不與橫軸相交的鐘形曲線 正態(tài)曲線由和兩個(gè)參數(shù)決定,為總體均數(shù),為總體標(biāo)準(zhǔn)差。決定正態(tài)曲線

12、的位置,決定正態(tài)曲線形狀 。2.3.2 樣本特征推斷樣本分布形式的判定確定正常值范圍確定樣本所代表總體的理論頻數(shù)分布2.4 參數(shù)估計(jì)定義探知研究對(duì)象的總體特征是環(huán)境研究的主要目標(biāo),由于總體龐大的原因,直接計(jì)算參數(shù)是極其困難的,因此,往往用樣本統(tǒng)計(jì)量來估計(jì)總體參數(shù),這個(gè)過程稱為參數(shù)估計(jì)(estimation of parameter)。 本節(jié)主要討論總體均數(shù)估計(jì)的基本問題。 總體均數(shù)估計(jì)分為點(diǎn)估計(jì)和區(qū)間估計(jì)。點(diǎn)估計(jì)(point estimation)是根據(jù)一個(gè)樣本求出總體參數(shù)的具體數(shù)值,常用根據(jù)極大似然法原理導(dǎo)出的公式計(jì)算極大似然估計(jì)量。 由于存在變異和抽樣的隨機(jī)性,用不同的樣本推斷總體時(shí),可能

13、得到不同的參數(shù)估計(jì)值。因此更穩(wěn)妥的辦法是采用區(qū)間估計(jì)。 2.4.1 總體均數(shù)區(qū)間估計(jì)的理論基礎(chǔ)t分布 2.4.1.1 抽樣誤差定義 對(duì)樣本的統(tǒng)計(jì)結(jié)果與總體的“真實(shí)”之間必然存在差異,這種由于抽樣而引起的樣本與總體之間的差異稱為抽樣誤差。標(biāo)準(zhǔn)誤差樣本均數(shù)的標(biāo)準(zhǔn)差稱為標(biāo)準(zhǔn)誤差, 。計(jì)算公式為:在實(shí)際工作中,總體標(biāo)準(zhǔn)差 常屬未知,只能用樣本標(biāo)準(zhǔn)差S代替 作為最佳的無偏估計(jì),于是標(biāo)準(zhǔn)誤的計(jì)算公式變?yōu)椋?.4.1.2 描述樣本均數(shù)的分布t分布 從一個(gè)均數(shù)為,標(biāo)準(zhǔn)差為的正態(tài)總體中,隨機(jī)抽取含量為n的樣本,可計(jì)算樣本均數(shù) ,樣本標(biāo)準(zhǔn)誤 ,則將樣本均數(shù)與總體均數(shù)的離差以樣本標(biāo)準(zhǔn)誤 為單位,得正態(tài)(離)差 t

14、,若干樣本的t值就構(gòu)成統(tǒng)計(jì)上著名的t分布。實(shí)際工作中總體標(biāo)準(zhǔn)差 往往是不知道的,只能用樣本標(biāo)準(zhǔn)差S來代替,于是得t 2.4.2 總體均數(shù)的區(qū)間估計(jì)區(qū)間估計(jì)(interval estimation) 按預(yù)先給定的概率,由一個(gè)樣本均數(shù)及其標(biāo)準(zhǔn)誤求出總體均數(shù)數(shù)值范圍的過程?!邦A(yù)先給定的概率” 也稱為可信度、可信水平、可信系數(shù),符號(hào)為1-,常取0.99或0.95?!翱傮w均數(shù)數(shù)值范圍” 也稱為可信區(qū)間,符號(hào)為CI。其含義是:由一個(gè)樣本均數(shù)及其標(biāo)準(zhǔn)誤求出的被估計(jì)參數(shù)值有0.99或0.95的可能在此數(shù)值范圍內(nèi),或由若干個(gè)樣本均數(shù)及其標(biāo)準(zhǔn)誤求出的若干個(gè)被估計(jì)參數(shù)值中,有99或95的個(gè)數(shù)可能在此數(shù)值范圍內(nèi)。 2

15、.4.3 總體率的區(qū)間估計(jì)可仿照總體均數(shù)的可信區(qū)間估計(jì)的方法來估計(jì)總體率的所在范圍,即求總體率的可信區(qū)間,我們介紹兩種方法。 正態(tài)近似法 當(dāng)n足夠大,且p和(1-p)不接近零,有np和n(1-p)均大于5時(shí),總體率的可信區(qū)間為: 式中u為可信度1-時(shí)的標(biāo)準(zhǔn)正態(tài)離差,由u界值得知,如99可信區(qū)間時(shí),0.01,u2.58,95可信區(qū)間時(shí),0.05,u1.96。 查表法 當(dāng)n1000,pl時(shí),可查附表3(百分率的可信限表),得到總體率的可信區(qū)間。 2.5 顯著性檢驗(yàn)兩均數(shù)差異顯著性檢驗(yàn)樣本均數(shù)與總體均數(shù)的差異顯著性檢驗(yàn)兩樣本均數(shù)的差異顯著性檢驗(yàn)兩個(gè)幾何級(jí)數(shù)樣本均數(shù)的差異顯著性檢驗(yàn)配對(duì)資料的差異顯著性

16、檢驗(yàn)兩個(gè)大樣本均數(shù)的顯著性檢驗(yàn)u 檢驗(yàn)方差不齊的兩樣本均數(shù)差異的顯著性檢驗(yàn)t檢驗(yàn)2.5.1 顯著性檢驗(yàn)的含義與一般步驟含義在回答樣本與總體是否有本質(zhì)差異或差異是否有顯著時(shí),必須考慮:樣本與總體差異無顯著性和樣本與總體差異有顯著性2種情況。究竟屬于那種情況,需通過差異顯著性檢驗(yàn)來回答。顯著性檢驗(yàn)的步驟建立“檢驗(yàn)假設(shè)”確定檢驗(yàn)水準(zhǔn)選擇檢驗(yàn)方法和計(jì)算統(tǒng)計(jì)量確定概率做出推斷結(jié)論2.5.2 兩均數(shù)差異顯著性檢驗(yàn) 2.5.2.1 兩均數(shù)差異顯著性檢驗(yàn)的基本思路 t檢驗(yàn)是檢驗(yàn)兩均數(shù)間差異顯著性的基本方法。按式(2.20)計(jì)算統(tǒng)計(jì)量t值后,與根據(jù)相應(yīng)自由度查附表2(t值表)所得的t界值進(jìn)行比較,判斷均數(shù)間差異

17、的顯著性。 tt0.05(v) P0.05 差異無顯著性若t0.05(v)tt0.01(v) 則 0.05P0.01 即 差異有顯著性 tt0.01(v) P0.01 差異有極顯著性 當(dāng)v(自由度)50時(shí),可直接采用正態(tài)分布臨界值1.96或2.58來判斷P大于還是小于0.05或0.01。 2.5.2.2 樣本均數(shù)與總體均數(shù)的差異顯著性檢驗(yàn) 【例 2.17】解題步驟:建立檢驗(yàn)假設(shè)計(jì)算t值確定p值結(jié)果判斷2.5.2.3 兩樣本均數(shù)的差異顯著性檢驗(yàn) 兩樣本均數(shù)比較是最常見的統(tǒng)計(jì)比較研究,又稱成組比較,其目的是推斷兩樣本分別代表的總體均數(shù)1與2是否相等。采用下面的公式來檢驗(yàn)兩均數(shù)的差異是否有顯著性。

18、2.5.2.4 兩個(gè)幾何級(jí)數(shù)樣本均數(shù)的差異顯著性檢驗(yàn) 檢驗(yàn)兩個(gè)幾何均數(shù)的差別是否有顯著性,所采用的方法,仍然是t檢驗(yàn)法,只是將所有數(shù)值全部轉(zhuǎn)換為對(duì)數(shù)值進(jìn)行計(jì)算。 2.5.2.5 配對(duì)資料的差異顯著性檢驗(yàn) 在實(shí)驗(yàn)研究中,常采用配對(duì)比較的方法。配對(duì)研究的目的是比較兩種處理方法或?qū)嶒?yàn)前后的結(jié)果有無差異。配對(duì)資料的實(shí)驗(yàn)設(shè)計(jì)有兩種:同體配對(duì),實(shí)驗(yàn)對(duì)象自身對(duì)比;非同體配對(duì)。2.5.2.6 兩個(gè)大樣本均數(shù)的顯著性檢驗(yàn)u 檢驗(yàn) 當(dāng)兩個(gè)樣本的觀察單位數(shù)較多時(shí)(每組n50),資料分布基本近似于正態(tài)分布,可以用u檢驗(yàn)。計(jì)算出u值后,直接根據(jù)表2.13 u檢驗(yàn)的檢驗(yàn)水準(zhǔn)表作出結(jié)果判斷。 2.5.2.7 方差不齊的兩樣

19、本均數(shù)差異的顯著性檢驗(yàn)t檢驗(yàn) 使用t檢驗(yàn)的前提條件是兩個(gè)總體的方差相等, 。事實(shí)上,即使兩個(gè)總體方差相等,樣本方差也會(huì)因?yàn)槌闃佣霈F(xiàn)波動(dòng),因此必需對(duì)兩組樣本進(jìn)行方差齊性檢驗(yàn)。如果方差齊性檢驗(yàn)顯示方差不齊時(shí),則不能直接采用t檢驗(yàn),需要用校正t檢驗(yàn)法(t檢驗(yàn))。 方差齊性檢驗(yàn) 計(jì)算F統(tǒng)計(jì)量 查附表4(方差齊性F界值表) 做出兩總體方差是否相等的推斷 t檢驗(yàn) 計(jì)算均數(shù)標(biāo)準(zhǔn)誤平方 計(jì)算兩樣本均數(shù)差數(shù)的標(biāo)準(zhǔn)誤 計(jì)算t值 求t顯著性界限的近似值 2.5.3多均數(shù)差異的顯著性檢驗(yàn)F檢驗(yàn) 在環(huán)境研究工作中,經(jīng)常有兩個(gè)以上的均數(shù)需要同時(shí)進(jìn)行比較,這時(shí),若應(yīng)用上述的t檢驗(yàn)法,則必須對(duì)每兩個(gè)均數(shù)進(jìn)行t檢驗(yàn),比較繁瑣

20、。而應(yīng)用F檢驗(yàn)法(即方差分析法)可使顯著性檢驗(yàn)大為簡化。 方差分析又稱變異數(shù)分析,其基本思想是把全部觀察值之間總變異,按設(shè)計(jì)和需要分為二個(gè)或多個(gè)組成部分進(jìn)行分析。 總變異的分類在單因素的完全隨機(jī)設(shè)計(jì)的實(shí)驗(yàn)資料中,總變異可分為組內(nèi)變異和組間變異。在配伍組設(shè)計(jì)的資料中,總變異可分為處理組間變異、配伍組間變異及誤差三部分。在22析因設(shè)計(jì)資料中,總變異可分為兩個(gè)因素的兩個(gè)組間變異、兩因素交互作用及誤差四部分。 2.5.3.1 單因素多個(gè)樣本均數(shù)比較 比較步驟檢驗(yàn)假設(shè)計(jì)算校正數(shù)確定P值結(jié)果判斷2.5.3.2 兩因素多個(gè)樣本均數(shù)比較比較步驟列計(jì)算表計(jì)算校正數(shù)(C)計(jì)算離均差平方和(SS)計(jì)算自由度計(jì)算均方

21、(MS)計(jì)算F值確定P值并判斷結(jié)果2.5.3.3 多組均數(shù)間兩兩比較 資料經(jīng)F檢驗(yàn)后,各組均數(shù)間的差異為無顯著性,則不須作進(jìn)一步的統(tǒng)計(jì)處理;如果各組均數(shù)間的差異有顯著意義,則須作進(jìn)一步的分析,以檢驗(yàn)兩兩均數(shù)間的差異哪些是有顯著性的。比較步驟檢驗(yàn)假設(shè)計(jì)算q值求處理數(shù)(a)根據(jù)誤差的自由度及處理數(shù)(a)查附表6(q值表),得q的顯著界值。 確定P值與判斷結(jié)果2.5.4 兩率差異的顯著性檢驗(yàn) 2.5.4.1 率的抽樣誤差 定義樣本率與總體率間的差異情況是由于抽樣造成的,稱為率的抽樣誤差。 公式率的抽樣誤差可用率的標(biāo)準(zhǔn)誤來表示 。2.5.4.2 大樣本率與總體率差異的顯著性檢驗(yàn)u檢驗(yàn) 通常,樣本率與總

22、體率之間進(jìn)行比較時(shí),如樣本含量較大(一般大于50),可采用u檢驗(yàn)。再依據(jù)表作判斷。 2.5.4.3 兩大樣本率的差異顯著性檢驗(yàn)u檢驗(yàn) 公式檢驗(yàn)兩個(gè)樣本率的差異是否顯著時(shí),可用公式: 2.5.4.4 兩大樣本率的差異顯著性檢驗(yàn)四格表 檢驗(yàn) 檢驗(yàn)范圍 檢驗(yàn)(卡方檢驗(yàn))常用以檢驗(yàn)兩個(gè)率或多個(gè)率之間的差別,兩組或多組資料內(nèi)部構(gòu)成之間的差別,理論分布數(shù)列與實(shí)際觀察分布數(shù)列之間的差別,兩個(gè)觀察數(shù)列之間的差別是否有顯著性等。公式檢驗(yàn)的基本公式:X2 式中 A 實(shí)際數(shù) T 理論數(shù) 檢驗(yàn)步驟:(1)檢驗(yàn)假設(shè)(2)計(jì)算 值(3)確定概率,做出判斷 四格表專用公式法四格表專用公式是從 基本公式推導(dǎo)出來的,故兩者計(jì)算

23、的結(jié)果是相同的。 四格表的形式: 四格表專用公式:2.5.4.5 n40且有一個(gè)理論數(shù)小于5的兩率差異顯著性檢驗(yàn)四格表校正 值檢驗(yàn) 公式=2.5.4.6 n40且有一個(gè)理論數(shù)小于5的兩率差異顯著性檢驗(yàn)精確檢驗(yàn)法 四格表中有實(shí)際值為零時(shí),計(jì)算概率的公式為: P 式中! 階乘,規(guī)定0!1。 四格表中無實(shí)際值為零時(shí) 【例 2.31】2.5.5 多率的差異顯著性檢驗(yàn)行列的 檢驗(yàn) 定義當(dāng)資料的組數(shù)或處理方法超過兩組(即行數(shù)或列數(shù)超過兩組)時(shí),通稱為行列表或稱RC表,其檢驗(yàn)方法,可用 的基本公式法,也可采用行列表專用公式法。公式行列表專用公式為: 2.5.6 配對(duì)計(jì)數(shù)資料的差異顯著性檢驗(yàn) 檢驗(yàn) 通過配對(duì)的

24、方法進(jìn)行實(shí)驗(yàn),如每一對(duì)實(shí)驗(yàn)對(duì)象分別給予不同的處理,或同一實(shí)驗(yàn)對(duì)象,先后給予不同的處理,既可獲得計(jì)量資料,也可獲得計(jì)數(shù)資料,這類計(jì)數(shù)資料的率的差別顯著性檢驗(yàn),采用配對(duì)的檢驗(yàn)法。 公式計(jì)算公式:=當(dāng) b + c 40時(shí),則改用校正公式:= 2.6 直線相關(guān)與直線回歸 相關(guān)(correlation) 相關(guān)指兩事物或兩變量之間呈現(xiàn)某種相依變動(dòng)關(guān)系。相關(guān)有直線相關(guān)、曲線相關(guān)、多元線性相關(guān),直線相關(guān)是最簡單的相關(guān)?;貧w(regression) 回歸原指樣本統(tǒng)計(jì)量向總體參數(shù)靠攏或回歸的現(xiàn)象,現(xiàn)指利用方程描述變量變化的數(shù)量關(guān)系?;貧w有直線回歸、曲線擬合、多元線性回歸,直線回歸是最簡單的回歸。 2.6.1 直線

25、相關(guān)定義 如果相關(guān)散點(diǎn)圖顯示一個(gè)變量X由小到大變化,另一個(gè)變量Y亦相應(yīng)地呈直線由小到大(或由大到小)變化,則這兩個(gè)變量間有直線關(guān)系;散點(diǎn)圖顯示的相關(guān)性質(zhì)和密切程度,由直線相關(guān)系數(shù)描述。這種直線關(guān)系以及分析這種直線關(guān)系的理論和方法,統(tǒng)稱直線相關(guān)(linear correlation)。 2.6.1.1 相關(guān)散點(diǎn)圖與相關(guān)系數(shù) 相關(guān)以橫軸(X)代表汽車輛數(shù),以縱軸(Y)代表NO2濃度,繪制相關(guān)散點(diǎn)圖,見下圖。從圖中可見,隨著汽車輛數(shù)的增加,大氣中NO2的濃度也隨之增高,呈現(xiàn)從左下到右上的變化趨勢。我們稱這種“從左下到右上的變化趨勢”為正相關(guān)。 事實(shí)上,除正相關(guān)外,相關(guān)散點(diǎn)圖的散點(diǎn)分布還有多種情形,見

26、下圖。 相關(guān)系數(shù) 定量地表示變量間的線性相關(guān)程度及相關(guān)方向。 相關(guān)系數(shù)沒有單位,其值在1至+1之間。 正相關(guān): 散點(diǎn)的Y值隨X值增加而上升,0r1,如圖2.7(a);如果散點(diǎn)完全在一條直線上,則為完全正相關(guān),r1,如上圖 (b)。 負(fù)相關(guān): 散點(diǎn)的Y值隨X值增加而減少,lr0,如上圖 (c);如果散點(diǎn)完全在一條直線上,則為完全負(fù)相關(guān),r1,如上圖 (d)。零相關(guān): 散點(diǎn)的X與Y的數(shù)值增減無一定規(guī)律,或Y值的變化不受X變化的影響, r0,如上圖 (e、f、g)。無線性相關(guān):散點(diǎn)的X與Y的數(shù)值增減服從非直線規(guī)律,r0,如上圖 (h)。 2.6.1.2 相關(guān)系數(shù)的計(jì)算計(jì)算公式r = = 2.6.2

27、相關(guān)系數(shù)的顯著性檢驗(yàn) 定義 由于抽樣誤差的影響,從相關(guān)系數(shù)為零的總體中隨機(jī)抽取的樣本的相關(guān)系數(shù)不一定為零,檢驗(yàn)樣本相關(guān)系數(shù)不等于零的可能性,即稱為相關(guān)系數(shù)的差異顯著性檢驗(yàn)。常用方法為 檢驗(yàn)。 2.6.2.1 計(jì)算法計(jì)算步驟(1)檢驗(yàn)假設(shè) X與Y沒有相關(guān)關(guān)系,即總體相關(guān)系數(shù) 0,樣本相關(guān)系數(shù)r是從 中抽取,r與 的差別是由于抽樣誤差而引起。 (2)計(jì)算 (3)確定P值與判斷結(jié)果2.6.2.2 查表法椐自由度nn2查附表8 (相關(guān)系數(shù)r界值表),據(jù)界值與計(jì)算相關(guān)系數(shù)的比較結(jié)果判定。 2.6.3 直線回歸2.6.3.1 直線回歸概述環(huán)境研究中,常需由一個(gè)變量(自變量,X)推算另一個(gè)變量(因變量,Y)

28、的估計(jì)值,稱為回歸分析。直線回歸(linear regression)分析的任務(wù)是,按照各點(diǎn)到直線的距離的平方和最小的要求,確定一條最接近于各點(diǎn)的直線(回歸直線),并建立這條直線的方程(回歸方程,regression equation),以描述兩變量的變化規(guī)律或進(jìn)行變量推算。2.6.3.2 回歸方程的建立【例2.37】解題步驟:計(jì)算基本數(shù)據(jù): 、 、 、 、 。相關(guān)系數(shù)r及其顯著性檢驗(yàn)。按(2.51)式計(jì)算回歸系數(shù) 。 按(2.53)式計(jì)算截距a 。按(2.54)建立回歸方程 a+bX 。顯示回歸線。 2.6.3.3 回歸方程的顯著性檢驗(yàn)(1)單樣本回歸系數(shù)的顯著性檢驗(yàn)回歸系數(shù)的顯著性檢驗(yàn)也用t檢驗(yàn)。檢驗(yàn)假設(shè)計(jì)算標(biāo)準(zhǔn)估計(jì)誤差計(jì)算 、 值確定P值及結(jié)果判斷(2)兩樣本回歸系數(shù)的差異顯著性檢驗(yàn) 若通過兩個(gè)樣本,獲得兩個(gè)回歸系數(shù)b1和b2,回歸系數(shù)的標(biāo)準(zhǔn)誤分別為Sb1和Sb2,需對(duì)兩樣本之間的差異進(jìn)行顯著性檢驗(yàn)。檢驗(yàn)假設(shè)按公式計(jì)算t值確定P值及結(jié)果判斷2.7 環(huán)境數(shù)據(jù)統(tǒng)計(jì)與分析的計(jì)算機(jī)處理2.7.1 均數(shù)2.7.1.1 算術(shù)均數(shù)直接計(jì)算法頻數(shù)加權(quán)計(jì)算法2.7.1.2 幾何均數(shù)直接計(jì)算法頻數(shù)表計(jì)算法2.7.2 中位數(shù)直接計(jì)算法頻數(shù)表計(jì)算法2.7.3 變異數(shù)標(biāo)準(zhǔn)差變異系數(shù)2.7.4 樣本特征推斷2.7.4.1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論