大數(shù)據(jù)分析中數(shù)理統(tǒng)計方法的正確使用_第1頁
大數(shù)據(jù)分析中數(shù)理統(tǒng)計方法的正確使用_第2頁
大數(shù)據(jù)分析中數(shù)理統(tǒng)計方法的正確使用_第3頁
大數(shù)據(jù)分析中數(shù)理統(tǒng)計方法的正確使用_第4頁
大數(shù)據(jù)分析中數(shù)理統(tǒng)計方法的正確使用_第5頁
已閱讀5頁,還剩104頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、v作者所處理的數(shù)據(jù)屬于隨機(jī)變量的特定樣本。作者所處理的數(shù)據(jù)屬于隨機(jī)變量的特定樣本。v作者已經(jīng)掌握最基本的數(shù)理統(tǒng)計學(xué)常識,如概率、作者已經(jīng)掌握最基本的數(shù)理統(tǒng)計學(xué)常識,如概率、假設(shè)檢驗、均值、方差、標(biāo)準(zhǔn)差、正態(tài)分布、相假設(shè)檢驗、均值、方差、標(biāo)準(zhǔn)差、正態(tài)分布、相關(guān)分析、回歸分析、方差分析關(guān)分析、回歸分析、方差分析。v在科學(xué)研究中,經(jīng)常會涉及到對隨機(jī)變量在科學(xué)研究中,經(jīng)常會涉及到對隨機(jī)變量大小大小、離散離散及及分布分布特征的描述以及對特征的描述以及對2 2個或多個隨機(jī)變量之間的個或多個隨機(jī)變量之間的關(guān)系關(guān)系描述問題。描述問題。地學(xué)、環(huán)境科學(xué)研究也不例外地學(xué)、環(huán)境科學(xué)研究也不例外。v對隨機(jī)變量及隨機(jī)變量

2、之間的關(guān)系進(jìn)行定量描述的數(shù)學(xué)工具對隨機(jī)變量及隨機(jī)變量之間的關(guān)系進(jìn)行定量描述的數(shù)學(xué)工具就是就是數(shù)理統(tǒng)計學(xué)數(shù)理統(tǒng)計學(xué)。v在科學(xué)研究中,能否正確使用各種數(shù)理統(tǒng)計方法關(guān)系到所得在科學(xué)研究中,能否正確使用各種數(shù)理統(tǒng)計方法關(guān)系到所得出結(jié)論的客觀性和可信性。所以,出結(jié)論的客觀性和可信性。所以,來稿中使用的數(shù)理統(tǒng)計方來稿中使用的數(shù)理統(tǒng)計方法是否正確法是否正確應(yīng)是學(xué)術(shù)期刊編輯和作者極為重視的問題。應(yīng)是學(xué)術(shù)期刊編輯和作者極為重視的問題。v目前,國內(nèi)科技期刊對稿件中數(shù)理統(tǒng)計方法問題的重視程度目前,國內(nèi)科技期刊對稿件中數(shù)理統(tǒng)計方法問題的重視程度存在差異。存在差異。 v統(tǒng)計分析通常涉及大量的數(shù)據(jù),需要較大的計算統(tǒng)計分析

3、通常涉及大量的數(shù)據(jù),需要較大的計算工作量。工作量。v在進(jìn)行統(tǒng)計分析時,盡管作者可以自行編寫計算在進(jìn)行統(tǒng)計分析時,盡管作者可以自行編寫計算程序,但在統(tǒng)計軟件很普及的今天,這樣做是毫程序,但在統(tǒng)計軟件很普及的今天,這樣做是毫無必要的。無必要的。v出于對出于對工作效率工作效率以及對以及對算法的通用性、可比性算法的通用性、可比性的的考慮,一些學(xué)術(shù)期刊要求作者采用專門的數(shù)理統(tǒng)考慮,一些學(xué)術(shù)期刊要求作者采用專門的數(shù)理統(tǒng)計軟件進(jìn)行統(tǒng)計分析。計軟件進(jìn)行統(tǒng)計分析。 問題:作者未使用專門的數(shù)理統(tǒng)計軟件,而采用問題:作者未使用專門的數(shù)理統(tǒng)計軟件,而采用Excel這樣的電子表格軟件進(jìn)行數(shù)據(jù)統(tǒng)計分析。這樣的電子表格軟件

4、進(jìn)行數(shù)據(jù)統(tǒng)計分析。v由于電子表格軟件提供的統(tǒng)計分析功能十分有限,由于電子表格軟件提供的統(tǒng)計分析功能十分有限,只能借助它進(jìn)行較為簡單的統(tǒng)計分析,故我們不主只能借助它進(jìn)行較為簡單的統(tǒng)計分析,故我們不主張作者采用這樣的軟件進(jìn)行統(tǒng)計分析。張作者采用這樣的軟件進(jìn)行統(tǒng)計分析。 v目前,國際上已開發(fā)出的專門用于統(tǒng)計分析的商目前,國際上已開發(fā)出的專門用于統(tǒng)計分析的商業(yè)軟件很多,比較著名有業(yè)軟件很多,比較著名有SPSS(Statistical Package for Social Sciences)和和SAS(Statistical Analysis System)。此外,還有此外,還有BMDP和和STATIS

5、TICA等等。vSPSS是專門為社會科學(xué)領(lǐng)域的研究者設(shè)計的,但是專門為社會科學(xué)領(lǐng)域的研究者設(shè)計的,但此軟件在自然科學(xué)領(lǐng)域也得到廣泛應(yīng)用。此軟件在自然科學(xué)領(lǐng)域也得到廣泛應(yīng)用。vBMDP是專門為生物學(xué)和醫(yī)學(xué)領(lǐng)域研究者編制的是專門為生物學(xué)和醫(yī)學(xué)領(lǐng)域研究者編制的統(tǒng)計軟件。統(tǒng)計軟件。 v目前,國際學(xué)術(shù)界有一條不成文的約定:凡是用目前,國際學(xué)術(shù)界有一條不成文的約定:凡是用SPSSSPSS和和SASSAS軟件進(jìn)行統(tǒng)計分析所獲得的結(jié)果,在國際學(xué)術(shù)軟件進(jìn)行統(tǒng)計分析所獲得的結(jié)果,在國際學(xué)術(shù)交流中不必說明具體算法。由此可見,交流中不必說明具體算法。由此可見,SPSSSPSS和和SASSAS軟軟件已被各領(lǐng)域研究者普遍

6、認(rèn)可。件已被各領(lǐng)域研究者普遍認(rèn)可。v我們建議作者們在進(jìn)行統(tǒng)計分析時盡量使用這我們建議作者們在進(jìn)行統(tǒng)計分析時盡量使用這2 2個專個專門的統(tǒng)計軟件。目前,有關(guān)這門的統(tǒng)計軟件。目前,有關(guān)這2 2個軟件的使用教程在個軟件的使用教程在書店中可很容易地買到。書店中可很容易地買到。 v1 1)均值(準(zhǔn)確的稱呼應(yīng)為)均值(準(zhǔn)確的稱呼應(yīng)為“樣本均值樣本均值”)的統(tǒng))的統(tǒng)計學(xué)意義:反映隨機(jī)變量樣本的大小特征。計學(xué)意義:反映隨機(jī)變量樣本的大小特征。v2 2)均值對應(yīng)于隨機(jī)變量總體的數(shù)學(xué)期望)均值對應(yīng)于隨機(jī)變量總體的數(shù)學(xué)期望總體的總體的數(shù)學(xué)期望客觀上決定著樣本的均值,反過來,通數(shù)學(xué)期望客觀上決定著樣本的均值,反過來,

7、通過計算樣本的均值可以描述總體的數(shù)學(xué)期望。過計算樣本的均值可以描述總體的數(shù)學(xué)期望。v3 3)在處理實驗數(shù)據(jù)或采樣數(shù)據(jù)時,經(jīng)常會遇到)在處理實驗數(shù)據(jù)或采樣數(shù)據(jù)時,經(jīng)常會遇到對相同采樣或相同實驗條件下同一隨機(jī)變量的多對相同采樣或相同實驗條件下同一隨機(jī)變量的多個不同取值進(jìn)行統(tǒng)計處理的問題。個不同取值進(jìn)行統(tǒng)計處理的問題。v4 4)為找到代表這些觀測值總體大小特征的代表)為找到代表這些觀測值總體大小特征的代表值(統(tǒng)計量,該統(tǒng)計量根據(jù)樣本數(shù)據(jù)算出),多值(統(tǒng)計量,該統(tǒng)計量根據(jù)樣本數(shù)據(jù)算出),多數(shù)作者會不假思索地直接給出算術(shù)平均值和標(biāo)準(zhǔn)數(shù)作者會不假思索地直接給出算術(shù)平均值和標(biāo)準(zhǔn)差。顯然,這種做法是不嚴(yán)謹(jǐn)?shù)牟?/p>

8、。顯然,這種做法是不嚴(yán)謹(jǐn)?shù)牟灰欢偸遣灰欢偸钦_的正確的v在數(shù)理統(tǒng)計學(xué)中,作為描述隨機(jī)變量樣本的總體大小在數(shù)理統(tǒng)計學(xué)中,作為描述隨機(jī)變量樣本的總體大小特征的統(tǒng)計量有算術(shù)平均值、幾何平均值和中位數(shù)等特征的統(tǒng)計量有算術(shù)平均值、幾何平均值和中位數(shù)等多個。多個。v何時用算術(shù)平均值?何時用幾何平均值?以及何時用何時用算術(shù)平均值?何時用幾何平均值?以及何時用中位數(shù)?中位數(shù)?這不能由研究者根據(jù)主觀意愿隨意確定,而這不能由研究者根據(jù)主觀意愿隨意確定,而要根據(jù)隨機(jī)變量的分布特征確定要根據(jù)隨機(jī)變量的分布特征確定。 v反映隨機(jī)變量總體大小特征的統(tǒng)計量是數(shù)學(xué)期望,而在隨機(jī)反映隨機(jī)變量總體大小特征的統(tǒng)計量是數(shù)學(xué)期望,

9、而在隨機(jī)變量的分布服從正態(tài)分布時,其數(shù)學(xué)期望就可以用樣本的算變量的分布服從正態(tài)分布時,其數(shù)學(xué)期望就可以用樣本的算術(shù)平均值描述。此時,可用樣本的術(shù)平均值描述。此時,可用樣本的算術(shù)平均值算術(shù)平均值描述隨機(jī)變量描述隨機(jī)變量的大小特征。的大小特征。v如果所研究的隨機(jī)變量不服從正態(tài)分布,則算術(shù)平均值不能如果所研究的隨機(jī)變量不服從正態(tài)分布,則算術(shù)平均值不能準(zhǔn)確反映該變量的大小特征。在這種情況下,可通過假設(shè)檢準(zhǔn)確反映該變量的大小特征。在這種情況下,可通過假設(shè)檢驗來判斷隨機(jī)變量是否服從對數(shù)正態(tài)分布。如果服從對數(shù)正驗來判斷隨機(jī)變量是否服從對數(shù)正態(tài)分布。如果服從對數(shù)正態(tài)分布,則幾何平均值就是數(shù)學(xué)期望的值。此時,就

10、可以計態(tài)分布,則幾何平均值就是數(shù)學(xué)期望的值。此時,就可以計算變量的算變量的幾何平均值幾何平均值。v如果隨機(jī)變量既不服從正態(tài)分布也不服從對數(shù)正態(tài)分布,則如果隨機(jī)變量既不服從正態(tài)分布也不服從對數(shù)正態(tài)分布,則按現(xiàn)有的數(shù)理統(tǒng)計學(xué)知識,尚無合適的統(tǒng)計量描述該變量的按現(xiàn)有的數(shù)理統(tǒng)計學(xué)知識,尚無合適的統(tǒng)計量描述該變量的大小特征。此時,可用大小特征。此時,可用中位數(shù)中位數(shù)來描述變量的大小特征。來描述變量的大小特征。 v在相關(guān)分析中,作者們常犯的錯誤是:簡單地計算在相關(guān)分析中,作者們常犯的錯誤是:簡單地計算Pearson Pearson 積矩相關(guān)系數(shù),而且既不給出正態(tài)分布檢驗結(jié)果,也往往積矩相關(guān)系數(shù),而且既不給

11、出正態(tài)分布檢驗結(jié)果,也往往不明確指出所計算的相關(guān)系數(shù)就是不明確指出所計算的相關(guān)系數(shù)就是Pearson Pearson 積矩相關(guān)系數(shù)。積矩相關(guān)系數(shù)。v在數(shù)理統(tǒng)計學(xué)中,除有針對數(shù)值變量設(shè)計的在數(shù)理統(tǒng)計學(xué)中,除有針對數(shù)值變量設(shè)計的Pearson Pearson 積矩積矩相關(guān)系數(shù)(對應(yīng)于相關(guān)系數(shù)(對應(yīng)于 “參數(shù)方法參數(shù)方法”)外,還有針對順序變量)外,還有針對順序變量(即(即“秩變量秩變量”)設(shè)計的)設(shè)計的SpearmanSpearman秩相關(guān)系數(shù)和秩相關(guān)系數(shù)和KendallKendall秩相關(guān)系數(shù)(對應(yīng)于秩相關(guān)系數(shù)(對應(yīng)于 “非參數(shù)方法非參數(shù)方法”)等。)等。vPearson Pearson 積矩相

12、關(guān)系數(shù)可用于描述積矩相關(guān)系數(shù)可用于描述2 2個隨機(jī)變量的線性相關(guān)個隨機(jī)變量的線性相關(guān)程度,程度,SpearmanSpearman或或KendallKendall秩相關(guān)系數(shù)用來判斷兩個隨機(jī)秩相關(guān)系數(shù)用來判斷兩個隨機(jī)變量在二維和多維空間中是否具有某種共變趨勢。變量在二維和多維空間中是否具有某種共變趨勢。 在相關(guān)分析中,計算各種相關(guān)系數(shù)是有前提條件在相關(guān)分析中,計算各種相關(guān)系數(shù)是有前提條件的。的。在相關(guān)分析中,對于秩變量,一般別無選擇,只在相關(guān)分析中,對于秩變量,一般別無選擇,只能計算能計算SpearmanSpearman或或KendallKendall秩相關(guān)系數(shù)。秩相關(guān)系數(shù)。對于數(shù)值變量,只要條件

13、許可,應(yīng)盡量使用對于數(shù)值變量,只要條件許可,應(yīng)盡量使用檢驗檢驗功效最高功效最高的參數(shù)方法,即計算用的參數(shù)方法,即計算用Pearson Pearson 積矩相積矩相關(guān)系數(shù)。只有計算關(guān)系數(shù)。只有計算Pearson Pearson 積矩相關(guān)系數(shù)的前提積矩相關(guān)系數(shù)的前提不存在時,才考慮退而求其次,計算專門為秩變不存在時,才考慮退而求其次,計算專門為秩變量設(shè)計的量設(shè)計的SpearmanSpearman或或KendallKendall秩相關(guān)系數(shù)(秩相關(guān)系數(shù)(盡管盡管這樣做會導(dǎo)致檢驗功效的降低這樣做會導(dǎo)致檢驗功效的降低)。)。 v對于數(shù)值變量,相關(guān)系數(shù)選擇的依據(jù)是變量是否服從正態(tài)對于數(shù)值變量,相關(guān)系數(shù)選擇的

14、依據(jù)是變量是否服從正態(tài)分布,或變換后的數(shù)據(jù)是否服從正態(tài)分布。分布,或變換后的數(shù)據(jù)是否服從正態(tài)分布。v對于二元相關(guān)分析,如果對于二元相關(guān)分析,如果2 2個隨機(jī)變量服從二元正態(tài)分布假個隨機(jī)變量服從二元正態(tài)分布假設(shè),則應(yīng)該用設(shè),則應(yīng)該用Pearson Pearson 積矩相關(guān)系數(shù)描述這積矩相關(guān)系數(shù)描述這2 2個隨機(jī)變量個隨機(jī)變量間的相關(guān)關(guān)系。間的相關(guān)關(guān)系。v如果樣本數(shù)據(jù)不服從二元正態(tài)分布,則可嘗試進(jìn)行數(shù)據(jù)變?nèi)绻麡颖緮?shù)據(jù)不服從二元正態(tài)分布,則可嘗試進(jìn)行數(shù)據(jù)變換,看變換后的數(shù)據(jù)是否符合正態(tài)分布?如果是,則可以換,看變換后的數(shù)據(jù)是否符合正態(tài)分布?如果是,則可以針對變換后的數(shù)據(jù)計算針對變換后的數(shù)據(jù)計算Pea

15、rson Pearson 積矩相關(guān)系數(shù);否則,就積矩相關(guān)系數(shù);否則,就不能計算不能計算Pearson Pearson 積矩相關(guān)系數(shù),而應(yīng)改用檢驗功效較低積矩相關(guān)系數(shù),而應(yīng)改用檢驗功效較低的的SpearmanSpearman或或KendallKendall秩相關(guān)系數(shù)(此時,如果強(qiáng)行計算秩相關(guān)系數(shù)(此時,如果強(qiáng)行計算Pearson Pearson 積矩相關(guān)系數(shù)有可能會得出完全錯誤的結(jié)論)。積矩相關(guān)系數(shù)有可能會得出完全錯誤的結(jié)論)。相關(guān)分析和回歸分析是極為常用的相關(guān)分析和回歸分析是極為常用的2 2種數(shù)理統(tǒng)計方法,種數(shù)理統(tǒng)計方法,在環(huán)境科學(xué)及其它科學(xué)研究領(lǐng)域有著廣泛的用途。然在環(huán)境科學(xué)及其它科學(xué)研究領(lǐng)

16、域有著廣泛的用途。然而,由于這而,由于這2 2種數(shù)理統(tǒng)計方法在計算方面存在很多相種數(shù)理統(tǒng)計方法在計算方面存在很多相似之處,且在一些數(shù)理統(tǒng)計教科書中沒有系統(tǒng)闡明這似之處,且在一些數(shù)理統(tǒng)計教科書中沒有系統(tǒng)闡明這2 2種數(shù)理統(tǒng)計方法的內(nèi)在差別,從而使一些研究者不種數(shù)理統(tǒng)計方法的內(nèi)在差別,從而使一些研究者不能嚴(yán)格區(qū)分相關(guān)分析與回歸分析能嚴(yán)格區(qū)分相關(guān)分析與回歸分析 。1 1)最常見的錯誤是)最常見的錯誤是: :用回歸分析的結(jié)果解釋相關(guān)性問用回歸分析的結(jié)果解釋相關(guān)性問題。例如,作者將題。例如,作者將“回歸直線(曲線)圖回歸直線(曲線)圖”稱為稱為“相關(guān)性圖相關(guān)性圖”或或“相關(guān)關(guān)系圖相關(guān)關(guān)系圖”;將回歸直線

17、的;將回歸直線的R2 2( (擬合度,或稱擬合度,或稱“可決系數(shù)可決系數(shù)”) )錯誤地稱為錯誤地稱為“相關(guān)相關(guān)系數(shù)系數(shù)”或或“相關(guān)系數(shù)的平方相關(guān)系數(shù)的平方”;根據(jù)回歸分析的結(jié);根據(jù)回歸分析的結(jié)果宣稱果宣稱2 2個變量之間存在正的或負(fù)的相關(guān)關(guān)系。個變量之間存在正的或負(fù)的相關(guān)關(guān)系。 2 2)相關(guān)分析與回歸分析均為研究)相關(guān)分析與回歸分析均為研究2 2個或多個變量間個或多個變量間關(guān)聯(lián)性的方法,但關(guān)聯(lián)性的方法,但2 2種數(shù)理統(tǒng)計方法存在本質(zhì)的差種數(shù)理統(tǒng)計方法存在本質(zhì)的差別,即它們用于不同的研究目的。別,即它們用于不同的研究目的。3 3)相關(guān)分析的目的在于檢驗兩個隨機(jī)變量的共變趨)相關(guān)分析的目的在于檢驗

18、兩個隨機(jī)變量的共變趨勢(即共同變化的程度),回歸分析的目的則在于勢(即共同變化的程度),回歸分析的目的則在于試圖用自變量來預(yù)測因變量的值。試圖用自變量來預(yù)測因變量的值。 4 4)在相關(guān)分析中,兩個變量必須同時都是隨機(jī)變量,)在相關(guān)分析中,兩個變量必須同時都是隨機(jī)變量,如果其中的一個變量不是隨機(jī)變量,就不能進(jìn)行相如果其中的一個變量不是隨機(jī)變量,就不能進(jìn)行相關(guān)分析。這是相關(guān)分析方法本身所決定的。關(guān)分析。這是相關(guān)分析方法本身所決定的。 5 5)對于回歸分析,其中的因變量肯定為隨機(jī)變)對于回歸分析,其中的因變量肯定為隨機(jī)變量(這是回歸分析方法本身所決定的),而自量(這是回歸分析方法本身所決定的),而自

19、變量則可以是普通變量(有確定的取值)也可變量則可以是普通變量(有確定的取值)也可以是隨機(jī)變量。以是隨機(jī)變量。 6 6)如果自變量是普通變量,即模型)如果自變量是普通變量,即模型回歸分析,回歸分析,采用的回歸方法就是最為常用的最小二乘法。采用的回歸方法就是最為常用的最小二乘法。7 7)如果自變量是隨機(jī)變量,)如果自變量是隨機(jī)變量,即模型即模型回歸分析,回歸分析,所采用的回歸方法與計算者的目的有關(guān)。所采用的回歸方法與計算者的目的有關(guān)。在以預(yù)測為目的的情況下,仍采用在以預(yù)測為目的的情況下,仍采用“最小二乘法最小二乘法”(但精度下降(但精度下降最小二乘法是專為模型最小二乘法是專為模型 設(shè)計的,設(shè)計的,

20、未考慮自變量的隨機(jī)誤差);未考慮自變量的隨機(jī)誤差);在以估值為目的(如計算可決系數(shù)、回歸系數(shù)等)的在以估值為目的(如計算可決系數(shù)、回歸系數(shù)等)的情況下,應(yīng)使用相對嚴(yán)謹(jǐn)?shù)姆椒ǎㄈ缜闆r下,應(yīng)使用相對嚴(yán)謹(jǐn)?shù)姆椒ǎㄈ纭爸鬏S法主軸法”、“約化主軸法約化主軸法”或或“BartlettBartlett法法” )。)。8 8)顯然,對于回歸分析,如果是模型)顯然,對于回歸分析,如果是模型回歸分析,鑒于兩回歸分析,鑒于兩個隨機(jī)變量客觀上存在個隨機(jī)變量客觀上存在“相關(guān)性相關(guān)性”問題,只是由于回歸分問題,只是由于回歸分析方法本身不能提供針對自變量和因變量之間相關(guān)關(guān)系的析方法本身不能提供針對自變量和因變量之間相關(guān)關(guān)系

21、的準(zhǔn)確的檢驗手段,因此,若以預(yù)測為目的,最好不提準(zhǔn)確的檢驗手段,因此,若以預(yù)測為目的,最好不提“相相關(guān)性關(guān)性”問題;問題;若以探索兩者的若以探索兩者的“共變趨勢共變趨勢”為目的為目的,應(yīng)該,應(yīng)該改用相關(guān)分析。改用相關(guān)分析。9 9)如果是模型)如果是模型回歸分析,就根本不可能回答變量的回歸分析,就根本不可能回答變量的“相相關(guān)性關(guān)性”問題,問題,因為普通變量與隨機(jī)變量之間不存在因為普通變量與隨機(jī)變量之間不存在“相關(guān)相關(guān)性性”這一概念這一概念(問題在于,大多數(shù)的回歸分析都是模型(問題在于,大多數(shù)的回歸分析都是模型回歸分析?。4藭r,即使作者想描述回歸分析!)。此時,即使作者想描述2 2個變量間的個變

22、量間的“共共變趨勢變趨勢”而改用相關(guān)分析,也會因相關(guān)分析的前提不存在而改用相關(guān)分析,也會因相關(guān)分析的前提不存在而使分析結(jié)果毫無意義。而使分析結(jié)果毫無意義。1010)需要特別指出的是,回歸分析中的)需要特別指出的是,回歸分析中的R2在數(shù)學(xué)上恰好是在數(shù)學(xué)上恰好是PearsonPearson積矩相關(guān)系數(shù)積矩相關(guān)系數(shù)r的平方。因此,這極易使作者們錯的平方。因此,這極易使作者們錯誤地理解誤地理解R2的含義,認(rèn)為的含義,認(rèn)為R2就是就是 “相關(guān)系數(shù)相關(guān)系數(shù)”或或“相關(guān)系相關(guān)系數(shù)的平方數(shù)的平方”。問題在于,對于自變量是普通變量(即其取。問題在于,對于自變量是普通變量(即其取值有確定性的變量)、因變量為隨機(jī)變

23、量的模型值有確定性的變量)、因變量為隨機(jī)變量的模型回歸分回歸分析,析,2 2個變量之間的個變量之間的“相關(guān)性相關(guān)性”概念根本不存在,又何談概念根本不存在,又何談“相關(guān)系數(shù)相關(guān)系數(shù)”呢?呢?1111)更值得注意的是,一些早期的教科書作者不是用)更值得注意的是,一些早期的教科書作者不是用R2來描來描述回歸效果(擬合程度,擬合度)的,而是用述回歸效果(擬合程度,擬合度)的,而是用PearsonPearson積矩積矩相關(guān)系數(shù)來描述。這就更容易誤導(dǎo)讀者。相關(guān)系數(shù)來描述。這就更容易誤導(dǎo)讀者。5.1 假設(shè)檢驗基本思想基本思想v統(tǒng)計推斷:是根據(jù)樣本數(shù)據(jù)推斷總體特征的一種方法。統(tǒng)計推斷:是根據(jù)樣本數(shù)據(jù)推斷總體特

24、征的一種方法。v假設(shè)檢驗:是進(jìn)行假設(shè)檢驗:是進(jìn)行統(tǒng)計推斷統(tǒng)計推斷的途徑之一(另一種途徑是參的途徑之一(另一種途徑是參數(shù)估計,如點估計和區(qū)間估計)。數(shù)估計,如點估計和區(qū)間估計)。v假設(shè)檢驗中的關(guān)鍵問題:假設(shè)檢驗中的關(guān)鍵問題:1 1)在原假設(shè)成立的情況下,如何)在原假設(shè)成立的情況下,如何計算樣本值或某一極端值發(fā)生的概率?計算樣本值或某一極端值發(fā)生的概率?2 2)如何界定小概率)如何界定小概率事件?事件?基本思路基本思路首先,對總體參數(shù)值提出假設(shè)(原假設(shè));然后,利用樣本首先,對總體參數(shù)值提出假設(shè)(原假設(shè));然后,利用樣本數(shù)據(jù)提供的信息來驗證所提出的假設(shè)是否成立(統(tǒng)計推數(shù)據(jù)提供的信息來驗證所提出的假

25、設(shè)是否成立(統(tǒng)計推斷)斷)如果樣本數(shù)據(jù)提供的信息不能證明上述假設(shè)成立,如果樣本數(shù)據(jù)提供的信息不能證明上述假設(shè)成立,則應(yīng)拒絕該假設(shè);如果樣本數(shù)據(jù)提供的信息不能證明上述假則應(yīng)拒絕該假設(shè);如果樣本數(shù)據(jù)提供的信息不能證明上述假設(shè)不成立,則不應(yīng)拒絕該假設(shè)。設(shè)不成立,則不應(yīng)拒絕該假設(shè)。接受或拒絕原假設(shè)的依據(jù)接受或拒絕原假設(shè)的依據(jù) 小概率事件不可能發(fā)生。顯然,這樣做是有風(fēng)險的(小概率小概率事件不可能發(fā)生。顯然,這樣做是有風(fēng)險的(小概率事件真的發(fā)生了)。事件真的發(fā)生了)?;静襟E 1 1)提出原假設(shè)(或稱)提出原假設(shè)(或稱“零假設(shè)零假設(shè)”,H0);); 2 2)選擇檢驗統(tǒng)計量;)選擇檢驗統(tǒng)計量; 3 3)根據(jù)

26、樣本數(shù)據(jù)計算檢驗統(tǒng)計量觀測值的發(fā)生概率(相)根據(jù)樣本數(shù)據(jù)計算檢驗統(tǒng)計量觀測值的發(fā)生概率(相伴概率,伴概率,p);); 4 4)根據(jù)給定的小概率事件界定標(biāo)準(zhǔn)(顯著性水平,如)根據(jù)給定的小概率事件界定標(biāo)準(zhǔn)(顯著性水平,如0.050.05,0.010.01)做出統(tǒng)計推斷。)做出統(tǒng)計推斷?;静襟E:為什么要設(shè)計并計算檢驗統(tǒng)計量?基本步驟:為什么要設(shè)計并計算檢驗統(tǒng)計量?v在假設(shè)檢驗中,樣本值(或更極端的取值)發(fā)生的概率在假設(shè)檢驗中,樣本值(或更極端的取值)發(fā)生的概率不能直接通過樣本數(shù)據(jù)計算,而是通過計算不能直接通過樣本數(shù)據(jù)計算,而是通過計算檢驗統(tǒng)計量檢驗統(tǒng)計量觀測值觀測值的發(fā)生概率而間接得到的。的發(fā)生概

27、率而間接得到的。v所設(shè)計的檢驗統(tǒng)計量一般服從或近似服從某種已知的理所設(shè)計的檢驗統(tǒng)計量一般服從或近似服從某種已知的理論分布(如論分布(如t-t-分布、分布、F-F-分布、卡方分布),易于估算其分布、卡方分布),易于估算其取值概率。取值概率。v對于不同的假設(shè)檢驗和不同的總體,會有不同的選擇檢對于不同的假設(shè)檢驗和不同的總體,會有不同的選擇檢驗統(tǒng)計量的理論和方法驗統(tǒng)計量的理論和方法。基本步驟:計算檢驗統(tǒng)計量觀測值的發(fā)生概率基本步驟:計算檢驗統(tǒng)計量觀測值的發(fā)生概率 在假定原假設(shè)成立的前提下,利用樣本數(shù)據(jù)計算檢驗統(tǒng)計量觀測值發(fā)生的概率(即p值,又稱“相伴概率”指該檢驗統(tǒng)計量在某個特定的極端區(qū)域在原假設(shè)成立

28、時的概率)。該概率值間接地給出了在原假設(shè)成立的條件下樣本值(或更極端值)發(fā)生的概率。進(jìn)行統(tǒng)計推斷進(jìn)行統(tǒng)計推斷 依據(jù)預(yù)先確定的 “顯著性水平” (即值),如0.01或0.05,決定是否拒絕原假設(shè)。 如果p值小于值,即認(rèn)為原假設(shè)成立時檢驗統(tǒng)計量觀測值的發(fā)生是小概率事件,則拒絕原假設(shè)。否則,就接受原假設(shè)。v在假設(shè)檢驗中,在假設(shè)檢驗中,顯著性水平(顯著性水平(Significant level,用用表示)的確定是假設(shè)檢驗中至關(guān)重要的問題。表示)的確定是假設(shè)檢驗中至關(guān)重要的問題。v顯著性水平是在原假設(shè)成立時檢驗統(tǒng)計量的制落在顯著性水平是在原假設(shè)成立時檢驗統(tǒng)計量的制落在某個極端區(qū)域的概率值。因此,如果取某

29、個極端區(qū)域的概率值。因此,如果取= 0.050.05,如果計算出的如果計算出的p值小于值小于 ,則可認(rèn)為原假設(shè)是一個,則可認(rèn)為原假設(shè)是一個不可能發(fā)生的小概率事件。當(dāng)然,如果真的發(fā)生了,不可能發(fā)生的小概率事件。當(dāng)然,如果真的發(fā)生了,則犯錯誤的可能性為則犯錯誤的可能性為5%5%。顯然,顯著性水平反映顯然,顯著性水平反映了拒絕某一原假設(shè)時所犯錯誤的可能性,或者說,了拒絕某一原假設(shè)時所犯錯誤的可能性,或者說, 是指拒絕了事實上正確的原假設(shè)的概率。是指拒絕了事實上正確的原假設(shè)的概率。v值一般在進(jìn)行假設(shè)檢驗前由研究者根據(jù)實際的需值一般在進(jìn)行假設(shè)檢驗前由研究者根據(jù)實際的需要確定。要確定。v常用的取值是常用的

30、取值是0.050.05或或0.010.01。對于前者,相當(dāng)于在。對于前者,相當(dāng)于在原假設(shè)事實上正確的情況下,研究者接受這一假原假設(shè)事實上正確的情況下,研究者接受這一假設(shè)的可能性為設(shè)的可能性為95%95%;對于后者,則研究者接受事;對于后者,則研究者接受事實上正確的原假設(shè)的可能性為實上正確的原假設(shè)的可能性為99%99%。v顯然,降低顯然,降低值可以減少拒絕原假設(shè)的可能性。因值可以減少拒絕原假設(shè)的可能性。因此,在報告統(tǒng)計分析結(jié)果時,必須給出此,在報告統(tǒng)計分析結(jié)果時,必須給出 值。值。 v在進(jìn)行假設(shè)檢驗時,各種統(tǒng)計軟件均會給出在進(jìn)行假設(shè)檢驗時,各種統(tǒng)計軟件均會給出檢驗統(tǒng)檢驗統(tǒng)計量觀測值計量觀測值以及

31、原假設(shè)成立時該檢驗統(tǒng)計量取值的以及原假設(shè)成立時該檢驗統(tǒng)計量取值的相伴概率相伴概率(即(即檢驗統(tǒng)計量檢驗統(tǒng)計量某特定取值及更極端可能某特定取值及更極端可能值出現(xiàn)的概率,用值出現(xiàn)的概率,用p p表示)。表示)。vp p值是否小于事先確定的值是否小于事先確定的值,是接受或拒絕原假值,是接受或拒絕原假設(shè)的依據(jù)。設(shè)的依據(jù)。v如果如果p p值小于事先已確定的值小于事先已確定的值,就意味著檢驗統(tǒng)值,就意味著檢驗統(tǒng)計量取值的可能性很小,進(jìn)而可推斷原假設(shè)成立的計量取值的可能性很小,進(jìn)而可推斷原假設(shè)成立的可能性很小,因而可以拒絕原假設(shè)。相反,如果可能性很小,因而可以拒絕原假設(shè)。相反,如果p p值大于事先已確定的值

32、大于事先已確定的值,就不能拒絕原假設(shè)。值,就不能拒絕原假設(shè)。 1 1)在計算機(jī)技術(shù)十分發(fā)達(dá),以及專業(yè)統(tǒng)計軟件功能十分強(qiáng))在計算機(jī)技術(shù)十分發(fā)達(dá),以及專業(yè)統(tǒng)計軟件功能十分強(qiáng)大的今天,計算檢驗統(tǒng)計量及其相伴概率是一件十分容易大的今天,計算檢驗統(tǒng)計量及其相伴概率是一件十分容易的事情。的事情。2 2)然而,在)然而,在2020世紀(jì)世紀(jì)9090年代以前,只有服從標(biāo)準(zhǔn)正態(tài)分布年代以前,只有服從標(biāo)準(zhǔn)正態(tài)分布的檢驗統(tǒng)計量,人們可以直接查閱事先準(zhǔn)備好的的檢驗統(tǒng)計量,人們可以直接查閱事先準(zhǔn)備好的標(biāo)準(zhǔn)正態(tài)標(biāo)準(zhǔn)正態(tài)分布函數(shù)表分布函數(shù)表,從中獲得特定計算結(jié)果的相伴概率。而對于,從中獲得特定計算結(jié)果的相伴概率。而對于的服從

33、的服從t-t-分布、分布、F-F-分布、卡方分布或其它特殊的理論分布分布、卡方分布或其它特殊的理論分布的檢驗統(tǒng)計量(大多數(shù)的假設(shè)檢驗是這樣),人們無法直的檢驗統(tǒng)計量(大多數(shù)的假設(shè)檢驗是這樣),人們無法直接計算相伴概率。人們通常查閱各類假設(shè)檢驗的臨界值表接計算相伴概率。人們通常查閱各類假設(shè)檢驗的臨界值表進(jìn)行統(tǒng)計推斷。這些表格以自由度和很少的幾個相伴概率進(jìn)行統(tǒng)計推斷。這些表格以自由度和很少的幾個相伴概率(通常為(通常為0.10.1、0.050.05和和0.010.01)為自變量,以檢驗統(tǒng)計量的)為自變量,以檢驗統(tǒng)計量的臨界值為函數(shù)排列。臨界值為函數(shù)排列。3 3)在進(jìn)行統(tǒng)計推斷時,人們使用上述臨界值

34、表)在進(jìn)行統(tǒng)計推斷時,人們使用上述臨界值表根據(jù)事先確定的顯著性水平,查閱對應(yīng)于某一自根據(jù)事先確定的顯著性水平,查閱對應(yīng)于某一自由度和特定相伴概率的檢驗統(tǒng)計量的臨界值,然由度和特定相伴概率的檢驗統(tǒng)計量的臨界值,然后將所計算出的檢驗統(tǒng)計量與該臨界值相比較。后將所計算出的檢驗統(tǒng)計量與該臨界值相比較。如果檢驗統(tǒng)計量的計算值大于臨界值,即實際的如果檢驗統(tǒng)計量的計算值大于臨界值,即實際的相伴概率小于事先規(guī)定的顯著性水平,便可拒絕相伴概率小于事先規(guī)定的顯著性水平,便可拒絕原假設(shè)。否則,可接受原假設(shè)。原假設(shè)。否則,可接受原假設(shè)。v在根據(jù)顯著性水平進(jìn)行統(tǒng)計推斷時,應(yīng)注意原假設(shè)的性質(zhì)。在根據(jù)顯著性水平進(jìn)行統(tǒng)計推斷

35、時,應(yīng)注意原假設(shè)的性質(zhì)。v以二元相關(guān)分析為例,相關(guān)分析中的原假設(shè)是以二元相關(guān)分析為例,相關(guān)分析中的原假設(shè)是“相關(guān)系數(shù)相關(guān)系數(shù)為零為零”(即(即2 2個隨機(jī)變量間不存在顯著的相關(guān)關(guān)系)。如果個隨機(jī)變量間不存在顯著的相關(guān)關(guān)系)。如果計算出的檢驗統(tǒng)計量的相伴概率(計算出的檢驗統(tǒng)計量的相伴概率(p值)低于事先給定值)低于事先給定 值值(如(如0.050.05),就可以認(rèn)為),就可以認(rèn)為“相關(guān)系數(shù)為零相關(guān)系數(shù)為零”的可能性很低,的可能性很低, 既既2 2個隨機(jī)變量之間存在顯著的相關(guān)關(guān)系。個隨機(jī)變量之間存在顯著的相關(guān)關(guān)系。v在正態(tài)分布檢驗時,原假設(shè)是在正態(tài)分布檢驗時,原假設(shè)是“樣本數(shù)據(jù)來自服從正態(tài)分樣本數(shù)

36、據(jù)來自服從正態(tài)分布的總體布的總體”。此時,如果計算出的檢驗統(tǒng)計量的相伴概率。此時,如果計算出的檢驗統(tǒng)計量的相伴概率(p值)低于事先給定值)低于事先給定 值(如值(如0.050.05),則表明數(shù)據(jù)不服從),則表明數(shù)據(jù)不服從正態(tài)分布。只有正態(tài)分布。只有p值高于值高于 值時,數(shù)據(jù)才服從正態(tài)分布。值時,數(shù)據(jù)才服從正態(tài)分布。這這與相關(guān)分析的假設(shè)檢驗不同。與相關(guān)分析的假設(shè)檢驗不同。v作者在描述相關(guān)分析結(jié)果時常有的失誤是:僅給出相關(guān)系作者在描述相關(guān)分析結(jié)果時常有的失誤是:僅給出相關(guān)系數(shù)的值,而不給出顯著性水平。這就無法判斷數(shù)的值,而不給出顯著性水平。這就無法判斷2 2個隨機(jī)變量個隨機(jī)變量間的相關(guān)性是否顯著。

37、間的相關(guān)性是否顯著。v有時作者不是根據(jù)顯著性水平判斷相關(guān)關(guān)系是否顯著,而有時作者不是根據(jù)顯著性水平判斷相關(guān)關(guān)系是否顯著,而是根據(jù)相關(guān)系數(shù)的大小來推斷(相關(guān)系數(shù)越近是根據(jù)相關(guān)系數(shù)的大小來推斷(相關(guān)系數(shù)越近1 1,則相關(guān)關(guān),則相關(guān)關(guān)系越顯著)。問題是,相關(guān)系數(shù)本身是一個基于樣本數(shù)據(jù)系越顯著)。問題是,相關(guān)系數(shù)本身是一個基于樣本數(shù)據(jù)計算出的觀測值,其本身的可靠性尚需檢驗。計算出的觀測值,其本身的可靠性尚需檢驗。v此外,作者在論文中常常用此外,作者在論文中常常用“顯著相關(guān)顯著相關(guān)”和和“極顯著相關(guān)極顯著相關(guān)”來描述相關(guān)分析結(jié)果,即認(rèn)為來描述相關(guān)分析結(jié)果,即認(rèn)為p值小于值小于0.050.05就是顯著相關(guān)

38、關(guān)就是顯著相關(guān)關(guān)系(或顯著相關(guān)),小于系(或顯著相關(guān)),小于0.010.01就是極顯著相關(guān)關(guān)系(或極就是極顯著相關(guān)關(guān)系(或極顯著相關(guān))。顯著相關(guān))。 在假設(shè)檢驗中,只有在假設(shè)檢驗中,只有 “顯著顯著”和和 “不顯著不顯著”,沒,沒有有“極顯著極顯著”這樣的斷語。只要計算出的檢驗統(tǒng)這樣的斷語。只要計算出的檢驗統(tǒng)計量的相伴概率(計量的相伴概率(p值)低于事先確定的值)低于事先確定的 值,就值,就可以認(rèn)為檢驗結(jié)果可以認(rèn)為檢驗結(jié)果“顯著顯著”(相關(guān)分析的原假設(shè)(相關(guān)分析的原假設(shè)是是“相關(guān)系數(shù)為零相關(guān)系數(shù)為零”,故此處的,故此處的“顯著顯著”實際意實際意味著味著“相關(guān)系數(shù)不為零相關(guān)系數(shù)不為零”,或說,或

39、說“2 2個隨機(jī)變量間個隨機(jī)變量間有顯著的相關(guān)關(guān)系有顯著的相關(guān)關(guān)系”);同樣,只要計算出的檢);同樣,只要計算出的檢驗統(tǒng)計量的相伴概率(驗統(tǒng)計量的相伴概率(p值)高于事先確定的值)高于事先確定的 值,值,就可以認(rèn)為檢驗結(jié)果就可以認(rèn)為檢驗結(jié)果“不顯著不顯著”。 在進(jìn)行相關(guān)分析時,不能同時使用在進(jìn)行相關(guān)分析時,不能同時使用0.050.05和和0.010.01這這2 2個顯著性水平來決定是否拒絕原假設(shè),只能使用其個顯著性水平來決定是否拒絕原假設(shè),只能使用其中的中的1 1個。個。 1)顯著和不顯著:描述相關(guān)關(guān)系是否存在。2)相關(guān)性強(qiáng)或不強(qiáng):在存在相關(guān)關(guān)系的前提下,這種相關(guān)關(guān)系的強(qiáng)或弱??梢哉J(rèn)為,相關(guān)系

40、數(shù)越接近1,則相關(guān)性越強(qiáng)。聲明:第聲明:第1 1)條是公認(rèn)的數(shù)理統(tǒng)計常識,但第)條是公認(rèn)的數(shù)理統(tǒng)計常識,但第2 2)條是個人)條是個人理解,僅供參考。本文不對第理解,僅供參考。本文不對第2 2)條承擔(dān)責(zé)任。)條承擔(dān)責(zé)任。1)假設(shè)檢驗統(tǒng)計推斷:單側(cè)檢驗與雙側(cè)檢驗對于假設(shè)檢驗,其檢驗統(tǒng)計量的異常取值有2個方向,即概率分布曲線的左側(cè)(對應(yīng)于過小的值)和右側(cè)(對應(yīng)于過大的值)。檢驗統(tǒng)計量在左側(cè)和右側(cè)均有可能取值檢驗統(tǒng)計量的取值空間v一般情況下,概率分布函數(shù)曲線兩側(cè)尾端的小概一般情況下,概率分布函數(shù)曲線兩側(cè)尾端的小概率事件都要考慮(即雙側(cè)檢驗)。如果事先有把率事件都要考慮(即雙側(cè)檢驗)。如果事先有把握確

41、定其中的一側(cè)不可能取值,則僅需對另一側(cè)握確定其中的一側(cè)不可能取值,則僅需對另一側(cè)的小概率事件進(jìn)行檢驗即可(單側(cè)檢驗)。的小概率事件進(jìn)行檢驗即可(單側(cè)檢驗)。v在用在用 “查表法查表法”進(jìn)行統(tǒng)計推斷時,基于單側(cè)小概進(jìn)行統(tǒng)計推斷時,基于單側(cè)小概率事件檢驗的臨界值表稱率事件檢驗的臨界值表稱“單尾表單尾表”,基于雙側(cè),基于雙側(cè)小概率事件檢驗的臨界值表稱小概率事件檢驗的臨界值表稱“雙尾表雙尾表”。除除t-t-分布臨界值表是雙尾表外,大多數(shù)的檢驗臨界值分布臨界值表是雙尾表外,大多數(shù)的檢驗臨界值表均為單尾表表均為單尾表。v在顯著性水平一定的情況下(例如在顯著性水平一定的情況下(例如 =0.05 =0.05)

42、,),對于單尾表,單側(cè)檢驗時仍使用對于單尾表,單側(cè)檢驗時仍使用進(jìn)行統(tǒng)計推斷,進(jìn)行統(tǒng)計推斷,雙側(cè)檢驗則用雙側(cè)檢驗則用 /2 /2進(jìn)行統(tǒng)計推斷;對于雙尾表,進(jìn)行統(tǒng)計推斷;對于雙尾表,單側(cè)檢驗時改用單側(cè)檢驗時改用2 2進(jìn)行統(tǒng)計推斷,雙側(cè)檢驗則進(jìn)行統(tǒng)計推斷,雙側(cè)檢驗則用用 進(jìn)行統(tǒng)計推斷。進(jìn)行統(tǒng)計推斷。v在統(tǒng)計軟件(如在統(tǒng)計軟件(如SPSS或或SAS統(tǒng)計軟件)給出的計統(tǒng)計軟件)給出的計算結(jié)果中,已標(biāo)注出所計算的相伴概率是單側(cè)還算結(jié)果中,已標(biāo)注出所計算的相伴概率是單側(cè)還是雙側(cè),對應(yīng)于上述的單尾表和雙尾表。是雙側(cè),對應(yīng)于上述的單尾表和雙尾表。以下是以下是SPSS SPSS 中的單樣本中的單樣本t t檢驗輸出

43、結(jié)果:檢驗輸出結(jié)果:vOne-Sample Test(原假設(shè):儲戶1次平均存取的現(xiàn)金與2000元無顯著差異)vTest Value=2000(均值比較的參比值)vt=1.240(檢驗統(tǒng)計量的觀測值)vdf=312(自由度,樣本量N=313)vSig.(2-tailed)=0.216(雙側(cè)相伴概率p )vMean Difference=473.78(均值的標(biāo)準(zhǔn)誤差)v95% Confidence Interval of the Difference(總體均值與原假設(shè)值之差的95%的置信區(qū)間):-278.131225.69(有95%的把握可認(rèn)為:儲戶1次平均存取的金額為1721.873225.69

44、元)上述檢驗屬 “均值比較”,是雙側(cè)檢驗(大于或小于2000元都算拒絕原假設(shè)),計算的相伴概率也是雙側(cè)的。因此,可直接用p與比較。取=0.05,則因p大于,故不能拒絕原假設(shè)(不是小概率事件)。統(tǒng)計推斷結(jié)果:根據(jù)313個儲戶調(diào)查數(shù)據(jù),每個儲戶一次平均存取金額大體為2000元。在統(tǒng)計軟件中,可通過選擇Test of Significance選項來控制所輸出的相伴概率是單尾(1 tailed)概率還是雙尾(2 tailed )概率。2)正態(tài)分布檢驗v目的:檢驗樣本是否來自正態(tài)分布的總體v原假設(shè):樣本來自正態(tài)分布的總體v分布檢驗只能使用非參數(shù)方法(只有分布形式已知時才能使用參數(shù)方法)。v不同的統(tǒng)計軟件

45、給出了不同的檢驗方法。v在SAS中,提供了Shapiro-Wilk(適用于樣本量小于50的情形)檢驗法。此檢驗無單尾、雙尾之分。v在SPSS中提供了卡方檢驗(Chi-Square Test)和單樣本的 Kolmogorov-Smirnov(柯爾莫哥洛夫-斯米爾諾夫,簡稱K-S)檢驗。后者比前者精確一些,建議采用。單樣本的 Kolmogorov-Smirnov(柯爾莫哥洛夫-斯米爾諾夫,簡稱K-S)檢驗屬于雙側(cè)檢驗,計算檢驗統(tǒng)計量(Z)的雙尾概率。3) 均值比較a)將樣本均值與某一特定值相比:t-檢驗(參數(shù)檢驗)原假設(shè):總體均值與特定值無顯著差異前提:樣本來自正態(tài)分布的總體雙側(cè)檢驗:是否等于。單

46、側(cè)檢驗:已知不可能大于(或不可能小于),檢驗是否等于。b)比較2個獨立樣本均值: t-檢驗(參數(shù)檢驗)原假設(shè):2個樣本所代表的2個總體的均值無顯著差異用于對2個來自正態(tài)分布總體的樣本的大小進(jìn)行比較,且2個樣本相互獨立(無相關(guān)關(guān)系)。改檢驗有單側(cè)和雙側(cè)之分。3)均值比較c) 比較2個獨立總體大小的非參數(shù)檢驗適用于對2個順序變量的大小進(jìn)行比較或?qū)?個不服從正態(tài)分布的數(shù)值變量的大小進(jìn)行比較“Mann-Whitney U” 檢驗:適合樣本量較大的樣本。 “Wilcoxon秩和”檢驗:與“Mann-Whitney U” 檢驗在本質(zhì)上完全等價。Kolmogorov單側(cè)檢驗:適用于樣本量較小的樣本。3)均值

47、比較d)比較多個來自正態(tài)分布總體的樣本均值的檢驗方法:單因子方差分析(single-factor anova)。對于將因子作為固定處理(而不是隨機(jī)變量)的情形,即模型1單因子方差分析,實際上可以看作比較2個總體均值的t-檢驗的直接推廣。該方法屬于參數(shù)檢驗。有關(guān)假定:多個樣本相互獨立、樣本均服從正態(tài)分布、方差同質(zhì)性(各個樣本的方差大小沒有顯著差異)等。原假設(shè):各樣本的均值間無顯著差異,即某影響因子的不同取值(等級)對各樣本的大小沒有影響。3)均值比較d)比較多個來自非正態(tài)分布總體的樣本均值的檢驗方法:Kruskal-Wallis檢驗:該方法基于順序變量設(shè)計,用于檢驗3個以上獨立樣本是否來自大小相

48、同的總體,是應(yīng)用最廣泛的非參數(shù)檢驗方法。推廣的中位數(shù)檢驗:用于檢驗3個以上的獨立樣本是否來自中位數(shù)無顯著差異的樣本。該方法檢驗功效低,不推薦采用。原假設(shè):各獨立樣本所代表的總體的中位數(shù)無顯著差異。Friedman秩方差分析:用于檢驗3個以上相關(guān)樣本是否來自大小相同的總體。2.4 Cd2.4 Cd、PbPb之間的交互作用之間的交互作用如表如表4 4所示,三種花卉植物各部位對重金屬所示,三種花卉植物各部位對重金屬CdCd、PbPb的積累量與培養(yǎng)溶液的積累量與培養(yǎng)溶液中所投加的中所投加的CdCd、PbPb量之間,可以很恰當(dāng)?shù)乇桓髁恐g,可以很恰當(dāng)?shù)乇桓鞫嘣貧w方程多元回歸方程表示出來,表示出來,它們

49、之間呈它們之間呈極顯著相關(guān)關(guān)系極顯著相關(guān)關(guān)系(P0.01P0.05p0.05); ;v有相關(guān)性,顯著(有相關(guān)性,顯著(0.05p0.010.05p0.01); ;v有相關(guān)性,極顯著(有相關(guān)性,極顯著(p0.01p0.200p0.200)、珠江口()、珠江口(p0.091p0.091)和澳門水域()和澳門水域(p0.110p0.110)呈正)呈正態(tài)分布(態(tài)分布(=0.05=0.05). .因此對珠江、珠江口和澳門水域進(jìn)行因此對珠江、珠江口和澳門水域進(jìn)行PearsonPearson相相關(guān)分析,對東江、西江和南海北部海域進(jìn)行關(guān)分析,對東江、西江和南海北部海域進(jìn)行KendallKendall相關(guān)分析相

50、關(guān)分析. .從表從表2 2可以看出,除澳門水域外其它研究區(qū)域,可以看出,除澳門水域外其它研究區(qū)域,BDE209BDE209與與PBDEsPBDEs相關(guān)性不相關(guān)性不顯著(顯著(r0.434r0.047p0.047), ,這是由于這是由于BDE209BDE209與其它與其它PBDEsPBDEs同系同系物分別來自不同的溴代阻燃劑;但澳門水域沉積物中的物分別來自不同的溴代阻燃劑;但澳門水域沉積物中的BDE209BDE209與與PBDEsPBDEs相關(guān)性顯著(相關(guān)性顯著(r=0.955r=0.955,p=0p=0)(圖)(圖5 5),表明澳門水域),表明澳門水域BDE209BDE209和其它其它和其它其

51、它PBDEsPBDEs同系物具有相同的輸入途徑,正如上述,同系物具有相同的輸入途徑,正如上述,它們主要都是通過水體中顆粒物輸入的,它們之間較高的相關(guān)性是它們主要都是通過水體中顆粒物輸入的,它們之間較高的相關(guān)性是PBDEsPBDEs在水體顆粒物中再分配的結(jié)果,這也證實了澳門水域是珠三角在水體顆粒物中再分配的結(jié)果,這也證實了澳門水域是珠三角水體環(huán)境中水體環(huán)境中PBDEsPBDEs的的“匯匯”. . 圖2b表明,1/qN對1/D有很好的線性關(guān)系,相關(guān)系數(shù)R=0.9922(R2=0.9845)。 HA對有機(jī)農(nóng)藥甲基對硫磷、西維因、克百威的吸附等溫線見圖3,用線性吸附方程擬合甲基對硫磷、西維因和克百威的

52、吸附等溫線,擬合結(jié)果見表3。線性吸附方程為: Q = KdCe + A (1)式中Q為吸附量(mg/kg);Ce為平衡濃度(mg/l);Kd為線性吸附平衡常數(shù),A為線性方程待定常數(shù)。用HA總有機(jī)碳標(biāo)化有機(jī)農(nóng)藥的吸附系數(shù)Kd得有機(jī)碳標(biāo)化吸附系數(shù)Koc,有機(jī)農(nóng)藥在HA上的Koc值見表3。由圖3、表3可知,甲基對硫磷、西維因和克百威在HA上的吸附等溫線較好的符合線性吸附方程,相關(guān)系數(shù)在0.87480.9940之間,但是克百威的相關(guān)系數(shù)要小于甲基對硫磷和西維因;從整體上看有機(jī)農(nóng)藥在HA上的Kd大小順序為:水解處理HA原始HA肟化處理HA氧化處理HA。 在下表中,作者將回歸方程的可決系數(shù)誤稱為“相關(guān)系數(shù)

53、”。早期的研究表明有機(jī)污染物通過分配作用吸附到土壤/沉積物有機(jī)質(zhì)上,其吸附量與有機(jī)碳含量和有機(jī)污染物的辛醇-水分配系數(shù)成正比3。從甲基對硫磷、西維因和克百威分配系數(shù)Kd與改性HA有機(jī)碳含量的關(guān)系可知(見圖4), Kd與HA的有機(jī)碳含量成正比,但相關(guān)性不高分別為:0.7429、0.8870和0.6900,這表明有機(jī)農(nóng)藥在HA上的吸附行為不是由HA的有機(jī)碳含量唯一確定,還受到其他因素的影響。圖5為有機(jī)農(nóng)藥在處理前后HA上的有機(jī)碳標(biāo)化吸附系數(shù)Koc對數(shù)(lgKoc)與三種有機(jī)農(nóng)藥辛醇-水分配系數(shù)Kow對數(shù)(lgKow)之間的關(guān)系曲線,lgKoc與lgKow呈現(xiàn)較好的線性關(guān)系,相關(guān)系數(shù)分別為:0.85

54、73、0.8367、0.8420和0.9408,可見用辛醇-水分配系數(shù)來預(yù)測有機(jī)污染物在土壤/沉積物上的吸附具有一定的合理性3。 0500100015002000250035404550甲基對硫磷010020030040050035404550西維因0153045607535404550克百威O / %Kd050010001500200025000.060.070.080.09甲基對硫磷01002003004005000.060.070.080.09西維因015304560750.060.070.080.09克百威H/C / %Kd圖6 Kd與腐殖酸O元素含量和H/C比的相關(guān)性Fig 6 Co

55、rrelation of Kd and O content and H/C rate of the humic acids 圖4為取每天19:00的DO值與葉綠素值做的趨勢圖,通過分析它們數(shù)據(jù)得出它們的相關(guān)性為0.8899,在一定程度上能反映藻類的變化趨勢??梢宰鳛樵孱愒鲩L趨勢的預(yù)報指標(biāo)。 作圖得到一條直線見圖6,二級動力學(xué)速率方程可很好的描述Cu2、Cd2在生物膜上的吸附(RCu=0.9989,RCd0.9978)。 由表由表1 1可知可知,0,05cm5cm土壤層中土壤層中, ,活動區(qū)土壤微生物生物量碳和活動區(qū)土壤微生物生物量碳和緩沖區(qū)土壤微生物生物量碳分別比背景區(qū)土壤微生物生物量緩沖區(qū)土

56、壤微生物生物量碳分別比背景區(qū)土壤微生物生物量碳降低了碳降低了65.96%65.96%和和20.05%20.05%,而活動區(qū)土壤微生物生物量碳比,而活動區(qū)土壤微生物生物量碳比緩沖區(qū)土壤微生物生物量碳降低了緩沖區(qū)土壤微生物生物量碳降低了57.42%57.42%,并且并且3 3個試驗區(qū)的個試驗區(qū)的差異均達(dá)到顯著水平(差異均達(dá)到顯著水平(P0.05P0.05). 5. 515cm15cm土壤層中土壤層中, ,活動區(qū)活動區(qū)土壤微生物生物量碳比緩沖區(qū)土壤微生物生物量碳降低了土壤微生物生物量碳比緩沖區(qū)土壤微生物生物量碳降低了43.14%43.14%,而緩沖區(qū)土壤微生物生物量碳比背景區(qū)土壤微生物,而緩沖區(qū)土壤

57、微生物生物量碳比背景區(qū)土壤微生物生物量碳降低了生物量碳降低了13.85%13.85%,3 3個試驗區(qū)的差異也均達(dá)到顯著水平個試驗區(qū)的差異也均達(dá)到顯著水平(P0.05P0.05). 15. 1525cm25cm土壤層中土壤層中, ,活動區(qū)土壤微生物生物量碳活動區(qū)土壤微生物生物量碳比緩沖區(qū)土壤微生物生物量碳降低了比緩沖區(qū)土壤微生物生物量碳降低了18.58%18.58%,而緩沖區(qū)土壤,而緩沖區(qū)土壤微生物生物量碳只比背景區(qū)土壤微生物生物量碳降低了微生物生物量碳只比背景區(qū)土壤微生物生物量碳降低了11.06%11.06%,但,但3 3個試驗區(qū)的差異均達(dá)到顯著水平(個試驗區(qū)的差異均達(dá)到顯著水平(P0.05P

58、0.05). . 由表由表2 2可知,在可知,在0 05cm5cm土壤層和土壤層和5 515cm15cm土壤土壤層層, ,旅游踩踏對土壤微生物生物量氮的影響與對土旅游踩踏對土壤微生物生物量氮的影響與對土壤微生物生物量碳的影響是相似的壤微生物生物量碳的影響是相似的. .但在但在151525cm25cm土壤層,活動區(qū)土壤微生物生物量氮比背土壤層,活動區(qū)土壤微生物生物量氮比背景區(qū)土壤微生物生物量氮低,并且達(dá)到顯著水平景區(qū)土壤微生物生物量氮低,并且達(dá)到顯著水平(P0.05P0.05);緩沖區(qū)土壤微生物生物量氮與活);緩沖區(qū)土壤微生物生物量氮與活動區(qū)土壤微生物生物量氮的差異也達(dá)到顯著水平動區(qū)土壤微生物生

59、物量氮的差異也達(dá)到顯著水平(P0.05P0.05P0.05) . .2.10 相關(guān)性分析所有相關(guān)數(shù)據(jù)分析,通過SPSS10.0軟件分析完成,采用t測驗法檢驗相關(guān)系數(shù)的顯著性。 表2:噴灑菌株與TSNA與硝酸鹽、亞硝酸鹽的相關(guān)性及顯著性分析Table2: The correlation and significant analysis of spraying WB5 with nitrate, nitrite 注:*極顯著 *顯著 從表從表2 2可知,晾制期間煙葉中可知,晾制期間煙葉中WB5WB5的菌量與硝酸的菌量與硝酸鹽含量幾乎沒有相關(guān)性,而與亞硝酸鹽、鹽含量幾乎沒有相關(guān)性,而與亞硝酸鹽、NN

60、NNNN和和總總TSNATSNA都存在著都存在著顯著的負(fù)相關(guān)性顯著的負(fù)相關(guān)性,與,與NAT+NABNAT+NAB存在存在極顯著的負(fù)相關(guān)性極顯著的負(fù)相關(guān)性,而與,而與NNKNNK的的負(fù)相關(guān)性則負(fù)相關(guān)性則不顯著不顯著。結(jié)果表明,噴灑。結(jié)果表明,噴灑WB5WB5菌株可以明顯降低菌株可以明顯降低煙葉中的煙葉中的TSNATSNA含量,對煙草的安全性來說,最含量,對煙草的安全性來說,最主要是降低用于卷煙煙葉中的有害物質(zhì),因此,主要是降低用于卷煙煙葉中的有害物質(zhì),因此,該菌株對提高煙草安全性有積極的意義。該菌株對提高煙草安全性有積極的意義。 從表3可知,亞硝酸鹽與硝酸鹽存在一定的相關(guān)性,相關(guān)系數(shù)為0.487

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論