論文寫作中存在的數理統計問題_第1頁
論文寫作中存在的數理統計問題_第2頁
論文寫作中存在的數理統計問題_第3頁
論文寫作中存在的數理統計問題_第4頁
論文寫作中存在的數理統計問題_第5頁
已閱讀5頁,還剩43頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、報告人:張利田張利田 環(huán)境科學學報編委會執(zhí)行副主編、編輯部主任 2006-11-26 重要假定 n作者所處理的數據屬于隨機變量的特定樣本。作者所處理的數據屬于隨機變量的特定樣本。 n作者已經掌握最基本的數理統計學常識,如概率、作者已經掌握最基本的數理統計學常識,如概率、 假設檢驗、均值、方差、標準差、正態(tài)分布、相假設檢驗、均值、方差、標準差、正態(tài)分布、相 關分析、回歸分析、方差分析關分析、回歸分析、方差分析。 數理統計問題的重要性數理統計問題的重要性 n在科學研究中,經常會涉及到對隨機變量在科學研究中,經常會涉及到對隨機變量大小大小、離散離散及及分布分布 特征的描述以及對特征的描述以及對2 2

2、個或多個隨機變量之間的個或多個隨機變量之間的關系關系描述問題。描述問題。 地學、環(huán)境科學研究也不例外地學、環(huán)境科學研究也不例外。 n對隨機變量及隨機變量之間的關系進行定量描述的數學工具對隨機變量及隨機變量之間的關系進行定量描述的數學工具 就是就是數理統計學數理統計學。 n在科學研究中,能否正確使用各種數理統計方法關系到所得在科學研究中,能否正確使用各種數理統計方法關系到所得 出結論的客觀性和可信性。所以,出結論的客觀性和可信性。所以,來稿中使用的數理統計方來稿中使用的數理統計方 法是否正確法是否正確應是學術期刊編輯們極為重視的問題。應是學術期刊編輯們極為重視的問題。 n目前,國內環(huán)境科學與技術

3、類學術期刊對稿件中數理統計方目前,國內環(huán)境科學與技術類學術期刊對稿件中數理統計方 法問題的重視程度存在差異。法問題的重視程度存在差異。 1 統計軟件的選擇統計軟件的選擇 n統計分析通常涉及大量的數據,需要較大的計統計分析通常涉及大量的數據,需要較大的計 算工作量。算工作量。 n在進行統計分析時,盡管作者可以自行編寫計在進行統計分析時,盡管作者可以自行編寫計 算程序,但在統計軟件很普及的今天,這樣做算程序,但在統計軟件很普及的今天,這樣做 是毫無必要的。是毫無必要的。 n出于對出于對工作效率工作效率以及對以及對算法的通用性、可比性算法的通用性、可比性 的考慮,一些學術期刊要求作者采用專門的數的考

4、慮,一些學術期刊要求作者采用專門的數 理統計軟件進行統計分析。理統計軟件進行統計分析。 1 統計軟件的選擇統計軟件的選擇 n環(huán)境科學學報環(huán)境科學學報的編輯們在處理稿件時的編輯們在處理稿件時 經常發(fā)現的問題是:經常發(fā)現的問題是:作者未使用專門的數作者未使用專門的數 理統計軟件,而采用理統計軟件,而采用Excel這樣的電子表格這樣的電子表格 軟件進行數據統計分析。軟件進行數據統計分析。 n由于電子表格軟件提供的統計分析功能十由于電子表格軟件提供的統計分析功能十 分有限,只能借助它進行較為簡單的統計分有限,只能借助它進行較為簡單的統計 分析,故我們不主張作者采用這樣的軟件分析,故我們不主張作者采用這

5、樣的軟件 進行統計分析。進行統計分析。 1 統計軟件的選擇統計軟件的選擇 n目前,國際上已開發(fā)出的專門用于統計分析的商目前,國際上已開發(fā)出的專門用于統計分析的商 業(yè)軟件很多,比較著名有業(yè)軟件很多,比較著名有SPSS(Statistical Package for Social Sciences)和和SAS(Statistical Analysis System)。此外,還有此外,還有BMDP和和STATISTICA 等等。 nSPSS是專門為社會科學領域的研究者設計的,但是專門為社會科學領域的研究者設計的,但 此軟件在自然科學領域也得到廣泛應用。此軟件在自然科學領域也得到廣泛應用。 nBMDP

6、是專門為生物學和醫(yī)學領域研究者編制的統是專門為生物學和醫(yī)學領域研究者編制的統 計軟件。計軟件。 1 1 統計軟件的選擇統計軟件的選擇 n目前,國際學術界有一條不成文的約定:凡目前,國際學術界有一條不成文的約定:凡 是用是用SPSS和和SAS軟件進行統計分析所獲得的軟件進行統計分析所獲得的 結果,在國際學術交流中不必說明具體算法。結果,在國際學術交流中不必說明具體算法。 由此可見,由此可見,SPSS和和SAS軟件已被各領域研究軟件已被各領域研究 者普遍認可。者普遍認可。 n我們建議作者們在進行統計分析時盡量使用我們建議作者們在進行統計分析時盡量使用 這這2個專門的統計軟件。目前,有關這個專門的統

7、計軟件。目前,有關這2個軟個軟 件的使用教程在書店中可很容易地買到。件的使用教程在書店中可很容易地買到。 2 2 均值的計算均值的計算 :理論問題 n均值(準確的稱呼應為均值(準確的稱呼應為“樣本均值樣本均值”)的統計學意義:反)的統計學意義:反 映隨機變量樣本的大小特征。映隨機變量樣本的大小特征。 n均值對應于隨機變量總體的數學期望均值對應于隨機變量總體的數學期望總體的數學期望客總體的數學期望客 觀上決定著樣本的均值,反過來,通過計算樣本的均值可觀上決定著樣本的均值,反過來,通過計算樣本的均值可 以描述總體的數學期望。以描述總體的數學期望。 n在處理實驗數據或采樣數據時,經常會遇到對相同采樣

8、或在處理實驗數據或采樣數據時,經常會遇到對相同采樣或 相同實驗條件下同一隨機變量的多個不同取值進行統計處相同實驗條件下同一隨機變量的多個不同取值進行統計處 理的問題。理的問題。 n為找到代表這些觀測值總體大小特征的代表值(統計量,為找到代表這些觀測值總體大小特征的代表值(統計量, 該統計量根據樣本數據算出),多數作者會不假思索地直該統計量根據樣本數據算出),多數作者會不假思索地直 接給出算術平均值和標準差。顯然,這種做法是不嚴謹接給出算術平均值和標準差。顯然,這種做法是不嚴謹 的的不一定總是正確的。不一定總是正確的。 2 均值的計算:技術問題均值的計算:技術問題 n在數理統計學中,作為描述隨機

9、變量樣本的在數理統計學中,作為描述隨機變量樣本的 總體大小特征的統計量有算術平均值、幾何總體大小特征的統計量有算術平均值、幾何 平均值和中位數等多個。平均值和中位數等多個。 n何時用算術平均值?何時用幾何平均值?以何時用算術平均值?何時用幾何平均值?以 及何時用中位數?及何時用中位數?這不能由研究者根據主觀這不能由研究者根據主觀 意愿隨意確定,而要根據隨機變量的分布特意愿隨意確定,而要根據隨機變量的分布特 征確定征確定。 2 均值的計算:技術問題均值的計算:技術問題 n反映隨機變量總體大小特征的統計量是數學期望,而在隨機反映隨機變量總體大小特征的統計量是數學期望,而在隨機 變量的分布服從正態(tài)分

10、布時,其數學期望就可以用樣本的算變量的分布服從正態(tài)分布時,其數學期望就可以用樣本的算 術平均值描述。此時,可用樣本的術平均值描述。此時,可用樣本的算術平均值算術平均值描述隨機變量描述隨機變量 的大小特征。的大小特征。 n如果所研究的隨機變量不服從正態(tài)分布,則算術平均值不能如果所研究的隨機變量不服從正態(tài)分布,則算術平均值不能 準確反映該變量的大小特征。在這種情況下,可通過假設檢準確反映該變量的大小特征。在這種情況下,可通過假設檢 驗來判斷隨機變量是否服從對數正態(tài)分布。如果服從對數正驗來判斷隨機變量是否服從對數正態(tài)分布。如果服從對數正 態(tài)分布,則幾何平均值就是數學期望的值。此時,就可以計態(tài)分布,則

11、幾何平均值就是數學期望的值。此時,就可以計 算變量的算變量的幾何平均值幾何平均值。 n如果隨機變量既不服從正態(tài)分布也不服從對數正態(tài)分布,則如果隨機變量既不服從正態(tài)分布也不服從對數正態(tài)分布,則 按現有的數理統計學知識,尚無合適的統計量描述該變量的按現有的數理統計學知識,尚無合適的統計量描述該變量的 大小特征。此時,可用大小特征。此時,可用中位數中位數來描述變量的大小特征。來描述變量的大小特征。 3 3 相關分析相關分析:相關系數的選擇:相關系數的選擇 n在相關分析中,作者們常犯的錯誤是:簡單地計算在相關分析中,作者們常犯的錯誤是:簡單地計算 Pearson 積矩相關系數,而且既不給出正態(tài)分布檢驗

12、結果,積矩相關系數,而且既不給出正態(tài)分布檢驗結果, 也往往不明確指出所計算的相關系數就是也往往不明確指出所計算的相關系數就是Pearson 積矩相積矩相 關系數。關系數。 n在數理統計學中,除有針對數值變量設計的在數理統計學中,除有針對數值變量設計的Pearson 積矩積矩 相關系數(對應于相關系數(對應于 “參數方法參數方法”)外,還有針對順序變量)外,還有針對順序變量 (即(即“秩變量秩變量”)設計的)設計的Spearman秩相關系數和秩相關系數和Kendall 秩相關系數(對應于秩相關系數(對應于 “非參數方法非參數方法”)等。)等。 nPearson 積矩相關系數可用于描述積矩相關系數

13、可用于描述2個隨機變量的線性相關個隨機變量的線性相關 程度,程度,Spearman或或Kendall秩相關系數用來判斷兩個隨機秩相關系數用來判斷兩個隨機 變量在二維和多維空間中是否具有某種共變趨勢。變量在二維和多維空間中是否具有某種共變趨勢。 3 相關分析:相關系數的選擇相關分析:相關系數的選擇 n在相關分析中,計算各種相關系數是有前提條件在相關分析中,計算各種相關系數是有前提條件 的。的。 n在相關分析中,對于秩變量,一般別無選擇,只在相關分析中,對于秩變量,一般別無選擇,只 能計算能計算Spearman或或Kendall秩相關系數。秩相關系數。 n對于數值變量,只要條件許可,應盡量使用對于

14、數值變量,只要條件許可,應盡量使用檢驗檢驗 功效最高功效最高的參數方法,即計算用的參數方法,即計算用Pearson 積矩相積矩相 關系數。只有計算關系數。只有計算Pearson 積矩相關系數的前提積矩相關系數的前提 不存在時,才考慮退而求其次,計算專門為秩變不存在時,才考慮退而求其次,計算專門為秩變 量設計的量設計的Spearman或或Kendall秩相關系數(秩相關系數(盡管盡管 這樣做會導致檢驗功效的降低這樣做會導致檢驗功效的降低)。)。 3 相關分析:相關系數的選擇相關分析:相關系數的選擇 n對于數值變量,相關系數選擇的依據是變量是否服從正態(tài)對于數值變量,相關系數選擇的依據是變量是否服從

15、正態(tài) 分布,或變換后的數據是否服從正態(tài)分布。分布,或變換后的數據是否服從正態(tài)分布。 n對于二元相關分析,如果對于二元相關分析,如果2個隨機變量服從二元正態(tài)分布假個隨機變量服從二元正態(tài)分布假 設,則應該用設,則應該用Pearson 積矩相關系數描述這積矩相關系數描述這2個隨機變量個隨機變量 間的相關關系。間的相關關系。 n如果樣本數據不服從二元正態(tài)分布,則可嘗試進行數據變如果樣本數據不服從二元正態(tài)分布,則可嘗試進行數據變 換,看變換后的數據是否符合正態(tài)分布?如果是,則可以換,看變換后的數據是否符合正態(tài)分布?如果是,則可以 針對變換后的數據計算針對變換后的數據計算Pearson 積矩相關系數;否則

16、,就積矩相關系數;否則,就 不能計算不能計算Pearson 積矩相關系數,而應改用檢驗功效較低積矩相關系數,而應改用檢驗功效較低 的的Spearman或或Kendall秩相關系數(此時,如果強行計秩相關系數(此時,如果強行計 算算Pearson 積矩相關系數有可能會得出完全錯誤的結論)。積矩相關系數有可能會得出完全錯誤的結論)。 4 相關分析與回歸分析的區(qū)別相關分析與回歸分析的區(qū)別 n相關分析和回歸分析是極為常用的相關分析和回歸分析是極為常用的2種數理種數理 統計方法,在環(huán)境科學及其它科學研究領域統計方法,在環(huán)境科學及其它科學研究領域 有著廣泛的用途。然而,由于這有著廣泛的用途。然而,由于這2

17、種數理統種數理統 計方法在計算方面存在很多相似之處,且在計方法在計算方面存在很多相似之處,且在 一些數理統計教科書中沒有系統闡明這一些數理統計教科書中沒有系統闡明這2種種 數理統計方法的內在差別,從而使一些研究數理統計方法的內在差別,從而使一些研究 者不能嚴格區(qū)分相關分析與回歸分析者不能嚴格區(qū)分相關分析與回歸分析 。 4 相關分析與回歸分析的區(qū)別相關分析與回歸分析的區(qū)別 n最常見的錯誤是最常見的錯誤是:用回歸分析的結果解釋相用回歸分析的結果解釋相 關性問題。例如,作者將關性問題。例如,作者將“回歸直線(曲線)回歸直線(曲線) 圖圖”稱為稱為“相關性圖相關性圖”或或“相關關系圖相關關系圖”; 將

18、回歸直線的將回歸直線的R2(擬合度,或稱擬合度,或稱“可決系可決系 數數”)錯誤地稱為錯誤地稱為“相關系數相關系數”或或“相關系相關系 數的平方數的平方”;根據回歸分析的結果宣稱;根據回歸分析的結果宣稱2個個 變量之間存在正的或負的相關關系。變量之間存在正的或負的相關關系。 4 相關分析與回歸分析的區(qū)別相關分析與回歸分析的區(qū)別 n相關分析與回歸分析均為研究相關分析與回歸分析均為研究2個或多個個或多個 變量間關聯性的方法,但變量間關聯性的方法,但2種數理統計方種數理統計方 法存在本質的差別,即它們用于不同的法存在本質的差別,即它們用于不同的 研究目的。研究目的。 n相關分析的目的在于檢驗兩個隨機

19、變量相關分析的目的在于檢驗兩個隨機變量 的共變趨勢(即共同變化的程度),回的共變趨勢(即共同變化的程度),回 歸分析的目的則在于試圖用自變量來預歸分析的目的則在于試圖用自變量來預 測因變量的值。測因變量的值。 4 相關分析與回歸分析的區(qū)別相關分析與回歸分析的區(qū)別 n在相關分析中,兩個變量必須同時都是在相關分析中,兩個變量必須同時都是 隨機變量,如果其中的一個變量不是隨隨機變量,如果其中的一個變量不是隨 機變量,就不能進行相關分析。這是相機變量,就不能進行相關分析。這是相 關分析方法本身所決定的。關分析方法本身所決定的。 4 相關分析與回歸分析的區(qū)別相關分析與回歸分析的區(qū)別 n對于回歸分析,其中

20、的因變量肯定為隨對于回歸分析,其中的因變量肯定為隨 機變量(這是回歸分析方法本身所決定機變量(這是回歸分析方法本身所決定 的),而自變量則可以是普通變量(有的),而自變量則可以是普通變量(有 確定的取值)也可以是隨機變量。確定的取值)也可以是隨機變量。 4 相關分析與回歸分析的區(qū)別相關分析與回歸分析的區(qū)別 n如果自變量是普通變量,即模型如果自變量是普通變量,即模型回歸分析,回歸分析, 采用的回歸方法就是最為常用的最小二乘法。采用的回歸方法就是最為常用的最小二乘法。 n如果自變量是隨機變量,如果自變量是隨機變量,即模型即模型回歸分析,回歸分析, 所采用的回歸方法與計算者的目的有關。所采用的回歸方

21、法與計算者的目的有關。 n在以預測為目的的情況下,仍采用在以預測為目的的情況下,仍采用“最小二乘法最小二乘法” (但精度下降(但精度下降最小二乘法是專為模型最小二乘法是專為模型 設計的,設計的, 未考慮自變量的隨機誤差);未考慮自變量的隨機誤差); n在以估值為目的(如計算可決系數、回歸系數等)在以估值為目的(如計算可決系數、回歸系數等) 的情況下,應使用相對嚴謹的方法(如的情況下,應使用相對嚴謹的方法(如“主軸法主軸法”、 “約化主軸法約化主軸法”或或“BartlettBartlett法法” )。)。 4 相關分析與回歸分析的區(qū)別相關分析與回歸分析的區(qū)別 n顯然,對于回歸分析,如果是模型顯然

22、,對于回歸分析,如果是模型回歸分析,鑒于兩個回歸分析,鑒于兩個 隨機變量客觀上存在隨機變量客觀上存在“相關性相關性”問題,只是由于回歸分析問題,只是由于回歸分析 方法本身不能提供針對自變量和因變量之間相關關系的準方法本身不能提供針對自變量和因變量之間相關關系的準 確的檢驗手段,因此,若以預測為目的,最好不提確的檢驗手段,因此,若以預測為目的,最好不提“相關相關 性性”問題;問題;若以探索兩者的若以探索兩者的“共變趨勢共變趨勢”為目的為目的,應該改,應該改 用相關分析。用相關分析。 n如果是模型如果是模型回歸分析,就根本不可能回答變量的回歸分析,就根本不可能回答變量的“相關相關 性性”問題,問題

23、,因為普通變量與隨機變量之間不存在因為普通變量與隨機變量之間不存在“相關性相關性” 這一概念這一概念(問題在于,大多數的回歸分析都是模型(問題在于,大多數的回歸分析都是模型回歸回歸 分析?。?。此時,即使作者想描述分析?。?。此時,即使作者想描述2個變量間的個變量間的“共變趨共變趨 勢勢”而改用相關分析,也會因相關分析的前提不存在而使而改用相關分析,也會因相關分析的前提不存在而使 分析結果毫無意義。分析結果毫無意義。 4 相關分析與回歸分析的區(qū)別相關分析與回歸分析的區(qū)別 n需要特別指出的是,回歸分析中的需要特別指出的是,回歸分析中的R2在數學上恰好是在數學上恰好是 Pearson積矩相關系數積矩相

24、關系數r的平方。因此,這極易使作者們錯的平方。因此,這極易使作者們錯 誤地理解誤地理解R2的含義,認為的含義,認為R2就是就是 “相關系數相關系數”或或“相關系相關系 數的平方數的平方”。問題在于,對于自變量是普通變量(即其取值。問題在于,對于自變量是普通變量(即其取值 有確定性的變量)、因變量為隨機變量的模型有確定性的變量)、因變量為隨機變量的模型回歸分析,回歸分析, 2個變量之間的個變量之間的“相關性相關性”概念根本不存在,又何談概念根本不存在,又何談“相關相關 系數系數”呢?呢? n更值得注意的是,一些早期的教科書作者不是用更值得注意的是,一些早期的教科書作者不是用R2來描述回來描述回

25、歸效果(擬合程度,擬合度)的,而是用歸效果(擬合程度,擬合度)的,而是用Pearson積矩相關積矩相關 系數來描述。這就更容易誤導讀者。系數來描述。這就更容易誤導讀者。 5 重要的數理統計學常識 n1)假設檢驗 n假設檢驗的基本思想假設檢驗的基本思想 n統計推斷統計推斷:是根據樣本數據推斷總體特征的一種方法。:是根據樣本數據推斷總體特征的一種方法。 n假設檢驗:假設檢驗:是進行是進行統計推斷統計推斷的途徑之一(另一種途徑是參數估計,的途徑之一(另一種途徑是參數估計, 如點估計和區(qū)間估計)。如點估計和區(qū)間估計)。 n假設檢驗的基本思路是假設檢驗的基本思路是:首先,對總體參數值提出假設(原假設);

26、:首先,對總體參數值提出假設(原假設); 然后,利用樣本數據提供的信息來驗證所提出的假設是否成立(統然后,利用樣本數據提供的信息來驗證所提出的假設是否成立(統 計推斷)計推斷)-如果樣本數據提供的信息不能證明上述假設成立,則應如果樣本數據提供的信息不能證明上述假設成立,則應 拒絕該假設;如果樣本數據提供的信息不能證明上述假設不成立,拒絕該假設;如果樣本數據提供的信息不能證明上述假設不成立, 則不應拒絕該假設。則不應拒絕該假設。 n接受或拒絕原假設的依據接受或拒絕原假設的依據:小概率事件不可能發(fā)生。顯然,這樣做:小概率事件不可能發(fā)生。顯然,這樣做 是有風險的(小概率事件真的發(fā)生了)。是有風險的(

27、小概率事件真的發(fā)生了)。 n假設檢驗中的關鍵問題假設檢驗中的關鍵問題:1)在原假設成立的情況下,如何計算樣)在原假設成立的情況下,如何計算樣 本值或某一極端值發(fā)生的概率?本值或某一極端值發(fā)生的概率?2)如何界定小概率事件?)如何界定小概率事件? 5 重要的數理統計學常識 n1)假設檢驗 n假設檢驗的基本步驟 n1)提出原假設(或稱)提出原假設(或稱“零假設零假設”,H0);); n2)選擇檢驗統計量;)選擇檢驗統計量; n3)根據樣本數據計算檢驗統計量觀測值的發(fā))根據樣本數據計算檢驗統計量觀測值的發(fā) 生概率(相伴概率,生概率(相伴概率,p);); n4)根據給定的小概率事件界定標準(顯著性)根

28、據給定的小概率事件界定標準(顯著性 水平,如水平,如0.05,0.01)做出統計推斷。)做出統計推斷。 假設檢驗的基本步驟 n為什么要設計并計算檢驗統計量?為什么要設計并計算檢驗統計量? n在假設檢驗中,樣本值(或更極端的取值)發(fā)生的概率在假設檢驗中,樣本值(或更極端的取值)發(fā)生的概率 不能直接通過樣本數據計算,而是通過計算不能直接通過樣本數據計算,而是通過計算檢驗統計量檢驗統計量 觀測值觀測值的發(fā)生概率而間接得到的。的發(fā)生概率而間接得到的。 n所設計的檢驗統計量一般服從或近似服從某種已知的理所設計的檢驗統計量一般服從或近似服從某種已知的理 論分布(如論分布(如t-分布、分布、F-分布、卡方分

29、布),易于估算其分布、卡方分布),易于估算其 取值概率。取值概率。 n對于不同的假設檢驗和不同的總體,會有不同的選擇檢對于不同的假設檢驗和不同的總體,會有不同的選擇檢 驗統計量的理論和方法驗統計量的理論和方法。 假設檢驗的基本步驟 n計算檢驗統計量觀測值的發(fā)生概率計算檢驗統計量觀測值的發(fā)生概率 n在假定原假設成立的前提下,利用樣本數據計算 檢驗統計量觀測值發(fā)生的概率(即p值,又稱 “相伴概率”指該檢驗統計量在某個特定的極 端區(qū)域在原假設成立時的概率)。該概率值間接 地給出了在原假設成立的條件下樣本值(或更極 端值)發(fā)生的概率。 假設檢驗的基本步驟 n進行統計推斷進行統計推斷 n依據預先確定的

30、“顯著性水平” (即值), 如0.01或0.05,決定是否拒絕原假設。 n如果p值小于值,即認為原假設成立時檢驗統 計量觀測值的發(fā)生是小概率事件,則拒絕原假 設。否則,就接受原假設。 顯著性水平:概念與意義顯著性水平:概念與意義 n在假設檢驗中,在假設檢驗中,顯著性水平(顯著性水平(Significant level,用用 表示)的確定是假設檢驗中至關重要的問題。表示)的確定是假設檢驗中至關重要的問題。 n顯著性水平是在原假設成立時檢驗統計量的制落在顯著性水平是在原假設成立時檢驗統計量的制落在 某個極端區(qū)域的概率值。因此,如果取某個極端區(qū)域的概率值。因此,如果取= 0.05, 如果計算出的如果

31、計算出的p值小于值小于 ,則可認為原假設是一個,則可認為原假設是一個 不可能發(fā)生的小概率事件。當然,如果真的發(fā)生了,不可能發(fā)生的小概率事件。當然,如果真的發(fā)生了, 則犯錯誤的可能性為則犯錯誤的可能性為5%。顯然,顯著性水平反映顯然,顯著性水平反映 了拒絕某一原假設時所犯錯誤的可能性,或者說,了拒絕某一原假設時所犯錯誤的可能性,或者說, 是指拒絕了事實上正確的原假設的概率。是指拒絕了事實上正確的原假設的概率。 顯著性水平:通常的取值顯著性水平:通常的取值 n值一般在進行假設檢驗前由研究者根據實際的需值一般在進行假設檢驗前由研究者根據實際的需 要確定。要確定。 n常用的取值是常用的取值是0.05或

32、或0.01。對于前者,相當于在。對于前者,相當于在 原假設事實上正確的情況下,研究者接受這一假原假設事實上正確的情況下,研究者接受這一假 設的可能性為設的可能性為95%;對于后者,則研究者接受事;對于后者,則研究者接受事 實上正確的原假設的可能性為實上正確的原假設的可能性為99%。 n顯然,降低顯然,降低值可以減少拒絕原假設的可能性。因值可以減少拒絕原假設的可能性。因 此,在報告統計分析結果時,必須給出此,在報告統計分析結果時,必須給出值。值。 顯著性水平:進行統計推斷顯著性水平:進行統計推斷 n在進行假設檢驗時,各種統計軟件均會給出在進行假設檢驗時,各種統計軟件均會給出檢驗統檢驗統 計量觀測

33、值計量觀測值以及原假設成立時該檢驗統計量取值的以及原假設成立時該檢驗統計量取值的 相伴概率相伴概率(即(即檢驗統計量檢驗統計量某特定取值及更極端可能某特定取值及更極端可能 值出現的概率,用值出現的概率,用p p表示)。表示)。 np p值是否小于事先確定的值是否小于事先確定的值,是接受或拒絕原假值,是接受或拒絕原假 設的依據。設的依據。 n如果如果p p值小于事先已確定的值小于事先已確定的值,就意味著檢驗統值,就意味著檢驗統 計量取值的可能性很小,進而可推斷原假設成立的計量取值的可能性很小,進而可推斷原假設成立的 可能性很小,因而可以拒絕原假設。相反,如果可能性很小,因而可以拒絕原假設。相反,

34、如果p p 值大于事先已確定的值大于事先已確定的值,就不能拒絕原假設。值,就不能拒絕原假設。 統計推斷:過去的回憶統計推斷:過去的回憶 n在計算機技術十分發(fā)達,以及專業(yè)統計軟件功能十分強大的今天,計算在計算機技術十分發(fā)達,以及專業(yè)統計軟件功能十分強大的今天,計算 檢驗統計量及其相伴概率是一件十分容易的事情。檢驗統計量及其相伴概率是一件十分容易的事情。 n然而,在然而,在20世紀世紀90年代以前,只有服從標準正態(tài)分布的檢驗統計量,年代以前,只有服從標準正態(tài)分布的檢驗統計量, 人們可以直接查閱事先準備好的人們可以直接查閱事先準備好的標準正態(tài)分布函數表標準正態(tài)分布函數表,從中獲得特定計,從中獲得特定

35、計 算結果的相伴概率。而對于的服從算結果的相伴概率。而對于的服從t-分布、分布、F-分布、卡方分布或其它特分布、卡方分布或其它特 殊的理論分布的檢驗統計量(大多數的假設檢驗是這樣),人們無法直殊的理論分布的檢驗統計量(大多數的假設檢驗是這樣),人們無法直 接計算相伴概率。人們通常查閱各類假設檢驗的臨界值表進行統計推斷。接計算相伴概率。人們通常查閱各類假設檢驗的臨界值表進行統計推斷。 這些表格以自由度和很少的幾個相伴概率(通常為這些表格以自由度和很少的幾個相伴概率(通常為0.1、0.05和和0.01) 為自變量,以檢驗統計量的臨界值為函數排列。為自變量,以檢驗統計量的臨界值為函數排列。 n在進行

36、統計推斷時,人們使用上述臨界值表根據事先確定的顯著性水平,在進行統計推斷時,人們使用上述臨界值表根據事先確定的顯著性水平, 查閱對應于某一自由度和特定相伴概率的檢驗統計量的臨界值,然后將查閱對應于某一自由度和特定相伴概率的檢驗統計量的臨界值,然后將 所計算出的檢驗統計量與該臨界值相比較。如果檢驗統計量的計算值大所計算出的檢驗統計量與該臨界值相比較。如果檢驗統計量的計算值大 于臨界值,即實際的相伴概率小于事先規(guī)定的顯著性水平,便可拒絕原于臨界值,即實際的相伴概率小于事先規(guī)定的顯著性水平,便可拒絕原 假設。否則,可接受原假設。假設。否則,可接受原假設。 顯著性水平:舉例顯著性水平:舉例 n在根據顯

37、著性水平進行統計推斷時,應注意原假設的性質。在根據顯著性水平進行統計推斷時,應注意原假設的性質。 n以二元相關分析為例,相關分析中的原假設是以二元相關分析為例,相關分析中的原假設是“相關系數為相關系數為 零零”(即(即2個隨機變量間不存在顯著的相關關系)。如果計個隨機變量間不存在顯著的相關關系)。如果計 算出的檢驗統計量的相伴概率(算出的檢驗統計量的相伴概率(p值)低于事先給定值)低于事先給定值值 (如(如0.05),就可以認為),就可以認為“相關系數為零相關系數為零”的可能性很低,的可能性很低, 既既2個隨機變量之間存在顯著的相關關系。個隨機變量之間存在顯著的相關關系。 n在正態(tài)分布檢驗時,

38、原假設是在正態(tài)分布檢驗時,原假設是“樣本數據來自服從正態(tài)分布樣本數據來自服從正態(tài)分布 的總體的總體”。此時,如果計算出的檢驗統計量的相伴概率(。此時,如果計算出的檢驗統計量的相伴概率(p 值)低于事先給定值)低于事先給定值(如值(如0.05),則表明數據不服從正態(tài)),則表明數據不服從正態(tài) 分布。只有分布。只有p值高于值高于值時,數據才服從正態(tài)分布。值時,數據才服從正態(tài)分布。這與相這與相 關分析的假設檢驗不同。關分析的假設檢驗不同。 顯著性水平顯著性水平 n作者在描述相關分析結果時常有的失誤是:僅給出相關系數作者在描述相關分析結果時常有的失誤是:僅給出相關系數 的值,而不給出顯著性水平。這就無法

39、判斷的值,而不給出顯著性水平。這就無法判斷2個隨機變量間個隨機變量間 的相關性是否顯著。的相關性是否顯著。 n有時作者不是根據顯著性水平判斷相關關系是否顯著,而是有時作者不是根據顯著性水平判斷相關關系是否顯著,而是 根據相關系數的大小來推斷(相關系數越近根據相關系數的大小來推斷(相關系數越近1,則相關關系,則相關關系 越顯著)。問題是,相關系數本身是一個基于樣本數據計算越顯著)。問題是,相關系數本身是一個基于樣本數據計算 出的觀測值,其本身的可靠性尚需檢驗。出的觀測值,其本身的可靠性尚需檢驗。 n此外,作者在論文中常常用此外,作者在論文中常常用“顯著相關顯著相關”和和“極顯著相關極顯著相關”

40、來描述相關分析結果,即認為來描述相關分析結果,即認為p值小于值小于0.05就是顯著相關關就是顯著相關關 系(或顯著相關),小于系(或顯著相關),小于0.01就是極顯著相關關系(或極就是極顯著相關關系(或極 顯著相關)。顯著相關)。 統計推斷的注意事項統計推斷的注意事項 n在假設檢驗中,只有在假設檢驗中,只有 “顯著顯著”和和 “不顯著不顯著”,沒,沒 有有“極顯著極顯著”這樣的斷語。只要計算出的檢驗統這樣的斷語。只要計算出的檢驗統 計量的相伴概率(計量的相伴概率(p值)低于事先確定的值)低于事先確定的值,就值,就 可以認為檢驗結果可以認為檢驗結果“顯著顯著”(相關分析的原假設(相關分析的原假設

41、 是是“相關系數為零相關系數為零”,故此處的,故此處的“顯著顯著”實際意實際意 味著味著“相關系數不為零相關系數不為零”,或說,或說“2個隨機變量間個隨機變量間 有顯著的相關關系有顯著的相關關系”);同樣,只要計算出的檢);同樣,只要計算出的檢 驗統計量的相伴概率(驗統計量的相伴概率(p值)高于事先確定的值)高于事先確定的值,值, 就可以認為檢驗結果就可以認為檢驗結果“不顯著不顯著”。 統計推斷的注意事項統計推斷的注意事項 n在進行相關分析時,不能同時使用在進行相關分析時,不能同時使用0.05 和和0.01這這2個顯著性水平來決定是否拒個顯著性水平來決定是否拒 絕原假設,只能使用其中的絕原假設

42、,只能使用其中的1個。個。 有關相關分析的斷語有關相關分析的斷語 n1)顯著和不顯著:描述相關關系是否存在。 n2)相關性強或不強:在存在相關關系的前提 下,這種相關關系的強或弱??梢哉J為,相 關系數越接近1,則相關性越強。 n聲明:第聲明:第1 1)條是公認的數理統計常識,但第)條是公認的數理統計常識,但第2 2)條是個人理)條是個人理 解,僅供參考。本文不對第解,僅供參考。本文不對第2 2)條承擔責任。)條承擔責任。 5 重要的數理統計學常識 n1)假設檢驗 n統計推斷:單側檢驗與雙側檢驗 n對于假設檢驗,其檢驗統計量的異常取值有 2個方向,即概率分布曲線的左側(對應于 過小的值)和右側(

43、對應于過大的值)。 檢驗統計量的極端取值 n檢驗統計量在左側和右側均有可能取值 檢驗統計量的取值空間 單側檢驗與雙側檢驗 n一般情況下,概率分布函數曲線兩側尾端的小概率事件都要考慮(即一般情況下,概率分布函數曲線兩側尾端的小概率事件都要考慮(即 雙側檢驗)。如果事先有把握確定其中的一側不可能取值,則僅需對雙側檢驗)。如果事先有把握確定其中的一側不可能取值,則僅需對 另一側的小概率事件進行檢驗即可(單側檢驗)。另一側的小概率事件進行檢驗即可(單側檢驗)。 n在用在用 “查表法查表法”進行統計推斷時,基于單側小概率事件檢驗的臨界值進行統計推斷時,基于單側小概率事件檢驗的臨界值 表稱表稱“單尾表單尾

44、表”,基于雙側小概率事件檢驗的臨界值表稱,基于雙側小概率事件檢驗的臨界值表稱“雙尾表雙尾表”。 除除t-t-分布臨界值表是雙尾表外,大多數的檢驗臨界值表均為單尾表分布臨界值表是雙尾表外,大多數的檢驗臨界值表均為單尾表。 n在顯著性水平一定的情況下(例如在顯著性水平一定的情況下(例如 =0.05 =0.05),對于單尾表,單側檢),對于單尾表,單側檢 驗時仍使用驗時仍使用進行統計推斷,雙側檢驗則用進行統計推斷,雙側檢驗則用 /2 /2進行統計推斷;對于進行統計推斷;對于 雙尾表,單側檢驗時改用雙尾表,單側檢驗時改用2 2進行統計推斷,雙側檢驗則用進行統計推斷,雙側檢驗則用 進行統進行統 計推斷。

45、計推斷。 n在統計軟件(如在統計軟件(如SPSS或或SAS統計軟件)給出的計算結果中,已標注出統計軟件)給出的計算結果中,已標注出 所計算的相伴概率是單側還是雙側,對應于上述的單尾表和雙尾表。所計算的相伴概率是單側還是雙側,對應于上述的單尾表和雙尾表。 單側檢驗與雙側檢驗 n以下是以下是SPSS 中的單樣本中的單樣本t檢驗輸出結果:檢驗輸出結果: nOne-Sample Test(原假設:儲戶1次平均存取的現金與2000元無顯著差異) nTest Value=2000(均值比較的參比值) nt=1.240(檢驗統計量的觀測值) ndf=312(自由度,樣本量N=313) nSig.(2-tailed)=0.216(雙側相伴概率p ) nMean Difference=473.78(均值的標準誤差) n95% Confidence Interval of the Difference(總體均值與原假設值之差的95% 的置信區(qū)間):-278.131225.69(有95%的把握可認為:儲戶1次平均存取的 金額為1721.873225.69元) n上述檢驗屬 “均值比較”,是雙側檢驗

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論