論文寫作中存在的數(shù)理統(tǒng)計問題_第1頁
論文寫作中存在的數(shù)理統(tǒng)計問題_第2頁
論文寫作中存在的數(shù)理統(tǒng)計問題_第3頁
論文寫作中存在的數(shù)理統(tǒng)計問題_第4頁
論文寫作中存在的數(shù)理統(tǒng)計問題_第5頁
已閱讀5頁,還剩43頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、報告人:張利田張利田 環(huán)境科學(xué)學(xué)報編委會執(zhí)行副主編、編輯部主任 2006-11-26 重要假定 n作者所處理的數(shù)據(jù)屬于隨機變量的特定樣本。作者所處理的數(shù)據(jù)屬于隨機變量的特定樣本。 n作者已經(jīng)掌握最基本的數(shù)理統(tǒng)計學(xué)常識,如概率、作者已經(jīng)掌握最基本的數(shù)理統(tǒng)計學(xué)常識,如概率、 假設(shè)檢驗、均值、方差、標(biāo)準(zhǔn)差、正態(tài)分布、相假設(shè)檢驗、均值、方差、標(biāo)準(zhǔn)差、正態(tài)分布、相 關(guān)分析、回歸分析、方差分析關(guān)分析、回歸分析、方差分析。 數(shù)理統(tǒng)計問題的重要性數(shù)理統(tǒng)計問題的重要性 n在科學(xué)研究中,經(jīng)常會涉及到對隨機變量在科學(xué)研究中,經(jīng)常會涉及到對隨機變量大小大小、離散離散及及分布分布 特征的描述以及對特征的描述以及對2 2

2、個或多個隨機變量之間的個或多個隨機變量之間的關(guān)系關(guān)系描述問題。描述問題。 地學(xué)、環(huán)境科學(xué)研究也不例外地學(xué)、環(huán)境科學(xué)研究也不例外。 n對隨機變量及隨機變量之間的關(guān)系進(jìn)行定量描述的數(shù)學(xué)工具對隨機變量及隨機變量之間的關(guān)系進(jìn)行定量描述的數(shù)學(xué)工具 就是就是數(shù)理統(tǒng)計學(xué)數(shù)理統(tǒng)計學(xué)。 n在科學(xué)研究中,能否正確使用各種數(shù)理統(tǒng)計方法關(guān)系到所得在科學(xué)研究中,能否正確使用各種數(shù)理統(tǒng)計方法關(guān)系到所得 出結(jié)論的客觀性和可信性。所以,出結(jié)論的客觀性和可信性。所以,來稿中使用的數(shù)理統(tǒng)計方來稿中使用的數(shù)理統(tǒng)計方 法是否正確法是否正確應(yīng)是學(xué)術(shù)期刊編輯們極為重視的問題。應(yīng)是學(xué)術(shù)期刊編輯們極為重視的問題。 n目前,國內(nèi)環(huán)境科學(xué)與技術(shù)

3、類學(xué)術(shù)期刊對稿件中數(shù)理統(tǒng)計方目前,國內(nèi)環(huán)境科學(xué)與技術(shù)類學(xué)術(shù)期刊對稿件中數(shù)理統(tǒng)計方 法問題的重視程度存在差異。法問題的重視程度存在差異。 1 統(tǒng)計軟件的選擇統(tǒng)計軟件的選擇 n統(tǒng)計分析通常涉及大量的數(shù)據(jù),需要較大的計統(tǒng)計分析通常涉及大量的數(shù)據(jù),需要較大的計 算工作量。算工作量。 n在進(jìn)行統(tǒng)計分析時,盡管作者可以自行編寫計在進(jìn)行統(tǒng)計分析時,盡管作者可以自行編寫計 算程序,但在統(tǒng)計軟件很普及的今天,這樣做算程序,但在統(tǒng)計軟件很普及的今天,這樣做 是毫無必要的。是毫無必要的。 n出于對出于對工作效率工作效率以及對以及對算法的通用性、可比性算法的通用性、可比性 的考慮,一些學(xué)術(shù)期刊要求作者采用專門的數(shù)的考

4、慮,一些學(xué)術(shù)期刊要求作者采用專門的數(shù) 理統(tǒng)計軟件進(jìn)行統(tǒng)計分析。理統(tǒng)計軟件進(jìn)行統(tǒng)計分析。 1 統(tǒng)計軟件的選擇統(tǒng)計軟件的選擇 n環(huán)境科學(xué)學(xué)報環(huán)境科學(xué)學(xué)報的編輯們在處理稿件時的編輯們在處理稿件時 經(jīng)常發(fā)現(xiàn)的問題是:經(jīng)常發(fā)現(xiàn)的問題是:作者未使用專門的數(shù)作者未使用專門的數(shù) 理統(tǒng)計軟件,而采用理統(tǒng)計軟件,而采用Excel這樣的電子表格這樣的電子表格 軟件進(jìn)行數(shù)據(jù)統(tǒng)計分析。軟件進(jìn)行數(shù)據(jù)統(tǒng)計分析。 n由于電子表格軟件提供的統(tǒng)計分析功能十由于電子表格軟件提供的統(tǒng)計分析功能十 分有限,只能借助它進(jìn)行較為簡單的統(tǒng)計分有限,只能借助它進(jìn)行較為簡單的統(tǒng)計 分析,故我們不主張作者采用這樣的軟件分析,故我們不主張作者采用這

5、樣的軟件 進(jìn)行統(tǒng)計分析。進(jìn)行統(tǒng)計分析。 1 統(tǒng)計軟件的選擇統(tǒng)計軟件的選擇 n目前,國際上已開發(fā)出的專門用于統(tǒng)計分析的商目前,國際上已開發(fā)出的專門用于統(tǒng)計分析的商 業(yè)軟件很多,比較著名有業(yè)軟件很多,比較著名有SPSS(Statistical Package for Social Sciences)和和SAS(Statistical Analysis System)。此外,還有此外,還有BMDP和和STATISTICA 等等。 nSPSS是專門為社會科學(xué)領(lǐng)域的研究者設(shè)計的,但是專門為社會科學(xué)領(lǐng)域的研究者設(shè)計的,但 此軟件在自然科學(xué)領(lǐng)域也得到廣泛應(yīng)用。此軟件在自然科學(xué)領(lǐng)域也得到廣泛應(yīng)用。 nBMDP

6、是專門為生物學(xué)和醫(yī)學(xué)領(lǐng)域研究者編制的統(tǒng)是專門為生物學(xué)和醫(yī)學(xué)領(lǐng)域研究者編制的統(tǒng) 計軟件。計軟件。 1 1 統(tǒng)計軟件的選擇統(tǒng)計軟件的選擇 n目前,國際學(xué)術(shù)界有一條不成文的約定:凡目前,國際學(xué)術(shù)界有一條不成文的約定:凡 是用是用SPSS和和SAS軟件進(jìn)行統(tǒng)計分析所獲得的軟件進(jìn)行統(tǒng)計分析所獲得的 結(jié)果,在國際學(xué)術(shù)交流中不必說明具體算法。結(jié)果,在國際學(xué)術(shù)交流中不必說明具體算法。 由此可見,由此可見,SPSS和和SAS軟件已被各領(lǐng)域研究軟件已被各領(lǐng)域研究 者普遍認(rèn)可。者普遍認(rèn)可。 n我們建議作者們在進(jìn)行統(tǒng)計分析時盡量使用我們建議作者們在進(jìn)行統(tǒng)計分析時盡量使用 這這2個專門的統(tǒng)計軟件。目前,有關(guān)這個專門的統(tǒng)

7、計軟件。目前,有關(guān)這2個軟個軟 件的使用教程在書店中可很容易地買到。件的使用教程在書店中可很容易地買到。 2 2 均值的計算均值的計算 :理論問題 n均值(準(zhǔn)確的稱呼應(yīng)為均值(準(zhǔn)確的稱呼應(yīng)為“樣本均值樣本均值”)的統(tǒng)計學(xué)意義:反)的統(tǒng)計學(xué)意義:反 映隨機變量樣本的大小特征。映隨機變量樣本的大小特征。 n均值對應(yīng)于隨機變量總體的數(shù)學(xué)期望均值對應(yīng)于隨機變量總體的數(shù)學(xué)期望總體的數(shù)學(xué)期望客總體的數(shù)學(xué)期望客 觀上決定著樣本的均值,反過來,通過計算樣本的均值可觀上決定著樣本的均值,反過來,通過計算樣本的均值可 以描述總體的數(shù)學(xué)期望。以描述總體的數(shù)學(xué)期望。 n在處理實驗數(shù)據(jù)或采樣數(shù)據(jù)時,經(jīng)常會遇到對相同采樣

8、或在處理實驗數(shù)據(jù)或采樣數(shù)據(jù)時,經(jīng)常會遇到對相同采樣或 相同實驗條件下同一隨機變量的多個不同取值進(jìn)行統(tǒng)計處相同實驗條件下同一隨機變量的多個不同取值進(jìn)行統(tǒng)計處 理的問題。理的問題。 n為找到代表這些觀測值總體大小特征的代表值(統(tǒng)計量,為找到代表這些觀測值總體大小特征的代表值(統(tǒng)計量, 該統(tǒng)計量根據(jù)樣本數(shù)據(jù)算出),多數(shù)作者會不假思索地直該統(tǒng)計量根據(jù)樣本數(shù)據(jù)算出),多數(shù)作者會不假思索地直 接給出算術(shù)平均值和標(biāo)準(zhǔn)差。顯然,這種做法是不嚴(yán)謹(jǐn)接給出算術(shù)平均值和標(biāo)準(zhǔn)差。顯然,這種做法是不嚴(yán)謹(jǐn) 的的不一定總是正確的。不一定總是正確的。 2 均值的計算:技術(shù)問題均值的計算:技術(shù)問題 n在數(shù)理統(tǒng)計學(xué)中,作為描述隨機

9、變量樣本的在數(shù)理統(tǒng)計學(xué)中,作為描述隨機變量樣本的 總體大小特征的統(tǒng)計量有算術(shù)平均值、幾何總體大小特征的統(tǒng)計量有算術(shù)平均值、幾何 平均值和中位數(shù)等多個。平均值和中位數(shù)等多個。 n何時用算術(shù)平均值?何時用幾何平均值?以何時用算術(shù)平均值?何時用幾何平均值?以 及何時用中位數(shù)?及何時用中位數(shù)?這不能由研究者根據(jù)主觀這不能由研究者根據(jù)主觀 意愿隨意確定,而要根據(jù)隨機變量的分布特意愿隨意確定,而要根據(jù)隨機變量的分布特 征確定征確定。 2 均值的計算:技術(shù)問題均值的計算:技術(shù)問題 n反映隨機變量總體大小特征的統(tǒng)計量是數(shù)學(xué)期望,而在隨機反映隨機變量總體大小特征的統(tǒng)計量是數(shù)學(xué)期望,而在隨機 變量的分布服從正態(tài)分

10、布時,其數(shù)學(xué)期望就可以用樣本的算變量的分布服從正態(tài)分布時,其數(shù)學(xué)期望就可以用樣本的算 術(shù)平均值描述。此時,可用樣本的術(shù)平均值描述。此時,可用樣本的算術(shù)平均值算術(shù)平均值描述隨機變量描述隨機變量 的大小特征。的大小特征。 n如果所研究的隨機變量不服從正態(tài)分布,則算術(shù)平均值不能如果所研究的隨機變量不服從正態(tài)分布,則算術(shù)平均值不能 準(zhǔn)確反映該變量的大小特征。在這種情況下,可通過假設(shè)檢準(zhǔn)確反映該變量的大小特征。在這種情況下,可通過假設(shè)檢 驗來判斷隨機變量是否服從對數(shù)正態(tài)分布。如果服從對數(shù)正驗來判斷隨機變量是否服從對數(shù)正態(tài)分布。如果服從對數(shù)正 態(tài)分布,則幾何平均值就是數(shù)學(xué)期望的值。此時,就可以計態(tài)分布,則

11、幾何平均值就是數(shù)學(xué)期望的值。此時,就可以計 算變量的算變量的幾何平均值幾何平均值。 n如果隨機變量既不服從正態(tài)分布也不服從對數(shù)正態(tài)分布,則如果隨機變量既不服從正態(tài)分布也不服從對數(shù)正態(tài)分布,則 按現(xiàn)有的數(shù)理統(tǒng)計學(xué)知識,尚無合適的統(tǒng)計量描述該變量的按現(xiàn)有的數(shù)理統(tǒng)計學(xué)知識,尚無合適的統(tǒng)計量描述該變量的 大小特征。此時,可用大小特征。此時,可用中位數(shù)中位數(shù)來描述變量的大小特征。來描述變量的大小特征。 3 3 相關(guān)分析相關(guān)分析:相關(guān)系數(shù)的選擇:相關(guān)系數(shù)的選擇 n在相關(guān)分析中,作者們常犯的錯誤是:簡單地計算在相關(guān)分析中,作者們常犯的錯誤是:簡單地計算 Pearson 積矩相關(guān)系數(shù),而且既不給出正態(tài)分布檢驗

12、結(jié)果,積矩相關(guān)系數(shù),而且既不給出正態(tài)分布檢驗結(jié)果, 也往往不明確指出所計算的相關(guān)系數(shù)就是也往往不明確指出所計算的相關(guān)系數(shù)就是Pearson 積矩相積矩相 關(guān)系數(shù)。關(guān)系數(shù)。 n在數(shù)理統(tǒng)計學(xué)中,除有針對數(shù)值變量設(shè)計的在數(shù)理統(tǒng)計學(xué)中,除有針對數(shù)值變量設(shè)計的Pearson 積矩積矩 相關(guān)系數(shù)(對應(yīng)于相關(guān)系數(shù)(對應(yīng)于 “參數(shù)方法參數(shù)方法”)外,還有針對順序變量)外,還有針對順序變量 (即(即“秩變量秩變量”)設(shè)計的)設(shè)計的Spearman秩相關(guān)系數(shù)和秩相關(guān)系數(shù)和Kendall 秩相關(guān)系數(shù)(對應(yīng)于秩相關(guān)系數(shù)(對應(yīng)于 “非參數(shù)方法非參數(shù)方法”)等。)等。 nPearson 積矩相關(guān)系數(shù)可用于描述積矩相關(guān)系數(shù)

13、可用于描述2個隨機變量的線性相關(guān)個隨機變量的線性相關(guān) 程度,程度,Spearman或或Kendall秩相關(guān)系數(shù)用來判斷兩個隨機秩相關(guān)系數(shù)用來判斷兩個隨機 變量在二維和多維空間中是否具有某種共變趨勢。變量在二維和多維空間中是否具有某種共變趨勢。 3 相關(guān)分析:相關(guān)系數(shù)的選擇相關(guān)分析:相關(guān)系數(shù)的選擇 n在相關(guān)分析中,計算各種相關(guān)系數(shù)是有前提條件在相關(guān)分析中,計算各種相關(guān)系數(shù)是有前提條件 的。的。 n在相關(guān)分析中,對于秩變量,一般別無選擇,只在相關(guān)分析中,對于秩變量,一般別無選擇,只 能計算能計算Spearman或或Kendall秩相關(guān)系數(shù)。秩相關(guān)系數(shù)。 n對于數(shù)值變量,只要條件許可,應(yīng)盡量使用對于

14、數(shù)值變量,只要條件許可,應(yīng)盡量使用檢驗檢驗 功效最高功效最高的參數(shù)方法,即計算用的參數(shù)方法,即計算用Pearson 積矩相積矩相 關(guān)系數(shù)。只有計算關(guān)系數(shù)。只有計算Pearson 積矩相關(guān)系數(shù)的前提積矩相關(guān)系數(shù)的前提 不存在時,才考慮退而求其次,計算專門為秩變不存在時,才考慮退而求其次,計算專門為秩變 量設(shè)計的量設(shè)計的Spearman或或Kendall秩相關(guān)系數(shù)(秩相關(guān)系數(shù)(盡管盡管 這樣做會導(dǎo)致檢驗功效的降低這樣做會導(dǎo)致檢驗功效的降低)。)。 3 相關(guān)分析:相關(guān)系數(shù)的選擇相關(guān)分析:相關(guān)系數(shù)的選擇 n對于數(shù)值變量,相關(guān)系數(shù)選擇的依據(jù)是變量是否服從正態(tài)對于數(shù)值變量,相關(guān)系數(shù)選擇的依據(jù)是變量是否服從

15、正態(tài) 分布,或變換后的數(shù)據(jù)是否服從正態(tài)分布。分布,或變換后的數(shù)據(jù)是否服從正態(tài)分布。 n對于二元相關(guān)分析,如果對于二元相關(guān)分析,如果2個隨機變量服從二元正態(tài)分布假個隨機變量服從二元正態(tài)分布假 設(shè),則應(yīng)該用設(shè),則應(yīng)該用Pearson 積矩相關(guān)系數(shù)描述這積矩相關(guān)系數(shù)描述這2個隨機變量個隨機變量 間的相關(guān)關(guān)系。間的相關(guān)關(guān)系。 n如果樣本數(shù)據(jù)不服從二元正態(tài)分布,則可嘗試進(jìn)行數(shù)據(jù)變?nèi)绻麡颖緮?shù)據(jù)不服從二元正態(tài)分布,則可嘗試進(jìn)行數(shù)據(jù)變 換,看變換后的數(shù)據(jù)是否符合正態(tài)分布?如果是,則可以換,看變換后的數(shù)據(jù)是否符合正態(tài)分布?如果是,則可以 針對變換后的數(shù)據(jù)計算針對變換后的數(shù)據(jù)計算Pearson 積矩相關(guān)系數(shù);否則

16、,就積矩相關(guān)系數(shù);否則,就 不能計算不能計算Pearson 積矩相關(guān)系數(shù),而應(yīng)改用檢驗功效較低積矩相關(guān)系數(shù),而應(yīng)改用檢驗功效較低 的的Spearman或或Kendall秩相關(guān)系數(shù)(此時,如果強行計秩相關(guān)系數(shù)(此時,如果強行計 算算Pearson 積矩相關(guān)系數(shù)有可能會得出完全錯誤的結(jié)論)。積矩相關(guān)系數(shù)有可能會得出完全錯誤的結(jié)論)。 4 相關(guān)分析與回歸分析的區(qū)別相關(guān)分析與回歸分析的區(qū)別 n相關(guān)分析和回歸分析是極為常用的相關(guān)分析和回歸分析是極為常用的2種數(shù)理種數(shù)理 統(tǒng)計方法,在環(huán)境科學(xué)及其它科學(xué)研究領(lǐng)域統(tǒng)計方法,在環(huán)境科學(xué)及其它科學(xué)研究領(lǐng)域 有著廣泛的用途。然而,由于這有著廣泛的用途。然而,由于這2

17、種數(shù)理統(tǒng)種數(shù)理統(tǒng) 計方法在計算方面存在很多相似之處,且在計方法在計算方面存在很多相似之處,且在 一些數(shù)理統(tǒng)計教科書中沒有系統(tǒng)闡明這一些數(shù)理統(tǒng)計教科書中沒有系統(tǒng)闡明這2種種 數(shù)理統(tǒng)計方法的內(nèi)在差別,從而使一些研究數(shù)理統(tǒng)計方法的內(nèi)在差別,從而使一些研究 者不能嚴(yán)格區(qū)分相關(guān)分析與回歸分析者不能嚴(yán)格區(qū)分相關(guān)分析與回歸分析 。 4 相關(guān)分析與回歸分析的區(qū)別相關(guān)分析與回歸分析的區(qū)別 n最常見的錯誤是最常見的錯誤是:用回歸分析的結(jié)果解釋相用回歸分析的結(jié)果解釋相 關(guān)性問題。例如,作者將關(guān)性問題。例如,作者將“回歸直線(曲線)回歸直線(曲線) 圖圖”稱為稱為“相關(guān)性圖相關(guān)性圖”或或“相關(guān)關(guān)系圖相關(guān)關(guān)系圖”; 將

18、回歸直線的將回歸直線的R2(擬合度,或稱擬合度,或稱“可決系可決系 數(shù)數(shù)”)錯誤地稱為錯誤地稱為“相關(guān)系數(shù)相關(guān)系數(shù)”或或“相關(guān)系相關(guān)系 數(shù)的平方數(shù)的平方”;根據(jù)回歸分析的結(jié)果宣稱;根據(jù)回歸分析的結(jié)果宣稱2個個 變量之間存在正的或負(fù)的相關(guān)關(guān)系。變量之間存在正的或負(fù)的相關(guān)關(guān)系。 4 相關(guān)分析與回歸分析的區(qū)別相關(guān)分析與回歸分析的區(qū)別 n相關(guān)分析與回歸分析均為研究相關(guān)分析與回歸分析均為研究2個或多個個或多個 變量間關(guān)聯(lián)性的方法,但變量間關(guān)聯(lián)性的方法,但2種數(shù)理統(tǒng)計方種數(shù)理統(tǒng)計方 法存在本質(zhì)的差別,即它們用于不同的法存在本質(zhì)的差別,即它們用于不同的 研究目的。研究目的。 n相關(guān)分析的目的在于檢驗兩個隨機

19、變量相關(guān)分析的目的在于檢驗兩個隨機變量 的共變趨勢(即共同變化的程度),回的共變趨勢(即共同變化的程度),回 歸分析的目的則在于試圖用自變量來預(yù)歸分析的目的則在于試圖用自變量來預(yù) 測因變量的值。測因變量的值。 4 相關(guān)分析與回歸分析的區(qū)別相關(guān)分析與回歸分析的區(qū)別 n在相關(guān)分析中,兩個變量必須同時都是在相關(guān)分析中,兩個變量必須同時都是 隨機變量,如果其中的一個變量不是隨隨機變量,如果其中的一個變量不是隨 機變量,就不能進(jìn)行相關(guān)分析。這是相機變量,就不能進(jìn)行相關(guān)分析。這是相 關(guān)分析方法本身所決定的。關(guān)分析方法本身所決定的。 4 相關(guān)分析與回歸分析的區(qū)別相關(guān)分析與回歸分析的區(qū)別 n對于回歸分析,其中

20、的因變量肯定為隨對于回歸分析,其中的因變量肯定為隨 機變量(這是回歸分析方法本身所決定機變量(這是回歸分析方法本身所決定 的),而自變量則可以是普通變量(有的),而自變量則可以是普通變量(有 確定的取值)也可以是隨機變量。確定的取值)也可以是隨機變量。 4 相關(guān)分析與回歸分析的區(qū)別相關(guān)分析與回歸分析的區(qū)別 n如果自變量是普通變量,即模型如果自變量是普通變量,即模型回歸分析,回歸分析, 采用的回歸方法就是最為常用的最小二乘法。采用的回歸方法就是最為常用的最小二乘法。 n如果自變量是隨機變量,如果自變量是隨機變量,即模型即模型回歸分析,回歸分析, 所采用的回歸方法與計算者的目的有關(guān)。所采用的回歸方

21、法與計算者的目的有關(guān)。 n在以預(yù)測為目的的情況下,仍采用在以預(yù)測為目的的情況下,仍采用“最小二乘法最小二乘法” (但精度下降(但精度下降最小二乘法是專為模型最小二乘法是專為模型 設(shè)計的,設(shè)計的, 未考慮自變量的隨機誤差);未考慮自變量的隨機誤差); n在以估值為目的(如計算可決系數(shù)、回歸系數(shù)等)在以估值為目的(如計算可決系數(shù)、回歸系數(shù)等) 的情況下,應(yīng)使用相對嚴(yán)謹(jǐn)?shù)姆椒ǎㄈ绲那闆r下,應(yīng)使用相對嚴(yán)謹(jǐn)?shù)姆椒ǎㄈ纭爸鬏S法主軸法”、 “約化主軸法約化主軸法”或或“BartlettBartlett法法” )。)。 4 相關(guān)分析與回歸分析的區(qū)別相關(guān)分析與回歸分析的區(qū)別 n顯然,對于回歸分析,如果是模型顯然

22、,對于回歸分析,如果是模型回歸分析,鑒于兩個回歸分析,鑒于兩個 隨機變量客觀上存在隨機變量客觀上存在“相關(guān)性相關(guān)性”問題,只是由于回歸分析問題,只是由于回歸分析 方法本身不能提供針對自變量和因變量之間相關(guān)關(guān)系的準(zhǔn)方法本身不能提供針對自變量和因變量之間相關(guān)關(guān)系的準(zhǔn) 確的檢驗手段,因此,若以預(yù)測為目的,最好不提確的檢驗手段,因此,若以預(yù)測為目的,最好不提“相關(guān)相關(guān) 性性”問題;問題;若以探索兩者的若以探索兩者的“共變趨勢共變趨勢”為目的為目的,應(yīng)該改,應(yīng)該改 用相關(guān)分析。用相關(guān)分析。 n如果是模型如果是模型回歸分析,就根本不可能回答變量的回歸分析,就根本不可能回答變量的“相關(guān)相關(guān) 性性”問題,問題

23、,因為普通變量與隨機變量之間不存在因為普通變量與隨機變量之間不存在“相關(guān)性相關(guān)性” 這一概念這一概念(問題在于,大多數(shù)的回歸分析都是模型(問題在于,大多數(shù)的回歸分析都是模型回歸回歸 分析?。?。此時,即使作者想描述分析!)。此時,即使作者想描述2個變量間的個變量間的“共變趨共變趨 勢勢”而改用相關(guān)分析,也會因相關(guān)分析的前提不存在而使而改用相關(guān)分析,也會因相關(guān)分析的前提不存在而使 分析結(jié)果毫無意義。分析結(jié)果毫無意義。 4 相關(guān)分析與回歸分析的區(qū)別相關(guān)分析與回歸分析的區(qū)別 n需要特別指出的是,回歸分析中的需要特別指出的是,回歸分析中的R2在數(shù)學(xué)上恰好是在數(shù)學(xué)上恰好是 Pearson積矩相關(guān)系數(shù)積矩相

24、關(guān)系數(shù)r的平方。因此,這極易使作者們錯的平方。因此,這極易使作者們錯 誤地理解誤地理解R2的含義,認(rèn)為的含義,認(rèn)為R2就是就是 “相關(guān)系數(shù)相關(guān)系數(shù)”或或“相關(guān)系相關(guān)系 數(shù)的平方數(shù)的平方”。問題在于,對于自變量是普通變量(即其取值。問題在于,對于自變量是普通變量(即其取值 有確定性的變量)、因變量為隨機變量的模型有確定性的變量)、因變量為隨機變量的模型回歸分析,回歸分析, 2個變量之間的個變量之間的“相關(guān)性相關(guān)性”概念根本不存在,又何談概念根本不存在,又何談“相關(guān)相關(guān) 系數(shù)系數(shù)”呢?呢? n更值得注意的是,一些早期的教科書作者不是用更值得注意的是,一些早期的教科書作者不是用R2來描述回來描述回

25、歸效果(擬合程度,擬合度)的,而是用歸效果(擬合程度,擬合度)的,而是用Pearson積矩相關(guān)積矩相關(guān) 系數(shù)來描述。這就更容易誤導(dǎo)讀者。系數(shù)來描述。這就更容易誤導(dǎo)讀者。 5 重要的數(shù)理統(tǒng)計學(xué)常識 n1)假設(shè)檢驗 n假設(shè)檢驗的基本思想假設(shè)檢驗的基本思想 n統(tǒng)計推斷統(tǒng)計推斷:是根據(jù)樣本數(shù)據(jù)推斷總體特征的一種方法。:是根據(jù)樣本數(shù)據(jù)推斷總體特征的一種方法。 n假設(shè)檢驗:假設(shè)檢驗:是進(jìn)行是進(jìn)行統(tǒng)計推斷統(tǒng)計推斷的途徑之一(另一種途徑是參數(shù)估計,的途徑之一(另一種途徑是參數(shù)估計, 如點估計和區(qū)間估計)。如點估計和區(qū)間估計)。 n假設(shè)檢驗的基本思路是假設(shè)檢驗的基本思路是:首先,對總體參數(shù)值提出假設(shè)(原假設(shè));

26、:首先,對總體參數(shù)值提出假設(shè)(原假設(shè)); 然后,利用樣本數(shù)據(jù)提供的信息來驗證所提出的假設(shè)是否成立(統(tǒng)然后,利用樣本數(shù)據(jù)提供的信息來驗證所提出的假設(shè)是否成立(統(tǒng) 計推斷)計推斷)-如果樣本數(shù)據(jù)提供的信息不能證明上述假設(shè)成立,則應(yīng)如果樣本數(shù)據(jù)提供的信息不能證明上述假設(shè)成立,則應(yīng) 拒絕該假設(shè);如果樣本數(shù)據(jù)提供的信息不能證明上述假設(shè)不成立,拒絕該假設(shè);如果樣本數(shù)據(jù)提供的信息不能證明上述假設(shè)不成立, 則不應(yīng)拒絕該假設(shè)。則不應(yīng)拒絕該假設(shè)。 n接受或拒絕原假設(shè)的依據(jù)接受或拒絕原假設(shè)的依據(jù):小概率事件不可能發(fā)生。顯然,這樣做:小概率事件不可能發(fā)生。顯然,這樣做 是有風(fēng)險的(小概率事件真的發(fā)生了)。是有風(fēng)險的(

27、小概率事件真的發(fā)生了)。 n假設(shè)檢驗中的關(guān)鍵問題假設(shè)檢驗中的關(guān)鍵問題:1)在原假設(shè)成立的情況下,如何計算樣)在原假設(shè)成立的情況下,如何計算樣 本值或某一極端值發(fā)生的概率?本值或某一極端值發(fā)生的概率?2)如何界定小概率事件?)如何界定小概率事件? 5 重要的數(shù)理統(tǒng)計學(xué)常識 n1)假設(shè)檢驗 n假設(shè)檢驗的基本步驟 n1)提出原假設(shè)(或稱)提出原假設(shè)(或稱“零假設(shè)零假設(shè)”,H0);); n2)選擇檢驗統(tǒng)計量;)選擇檢驗統(tǒng)計量; n3)根據(jù)樣本數(shù)據(jù)計算檢驗統(tǒng)計量觀測值的發(fā))根據(jù)樣本數(shù)據(jù)計算檢驗統(tǒng)計量觀測值的發(fā) 生概率(相伴概率,生概率(相伴概率,p);); n4)根據(jù)給定的小概率事件界定標(biāo)準(zhǔn)(顯著性)根

28、據(jù)給定的小概率事件界定標(biāo)準(zhǔn)(顯著性 水平,如水平,如0.05,0.01)做出統(tǒng)計推斷。)做出統(tǒng)計推斷。 假設(shè)檢驗的基本步驟 n為什么要設(shè)計并計算檢驗統(tǒng)計量?為什么要設(shè)計并計算檢驗統(tǒng)計量? n在假設(shè)檢驗中,樣本值(或更極端的取值)發(fā)生的概率在假設(shè)檢驗中,樣本值(或更極端的取值)發(fā)生的概率 不能直接通過樣本數(shù)據(jù)計算,而是通過計算不能直接通過樣本數(shù)據(jù)計算,而是通過計算檢驗統(tǒng)計量檢驗統(tǒng)計量 觀測值觀測值的發(fā)生概率而間接得到的。的發(fā)生概率而間接得到的。 n所設(shè)計的檢驗統(tǒng)計量一般服從或近似服從某種已知的理所設(shè)計的檢驗統(tǒng)計量一般服從或近似服從某種已知的理 論分布(如論分布(如t-分布、分布、F-分布、卡方分

29、布),易于估算其分布、卡方分布),易于估算其 取值概率。取值概率。 n對于不同的假設(shè)檢驗和不同的總體,會有不同的選擇檢對于不同的假設(shè)檢驗和不同的總體,會有不同的選擇檢 驗統(tǒng)計量的理論和方法驗統(tǒng)計量的理論和方法。 假設(shè)檢驗的基本步驟 n計算檢驗統(tǒng)計量觀測值的發(fā)生概率計算檢驗統(tǒng)計量觀測值的發(fā)生概率 n在假定原假設(shè)成立的前提下,利用樣本數(shù)據(jù)計算 檢驗統(tǒng)計量觀測值發(fā)生的概率(即p值,又稱 “相伴概率”指該檢驗統(tǒng)計量在某個特定的極 端區(qū)域在原假設(shè)成立時的概率)。該概率值間接 地給出了在原假設(shè)成立的條件下樣本值(或更極 端值)發(fā)生的概率。 假設(shè)檢驗的基本步驟 n進(jìn)行統(tǒng)計推斷進(jìn)行統(tǒng)計推斷 n依據(jù)預(yù)先確定的

30、“顯著性水平” (即值), 如0.01或0.05,決定是否拒絕原假設(shè)。 n如果p值小于值,即認(rèn)為原假設(shè)成立時檢驗統(tǒng) 計量觀測值的發(fā)生是小概率事件,則拒絕原假 設(shè)。否則,就接受原假設(shè)。 顯著性水平:概念與意義顯著性水平:概念與意義 n在假設(shè)檢驗中,在假設(shè)檢驗中,顯著性水平(顯著性水平(Significant level,用用 表示)的確定是假設(shè)檢驗中至關(guān)重要的問題。表示)的確定是假設(shè)檢驗中至關(guān)重要的問題。 n顯著性水平是在原假設(shè)成立時檢驗統(tǒng)計量的制落在顯著性水平是在原假設(shè)成立時檢驗統(tǒng)計量的制落在 某個極端區(qū)域的概率值。因此,如果取某個極端區(qū)域的概率值。因此,如果取= 0.05, 如果計算出的如果

31、計算出的p值小于值小于 ,則可認(rèn)為原假設(shè)是一個,則可認(rèn)為原假設(shè)是一個 不可能發(fā)生的小概率事件。當(dāng)然,如果真的發(fā)生了,不可能發(fā)生的小概率事件。當(dāng)然,如果真的發(fā)生了, 則犯錯誤的可能性為則犯錯誤的可能性為5%。顯然,顯著性水平反映顯然,顯著性水平反映 了拒絕某一原假設(shè)時所犯錯誤的可能性,或者說,了拒絕某一原假設(shè)時所犯錯誤的可能性,或者說, 是指拒絕了事實上正確的原假設(shè)的概率。是指拒絕了事實上正確的原假設(shè)的概率。 顯著性水平:通常的取值顯著性水平:通常的取值 n值一般在進(jìn)行假設(shè)檢驗前由研究者根據(jù)實際的需值一般在進(jìn)行假設(shè)檢驗前由研究者根據(jù)實際的需 要確定。要確定。 n常用的取值是常用的取值是0.05或

32、或0.01。對于前者,相當(dāng)于在。對于前者,相當(dāng)于在 原假設(shè)事實上正確的情況下,研究者接受這一假原假設(shè)事實上正確的情況下,研究者接受這一假 設(shè)的可能性為設(shè)的可能性為95%;對于后者,則研究者接受事;對于后者,則研究者接受事 實上正確的原假設(shè)的可能性為實上正確的原假設(shè)的可能性為99%。 n顯然,降低顯然,降低值可以減少拒絕原假設(shè)的可能性。因值可以減少拒絕原假設(shè)的可能性。因 此,在報告統(tǒng)計分析結(jié)果時,必須給出此,在報告統(tǒng)計分析結(jié)果時,必須給出值。值。 顯著性水平:進(jìn)行統(tǒng)計推斷顯著性水平:進(jìn)行統(tǒng)計推斷 n在進(jìn)行假設(shè)檢驗時,各種統(tǒng)計軟件均會給出在進(jìn)行假設(shè)檢驗時,各種統(tǒng)計軟件均會給出檢驗統(tǒng)檢驗統(tǒng) 計量觀測

33、值計量觀測值以及原假設(shè)成立時該檢驗統(tǒng)計量取值的以及原假設(shè)成立時該檢驗統(tǒng)計量取值的 相伴概率相伴概率(即(即檢驗統(tǒng)計量檢驗統(tǒng)計量某特定取值及更極端可能某特定取值及更極端可能 值出現(xiàn)的概率,用值出現(xiàn)的概率,用p p表示)。表示)。 np p值是否小于事先確定的值是否小于事先確定的值,是接受或拒絕原假值,是接受或拒絕原假 設(shè)的依據(jù)。設(shè)的依據(jù)。 n如果如果p p值小于事先已確定的值小于事先已確定的值,就意味著檢驗統(tǒng)值,就意味著檢驗統(tǒng) 計量取值的可能性很小,進(jìn)而可推斷原假設(shè)成立的計量取值的可能性很小,進(jìn)而可推斷原假設(shè)成立的 可能性很小,因而可以拒絕原假設(shè)。相反,如果可能性很小,因而可以拒絕原假設(shè)。相反,

34、如果p p 值大于事先已確定的值大于事先已確定的值,就不能拒絕原假設(shè)。值,就不能拒絕原假設(shè)。 統(tǒng)計推斷:過去的回憶統(tǒng)計推斷:過去的回憶 n在計算機技術(shù)十分發(fā)達(dá),以及專業(yè)統(tǒng)計軟件功能十分強大的今天,計算在計算機技術(shù)十分發(fā)達(dá),以及專業(yè)統(tǒng)計軟件功能十分強大的今天,計算 檢驗統(tǒng)計量及其相伴概率是一件十分容易的事情。檢驗統(tǒng)計量及其相伴概率是一件十分容易的事情。 n然而,在然而,在20世紀(jì)世紀(jì)90年代以前,只有服從標(biāo)準(zhǔn)正態(tài)分布的檢驗統(tǒng)計量,年代以前,只有服從標(biāo)準(zhǔn)正態(tài)分布的檢驗統(tǒng)計量, 人們可以直接查閱事先準(zhǔn)備好的人們可以直接查閱事先準(zhǔn)備好的標(biāo)準(zhǔn)正態(tài)分布函數(shù)表標(biāo)準(zhǔn)正態(tài)分布函數(shù)表,從中獲得特定計,從中獲得特定

35、計 算結(jié)果的相伴概率。而對于的服從算結(jié)果的相伴概率。而對于的服從t-分布、分布、F-分布、卡方分布或其它特分布、卡方分布或其它特 殊的理論分布的檢驗統(tǒng)計量(大多數(shù)的假設(shè)檢驗是這樣),人們無法直殊的理論分布的檢驗統(tǒng)計量(大多數(shù)的假設(shè)檢驗是這樣),人們無法直 接計算相伴概率。人們通常查閱各類假設(shè)檢驗的臨界值表進(jìn)行統(tǒng)計推斷。接計算相伴概率。人們通常查閱各類假設(shè)檢驗的臨界值表進(jìn)行統(tǒng)計推斷。 這些表格以自由度和很少的幾個相伴概率(通常為這些表格以自由度和很少的幾個相伴概率(通常為0.1、0.05和和0.01) 為自變量,以檢驗統(tǒng)計量的臨界值為函數(shù)排列。為自變量,以檢驗統(tǒng)計量的臨界值為函數(shù)排列。 n在進(jìn)行

36、統(tǒng)計推斷時,人們使用上述臨界值表根據(jù)事先確定的顯著性水平,在進(jìn)行統(tǒng)計推斷時,人們使用上述臨界值表根據(jù)事先確定的顯著性水平, 查閱對應(yīng)于某一自由度和特定相伴概率的檢驗統(tǒng)計量的臨界值,然后將查閱對應(yīng)于某一自由度和特定相伴概率的檢驗統(tǒng)計量的臨界值,然后將 所計算出的檢驗統(tǒng)計量與該臨界值相比較。如果檢驗統(tǒng)計量的計算值大所計算出的檢驗統(tǒng)計量與該臨界值相比較。如果檢驗統(tǒng)計量的計算值大 于臨界值,即實際的相伴概率小于事先規(guī)定的顯著性水平,便可拒絕原于臨界值,即實際的相伴概率小于事先規(guī)定的顯著性水平,便可拒絕原 假設(shè)。否則,可接受原假設(shè)。假設(shè)。否則,可接受原假設(shè)。 顯著性水平:舉例顯著性水平:舉例 n在根據(jù)顯

37、著性水平進(jìn)行統(tǒng)計推斷時,應(yīng)注意原假設(shè)的性質(zhì)。在根據(jù)顯著性水平進(jìn)行統(tǒng)計推斷時,應(yīng)注意原假設(shè)的性質(zhì)。 n以二元相關(guān)分析為例,相關(guān)分析中的原假設(shè)是以二元相關(guān)分析為例,相關(guān)分析中的原假設(shè)是“相關(guān)系數(shù)為相關(guān)系數(shù)為 零零”(即(即2個隨機變量間不存在顯著的相關(guān)關(guān)系)。如果計個隨機變量間不存在顯著的相關(guān)關(guān)系)。如果計 算出的檢驗統(tǒng)計量的相伴概率(算出的檢驗統(tǒng)計量的相伴概率(p值)低于事先給定值)低于事先給定值值 (如(如0.05),就可以認(rèn)為),就可以認(rèn)為“相關(guān)系數(shù)為零相關(guān)系數(shù)為零”的可能性很低,的可能性很低, 既既2個隨機變量之間存在顯著的相關(guān)關(guān)系。個隨機變量之間存在顯著的相關(guān)關(guān)系。 n在正態(tài)分布檢驗時,

38、原假設(shè)是在正態(tài)分布檢驗時,原假設(shè)是“樣本數(shù)據(jù)來自服從正態(tài)分布樣本數(shù)據(jù)來自服從正態(tài)分布 的總體的總體”。此時,如果計算出的檢驗統(tǒng)計量的相伴概率(。此時,如果計算出的檢驗統(tǒng)計量的相伴概率(p 值)低于事先給定值)低于事先給定值(如值(如0.05),則表明數(shù)據(jù)不服從正態(tài)),則表明數(shù)據(jù)不服從正態(tài) 分布。只有分布。只有p值高于值高于值時,數(shù)據(jù)才服從正態(tài)分布。值時,數(shù)據(jù)才服從正態(tài)分布。這與相這與相 關(guān)分析的假設(shè)檢驗不同。關(guān)分析的假設(shè)檢驗不同。 顯著性水平顯著性水平 n作者在描述相關(guān)分析結(jié)果時常有的失誤是:僅給出相關(guān)系數(shù)作者在描述相關(guān)分析結(jié)果時常有的失誤是:僅給出相關(guān)系數(shù) 的值,而不給出顯著性水平。這就無法

39、判斷的值,而不給出顯著性水平。這就無法判斷2個隨機變量間個隨機變量間 的相關(guān)性是否顯著。的相關(guān)性是否顯著。 n有時作者不是根據(jù)顯著性水平判斷相關(guān)關(guān)系是否顯著,而是有時作者不是根據(jù)顯著性水平判斷相關(guān)關(guān)系是否顯著,而是 根據(jù)相關(guān)系數(shù)的大小來推斷(相關(guān)系數(shù)越近根據(jù)相關(guān)系數(shù)的大小來推斷(相關(guān)系數(shù)越近1,則相關(guān)關(guān)系,則相關(guān)關(guān)系 越顯著)。問題是,相關(guān)系數(shù)本身是一個基于樣本數(shù)據(jù)計算越顯著)。問題是,相關(guān)系數(shù)本身是一個基于樣本數(shù)據(jù)計算 出的觀測值,其本身的可靠性尚需檢驗。出的觀測值,其本身的可靠性尚需檢驗。 n此外,作者在論文中常常用此外,作者在論文中常常用“顯著相關(guān)顯著相關(guān)”和和“極顯著相關(guān)極顯著相關(guān)”

40、來描述相關(guān)分析結(jié)果,即認(rèn)為來描述相關(guān)分析結(jié)果,即認(rèn)為p值小于值小于0.05就是顯著相關(guān)關(guān)就是顯著相關(guān)關(guān) 系(或顯著相關(guān)),小于系(或顯著相關(guān)),小于0.01就是極顯著相關(guān)關(guān)系(或極就是極顯著相關(guān)關(guān)系(或極 顯著相關(guān))。顯著相關(guān))。 統(tǒng)計推斷的注意事項統(tǒng)計推斷的注意事項 n在假設(shè)檢驗中,只有在假設(shè)檢驗中,只有 “顯著顯著”和和 “不顯著不顯著”,沒,沒 有有“極顯著極顯著”這樣的斷語。只要計算出的檢驗統(tǒng)這樣的斷語。只要計算出的檢驗統(tǒng) 計量的相伴概率(計量的相伴概率(p值)低于事先確定的值)低于事先確定的值,就值,就 可以認(rèn)為檢驗結(jié)果可以認(rèn)為檢驗結(jié)果“顯著顯著”(相關(guān)分析的原假設(shè)(相關(guān)分析的原假設(shè)

41、 是是“相關(guān)系數(shù)為零相關(guān)系數(shù)為零”,故此處的,故此處的“顯著顯著”實際意實際意 味著味著“相關(guān)系數(shù)不為零相關(guān)系數(shù)不為零”,或說,或說“2個隨機變量間個隨機變量間 有顯著的相關(guān)關(guān)系有顯著的相關(guān)關(guān)系”);同樣,只要計算出的檢);同樣,只要計算出的檢 驗統(tǒng)計量的相伴概率(驗統(tǒng)計量的相伴概率(p值)高于事先確定的值)高于事先確定的值,值, 就可以認(rèn)為檢驗結(jié)果就可以認(rèn)為檢驗結(jié)果“不顯著不顯著”。 統(tǒng)計推斷的注意事項統(tǒng)計推斷的注意事項 n在進(jìn)行相關(guān)分析時,不能同時使用在進(jìn)行相關(guān)分析時,不能同時使用0.05 和和0.01這這2個顯著性水平來決定是否拒個顯著性水平來決定是否拒 絕原假設(shè),只能使用其中的絕原假設(shè)

42、,只能使用其中的1個。個。 有關(guān)相關(guān)分析的斷語有關(guān)相關(guān)分析的斷語 n1)顯著和不顯著:描述相關(guān)關(guān)系是否存在。 n2)相關(guān)性強或不強:在存在相關(guān)關(guān)系的前提 下,這種相關(guān)關(guān)系的強或弱??梢哉J(rèn)為,相 關(guān)系數(shù)越接近1,則相關(guān)性越強。 n聲明:第聲明:第1 1)條是公認(rèn)的數(shù)理統(tǒng)計常識,但第)條是公認(rèn)的數(shù)理統(tǒng)計常識,但第2 2)條是個人理)條是個人理 解,僅供參考。本文不對第解,僅供參考。本文不對第2 2)條承擔(dān)責(zé)任。)條承擔(dān)責(zé)任。 5 重要的數(shù)理統(tǒng)計學(xué)常識 n1)假設(shè)檢驗 n統(tǒng)計推斷:單側(cè)檢驗與雙側(cè)檢驗 n對于假設(shè)檢驗,其檢驗統(tǒng)計量的異常取值有 2個方向,即概率分布曲線的左側(cè)(對應(yīng)于 過小的值)和右側(cè)(

43、對應(yīng)于過大的值)。 檢驗統(tǒng)計量的極端取值 n檢驗統(tǒng)計量在左側(cè)和右側(cè)均有可能取值 檢驗統(tǒng)計量的取值空間 單側(cè)檢驗與雙側(cè)檢驗 n一般情況下,概率分布函數(shù)曲線兩側(cè)尾端的小概率事件都要考慮(即一般情況下,概率分布函數(shù)曲線兩側(cè)尾端的小概率事件都要考慮(即 雙側(cè)檢驗)。如果事先有把握確定其中的一側(cè)不可能取值,則僅需對雙側(cè)檢驗)。如果事先有把握確定其中的一側(cè)不可能取值,則僅需對 另一側(cè)的小概率事件進(jìn)行檢驗即可(單側(cè)檢驗)。另一側(cè)的小概率事件進(jìn)行檢驗即可(單側(cè)檢驗)。 n在用在用 “查表法查表法”進(jìn)行統(tǒng)計推斷時,基于單側(cè)小概率事件檢驗的臨界值進(jìn)行統(tǒng)計推斷時,基于單側(cè)小概率事件檢驗的臨界值 表稱表稱“單尾表單尾

44、表”,基于雙側(cè)小概率事件檢驗的臨界值表稱,基于雙側(cè)小概率事件檢驗的臨界值表稱“雙尾表雙尾表”。 除除t-t-分布臨界值表是雙尾表外,大多數(shù)的檢驗臨界值表均為單尾表分布臨界值表是雙尾表外,大多數(shù)的檢驗臨界值表均為單尾表。 n在顯著性水平一定的情況下(例如在顯著性水平一定的情況下(例如 =0.05 =0.05),對于單尾表,單側(cè)檢),對于單尾表,單側(cè)檢 驗時仍使用驗時仍使用進(jìn)行統(tǒng)計推斷,雙側(cè)檢驗則用進(jìn)行統(tǒng)計推斷,雙側(cè)檢驗則用 /2 /2進(jìn)行統(tǒng)計推斷;對于進(jìn)行統(tǒng)計推斷;對于 雙尾表,單側(cè)檢驗時改用雙尾表,單側(cè)檢驗時改用2 2進(jìn)行統(tǒng)計推斷,雙側(cè)檢驗則用進(jìn)行統(tǒng)計推斷,雙側(cè)檢驗則用 進(jìn)行統(tǒng)進(jìn)行統(tǒng) 計推斷。

45、計推斷。 n在統(tǒng)計軟件(如在統(tǒng)計軟件(如SPSS或或SAS統(tǒng)計軟件)給出的計算結(jié)果中,已標(biāo)注出統(tǒng)計軟件)給出的計算結(jié)果中,已標(biāo)注出 所計算的相伴概率是單側(cè)還是雙側(cè),對應(yīng)于上述的單尾表和雙尾表。所計算的相伴概率是單側(cè)還是雙側(cè),對應(yīng)于上述的單尾表和雙尾表。 單側(cè)檢驗與雙側(cè)檢驗 n以下是以下是SPSS 中的單樣本中的單樣本t檢驗輸出結(jié)果:檢驗輸出結(jié)果: nOne-Sample Test(原假設(shè):儲戶1次平均存取的現(xiàn)金與2000元無顯著差異) nTest Value=2000(均值比較的參比值) nt=1.240(檢驗統(tǒng)計量的觀測值) ndf=312(自由度,樣本量N=313) nSig.(2-tailed)=0.216(雙側(cè)相伴概率p ) nMean Difference=473.78(均值的標(biāo)準(zhǔn)誤差) n95% Confidence Interval of the Difference(總體均值與原假設(shè)值之差的95% 的置信區(qū)間):-278.131225.69(有95%的把握可認(rèn)為:儲戶1次平均存取的 金額為1721.873225.69元) n上述檢驗屬 “均值比較”,是雙側(cè)檢驗

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論