




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、數(shù)據(jù)分析中數(shù)理統(tǒng)計方法的正確使用重要假定作者所處理的數(shù)據(jù)屬于隨機變量的特定樣本。作者已經(jīng)掌握最基本的數(shù)理統(tǒng)計學(xué)常識,如概率、假設(shè)檢驗、均值、方差、標(biāo)準(zhǔn)差、正態(tài)分布、相關(guān)分析、回歸分析、方差分析。數(shù)理統(tǒng)計問題的重要性在科學(xué)研究中,經(jīng)常會涉及到對隨機變量大小、離散及分布特征的描述以及對2個或多個隨機變量之間的關(guān)系描述問題。地學(xué)、環(huán)境科學(xué)研究也不例外。對隨機變量及隨機變量之間的關(guān)系進(jìn)行定量描述的數(shù)學(xué)工具就是數(shù)理統(tǒng)計學(xué)。在科學(xué)研究中,能否正確使用各種數(shù)理統(tǒng)計方法關(guān)系到所得出結(jié)論的客觀性和可信性。所以,來稿中使用的數(shù)理統(tǒng)計方法是否正確應(yīng)是學(xué)術(shù)期刊編輯們極為重視的問題。目前,國內(nèi)環(huán)境科學(xué)與技術(shù)類學(xué)術(shù)期刊對
2、稿件中數(shù)理統(tǒng)計方法問題的重視程度存在差異。 1 統(tǒng)計軟件的選擇 統(tǒng)計分析通常涉及大量的數(shù)據(jù),需要較大的計算工作量。在進(jìn)行統(tǒng)計分析時,盡管作者可以自行編寫計算程序,但在統(tǒng)計軟件很普及的今天,這樣做是毫無必要的。出于對工作效率以及對算法的通用性、可比性的考慮,一些學(xué)術(shù)期刊要求作者采用專門的數(shù)理統(tǒng)計軟件進(jìn)行統(tǒng)計分析。 1 統(tǒng)計軟件的選擇環(huán)境科學(xué)學(xué)報的編輯們在處理稿件時經(jīng)常發(fā)現(xiàn)的問題是:作者未使用專門的數(shù)理統(tǒng)計軟件,而采用Excel這樣的電子表格軟件進(jìn)行數(shù)據(jù)統(tǒng)計分析。由于電子表格軟件提供的統(tǒng)計分析功能十分有限,只能借助它進(jìn)行較為簡單的統(tǒng)計分析,故我們不主張作者采用這樣的軟件進(jìn)行統(tǒng)計分析。 1 統(tǒng)計軟件
3、的選擇目前,國際上已開發(fā)出的專門用于統(tǒng)計分析的商業(yè)軟件很多,比較著名有SPSS(Statistical Package for Social Sciences)和SAS(Statistical Analysis System)。此外,還有BMDP和STATISTICA等。SPSS是專門為社會科學(xué)領(lǐng)域的研究者設(shè)計的,但此軟件在自然科學(xué)領(lǐng)域也得到廣泛應(yīng)用。BMDP是專門為生物學(xué)和醫(yī)學(xué)領(lǐng)域研究者編制的統(tǒng)計軟件。 1 統(tǒng)計軟件的選擇目前,國際學(xué)術(shù)界有一條不成文的約定:凡是用SPSS和SAS軟件進(jìn)行統(tǒng)計分析所獲得的結(jié)果,在國際學(xué)術(shù)交流中不必說明具體算法。由此可見,SPSS和SAS軟件已被各領(lǐng)域研究者普遍
4、認(rèn)可。我們建議作者們在進(jìn)行統(tǒng)計分析時盡量使用這2個專門的統(tǒng)計軟件。目前,有關(guān)這2個軟件的使用教程在書店中可很容易地買到。 2 均值的計算 :理論問題均值(準(zhǔn)確的稱呼應(yīng)為“樣本均值”)的統(tǒng)計學(xué)意義:反映隨機變量樣本的大小特征。均值對應(yīng)于隨機變量總體的數(shù)學(xué)期望總體的數(shù)學(xué)期望客觀上決定著樣本的均值,反過來,通過計算樣本的均值可以描述總體的數(shù)學(xué)期望。在處理實驗數(shù)據(jù)或采樣數(shù)據(jù)時,經(jīng)常會遇到對相同采樣或相同實驗條件下同一隨機變量的多個不同取值進(jìn)行統(tǒng)計處理的問題。為找到代表這些觀測值總體大小特征的代表值(統(tǒng)計量,該統(tǒng)計量根據(jù)樣本數(shù)據(jù)算出),多數(shù)作者會不假思索地直接給出算術(shù)平均值和標(biāo)準(zhǔn)差。顯然,這種做法是不嚴(yán)
5、謹(jǐn)?shù)牟灰欢偸钦_的。2 均值的計算:技術(shù)問題在數(shù)理統(tǒng)計學(xué)中,作為描述隨機變量樣本的總體大小特征的統(tǒng)計量有算術(shù)平均值、幾何平均值和中位數(shù)等多個。何時用算術(shù)平均值?何時用幾何平均值?以及何時用中位數(shù)?這不能由研究者根據(jù)主觀意愿隨意確定,而要根據(jù)隨機變量的分布特征確定。 2 均值的計算:技術(shù)問題反映隨機變量總體大小特征的統(tǒng)計量是數(shù)學(xué)期望,而在隨機變量的分布服從正態(tài)分布時,其數(shù)學(xué)期望就可以用樣本的算術(shù)平均值描述。此時,可用樣本的算術(shù)平均值描述隨機變量的大小特征。如果所研究的隨機變量不服從正態(tài)分布,則算術(shù)平均值不能準(zhǔn)確反映該變量的大小特征。在這種情況下,可通過假設(shè)檢驗來判斷隨機變量是否服從對數(shù)正態(tài)分布
6、。如果服從對數(shù)正態(tài)分布,則幾何平均值就是數(shù)學(xué)期望的值。此時,就可以計算變量的幾何平均值。如果隨機變量既不服從正態(tài)分布也不服從對數(shù)正態(tài)分布,則按現(xiàn)有的數(shù)理統(tǒng)計學(xué)知識,尚無合適的統(tǒng)計量描述該變量的大小特征。此時,可用中位數(shù)來描述變量的大小特征。 3 相關(guān)分析:相關(guān)系數(shù)的選擇 在相關(guān)分析中,作者們常犯的錯誤是:簡單地計算Pearson 積矩相關(guān)系數(shù),而且既不給出正態(tài)分布檢驗結(jié)果,也往往不明確指出所計算的相關(guān)系數(shù)就是Pearson 積矩相關(guān)系數(shù)。在數(shù)理統(tǒng)計學(xué)中,除有針對數(shù)值變量設(shè)計的Pearson 積矩相關(guān)系數(shù)(對應(yīng)于 “參數(shù)方法”)外,還有針對順序變量(即“秩變量”)設(shè)計的Spearman秩相關(guān)系數(shù)
7、和Kendall秩相關(guān)系數(shù)(對應(yīng)于 “非參數(shù)方法”)等。Pearson 積矩相關(guān)系數(shù)可用于描述2個隨機變量的線性相關(guān)程度,Spearman或Kendall秩相關(guān)系數(shù)用來判斷兩個隨機變量在二維和多維空間中是否具有某種共變趨勢。 3 相關(guān)分析:相關(guān)系數(shù)的選擇在相關(guān)分析中,計算各種相關(guān)系數(shù)是有前提條件的。在相關(guān)分析中,對于秩變量,一般別無選擇,只能計算Spearman或Kendall秩相關(guān)系數(shù)。對于數(shù)值變量,只要條件許可,應(yīng)盡量使用檢驗功效最高的參數(shù)方法,即計算用Pearson 積矩相關(guān)系數(shù)。只有計算Pearson 積矩相關(guān)系數(shù)的前提不存在時,才考慮退而求其次,計算專門為秩變量設(shè)計的Spearman
8、或Kendall秩相關(guān)系數(shù)(盡管這樣做會導(dǎo)致檢驗功效的降低)。 3 相關(guān)分析:相關(guān)系數(shù)的選擇對于數(shù)值變量,相關(guān)系數(shù)選擇的依據(jù)是變量是否服從正態(tài)分布,或變換后的數(shù)據(jù)是否服從正態(tài)分布。對于二元相關(guān)分析,如果2個隨機變量服從二元正態(tài)分布假設(shè),則應(yīng)該用Pearson 積矩相關(guān)系數(shù)描述這2個隨機變量間的相關(guān)關(guān)系。如果樣本數(shù)據(jù)不服從二元正態(tài)分布,則可嘗試進(jìn)行數(shù)據(jù)變換,看變換后的數(shù)據(jù)是否符合正態(tài)分布?如果是,則可以針對變換后的數(shù)據(jù)計算Pearson 積矩相關(guān)系數(shù);否則,就不能計算Pearson 積矩相關(guān)系數(shù),而應(yīng)改用檢驗功效較低的Spearman或Kendall秩相關(guān)系數(shù)(此時,如果強行計算Pearson
9、積矩相關(guān)系數(shù)有可能會得出完全錯誤的結(jié)論)。4 相關(guān)分析與回歸分析的區(qū)別 相關(guān)分析和回歸分析是極為常用的2種數(shù)理統(tǒng)計方法,在環(huán)境科學(xué)及其它科學(xué)研究領(lǐng)域有著廣泛的用途。然而,由于這2種數(shù)理統(tǒng)計方法在計算方面存在很多相似之處,且在一些數(shù)理統(tǒng)計教科書中沒有系統(tǒng)闡明這2種數(shù)理統(tǒng)計方法的內(nèi)在差別,從而使一些研究者不能嚴(yán)格區(qū)分相關(guān)分析與回歸分析 。4 相關(guān)分析與回歸分析的區(qū)別最常見的錯誤是:用回歸分析的結(jié)果解釋相關(guān)性問題。例如,作者將“回歸直線(曲線)圖”稱為“相關(guān)性圖”或“相關(guān)關(guān)系圖”;將回歸直線的R2(擬合度,或稱“可決系數(shù)”)錯誤地稱為“相關(guān)系數(shù)”或“相關(guān)系數(shù)的平方”;根據(jù)回歸分析的結(jié)果宣稱2個變量之
10、間存在正的或負(fù)的相關(guān)關(guān)系。 4 相關(guān)分析與回歸分析的區(qū)別相關(guān)分析與回歸分析均為研究2個或多個變量間關(guān)聯(lián)性的方法,但2種數(shù)理統(tǒng)計方法存在本質(zhì)的差別,即它們用于不同的研究目的。相關(guān)分析的目的在于檢驗兩個隨機變量的共變趨勢(即共同變化的程度),回歸分析的目的則在于試圖用自變量來預(yù)測因變量的值。 4 相關(guān)分析與回歸分析的區(qū)別在相關(guān)分析中,兩個變量必須同時都是隨機變量,如果其中的一個變量不是隨機變量,就不能進(jìn)行相關(guān)分析。這是相關(guān)分析方法本身所決定的。 4 相關(guān)分析與回歸分析的區(qū)別對于回歸分析,其中的因變量肯定為隨機變量(這是回歸分析方法本身所決定的),而自變量則可以是普通變量(有確定的取值)也可以是隨機
11、變量。 4 相關(guān)分析與回歸分析的區(qū)別如果自變量是普通變量,即模型回歸分析,采用的回歸方法就是最為常用的最小二乘法。如果自變量是隨機變量,即模型回歸分析,所采用的回歸方法與計算者的目的有關(guān)。在以預(yù)測為目的的情況下,仍采用“最小二乘法”(但精度下降最小二乘法是專為模型 設(shè)計的,未考慮自變量的隨機誤差);在以估值為目的(如計算可決系數(shù)、回歸系數(shù)等)的情況下,應(yīng)使用相對嚴(yán)謹(jǐn)?shù)姆椒ǎㄈ纭爸鬏S法”、“約化主軸法”或“Bartlett法” )。4 相關(guān)分析與回歸分析的區(qū)別顯然,對于回歸分析,如果是模型回歸分析,鑒于兩個隨機變量客觀上存在“相關(guān)性”問題,只是由于回歸分析方法本身不能提供針對自變量和因變量之間相
12、關(guān)關(guān)系的準(zhǔn)確的檢驗手段,因此,若以預(yù)測為目的,最好不提“相關(guān)性”問題;若以探索兩者的“共變趨勢”為目的,應(yīng)該改用相關(guān)分析。如果是模型回歸分析,就根本不可能回答變量的“相關(guān)性”問題,因為普通變量與隨機變量之間不存在“相關(guān)性”這一概念(問題在于,大多數(shù)的回歸分析都是模型回歸分析!)。此時,即使作者想描述2個變量間的“共變趨勢”而改用相關(guān)分析,也會因相關(guān)分析的前提不存在而使分析結(jié)果毫無意義。4 相關(guān)分析與回歸分析的區(qū)別需要特別指出的是,回歸分析中的R2在數(shù)學(xué)上恰好是Pearson積矩相關(guān)系數(shù)r的平方。因此,這極易使作者們錯誤地理解R2的含義,認(rèn)為R2就是 “相關(guān)系數(shù)”或“相關(guān)系數(shù)的平方”。問題在于,
13、對于自變量是普通變量(即其取值有確定性的變量)、因變量為隨機變量的模型回歸分析,2個變量之間的“相關(guān)性”概念根本不存在,又何談“相關(guān)系數(shù)”呢?更值得注意的是,一些早期的教科書作者不是用R2來描述回歸效果(擬合程度,擬合度)的,而是用Pearson積矩相關(guān)系數(shù)來描述。這就更容易誤導(dǎo)讀者。5 重要的數(shù)理統(tǒng)計學(xué)常識1)假設(shè)檢驗假設(shè)檢驗的基本思想統(tǒng)計推斷:是根據(jù)樣本數(shù)據(jù)推斷總體特征的一種方法。假設(shè)檢驗:是進(jìn)行統(tǒng)計推斷的途徑之一(另一種途徑是參數(shù)估計,如點估計和區(qū)間估計)。假設(shè)檢驗的基本思路是:首先,對總體參數(shù)值提出假設(shè)(原假設(shè));然后,利用樣本數(shù)據(jù)提供的信息來驗證所提出的假設(shè)是否成立(統(tǒng)計推斷)-如果
14、樣本數(shù)據(jù)提供的信息不能證明上述假設(shè)成立,則應(yīng)拒絕該假設(shè);如果樣本數(shù)據(jù)提供的信息不能證明上述假設(shè)不成立,則不應(yīng)拒絕該假設(shè)。接受或拒絕原假設(shè)的依據(jù):小概率事件不可能發(fā)生。顯然,這樣做是有風(fēng)險的(小概率事件真的發(fā)生了)。假設(shè)檢驗中的關(guān)鍵問題:1)在原假設(shè)成立的情況下,如何計算樣本值或某一極端值發(fā)生的概率?2)如何界定小概率事件?5 重要的數(shù)理統(tǒng)計學(xué)常識1)假設(shè)檢驗假設(shè)檢驗的基本步驟1)提出原假設(shè)(或稱“零假設(shè)”,H0);2)選擇檢驗統(tǒng)計量;3)根據(jù)樣本數(shù)據(jù)計算檢驗統(tǒng)計量觀測值的發(fā)生概率(相伴概率,p);4)根據(jù)給定的小概率事件界定標(biāo)準(zhǔn)(顯著性水平,如0.05,0.01)做出統(tǒng)計推斷。假設(shè)檢驗的基本步
15、驟為什么要設(shè)計并計算檢驗統(tǒng)計量?在假設(shè)檢驗中,樣本值(或更極端的取值)發(fā)生的概率不能直接通過樣本數(shù)據(jù)計算,而是通過計算檢驗統(tǒng)計量觀測值的發(fā)生概率而間接得到的。所設(shè)計的檢驗統(tǒng)計量一般服從或近似服從某種已知的理論分布(如t-分布、F-分布、卡方分布),易于估算其取值概率。對于不同的假設(shè)檢驗和不同的總體,會有不同的選擇檢驗統(tǒng)計量的理論和方法。假設(shè)檢驗的基本步驟計算檢驗統(tǒng)計量觀測值的發(fā)生概率在假定原假設(shè)成立的前提下,利用樣本數(shù)據(jù)計算檢驗統(tǒng)計量觀測值發(fā)生的概率(即p值,又稱“相伴概率”指該檢驗統(tǒng)計量在某個特定的極端區(qū)域在原假設(shè)成立時的概率)。該概率值間接地給出了在原假設(shè)成立的條件下樣本值(或更極端值)發(fā)
16、生的概率。假設(shè)檢驗的基本步驟進(jìn)行統(tǒng)計推斷依據(jù)預(yù)先確定的 “顯著性水平” (即值),如0.01或0.05,決定是否拒絕原假設(shè)。如果p值小于值,即認(rèn)為原假設(shè)成立時檢驗統(tǒng)計量觀測值的發(fā)生是小概率事件,則拒絕原假設(shè)。否則,就接受原假設(shè)。顯著性水平:概念與意義在假設(shè)檢驗中,顯著性水平(Significant level,用表示)的確定是假設(shè)檢驗中至關(guān)重要的問題。顯著性水平是在原假設(shè)成立時檢驗統(tǒng)計量的制落在某個極端區(qū)域的概率值。因此,如果取= 0.05,如果計算出的p值小于 ,則可認(rèn)為原假設(shè)是一個不可能發(fā)生的小概率事件。當(dāng)然,如果真的發(fā)生了,則犯錯誤的可能性為5%。顯然,顯著性水平反映了拒絕某一原假設(shè)時所
17、犯錯誤的可能性,或者說, 是指拒絕了事實上正確的原假設(shè)的概率。顯著性水平:通常的取值值一般在進(jìn)行假設(shè)檢驗前由研究者根據(jù)實際的需要確定。常用的取值是0.05或0.01。對于前者,相當(dāng)于在原假設(shè)事實上正確的情況下,研究者接受這一假設(shè)的可能性為95%;對于后者,則研究者接受事實上正確的原假設(shè)的可能性為99%。顯然,降低值可以減少拒絕原假設(shè)的可能性。因此,在報告統(tǒng)計分析結(jié)果時,必須給出值。 顯著性水平:進(jìn)行統(tǒng)計推斷在進(jìn)行假設(shè)檢驗時,各種統(tǒng)計軟件均會給出檢驗統(tǒng)計量觀測值以及原假設(shè)成立時該檢驗統(tǒng)計量取值的相伴概率(即檢驗統(tǒng)計量某特定取值及更極端可能值出現(xiàn)的概率,用p表示)。p值是否小于事先確定的值,是接受
18、或拒絕原假設(shè)的依據(jù)。如果p值小于事先已確定的值,就意味著檢驗統(tǒng)計量取值的可能性很小,進(jìn)而可推斷原假設(shè)成立的可能性很小,因而可以拒絕原假設(shè)。相反,如果p值大于事先已確定的值,就不能拒絕原假設(shè)。 統(tǒng)計推斷:過去的回憶在計算機技術(shù)十分發(fā)達(dá),以及專業(yè)統(tǒng)計軟件功能十分強大的今天,計算檢驗統(tǒng)計量及其相伴概率是一件十分容易的事情。然而,在20世紀(jì)90年代以前,只有服從標(biāo)準(zhǔn)正態(tài)分布的檢驗統(tǒng)計量,人們可以直接查閱事先準(zhǔn)備好的標(biāo)準(zhǔn)正態(tài)分布函數(shù)表,從中獲得特定計算結(jié)果的相伴概率。而對于的服從t-分布、F-分布、卡方分布或其它特殊的理論分布的檢驗統(tǒng)計量(大多數(shù)的假設(shè)檢驗是這樣),人們無法直接計算相伴概率。人們通常查閱
19、各類假設(shè)檢驗的臨界值表進(jìn)行統(tǒng)計推斷。這些表格以自由度和很少的幾個相伴概率(通常為0.1、0.05和0.01)為自變量,以檢驗統(tǒng)計量的臨界值為函數(shù)排列。在進(jìn)行統(tǒng)計推斷時,人們使用上述臨界值表根據(jù)事先確定的顯著性水平,查閱對應(yīng)于某一自由度和特定相伴概率的檢驗統(tǒng)計量的臨界值,然后將所計算出的檢驗統(tǒng)計量與該臨界值相比較。如果檢驗統(tǒng)計量的計算值大于臨界值,即實際的相伴概率小于事先規(guī)定的顯著性水平,便可拒絕原假設(shè)。否則,可接受原假設(shè)。顯著性水平:舉例在根據(jù)顯著性水平進(jìn)行統(tǒng)計推斷時,應(yīng)注意原假設(shè)的性質(zhì)。以二元相關(guān)分析為例,相關(guān)分析中的原假設(shè)是“相關(guān)系數(shù)為零”(即2個隨機變量間不存在顯著的相關(guān)關(guān)系)。如果計算
20、出的檢驗統(tǒng)計量的相伴概率(p值)低于事先給定值(如0.05),就可以認(rèn)為“相關(guān)系數(shù)為零”的可能性很低, 既2個隨機變量之間存在顯著的相關(guān)關(guān)系。在正態(tài)分布檢驗時,原假設(shè)是“樣本數(shù)據(jù)來自服從正態(tài)分布的總體”。此時,如果計算出的檢驗統(tǒng)計量的相伴概率(p值)低于事先給定值(如0.05),則表明數(shù)據(jù)不服從正態(tài)分布。只有p值高于值時,數(shù)據(jù)才服從正態(tài)分布。這與相關(guān)分析的假設(shè)檢驗不同。顯著性水平作者在描述相關(guān)分析結(jié)果時常有的失誤是:僅給出相關(guān)系數(shù)的值,而不給出顯著性水平。這就無法判斷2個隨機變量間的相關(guān)性是否顯著。有時作者不是根據(jù)顯著性水平判斷相關(guān)關(guān)系是否顯著,而是根據(jù)相關(guān)系數(shù)的大小來推斷(相關(guān)系數(shù)越近1,則
21、相關(guān)關(guān)系越顯著)。問題是,相關(guān)系數(shù)本身是一個基于樣本數(shù)據(jù)計算出的觀測值,其本身的可靠性尚需檢驗。此外,作者在論文中常常用“顯著相關(guān)”和“極顯著相關(guān)”來描述相關(guān)分析結(jié)果,即認(rèn)為p值小于0.05就是顯著相關(guān)關(guān)系(或顯著相關(guān)),小于0.01就是極顯著相關(guān)關(guān)系(或極顯著相關(guān))。 統(tǒng)計推斷的注意事項在假設(shè)檢驗中,只有 “顯著”和 “不顯著”,沒有“極顯著”這樣的斷語。只要計算出的檢驗統(tǒng)計量的相伴概率(p值)低于事先確定的值,就可以認(rèn)為檢驗結(jié)果“顯著”(相關(guān)分析的原假設(shè)是“相關(guān)系數(shù)為零”,故此處的“顯著”實際意味著“相關(guān)系數(shù)不為零”,或說“2個隨機變量間有顯著的相關(guān)關(guān)系”);同樣,只要計算出的檢驗統(tǒng)計量的
22、相伴概率(p值)高于事先確定的值,就可以認(rèn)為檢驗結(jié)果“不顯著”。 統(tǒng)計推斷的注意事項在進(jìn)行相關(guān)分析時,不能同時使用0.05和0.01這2個顯著性水平來決定是否拒絕原假設(shè),只能使用其中的1個。 有關(guān)相關(guān)分析的斷語1)顯著和不顯著:描述相關(guān)關(guān)系是否存在。2)相關(guān)性強或不強:在存在相關(guān)關(guān)系的前提下,這種相關(guān)關(guān)系的強或弱??梢哉J(rèn)為,相關(guān)系數(shù)越接近1,則相關(guān)性越強。聲明:第1)條是公認(rèn)的數(shù)理統(tǒng)計常識,但第2)條是個人理解,僅供參考。本文不對第2)條承擔(dān)責(zé)任。5 重要的數(shù)理統(tǒng)計學(xué)常識1)假設(shè)檢驗統(tǒng)計推斷:單側(cè)檢驗與雙側(cè)檢驗對于假設(shè)檢驗,其檢驗統(tǒng)計量的異常取值有2個方向,即概率分布曲線的左側(cè)(對應(yīng)于過小的值
23、)和右側(cè)(對應(yīng)于過大的值)。檢驗統(tǒng)計量的極端取值檢驗統(tǒng)計量在左側(cè)和右側(cè)均有可能取值檢驗統(tǒng)計量的取值空間單側(cè)檢驗與雙側(cè)檢驗一般情況下,概率分布函數(shù)曲線兩側(cè)尾端的小概率事件都要考慮(即雙側(cè)檢驗)。如果事先有把握確定其中的一側(cè)不可能取值,則僅需對另一側(cè)的小概率事件進(jìn)行檢驗即可(單側(cè)檢驗)。在用 “查表法”進(jìn)行統(tǒng)計推斷時,基于單側(cè)小概率事件檢驗的臨界值表稱“單尾表”,基于雙側(cè)小概率事件檢驗的臨界值表稱“雙尾表”。除t-分布臨界值表是雙尾表外,大多數(shù)的檢驗臨界值表均為單尾表。在顯著性水平一定的情況下(例如 =0.05),對于單尾表,單側(cè)檢驗時仍使用進(jìn)行統(tǒng)計推斷,雙側(cè)檢驗則用 /2進(jìn)行統(tǒng)計推斷;對于雙尾表
24、,單側(cè)檢驗時改用2進(jìn)行統(tǒng)計推斷,雙側(cè)檢驗則用 進(jìn)行統(tǒng)計推斷。在統(tǒng)計軟件(如SPSS或SAS統(tǒng)計軟件)給出的計算結(jié)果中,已標(biāo)注出所計算的相伴概率是單側(cè)還是雙側(cè),對應(yīng)于上述的單尾表和雙尾表。單側(cè)檢驗與雙側(cè)檢驗以下是SPSS 中的單樣本t檢驗輸出結(jié)果:One-Sample Test(原假設(shè):儲戶1次平均存取的現(xiàn)金與2000元無顯著差異)Test Value=2000(均值比較的參比值)t=1.240(檢驗統(tǒng)計量的觀測值)df=312(自由度,樣本量N=313)Sig.(2-tailed)=0.216(雙側(cè)相伴概率p )Mean Difference=473.78(均值的標(biāo)準(zhǔn)誤差)95% Confid
25、ence Interval of the Difference(總體均值與原假設(shè)值之差的95%的置信區(qū)間):-278.131225.69(有95%的把握可認(rèn)為:儲戶1次平均存取的金額為1721.873225.69元)上述檢驗屬 “均值比較”,是雙側(cè)檢驗(大于或小于2000元都算拒絕原假設(shè)),計算的相伴概率也是雙側(cè)的。因此,可直接用p與比較。取=0.05,則因p大于,故不能拒絕原假設(shè)(不是小概率事件)。統(tǒng)計推斷結(jié)果:根據(jù)313個儲戶調(diào)查數(shù)據(jù),每個儲戶一次平均存取金額大體為2000元。單側(cè)檢驗與雙側(cè)檢驗在統(tǒng)計軟件中,可通過選擇Test of Significance選項來控制所輸出的相伴概率是單尾
26、(1 tailed)概率還是雙尾(2 tailed )概率。5 重要的數(shù)理統(tǒng)計學(xué)常識2)正態(tài)分布檢驗?zāi)康模簷z驗樣本是否來自正態(tài)分布的總體原假設(shè):樣本來自正態(tài)分布的總體分布檢驗只能使用非參數(shù)方法(只有分布形式已知時才能使用參數(shù)方法)。不同的統(tǒng)計軟件給出了不同的檢驗方法。正態(tài)分布檢驗在SAS中,提供了Shapiro-Wilk(適用于樣本量小于50的情形)檢驗法。此檢驗無單尾、雙尾之分。在SPSS中提供了卡方檢驗(Chi-Square Test)和單樣本的 Kolmogorov-Smirnov(柯爾莫哥洛夫-斯米爾諾夫,簡稱K-S)檢驗。后者比前者精確一些,建議采用。正態(tài)分布檢驗單樣本的 Kolmogorov-Smirnov(柯爾莫哥洛夫-斯米爾諾夫,簡稱K-S)檢驗屬于雙側(cè)檢驗,計算檢
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度解除勞動合同經(jīng)濟(jì)補償及社會保險銜接協(xié)議
- 二零二五年度能源互聯(lián)網(wǎng)合同管理制度及智能調(diào)度流程
- 二零二五年度鐵路運輸安全責(zé)任協(xié)議書
- 2025年度汽車維修店汽車美容裝潢業(yè)務(wù)轉(zhuǎn)讓合同
- 2025年度美甲店轉(zhuǎn)讓合同含店鋪裝修升級及開業(yè)慶典策劃
- 《睡谷的傳說》THE LEGEND OF SLEEPY HOLLOW小說英文原版電子版
- 2025年杭州駕??荚囏涍\從業(yè)資格證考試題庫
- 2025年新余道路運輸從業(yè)資格證考試內(nèi)容是什么
- 感謝領(lǐng)導(dǎo)發(fā)言稿
- 2025年宣城道路運輸從業(yè)人員資格考試內(nèi)容有哪些
- GB/T 20356-2006地理標(biāo)志產(chǎn)品廣昌白蓮
- AP微積分課件全版(無法編輯)
- 回轉(zhuǎn)窯基礎(chǔ)知識培訓(xùn)
- 學(xué)習(xí)空間大地測量應(yīng)具備的基礎(chǔ)知識
- 注冊安全工程師安全生產(chǎn)技術(shù)培訓(xùn)講義課件
- 美發(fā)店承包合同范本(2篇)
- 南方醫(yī)大內(nèi)科學(xué)教案04消化系統(tǒng)疾病-8炎癥性腸病
- 2023年蘇州健雄職業(yè)技術(shù)學(xué)院單招考試面試題庫及答案解析
- (完整版)標(biāo)書密封條格式word
- 五氟化銻的理化性質(zhì)及危險特性表
- 公司組織架構(gòu)圖(可編輯模版)
評論
0/150
提交評論