統(tǒng)計(jì)分析_P值的含義_第1頁(yè)
統(tǒng)計(jì)分析_P值的含義_第2頁(yè)
統(tǒng)計(jì)分析_P值的含義_第3頁(yè)
統(tǒng)計(jì)分析_P值的含義_第4頁(yè)
免費(fèi)預(yù)覽已結(jié)束,剩余1頁(yè)可下載查看

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、For personal use only in study and research; not for commercial useP 值是怎么來(lái)的從某總體中抽、這一樣本是由該總體抽出,其差別是由抽樣誤差所致;、這一樣本不是從該總體抽出,所以有所不同。如何判斷是那種原因呢?統(tǒng)計(jì)學(xué)中用顯著性檢驗(yàn)賴判斷。其步驟是:、建立檢驗(yàn)假設(shè)(又稱無(wú)效假設(shè) ,符號(hào)為H0 ):如要比較A 藥和 B 藥的療效是否相等,則假設(shè)兩組樣本來(lái)自同一總體,即A 藥的總體療效和B 藥相等,差別僅由抽樣誤差引起的碰巧出現(xiàn)的。、選擇適當(dāng)?shù)慕y(tǒng)計(jì)方法計(jì)算H0 成立的可能性即概率有多大,概率用P 值表示。、根據(jù)選定的顯著性水平(0.0

2、5 或 0.01),決定接受還是拒絕H0 。如果P 0.05 ,不能否定“差別由抽樣誤差引起”,則接受H0 ;如果 P 0.05 或 P 0.01,可以認(rèn)為差別不由抽樣誤差引起,可以拒絕H0 ,則 可以接受令一種可能性的假設(shè)(又稱備選假設(shè),符號(hào)為H1 ),即兩樣本來(lái)自不同的總體,所以兩藥療效有差別。統(tǒng)計(jì)學(xué)上規(guī)定的P 值意義見(jiàn)下表P 值 碰巧的概率對(duì)無(wú)效假設(shè)統(tǒng)計(jì)意義P 0.05 碰巧出現(xiàn)的可能性大于5%不能否定無(wú)效假設(shè)兩組差別無(wú)顯著意義P 0.05 碰巧出現(xiàn)的可能性小于5%可以否定無(wú)效假設(shè)兩組差別有顯著意義P 0.01 碰巧出現(xiàn)的可能性小于1%可以否定無(wú)效假設(shè)兩者差別有非常顯著意義理解 P 值,

3、下述幾點(diǎn)必須注意: P 的意義不表示兩組差別的大小, P 反映兩組差別有無(wú)統(tǒng)計(jì)學(xué)意義,并不表示差別大小。因此,與對(duì)照組相比, C 藥取得 P 0.05, D 藥取得 P 0.01 并不表示 D 的藥效比 C 強(qiáng)。 P 0.05 時(shí),差異無(wú)顯著意義,根據(jù)統(tǒng)計(jì)學(xué)原理可知,不能否認(rèn)無(wú)效假設(shè),但并不認(rèn)為無(wú)效假設(shè)肯定成立。在藥效統(tǒng)計(jì)分析中,更不表示兩藥等效。哪種將“兩組差別無(wú)顯著意義”與 “兩組基本等效”相同的做法是缺乏統(tǒng)計(jì)學(xué)依據(jù)的。統(tǒng)計(jì)學(xué)主要用上述三種P 值表示,也可以計(jì)算出確切的P 值,有人用P 0.001,無(wú)此必要。顯著性檢驗(yàn)只是統(tǒng)計(jì)結(jié)論。判斷差別還要根據(jù)專業(yè)知識(shí)。樣所得的樣本,其統(tǒng)計(jì)量會(huì)與總體參

4、數(shù)有所不同,這可能是由于兩種原因P 值是最常用的一個(gè)統(tǒng)計(jì)學(xué)指標(biāo),幾乎統(tǒng)計(jì)軟件輸出結(jié)果都有P 值。了解p 值的由來(lái)、計(jì)算和意義很有必要。統(tǒng)計(jì)學(xué)意義(p 值)(這是經(jīng)理每次爭(zhēng)論的焦點(diǎn))結(jié)果的統(tǒng)計(jì)學(xué)意義是結(jié)果真實(shí)程度(能夠代表總體)的一種估計(jì)方法。專業(yè)上,p 值為結(jié)果可信程度的一個(gè)遞減指標(biāo),p 值越大,我們?cè)讲荒苷J(rèn)為樣本中變量的關(guān)聯(lián)是總體中各變量關(guān)聯(lián)的可靠指標(biāo)。p 值是將觀察結(jié)果認(rèn)為有效即具有總體代表性的犯錯(cuò)概率。如p=0.05提示樣本中變量關(guān)聯(lián)有5% 的可能是由于偶然性造成的。即假設(shè)總體中任意變量間均無(wú)關(guān)聯(lián),我們重復(fù)類似實(shí)驗(yàn),會(huì)發(fā)現(xiàn)約20 個(gè)實(shí)驗(yàn)中有一個(gè)實(shí)驗(yàn),我們所研究的變量關(guān)聯(lián)將等于或強(qiáng)于我們的

5、實(shí)驗(yàn)結(jié)果。(這并不是說(shuō)如果變量間存在關(guān)聯(lián),我們可得到5% 或 95% 次數(shù)的相同結(jié)果,當(dāng)總體中的變量存在關(guān)聯(lián),重復(fù)研究和發(fā)現(xiàn)關(guān)聯(lián)的可能性與設(shè)計(jì)的統(tǒng)計(jì)學(xué)效力有關(guān)。)在許多研究領(lǐng)域, 0.05 的 p 值通常被認(rèn)為是可接受錯(cuò)誤的邊界水平。如何判定結(jié)果具有真實(shí)的顯著性在最后結(jié)論中判斷什么樣的顯著性水平具有統(tǒng)計(jì)學(xué)意義,不可避免地帶有武斷性。換句話說(shuō),認(rèn)為結(jié)果無(wú)效而被拒絕接受的水平的選擇具有武斷性。實(shí)踐中,最后的決定通常依賴于數(shù)據(jù)集比較和分析過(guò)程中結(jié)果是先驗(yàn)性還是僅僅為均數(shù)之間的兩兩> 比較,依賴于總體數(shù)據(jù)集里結(jié)論一致的支持性證據(jù)的數(shù)量,依賴于以往該研究領(lǐng)域的慣例。通常,許多的科學(xué)領(lǐng)域中產(chǎn)生p 值

6、的結(jié)果 0.05 被認(rèn)為是統(tǒng)計(jì)學(xué)意義的邊界線,但是這顯著性水平還包含了相當(dāng)高的犯錯(cuò)可能性。結(jié)果0.05 p>0.01 被認(rèn)為是具有統(tǒng)計(jì)學(xué)意義,而0.01 p0.001 被認(rèn)為具有高度統(tǒng)計(jì)學(xué)意義。但要注意這種分類僅僅是研究基礎(chǔ)上非正規(guī)的判斷常規(guī)。所有的檢驗(yàn)統(tǒng)計(jì)都是正態(tài)分布的嗎?并不完全如此,但大多數(shù)檢驗(yàn)都直接或間接與之有關(guān),可以從正態(tài)分布中推導(dǎo)出來(lái),如t 檢驗(yàn)、 f 檢驗(yàn)或卡方檢驗(yàn)。這些檢驗(yàn)一般都要求:所分析變量在總體中呈正態(tài)分布,即滿足所謂的正態(tài)假設(shè)。許多觀察變量的確是呈正態(tài)分布的,這也是正態(tài)分布是現(xiàn)實(shí)世界的基本特征的原因。當(dāng)人們用在正態(tài)分布基礎(chǔ)上建立的檢驗(yàn)分析非正態(tài)分布變量的數(shù)據(jù)時(shí)問(wèn)題

7、就產(chǎn)生了,(參閱非參數(shù)和方差分析的正態(tài)性檢驗(yàn))。這種條件下有兩種方法:一是用替代的非參數(shù)檢驗(yàn)(即無(wú)分布性檢驗(yàn)),但這種方法不方便,因?yàn)閺乃峁┑慕Y(jié)論形式看,這種方法統(tǒng)計(jì)效率低下、不靈活。另一種方法是:當(dāng)確定樣本量足夠大的情況下,通常還是可以使用基于正態(tài)分布前提下的檢驗(yàn)。后一種方法是基于一個(gè)相當(dāng)重要的原則產(chǎn)生的,該原則對(duì)正態(tài)方程基礎(chǔ)上的總體檢驗(yàn)有極其重要的作用。即,隨著樣本量的增加,樣本分布形狀趨于正態(tài),即使所研究的變量分布并不呈正態(tài)。1 統(tǒng)計(jì)軟件的選擇在進(jìn)行統(tǒng)計(jì)分析時(shí),作者常使用非專門的數(shù)理統(tǒng)計(jì)軟件Excel進(jìn)行統(tǒng)計(jì)分析。由于Excel提供的統(tǒng)計(jì)分析功能十分有限,很難滿足實(shí)際需要。目前,國(guó)際

8、上已開(kāi)發(fā)出的專門用于統(tǒng)計(jì)分析的商業(yè)軟件很多,比較著名有SPSS(StatisticalPackageforSocialSciences)、 SAS(StatisticalAnalysisSystem)、 BMDP和STATISTICA 等。其中, SPSS 是專門為社會(huì)科學(xué)領(lǐng)域的研究者設(shè)計(jì)的(但是,此軟件在自然科學(xué)領(lǐng)域也得到廣泛應(yīng)用); BMDP 是專門為生物學(xué)和醫(yī)學(xué)領(lǐng)域研究者編制的統(tǒng)計(jì)軟件。目前,國(guó)際學(xué)術(shù)界有一條不成文的約定:凡是用SPSS 和 SAS 軟件進(jìn)行統(tǒng)計(jì)分析所獲得的結(jié)果,在國(guó)際學(xué)術(shù)交流中不必說(shuō)明具體算法。由此可見(jiàn),SPSS和 SAS軟件已被各領(lǐng)域研究者普遍認(rèn)可。建議作者們?cè)谶M(jìn)行統(tǒng)

9、計(jì)分析時(shí)盡量使用這2 個(gè)專門的統(tǒng)計(jì)軟件。2 均值的計(jì)算在處理實(shí)驗(yàn)數(shù)據(jù)或采樣數(shù)據(jù)時(shí),經(jīng)常會(huì)遇到對(duì)相同采樣或相同實(shí)驗(yàn)條件下同一隨機(jī)變量的多個(gè)不同取值進(jìn)行統(tǒng)計(jì)處理的問(wèn)題。此時(shí),多數(shù)作者會(huì)不假思索地直接給出算術(shù)平均值和標(biāo)準(zhǔn)差。顯然,這種做法是不嚴(yán)謹(jǐn)?shù)?。在?shù)理統(tǒng)計(jì)學(xué)中,作為描述隨機(jī)變量總體大小特征的統(tǒng)計(jì)量有算術(shù)平均值、幾何平均值和中位數(shù)等。何時(shí)用算術(shù)平均值?何時(shí)用幾何平均值?以及何時(shí)用中位數(shù)?這不能由研究者根據(jù)主觀意愿隨意確定,而要根據(jù)隨機(jī)變量的分布特征確定。反映隨機(jī)變量總體大小特征的統(tǒng)計(jì)量是數(shù)學(xué)期望,而在隨機(jī)變量的分布服從正態(tài)分布時(shí),其總體的數(shù)學(xué)期望就是其算術(shù)平均值。此時(shí),可用樣本的算術(shù)平均值描述隨機(jī)

10、變量的大小特征。如果所研究的隨機(jī)變量不服從正態(tài)分布,則算術(shù)平均值不能準(zhǔn)確反映該變量的大小特征。在這種情況下,可通過(guò)假設(shè)檢驗(yàn)來(lái)判斷隨機(jī)變量是否服從對(duì)數(shù)正態(tài)分布。如果服從對(duì)數(shù)正態(tài)分布,則可用幾何平均值描述該隨機(jī)變量總體的大小。此時(shí),就可以計(jì)算變量的幾何平均值。如果隨機(jī)變量既不服從正態(tài)分布也不服從對(duì)數(shù)正態(tài)分布,則按現(xiàn)有的數(shù)理統(tǒng)計(jì)學(xué)知識(shí),尚無(wú)合適的統(tǒng)計(jì)量描述該變量的大小特征。退而求其次,此時(shí)可用中位數(shù)來(lái)描述變量的大小特征。3 相關(guān)分析中相關(guān)系數(shù)的選擇在相關(guān)分析中,作者們常犯的錯(cuò)誤是簡(jiǎn)單地計(jì)算Pearson積矩相關(guān)系數(shù),而且既不給出正態(tài)分布檢驗(yàn)結(jié)果,也往往不明確指出所計(jì)算的相關(guān)系數(shù)就是Pearson 積

11、矩相關(guān)系數(shù)。常用的相關(guān)系數(shù)除有Pearson積矩相關(guān)系數(shù)外,還有 Spearman秩相關(guān)系數(shù)和Kendall秩相關(guān)系數(shù)等。其中,Pearson 積矩相關(guān)系數(shù)可用于描述2 個(gè)隨機(jī)變量的線性相關(guān)程度(相應(yīng)的相關(guān)分析方法稱為“參數(shù)相關(guān)分析 ”,該方法的檢驗(yàn)功效高,檢驗(yàn)結(jié)果明確); Spearman 或 Kendall 秩相關(guān)系數(shù)用來(lái)判斷兩個(gè)隨機(jī)變量在二維和多維空間中是否具有某種共變趨勢(shì),而不考慮其變化的幅度 (相應(yīng)的相關(guān)分析稱為“非參數(shù)相關(guān)分析” ,該方法的檢驗(yàn)功效較參數(shù)方法稍差,檢驗(yàn)結(jié)果也不如參數(shù)方法明確)。各種成熟的統(tǒng)計(jì)軟件如SPSS 、 SAS 等均提供了這些相關(guān)系數(shù)的計(jì)算模塊。在相關(guān)分析中,

12、計(jì)算各種相關(guān)系數(shù)是有前提的。對(duì)于二元相關(guān)分析,如果2 個(gè)隨機(jī)變量服從二元正態(tài)分布,或2個(gè)隨機(jī)變量經(jīng)數(shù)據(jù)變換后服從二元正態(tài)分布,則可以用 Pearson 積矩相關(guān)系數(shù)描述這2 個(gè)隨機(jī)變量間的相關(guān)關(guān)系(此時(shí)描述的是線性相關(guān)關(guān)系),而不宜選用功效較低的Spearman或 Kendall秩相關(guān)系數(shù)。如果樣本數(shù)據(jù)或其變換值不服從正態(tài)分布,則計(jì)算Pearson積矩相關(guān)系數(shù)就毫無(wú)意義。退而求其次,此時(shí)只能計(jì)算Spearman或Kendall 秩相關(guān)系數(shù)(盡管這樣做會(huì)導(dǎo)致檢驗(yàn)功效的降低)。因此,在報(bào)告相關(guān)分析結(jié)果時(shí),還應(yīng)提供正態(tài)分布檢驗(yàn)結(jié)果,以證明計(jì)算所選擇的相關(guān)系數(shù)是妥當(dāng)?shù)?。需要指出的是,由于Spearma

13、n 或 Kendall 秩相關(guān)系數(shù)是基于順序變量 (秩)設(shè)計(jì)的相關(guān)系數(shù) ,因此,如果所采集的數(shù)據(jù)不是確定的數(shù)值而僅僅是秩,則使用 Spearman或 Kendall 秩相關(guān)系數(shù)進(jìn)行非參數(shù)相關(guān)分析就成為唯一的選擇。4 相關(guān)分析與回歸分析的區(qū)別相關(guān)分析和回歸分析是極為常用的2 種數(shù)理統(tǒng)計(jì)方法,在地質(zhì)學(xué)研究領(lǐng)域有著廣泛的用途。然而,由于這 2 種數(shù)理統(tǒng)計(jì)方法在計(jì)算方面存在很多相似之處,且在一些數(shù)理統(tǒng)計(jì)教科書(shū)中沒(méi)有系統(tǒng)闡明這2 種數(shù)理統(tǒng)計(jì)方法的內(nèi)在差別,從而使一些研究者不能嚴(yán)格區(qū)分相關(guān)分析與回歸分析。最常見(jiàn)的錯(cuò)誤是,用回歸分析的結(jié)果解釋相關(guān)性問(wèn)題。例如,作者將“回歸直線(曲線)圖”稱為 “相關(guān)性圖 ”

14、或 “相關(guān)關(guān)系圖 ”;將回歸直線的R2( 擬合度,或稱 “可決系數(shù) ”)錯(cuò)誤地稱為 “相關(guān)系數(shù) ”或 “相關(guān)系數(shù)的平方”;根據(jù)回歸分析的結(jié)果宣稱2 個(gè)變量之間存在正的或負(fù)的相關(guān)關(guān)系。這些情況在國(guó)內(nèi)極為普遍。相關(guān)分析與回歸分析均為研究2 個(gè)或多個(gè)隨機(jī)變量間關(guān)聯(lián)性的方法,但2 種數(shù)理統(tǒng)計(jì)方法存在本質(zhì)的差別,即它們用于不同的研究目的。相關(guān)分析的目的在于檢驗(yàn)兩個(gè)隨機(jī)變量的共變趨勢(shì)(即共同變化的程度),回歸分析的目的則在于試圖用自變量來(lái)預(yù)測(cè)因變量的值。在相關(guān)分析中,兩個(gè)變量必須同時(shí)都是隨機(jī)變量,如果其中的一個(gè)變量不是隨機(jī)變量,就不能進(jìn)行相關(guān)分析。這是相關(guān)分析方法本身所決定的。對(duì)于回歸分析,其中的因變量肯

15、定為隨機(jī)變量 (這是回歸分析方法本身所決定的),而自變量則可以是普通變量 (規(guī)范的叫法是“固定變量 ”,有確定的取值)也可以是隨機(jī)變量。如果自變量是普通變量,采用的回歸方法就是最為常用的“最小二乘法 ”,即模型回歸分析;如果自變量是隨機(jī)變量,所采用的回歸方法與計(jì)算者的目的有關(guān)- 在以預(yù)測(cè)為目的的情況下,仍采用“最小二乘法 ”,在以估值為目的的情況下須使用相對(duì)嚴(yán)謹(jǐn)?shù)摹爸鬏S法 ”、 “約化主軸法 ”或“ Bartlett 法 ”,即模型回歸分析。顯然,對(duì)于回歸分析,如果是模型回歸分析,就根本不可能回答變量的“相關(guān)性 ”問(wèn)題,因?yàn)槠胀ㄗ兞颗c隨機(jī)變量之間不存在“相關(guān)性 ”這一概念 (問(wèn)題在于,大多數(shù)的

16、回歸分析都是模型回歸分析?。?。此時(shí),即使作者想描述2 個(gè)變量間的 “共變趨勢(shì) ”而改用相關(guān)分析,也會(huì)因相關(guān)分析的前提不存在而使分析結(jié)果毫無(wú)意義。如果是模型回歸分析,鑒于兩個(gè)隨機(jī)變量客觀上存在“相關(guān)性 ”問(wèn)題,但因回歸分析方法本身不能提供針對(duì)自變量和因變量之間相關(guān)關(guān)系的準(zhǔn)確的檢驗(yàn)手段,因此,若以預(yù)測(cè)為目的 ,最好不提 “相關(guān)性 ”問(wèn)題;若以探索兩者的“共變趨勢(shì) ”為目的,建議作者改用相關(guān)分析。需要特別指出的是,回歸分析中的R2 在數(shù)學(xué)上恰好是Pearson 積矩相關(guān)系數(shù) r 的平方。因此,這極易使作者們錯(cuò)誤地理解R2 的含義,認(rèn)為R2 就是 “相關(guān)系數(shù) ”或 “相關(guān)系數(shù)的平方”。問(wèn)題在于,對(duì)于自

17、變量是普通變量(即其取值具有確定性)、因變量為隨機(jī)變量的模型回歸分析,2 個(gè)變量之間的 “相關(guān)性 ”概念根本不存在,又何談 “相關(guān)系數(shù) ”呢?(說(shuō)明:二元回歸可決系數(shù)符號(hào)用小寫(xiě)r2 )僅供個(gè)人用于學(xué)習(xí)、研究;不得用于商業(yè)用途。For personal use only in study and research; not for commercial use.Nur f ü r den pers?nlichen fü r Studien, Forschung, zu kommerziellen Zwecken verwendet werden.Pour l 'é tude et la recherche uniquementdes finsàpersonnelles; pasà des fins commerciales. , .以下無(wú)正文僅供個(gè)人用于學(xué)習(xí)、研究;不得用于商業(yè)用途。For personal use o

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論