P值爭論對生物統(tǒng)計(jì)學(xué)課程教學(xué)的影響_第1頁
P值爭論對生物統(tǒng)計(jì)學(xué)課程教學(xué)的影響_第2頁
P值爭論對生物統(tǒng)計(jì)學(xué)課程教學(xué)的影響_第3頁
P值爭論對生物統(tǒng)計(jì)學(xué)課程教學(xué)的影響_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、L值爭論對生物統(tǒng)計(jì)學(xué)課程教學(xué)的影響摘 要 p值在當(dāng)前生物學(xué)數(shù)據(jù)的統(tǒng)計(jì)學(xué)分析所廣為接受的規(guī)范中處于核心位置,大多數(shù)的數(shù)據(jù)分析結(jié)果最終用 P值來體現(xiàn),并依此作出科學(xué)問題的推斷。然而,隨著對p值的誤解以及p值局限性討論的深入,特別是對于實(shí)驗(yàn) 結(jié)論可重復(fù)性的焦慮,引起了學(xué)術(shù)界對P值使用的激烈爭論。P值的誤用以及P值爭論的出現(xiàn)也從側(cè)面折射出在 大學(xué)和研究生教育中生物統(tǒng)計(jì)學(xué)課程教學(xué)存在的不足在簡要介紹P值爭論的基礎(chǔ)上,探討當(dāng)前P值爭論引起的 對生物統(tǒng)計(jì)學(xué)課程教學(xué)的一些反思和啟示。關(guān)鍵詞 P值;P值爭論;生物統(tǒng)計(jì)學(xué);教學(xué)(-value controversy and its impact on biosta

2、tistics teachingAbstract Currently,P-value is at the core position for statistical analysis of biological data,as scientific inferences are made usually based on P-values. However,with the deepening of discussion of misunderstanding and the limitations of P-values,especially the anxiety about the re

3、producibility and replicability of scientific conclusions in the scientific community,an intense debate about the use of P- values has been raised especially. The misuse of P-values and the emergence of controversy over P-values can partly demonstrate the inadequacies in teaching of biostatistics in

4、 colleges and graduate schools. After introducing P-value controversy,reflections and enlightenments on biostatistics teaching are focused on from the current P-value controversy.Key words P-value; P-value controversy; biostatistics; teaching統(tǒng)計(jì)學(xué)知識在不同領(lǐng)域都有廣泛應(yīng)用,在終生學(xué) 習(xí)的社會氛圍中,即使不是所有學(xué)生在以后的職業(yè)生 涯中都會頻繁用到統(tǒng)計(jì)學(xué)知

5、識,但對于統(tǒng)計(jì)學(xué)知識的 掌握也有助于他們理解和學(xué)習(xí)其他知識。因此,統(tǒng)計(jì) 學(xué)相關(guān)課程作為很多專業(yè)的基礎(chǔ)課程在高校中廣泛開 設(shè)。生命科學(xué)相關(guān)專業(yè)一般開設(shè)生物統(tǒng)計(jì)學(xué)等課程。 特別是在生命科學(xué)步入大數(shù)據(jù)時(shí)代,此門經(jīng)典課程的 重要性和實(shí)用性日益提升。統(tǒng)計(jì)學(xué)中P值概念的提出最早可以追溯到1900 年經(jīng)過不斷發(fā)展,一個(gè)多世紀(jì)以來已然成為統(tǒng)計(jì) 推斷中普遍依據(jù)的一個(gè)指標(biāo),這也部分得益于其依賴 的統(tǒng)計(jì)學(xué)模型相對簡單且學(xué)術(shù)界有普遍采用的“判斷 閾值”(如P 0.05) $研究發(fā)現(xiàn),P值的使用頻率遠(yuǎn)高 于置信區(qū)間等其他統(tǒng)計(jì)學(xué)指標(biāo),且在研究結(jié)果中報(bào)告P 值的科學(xué)論文比例仍呈上升趨勢3 %然而P值被大量 誤用甚至不合理地

6、作為統(tǒng)計(jì)推斷的唯一依據(jù)的情形亦 屢見不鮮,導(dǎo)致其在被廣為采用的同時(shí)也飽受爭議P值作為統(tǒng)計(jì)推斷的核心依據(jù),其概念也是生物 統(tǒng)計(jì)學(xué)課程教學(xué)的重點(diǎn)和難點(diǎn)然而P值的大量誤用 也促使我們在大學(xué)教育中對于統(tǒng)計(jì)學(xué)的教學(xué)作出反 思美國統(tǒng)計(jì)學(xué)會(ASA)在關(guān)于統(tǒng)計(jì)意義和P值的聲 明中描述了 George Cobb教授在ASA論壇上提出的兩 個(gè)問題以及所得到的令人深思的答案H %問題1:為什么在眾多高校中教授的P值判斷閾 值是0. 05?答案:因?yàn)閷W(xué)術(shù)界以及期刊的編輯們都是這樣使 用的%問題2:為什么大家仍在使用0. 05作為P值的判 斷閾值?答案:因?yàn)榇髮W(xué)課程是這樣教的上述問題所描述的“怪圈”折射出我們在相關(guān)課

7、 程教學(xué)中仍有亟待改進(jìn)的地方而關(guān)于P值的爭論在 生命科學(xué)領(lǐng)域的研究中尤為激烈,因此不能忽視其對 生物統(tǒng)計(jì)學(xué)課程教學(xué)的影響。1 P值爭論隨著自然等權(quán)威期刊的持續(xù)關(guān)注及討論用,學(xué) 術(shù)界爭論了一個(gè)多世紀(jì)的P值在近幾年討論更加廣泛 和深入。針對P值的爭論,ASA在2016年發(fā)表了關(guān)于 統(tǒng)計(jì)意義和P值的聲明旬,在學(xué)術(shù)界引起很大反響。 關(guān)于P值爭論的學(xué)術(shù)論文很多,觀點(diǎn)也不盡相同,這里 難以描述全面,只簡單介紹作者的一些理解。引起P值爭論的一個(gè)重要原因是過分強(qiáng)調(diào)P值甚 至錯(cuò)誤地使用和解釋P值,從而引發(fā)了學(xué)術(shù)界對相關(guān) 科學(xué)結(jié)論的可靠性和可重復(fù)性的擔(dān)憂。過分強(qiáng)調(diào)和依 賴P值,甚至以P值作為統(tǒng)計(jì)推斷的唯一依據(jù)而不

8、考 慮實(shí)驗(yàn)設(shè)計(jì)和數(shù)據(jù)收集過程以及其他統(tǒng)計(jì)學(xué)指標(biāo),這 顯然是片面的。特別是隨著“P 0.05”逐步成為學(xué) 術(shù)界默認(rèn)的“標(biāo)準(zhǔn)”,研究人員容易陷入“P值操縱” (P#iackmg)的陷阱7 %除了過分強(qiáng)調(diào)P值外,對于P 值常見的錯(cuò)誤使用和解釋也是引起學(xué)術(shù)界擔(dān)憂的重要 方面例如,當(dāng)P值大于設(shè)定的顯著水準(zhǔn)時(shí),可能會做 出零假設(shè)成立(即沒有顯著差異)的推斷,這是很多學(xué) 術(shù)論文中常見的因?qū)值的誤解而得出的不合理的科 學(xué)推論7 %弓I起P值爭論的另一重要原因可能是P值 或其依賴的統(tǒng)計(jì)學(xué)模型本身并非完美例如P值并不 是原假設(shè)成立的概率,正如ASA關(guān)于統(tǒng)計(jì)意義和P值 的聲明中的描述:P值本身并非一個(gè)對模型或假設(shè)

9、提 供證據(jù)度量的理想指標(biāo)H%另一方面,當(dāng)樣本容量增 大時(shí),理論上得到一個(gè)非常小的P值的可能性會大大 增加,進(jìn)而導(dǎo)致拒絕原假設(shè)的概率也會增加,此時(shí)P 值并不能算是一個(gè)十分有效的指標(biāo),這也是導(dǎo)致“P值 操縱”容易實(shí)現(xiàn)的重要原因關(guān)于P值的爭論仍在進(jìn)行,但是目前學(xué)術(shù)界普遍 接受和認(rèn)可的是,P值在當(dāng)前應(yīng)用于統(tǒng)計(jì)推斷中的作 用被過分放大甚至誤用是客觀存在的雖然存在完全 摒棄P值的意見國,但是多數(shù)學(xué)者仍認(rèn)可P值的作用 在沈c+,關(guān)于P值爭論的專刊(59卷5期)中,參與討論的學(xué)者幾乎一致地認(rèn)為P值作為基 本的統(tǒng)計(jì)推斷工具不應(yīng)該被摒棄9 %近期Nature發(fā)布 的一篇超過800位學(xué)者簽名支持的評論文章呼吁放棄

10、使用統(tǒng)計(jì)顯著性作為研究結(jié)果評估指標(biāo),但是也強(qiáng)調(diào) 并不是摒棄P值,并建議在報(bào)告P值時(shí)給出其精確值 而不是一個(gè)不等式(如P 0.8) ? ASA的 聲明中建議研究者公開所提出的全部假設(shè)、收集到的 數(shù)據(jù)、數(shù)據(jù)分析結(jié)果,P值結(jié)果,以及這些分析是如何 被選中用于報(bào)告的4 %事實(shí)上已經(jīng)有不少學(xué)術(shù)期刊正 在努力這樣做當(dāng)然報(bào)告確切的P值可以讓讀者或研 究者自己判斷結(jié)果提示的意義不失為另一種選擇回, 但是筆者認(rèn)為這似乎有為了避免錯(cuò)誤而將做出科學(xué)推 論的任務(wù)推給讀者的嫌疑由此可見,持續(xù)了一個(gè)多 世紀(jì)的P值爭論可能將繼續(xù)爭論下去2積極對待P值爭論對課程教學(xué)的影響P值作為假設(shè)檢驗(yàn)統(tǒng)計(jì)思想的核心,在生命科學(xué) 研究中應(yīng)用

11、尤為廣泛3 %使學(xué)生正確理解并合理使用 P值進(jìn)行生物學(xué)數(shù)據(jù)的分析是生物統(tǒng)計(jì)學(xué)課程的重要 教學(xué)目標(biāo)學(xué)術(shù)界關(guān)于P值的大討論不僅使得對P值 的理解以及正確使用越來越清晰,而且將P值爭論融 入教學(xué)對于幫助學(xué)生了解和掌握P值這一關(guān)鍵概念, 從而對提升生物統(tǒng)計(jì)學(xué)的課堂教學(xué)效果亦大有幫助 此外,學(xué)術(shù)界關(guān)于P值的爭論雖然持續(xù)多年,但是P值 爭論的最新動態(tài)也是該門課程教學(xué)中關(guān)于學(xué)科發(fā)展前 沿介紹無法回避的方面因此,應(yīng)該積極對待P值爭 論對此門課程教學(xué)的影響,并將P值爭論的相關(guān)觀點(diǎn) 和由此引發(fā)的教學(xué)方面的改革積極融入此門課程的教 學(xué)過程中%在前文提及的ASA的聲明中關(guān)于“為什么學(xué)校這 樣教是因?yàn)榇蠹叶际沁@么做的,

12、而為什么大家都這樣 做是因?yàn)閷W(xué)校是這樣教的”的“P值使用怪圈”4至少 給我們的教學(xué)提供兩個(gè)方面的反思:一方面,我們關(guān)于 P值的教學(xué)可能存在欠缺或者不當(dāng),比如對于P值的 概念講解不透徹,對其局限性以及常見使用誤區(qū)未加 以深入剖析等,以致同學(xué)們對P值的理解可能片面化, 在P值使用時(shí)缺乏靈活性甚至誤用;另一方面,當(dāng)前關(guān) 于P值的學(xué)校教育可能使同學(xué)們走出學(xué)校后繼續(xù)“機(jī) 械地”按課堂上所學(xué)知識使用P值,這可能也是導(dǎo)致 如今P值誤用和爭論的一個(gè)重要原因因此,正確、及 時(shí)地調(diào)整關(guān)于P值的學(xué)校教育可能是解鎖“P值使用 怪圈”的一個(gè)根本環(huán)節(jié),同時(shí)也會給關(guān)于P值的爭論 注入更多積極、理性的因素3對課程教學(xué)的建議3

13、. 1課堂教學(xué)中應(yīng)重點(diǎn)厘清P值的概念相對于專門的統(tǒng)計(jì)學(xué)教材,目前普遍采用的生物 統(tǒng)計(jì)學(xué)教材一般更偏重怎樣運(yùn)用統(tǒng)計(jì)學(xué)知識設(shè)計(jì)和解 決生物學(xué)問題,而對于統(tǒng)計(jì)學(xué)相關(guān)的原理和方法的描 述相對簡單然而生命科學(xué)相關(guān)專業(yè)鮮有在開設(shè)生物 統(tǒng)計(jì)學(xué)的同時(shí)開設(shè)專門的統(tǒng)計(jì)學(xué)課程因此,在課堂 教學(xué)中對于像P值這種不易被學(xué)生理解的關(guān)鍵概念應(yīng) 該避免按課本的簡短描述來簡單教學(xué)建議在介紹假 設(shè)檢驗(yàn)以及假設(shè)檢驗(yàn)的兩類錯(cuò)誤時(shí)應(yīng)詳細(xì)、客觀地介 紹P值的概念作者在教學(xué)過程中經(jīng)常發(fā)現(xiàn)學(xué)生們認(rèn)為P值是原 假設(shè)(null hypothesis)發(fā)生的概率,因而依此根據(jù)較小 的P值推斷原假設(shè)成立的可能性較小雖然按此邏輯 對最終的統(tǒng)計(jì)推斷結(jié)果

14、沒有影響,但這顯然不是對P 值概念的正確理解。關(guān)于P值的具體含義,可以理解 成從一個(gè)假設(shè)所規(guī)定的特定總體中隨機(jī)抽樣,得到的 統(tǒng)計(jì)量值(如$值等)與實(shí)際觀測數(shù)據(jù)的相同及更極端 (更大或更小)的概率4 %這個(gè)假設(shè)即無效假設(shè)或稱 為原假設(shè),顧名思義,它一般假設(shè)數(shù)據(jù)之間沒有差異, 或相關(guān)的效應(yīng)等不明顯與之對立的假設(shè)稱為備擇假 設(shè)(alternative hypothesis) o P值越小,即在原假設(shè)的前 提下得到現(xiàn)有樣本觀察結(jié)果的概率越小,則可以反推 出原假設(shè)成立的可能性越小為促進(jìn)學(xué)生深入理解P值,在介紹P值概念的同 時(shí)還應(yīng)該重點(diǎn)介紹顯著水準(zhǔn)的概念,以引導(dǎo)學(xué)生正確 看待和靈活使用計(jì)算得到的P值,這對

15、于解鎖當(dāng)前的 “P值使用怪圈”非常重要顯著水準(zhǔn)一般是人為設(shè)定 的一個(gè)是否拒絕原假設(shè)的P值的閾值,若計(jì)算得出的 P值小于設(shè)定的顯著性水準(zhǔn),則根據(jù)小概率反證法原 理,作出拒絕原假設(shè)的判斷需要指出的是,確定的顯 著性水準(zhǔn)不同,可能得到完全相反的結(jié)論因此,影響 做出差異是否具有統(tǒng)計(jì)學(xué)意義的統(tǒng)計(jì)推斷的因素除了 計(jì)算得到的P值外,還有事先確定的顯著性水準(zhǔn)的值 P值是一個(gè)概率值,依據(jù)P值不論作出是否拒絕原假 設(shè)的判斷都可能得到錯(cuò)誤的結(jié)論錯(cuò)誤地拒絕了實(shí)際 正確的原假設(shè),稱為第一類錯(cuò)誤,而確立的顯著性水準(zhǔn) 的大小決定了犯此類錯(cuò)誤的可能性同樣,當(dāng)原假設(shè) 實(shí)際不成立時(shí)卻未能正確的否定原假設(shè),稱為第二類 錯(cuò)誤犯第二類

16、錯(cuò)誤的概率不能確定,但是在樣本容 量相同的情況下,它與犯第一類錯(cuò)誤的概率呈“此消彼 長”的關(guān)系因此,學(xué)術(shù)界普遍采用的0. 05或0.01作 為顯著性水準(zhǔn)并不是“黃金準(zhǔn)則”,需要我們根據(jù)良好 的實(shí)驗(yàn)設(shè)計(jì)以及實(shí)際情況合理地設(shè)置這一點(diǎn)無論是 在實(shí)際應(yīng)用還是學(xué)校教育中都是容易被忽視的,值得 在課程教學(xué)過程中重點(diǎn)強(qiáng)調(diào)3. 2對P值的常見誤用結(jié)合例題針對性剖析P值的誤用是引起P值爭論的主要原因,因此在 P值爭論中被學(xué)術(shù)界普遍討論的P值的常見誤用不僅 反映了學(xué)校教育的薄弱環(huán)節(jié),也給這門課程的課堂教 學(xué)指出了需要重視的地方這里結(jié)合作者對于此門課 程的教學(xué)經(jīng)驗(yàn),列舉兩點(diǎn)學(xué)生們對于P值常見的誤用 加以討論最常見的

17、誤用即當(dāng)計(jì)算得出的P值大于設(shè)定的顯 著性水準(zhǔn)時(shí),認(rèn)為原假設(shè)是成立的,即得出“無差別$ 或“無作用”等結(jié)論然而實(shí)際上,假設(shè)檢驗(yàn)方法不能 提供原假設(shè)正確的概率保證如果試驗(yàn)樣本少,也可 能得到P值大于設(shè)定的顯著性水準(zhǔn)的檢驗(yàn)結(jié)果在教 學(xué)中可以結(jié)合檢驗(yàn)統(tǒng)計(jì)量的計(jì)算公式從原理上講解, 如$值的計(jì)算公式中,在均數(shù)一致的情況下,樣本容量 直接影響公式中作為分母的標(biāo)準(zhǔn)誤的大小,并最終對 P值和統(tǒng)計(jì)推斷結(jié)果產(chǎn)生影響在介紹原理的基礎(chǔ) 上,結(jié)合相應(yīng)的生物學(xué)數(shù)據(jù)作為例題,例如以大田條件 下,單株產(chǎn)量實(shí)際存在差異的兩水稻品種的單株產(chǎn)量 數(shù)據(jù)為例,當(dāng)統(tǒng)計(jì)的樣本容量逐漸增大或減小時(shí),均值 變化不會很大,但是兩樣本$檢驗(yàn)的P值

18、會有明顯變 化,一般樣本容量較小時(shí)對應(yīng)的P值相對較大通過 此類例題直觀的展現(xiàn)出較大的P值與實(shí)際能否作出 “無差別”的結(jié)論的關(guān)系,輔助學(xué)生加深對此的理解在教學(xué)過程中遇到的另一常被學(xué)生誤用的情形 是,P值越小被錯(cuò)誤地理解為差異越大然而P值的 大小只表征差別有無統(tǒng)計(jì)學(xué)意義,與效應(yīng)量(effect size)沒有必然的聯(lián)系,即并不表示實(shí)際差異的大小 例如在樣本容量足夠大時(shí),即使差異非常微小也可能 得到很小的P值對于效應(yīng)量的表征目前有多種形 式,使用較為普遍的是Cohens d值10 %此點(diǎn)在教學(xué) 過程中也可以結(jié)合檢驗(yàn)統(tǒng)計(jì)量的計(jì)算公式從原理上講 解,并可以通過從反面列舉相關(guān)例題加以輔助教學(xué),如 列舉兩組

19、集中性很好的樣本,容量較大但均數(shù)相近的 數(shù)據(jù)且計(jì)算的P值遠(yuǎn)小于顯著水準(zhǔn),這樣可以直觀地 讓學(xué)生理解P值與實(shí)際差異大小之間的關(guān)系3.3可將“P值爭論”作為教學(xué)素材鼓勵(lì)學(xué)生自主學(xué) 習(xí)與討論P(yáng)值爭論本身也可以作為生物統(tǒng)計(jì)學(xué)課程很好的 教學(xué)素材可以通過介紹學(xué)術(shù)界對P值爭論的原因、 過程以及各種學(xué)術(shù)觀點(diǎn),引導(dǎo)學(xué)生思考,加深學(xué)生對相 關(guān)概念的理解此外,P值爭論是目前尚未形成統(tǒng)一 的學(xué)術(shù)觀點(diǎn)的前沿?zé)狳c(diǎn)話題,是組織學(xué)生討論的很好 的素材可以向?qū)W生推薦P值爭論的熱點(diǎn)文獻(xiàn),并鼓 勵(lì)學(xué)生課下自己搜集材料,組織學(xué)生分組,每組圍繞一 個(gè)主題或圍繞一個(gè)共同的主題,在條件允許的情況下, 通過翻轉(zhuǎn)課堂的形式讓學(xué)生討論并闡述對P值及P值 爭論的理解同時(shí),教師應(yīng)該在課堂上對學(xué)生在討論 過程中關(guān)于概念可能的不當(dāng)理解及時(shí)指出,對學(xué)生的 各種觀點(diǎn)予以客觀總結(jié)、點(diǎn)評這也是促進(jìn)學(xué)生對P 值的理解以及正確使用的一個(gè)行之有效的教學(xué)方式在課堂中利用P值爭論的熱點(diǎn)組織討論,不僅使 學(xué)術(shù)前沿自然地走進(jìn)課堂,而且改變了傳統(tǒng)的教學(xué)方

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論